Convertir dues accents (é) en UTF-8 ?

Résolu
Utilisateur anonyme - 27 nov. 2010 à 17:45
cs_beugue Messages postés 1 Date d'inscription mercredi 7 février 2007 Statut Membre Dernière intervention 21 juillet 2011 - 21 juil. 2011 à 14:47
Bonjour,

Une grosse erreur de conception de notre système m'amène sur un problème que je ne sais pas résoudre pour le moment, sans votre aide....

Voila le "bug" :

Nous avons installé un formulaire d'encodage HTML (FCKEditor pour ceux qui connaissent) avec les options par défaut (je pense, à moins que nous ayions merdé à ce moment là !). Le fait est, c'est que nous nous retrouvons avec une base de données (qui a deja plusieurs mois d'existences, donc plusieurs centaines d'enregistrements....) avec des codes du type "&...;" (Exemple : é pour les accents aigüs !)
Bon, la conneries est faite, .... dur dur de revenir en arrière car si ce n'étais que des pb d'accents, ca irait vite à corriger. Il y a même des tableaux !

Bon maintenant ce que je voudrais :

Sachant cette "pétouille", y aurais il des fonctions (je ne trouve rien dans la doc PHP) COMPLÈTES qui transforme toutes ces entités (é, • ... y'a pas que des accents, ça serait trop simple) qui puisse me convertir ces entité HTML en UTF-8, prenant ainsi en compte notamment • utilisé à par mal de reprise, mais c pas le seul !

But de cette manip

De peur de me faire incendier si je cite mon site ici (d'aucun le voient parfois comme de la pub), je recense des événements culturels de la région lorraine. L'unique but de cette manip est de générer un fichier XML en UTF-8 (de façon à normaliser les choses), pour pouvoir "l'envoyer" à d'autres sites. Un parseur sera écrit par la suite.

Quelqu'un aurait-il déjà été confronté à ce problème et comment l'aurait-il résolu ?

Je vous remercie TOUS d'avance pour vos contributions qui me permettront, j'espère, d'avancer....

4 réponses

cod57 Messages postés 1653 Date d'inscription dimanche 7 septembre 2008 Statut Membre Dernière intervention 11 septembre 2013 19
27 nov. 2010 à 19:12
bonsoir

faudrait faire un script avec une fonction qui convertit

http://php.net/manual/en/function.utf8-decode.php
http://www.unicodetools.com/
http://htmlpurifier.org/docs/enduser-utf8.html
http://php.net/manual/en/function.html-entity-decode.php

j'avais déjà un prob comme ça, j'ai exporté les tables avec phpmyadmin
en csv puis avec open office (calc) j'ai converti utf8 en iso et rechargé dans mysql avec phpmyadmin j'ai utilisé le format csv avec séparateur ;
...


a++
3
Utilisateur anonyme
27 nov. 2010 à 22:57
Merci pour tous ces liens que je vais m'empresser de regarder, notamment html purifier....
0
tetranima Messages postés 18 Date d'inscription lundi 15 juin 2009 Statut Membre Dernière intervention 21 septembre 2013
10 juin 2011 à 15:16
J'ai eu un problème similaire, résolu avec :

$string = utf8_encode(html_entity_decode($string));
0
cs_beugue Messages postés 1 Date d'inscription mercredi 7 février 2007 Statut Membre Dernière intervention 21 juillet 2011
21 juil. 2011 à 14:47
Merci beaucoup "tetranima". C'est bon.
0
Rejoignez-nous