Ecrire en unicode dans un fichier

eddie5150 Messages postés 34 Date d'inscription samedi 19 novembre 2005 Statut Membre Dernière intervention 20 octobre 2008 - 20 nov. 2007 à 23:38
codefalse Messages postés 1123 Date d'inscription mardi 8 janvier 2002 Statut Modérateur Dernière intervention 21 avril 2009 - 21 nov. 2007 à 14:07
Bonjour à tous,

voilà j'ai un petit probleme d'encodage de caractères ...

J'ai un fichier .txt contenant des caractères japonais, je souhaite lire les caractères de ce fichier, et les réécrire dans un autre.
Si je ne fais que lire ces caractères avec un fgetc, et les réécrire bêtement, tout se passe bien.

Cependant, je souhaite ajouter d'autres caractères, francais. Et c'est là que ca se corse : mes caractères japonais, au milieu des français, ne ressemblent plus du tout à du japonais !! (ex: ÿ,�8;�8;�8;�B;).

Donc apparemment, l'insertion de caractères français doit changer l'encodage utilisé ??

Quelqu'un a-til une solution (j'ai essayé diverses fonctions du style utf8_encode() mais n'y comprend pas grand chose).

3 réponses

codefalse Messages postés 1123 Date d'inscription mardi 8 janvier 2002 Statut Modérateur Dernière intervention 21 avril 2009 1
21 nov. 2007 à 14:07
A mon avis, il faut en effet jouer sur les encodages de fichiers.
Si je ne me trompe pas, utf-8 est le standard car il accepte une multitude de caractères, ce qui peux être interessant dans ton cas (si je l'ai bien compris).
Apres, vu que tu fait un fichier par langue, apparement, tu peux faire une règle d'encodage pour chaque fichier (iso pour le francais, utf8 pour l'anglais, etc), et au chargement de ta page, tu change le charset en fonction de la langue (mais à mon avis ca complique la chose)

A voir ...
0
codefalse Messages postés 1123 Date d'inscription mardi 8 janvier 2002 Statut Modérateur Dernière intervention 21 avril 2009 1
21 nov. 2007 à 14:07
A mon avis, il faut en effet jouer sur les encodages de fichiers.
Si je ne me trompe pas, utf-8 est le standard car il accepte une multitude de caractères, ce qui peux être interessant dans ton cas (si je l'ai bien compris).
Apres, vu que tu fait un fichier par langue, apparement, tu peux faire une règle d'encodage pour chaque fichier (iso pour le francais, utf8 pour l'anglais, etc), et au chargement de ta page, tu change le charset en fonction de la langue (mais à mon avis ca complique la chose)

A voir ...
0
codefalse Messages postés 1123 Date d'inscription mardi 8 janvier 2002 Statut Modérateur Dernière intervention 21 avril 2009 1
21 nov. 2007 à 14:07
euh désolé pour le double post ....
0
Rejoignez-nous