Encoding stuff

deniropacino Messages postés 1 Date d'inscription lundi 14 mars 2005 Statut Membre Dernière intervention 3 juin 2005 - 3 juin 2005 à 11:41
cs_GodConan Messages postés 2113 Date d'inscription samedi 8 novembre 2003 Statut Contributeur Dernière intervention 6 octobre 2012 - 3 juin 2005 à 21:39
ciao a tous, je re-edite un message que j'ai poster il y a de ca une paires de mois, et je suis toujours sans reponse... . ne me dites pas que personne n'a jamais pense a cela, ou jamais resolu un probleme similaire!
Bon, j'espere avoir un peu plus de succes avec cette nouvelle tentative...

"Salut a tous,


bon je me suis remit a Java il y a peu (apres un longue periode C++) et je suis face un probleme, qui n'est peut etre pas innerant a JAVA soit dit en passant, qui est le suivant:

J'ai en entree un fichier texte en entree dont je ne connais pas l'encodage et j'aimerais trouver ce-dernier; ou tout du moins etre capable de determiner que ce fichier n'est pas ISO-8859-1 ou en UTF-8 par exemple...

Le probleme se pose evidemment quand le fichier contient des characteres codes sur plusieurs octect, notre bon francais par exemple... :)

mon idee etait a partir du fichier en entree de creer deux fichiers, par exemple un en UTF-8 et l'autre en ISO-8859-1 et ensuite de les comparer avec mon fichier de depart.
Dans certains cas une comparaison de taille suffit : ok pas de probleme...
Dans d'autres cas il faut comparer le contenu. Seulement voila, pour cela il faut ouvrir le flux qui va recevoir mon fichier d'entree avec un encodage ... que je cherche! et si je ne precise pas d'encodage, la JVM convertit directement en UNICODE ...

bref je retourne le probleme dans tous les sens sans obtenir le moindre resultat...
Je pense que mon approche n'est pas la bonne, mais je n'ai pour le moment pas la moindre idee sur comment determiner l'encodage d'un fichier...

si quelqu'un a une idee, aussi petite soit-elle, il/elle est le/la bienvenu(e)!!!

merci d'avance! ;-) "

1 réponse

cs_GodConan Messages postés 2113 Date d'inscription samedi 8 novembre 2003 Statut Contributeur Dernière intervention 6 octobre 2012 12
3 juin 2005 à 21:39
et bien tu n ouvre pas ton fichier en mode text mais en binaire et tu lit octet par octet...

;o) ainsi tu n aura aucune interpretation parasite...

commande de base des E/S ;o)

++

GL

GodConan
0
Rejoignez-nous