JDOM - XML - Erreur de lecture de caracteres

estetzein Messages postés 8 Date d'inscription lundi 20 janvier 2003 Statut Membre Dernière intervention 7 septembre 2004 - 28 juin 2004 à 18:33
othmaniahlem Messages postés 5 Date d'inscription dimanche 3 décembre 2000 Statut Membre Dernière intervention 18 février 2009 - 12 févr. 2009 à 10:04
Bonjour,

Voila, j'utilise JDOM pr manipuler mon fichier XML.
Aussi, lorsque je le parse, je recupere une erreur :

java.io.UTFDataFormatException: Invalid byte 2 of 2-byte UTF-8 sequence.

Cette erreur provient d'un caractere tchèque (c avec accent circonflexe inversé)

Voici comment je lis mon fichier XML :

SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(file);

C'est au moment de faire le "builder.build(file);" que l'erreur se produit.

Quelqu'un aurait-il une solution pour que je puisse qd meme lire mon fichier ? P-e dois-je mettre a false la fonction qui verifie les caracteres ? Comment faire ?

Merci d'avance pour votre aide, car la je suis bien ennuyé...:(

-:: Estetzein ::-

3 réponses

wargre Messages postés 649 Date d'inscription mardi 8 juin 2004 Statut Membre Dernière intervention 9 septembre 2004 7
29 juin 2004 à 11:44
dans le XML n'oublie pas le encoding

ex: pour encoding europ de l"ouest avec euro:
<?xml version="1.0" encoding="ISO-8859-15"?>

Bon pour le tcheque je sais pas quel code c'est!
0
estetzein Messages postés 8 Date d'inscription lundi 20 janvier 2003 Statut Membre Dernière intervention 7 septembre 2004
29 juin 2004 à 15:32
Ok, je vois.

Le probleme, c'est que je lis un fichier XML qu'on me donne. Je ne le créé pas.
Mon appli doit repondre a la norme UTF-8 (unicode).
Moi ce ke je cherche c'est juste a copier (dans un premier tps) ce document XML. Or avec ces caracteres tcheques et autres, il m'est impossible.

Je pense qu'il s'agit d'un reglage au niveau du parseur. Surement eviter qu'il ne vérifie les caracteres. Car meme IE bloque sur ce caractere tcheque qd je veux le lire avec.

Bon j'esepere ke l'on pourra m'aider, car la je pattoge......

-:: Estetzein ::-
0
othmaniahlem Messages postés 5 Date d'inscription dimanche 3 décembre 2000 Statut Membre Dernière intervention 18 février 2009
12 févr. 2009 à 10:04
Meme erreur, j'imagine qu'il est posé par la feuille de style que vous
utilisé dés le départ , bon vous changer le transformeur aussi ou le
forcé à UTF-8;
peut tu m'envoyé ton code?
0