Csvreader : parseur xml

caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007 - 6 mars 2007 à 23:33
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 - 7 mars 2007 à 14:00
Bonjour,


J'ai developpé une application qui fait du mapping XML: à partir des
fichiers plats (.txt) je recupère les champs séparés par des
tabulations sur deux lignes et je construit mon fichier xml en sortie.


Mon problème c'est que lorsqu'un champ se termine par un caractère
accentué il me fait planter le traitement et me sort cette erreur :


com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 2 of 2-byte UTF-8 sequence.


voici mon bout de code qui me fait le parsing sur le fichier plat :

***************************************************************
try {

CsvReader csvr = new CsvReader(fileName);
csvr.setDelimiter('\t');
csvr.setSkipEmptyRecords(true);
csvr.readHeaders();

String[] headers = csvr.getHeaders();
while (csvr.readRecord()) {

for (String header : headers) {
String value = csvr.get(header);
data.put(header, value);
}
}

csvr.close();
} catch (IOException e) {
s_logger.error("Unable to build and serialize XML part from: "+ fileName + ". IO Exception: " + e.toString());
}

// 2- build the XML file from the temporary map

xml.append("\t\t\n");
Iterator<String> keys = data.keySet().iterator();
while (keys.hasNext()) {
String key = keys.next();
String value = data.get(key);
if (!"".equals(key)) { // do not process empty lines
xml.append("\t\t\t<").append(key).append(">");
xml.append(value);
xml.append("</").append(key).append(">\n");
}
}
xml.append("\t\t

\n");
return xml;


***************************************************************************

merci pour votre réponse

11 réponses

Ombitious_Developper Messages postés 2333 Date d'inscription samedi 28 février 2004 Statut Membre Dernière intervention 26 juillet 2013 38
6 mars 2007 à 23:45
Salut:

Je ne suis pas sûr mais je pense que ça devrais dû à l'attribut encoding de la balise XML.



<?xml version="1.0" encoding="UTF-8" ?>



Essayes de la changer par une autre pour supporter la norme UNICODE.



Je dis ça parceque UTF-8 ne supporte pas les caractères accentués.



Je répéte encore, je ne suis pas sûr.




____________________________________________________________________________________________
A.B. :  La lumière voyage plus vite que le son. C'est pourquoi certaines personnes paraissent brillantes jusqu'à ce qu'elles commencent à parler ...
0
caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007
6 mars 2007 à 23:55
Merci pour ton aide mais ce n'est pas ca!
Ca me pose vraiment problème car j'ai une centaine de fichier à mapper et si un fichier  plante bah toute l'appli plante!
 
0
Ombitious_Developper Messages postés 2333 Date d'inscription samedi 28 février 2004 Statut Membre Dernière intervention 26 juillet 2013 38
7 mars 2007 à 00:03
Salut:

Franchement, je n'ai pas encore travaillé avec XML donc je ne peux pas te rendre grand chose. Attends les autres membres.



Bonne chance.




__________________________________________________________
A.B. :  La lumière voyage plus vite que le son. C'est pourquoi certaines personnes paraissent brillantes jusqu'à ce qu'elles commencent à parler ...
0
caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007
7 mars 2007 à 12:47
Est ce qu'il ya un moyen de faire une transformation de ISO-8859-1 vers UTF-8 en java?
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 111
7 mars 2007 à 12:56
Salut,

essais :
String stringUTF8 = new String(stringISO.getBytes(), "UTF-8");

------------------------------------
"On n'est pas au resto : ici on ne fait pas dans les plats tout cuits ..."

WORA
0
caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007
7 mars 2007 à 12:59
Merci pour ta reponse
je le met ou dans mon code?


ET ca appel quel import?

Suis vraiment debutant et je galère
Merci encore une fois
0
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 111
7 mars 2007 à 13:16
Salut,

ba je sais pas moi ou tu le mets (je ne connais pas la classe CsvReader) ... en gros faut le mettre la ou tu fais un read de ta chaine ISO.... pour les imports il n'y en a pas c'est des méthodes de base de la classe java.lang.String...

PS:Qui te génère l'exception ? c'est le constructeur de CsvReader ?

------------------------------------
"On n'est pas au resto : ici on ne fait pas dans les plats tout cuits ..."

WORA
0
caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007
7 mars 2007 à 13:19
Merci pour ta reponse,
voici ma classe entière:

package eu.unilog.orias.serializers;

import java.io.IOException;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

import org.apache.log4j.Logger;

import com.csvreader.CsvReader;
import java.io.*;
public class XmlSubscriptionPart implements XmlSerializer {

    /**
     * The file where is stored the subscription part.
     */
    private String fileName = null;

    private static Logger s_logger = Logger.getLogger(XmlSubscriptions.class);

    /**
     * Build a subscription part bean.
     *
     * @param fileName
     *            The file path and name of the part.
     */
    public XmlSubscriptionPart(String fileName) {
        this.fileName = fileName;
    }
   
    /*
     * (non-Javadoc)
     *
     * @see eu.unilog.orias.serializers.XmlSerializer#serialize()
     */

    public StringBuffer serialize() throws XmlException {
        StringBuffer xml = new StringBuffer();
       
        // where are stored the read records (name -> values)
        Map<String, String> data = new HashMap<String, String>();

        // 1- read the CSV file and build the temporary map
        try {
       
            CsvReader csvr = new CsvReader(fileName);
            csvr.setDelimiter('\t');
            csvr.setSkipEmptyRecords(true);
            csvr.readHeaders();
           
            String[] headers = csvr.getHeaders();
            while (csvr.readRecord()) {

                for (String header : headers) {
                    String value = csvr.get(header);
                    data.put(header, value);
                   
                }
            }
           
            csvr.close();
        } catch (IOException e) {
            s_logger.error("Unable to build and serialize XML part from: "+ fileName + ". IO Exception: " + e.toString());
        }

        // 2- build the XML file from the temporary map

        xml.append("\t\t\n");
        Iterator<String> keys = data.keySet().iterator();
        while (keys.hasNext()) {

            String key = keys.next();
            String value = data.get(key);
           
            if (!"".equals(key)) { // do not process empty lines       
                xml.append("\t\t\t<").append(key).append(">");
                xml.append(value);
                xml.append("</").append(key).append(">\n");
            }
        }   

        xml.append("\t\t

\n");
        return xml;
       
    }
}
0
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 111
7 mars 2007 à 13:35
Salut,
cela ne change toujours rien au problème ... la question est simple qui te génère l'exception ? c'est CsvReader csvr new CsvReader(fileName); ? csvr.readHeaders(); ? String[] headers csvr.getHeaders(); ? while (csvr.readRecord())  ? etc ...

------------------------------------
"On n'est pas au resto : ici on ne fait pas dans les plats tout cuits ..."

WORA
0
caro_perf Messages postés 29 Date d'inscription dimanche 6 mars 2005 Statut Membre Dernière intervention 13 mars 2007
7 mars 2007 à 13:38
c'est while (csvr.readRecord())!
0
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 111
7 mars 2007 à 14:00
Salut,

bon oki essai ce constructeur :

CsvReader(java.io.InputStream inputStream, java.nio.charset.Charset charset);

pour ton code ça donne un truc du genre:
java.nio.charset.Charset charset = java.nio.charset.Charset.forName("UTF-8");
CsvReader csvr = new CsvReader(new java.io.FileInputStream(fileName), charset);

------------------------------------
"On n'est pas au resto : ici on ne fait pas dans les plats tout cuits ..."

WORA
0
Rejoignez-nous