Jideone
Messages postés9Date d'inscriptiondimanche 13 mai 2007StatutMembreDernière intervention 5 octobre 2010
-
2 juin 2007 à 17:59
cs_AlexN
Messages postés694Date d'inscriptionlundi 5 décembre 2005StatutMembreDernière intervention 8 janvier 2014
-
6 juin 2007 à 11:56
Salut tout le monde,
je cherche une solution pour eliminer les balises html d'un fichier et le transformer ainsi en forme plain.txt.
merci
the_wwt
Messages postés177Date d'inscriptionjeudi 5 octobre 2006StatutMembreDernière intervention16 janvier 20091 4 juin 2007 à 14:26
Bonjour,
Je te propose ce bout de script pas très propre, qui marche seulement si les balises ne sont pas sur plusieurs lignes, dans un autre cas je te laisse te gratter le cerveau, je pense en donner assez avec ceci:
public static void main(String[] args) throws IOException {
FileReader fr = new FileReader("test.html");
BufferedReader br = new BufferedReader(fr);
StringBuffer buffer = new StringBuffer();
/* On suppose que les balise ne sont pas sur plusieurs lignes ... ;-) */
ligne = ligne.substring(0, indexOfLT) + ligne.substring(indexOfGT + 1);
}
}
if( ligne.length() > 0 )
buffer.append(ligne + "\n");
}
br.close();
System.out.println(buffer);
FileWriter fw = new FileWriter("out.txt");
BufferedWriter bw = new BufferedWriter(fw);
bw.write(buffer.toString());
bw.close();
}