Extraction des données depuis un fichier .HTML

Question

Bonsoir, Je souhaiterais extraire des données depuis un fichier .HTML par exemple: ...

Bonjour à Tous

... =>Je souhaiterais afficher "Bonjour à Tous". J'ai déjà essayé ,avec le code suivant: public class extraction { public static void main(String[] args) { readFile("fichier.html"); } public static void readFile(String pathToFile){ try { BufferedReader reader = new BufferedReader(new FileReader(new File(pathToFile))); String ligne; while((ligne = reader.readLine()) != null){ if(ligne.endsWith("")){ System.out.println(ligne); } } } catch (Exception ex){ System.err.println("Error. "+ex.getMessage()); } } } =>le résultat affiché est:

Bonjour à Tous

or je veux éliminer les deux balises

et

. merci d'avance :)

cs_Julien39 · Answer

Salut, Si tu sais que tes balises sont

et

chaine.substring(4, chaine.length -5)

Twinuts · Answer

Salut, Si tu veux simplement isoler une ou 2 balises html tu peux utiliser les regex: String text = "

Bonjour à Tous

"; System.out.println(text.replaceAll("

(.*)

", "$1")); Sinon si tu veux parser un fichier HTML, il est préférable d'utiliser un parseur HTML https://www.google.com/search?q=java+html+parser

Extraction des données depuis un fichier .HTML

2 réponses

Votre réponse

Discussions similaires