Recherche de mots dans une page html téléchargé

KillJava - 6 janv. 2014 à 12:14
cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 - 8 janv. 2014 à 13:50
Bonjour,

Afin de réaliser un mini projet, je souhaiterai effectuer une recherche de liste ou de tableau de mots (modifiables) dans une page html que j'ai préalablement téléchargé dans un fichier local à l'aide d'une fonction telechargerPage();

Le but étant de vérifier tout les x temps que mes mots sont bien dans ma page p, afin de localiser les erreurs.

Pourriez-vous m'aider? je suis débutante en Java...

3 réponses

cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
6 janv. 2014 à 13:46
Salut,

Oui, nous pouvons t'aider, quel est ton problème ?
0
cs_AlexN Messages postés 694 Date d'inscription lundi 5 décembre 2005 Statut Membre Dernière intervention 8 janvier 2014 19
8 janv. 2014 à 12:05
Bonjour,

il existe de nombreuses librairies java permettant d'extraire le texte d'un document HTML :
- jsoup : http://jsoup.org/cookbook/extracting-data/attributes-text-html
- htmlparser : http://htmlparser.sourceforge.net/samples.html ou http://jericho.htmlparser.net/docs/javadoc/net/htmlparser/jericho/TextExtractor.html

D'autres suggestions ici : http://www.rgagnon.com/javadetails/java-0424.html

Enregistrer la page localement pour faire cette opération n'est pas indispensable avec ces librairies.
--
0
cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
8 janv. 2014 à 13:50
Au delà des librairies, peut être qu'il n'a besoin que d'une expression régulière, mais sans retour de sa part et sans plus de précision, impossible de le dire...
0
Rejoignez-nous