Récupération du code html d'une page web

yvon_bizimana Messages postés 3 Date d'inscription lundi 26 février 2007 Statut Membre Dernière intervention 29 juillet 2008 - 19 juin 2008 à 16:47
cs_AlexN Messages postés 694 Date d'inscription lundi 5 décembre 2005 Statut Membre Dernière intervention 8 janvier 2014 - 19 juin 2008 à 17:16
Bounjour tout le monde!
Dans le cadre de mon projet(J2EE/jsp) que je réalise avec eclipse europa je dois afficher l'arborescence d'une page web dont l'url a été saisi au préalable. Ma question est : est ce que quelqu'un sait comment faire pour récupérer le code html d'une page web, comment convertir le code html en code xml et comment à partir du code xml afficher l'arbre (donc l'arborescence de la page en question)

1 réponse

cs_AlexN Messages postés 694 Date d'inscription lundi 5 décembre 2005 Statut Membre Dernière intervention 8 janvier 2014 19
19 juin 2008 à 17:16
Salut,

Pour récupérer l'arbre DOM : htmlparser : http://htmlparser.sourceforge.net/
Parser parser = new Parser ("http://whatever");
NodeList list = parser.parse (null);
// do something with your list of nodes.

Pour le XML, parcourir la NodeList (getChildren, getNextSibling de la classe Node) et générer le XML à la volée.
0
Rejoignez-nous