Snacksou
Messages postés7Date d'inscriptiondimanche 8 février 2004StatutMembreDernière intervention25 février 2009
-
25 févr. 2009 à 18:37
cs_AlexN
Messages postés694Date d'inscriptionlundi 5 décembre 2005StatutMembreDernière intervention 8 janvier 2014
-
25 févr. 2009 à 22:00
Bonjour à tous,
dans le cadre d'un projet de détection de plagiat à la fac, développé en Java, nous sommes amenés à faire des requêtes vers divers moteurs de recherche, Google en tête. Je suis chargé de cette partie, et je suis donc amené à récupérer les résultats. J'arrive à récupérer les résultats sous forme de texte brut, mais il me faut ensuite parser les résultats obtenus afin de ne garder que les parties pertinentes. Arpès avoir glané pas mal le net, je suis tombé sur htmlparser, mais j'ai encore quelques soucis. J'arrive à récupérer séparement une String d'adresse URL et une String de texte mais je n'arrive pas à faire le lien entre.
Je m'explique. J'aimerais récupérer le lien () avec le texte,celui en dessous du lien (apparement dans une balise <div class="s"...) , pour l'intégrer dans une hasmap. Le lien en vert en dessous ne n'interesse que peu (a moins que ce ne soit plus facile).
Voilà, j'espère avoir été assez clair. Le code dont je dispose déjà ne me permet pas apparement de faire cela, mais si ça vous interesse, je vous le donne.