Lecture d'une page web sans récupération du HTML, mais uniquement le texte.

19hal62 Messages postés 8 Date d'inscription vendredi 3 janvier 2003 Statut Membre Dernière intervention 11 octobre 2011 - 2 mai 2010 à 17:59
19hal62 Messages postés 8 Date d'inscription vendredi 3 janvier 2003 Statut Membre Dernière intervention 11 octobre 2011 - 3 mai 2010 à 19:39
Bonjour,

Je cherche à récupérer le texte d'une page Web, sans le composant TWebBrowser (trop lent), boucle de plus de 200 pages ! Je ne suis intéressé que par le texte.
J'ai testé la fonction InternetOpenUrl, mais je ne récupère que le code source.
Je remercie la personne qui pourrait m'aider à mettre la bonne instruction.

Merci d'avance,

2 réponses

JulioDelphi Messages postés 2226 Date d'inscription dimanche 5 octobre 2003 Statut Membre Dernière intervention 18 novembre 2010 14
3 mai 2010 à 09:12
Hello
Tu est obligé de récupérer le code source, ensuite, supprime les tags (cherche sur google "delphi strip html tags") ça devrait te suffire
bye
0
19hal62 Messages postés 8 Date d'inscription vendredi 3 janvier 2003 Statut Membre Dernière intervention 11 octobre 2011
3 mai 2010 à 19:39
Merci JulioDelphi, ta proposition répond parfaitement à ma question.
Mais... eh oui il y a un mais, j'ai un autre problème, ne connaissant pas grand-chose au langage HTML, mon texte n'est pas dans ma récupération, donc je pense que cette page doit être construite à partir de fonction, peut-être un problème de frame...
Pour faire simple, ce que je vois sur ma page n'est pas dans le texte que je retrouve avec la fonction "InternetOpenUrl".
Je continue mes recherches et merci encore.
0
Rejoignez-nous