Lecture d'une page web sans récupération du HTML, mais uniquement le texte.

Signaler
Messages postés
8
Date d'inscription
vendredi 3 janvier 2003
Statut
Membre
Dernière intervention
11 octobre 2011
-
Messages postés
8
Date d'inscription
vendredi 3 janvier 2003
Statut
Membre
Dernière intervention
11 octobre 2011
-
Bonjour,

Je cherche à récupérer le texte d'une page Web, sans le composant TWebBrowser (trop lent), boucle de plus de 200 pages ! Je ne suis intéressé que par le texte.
J'ai testé la fonction InternetOpenUrl, mais je ne récupère que le code source.
Je remercie la personne qui pourrait m'aider à mettre la bonne instruction.

Merci d'avance,

2 réponses

Messages postés
2226
Date d'inscription
dimanche 5 octobre 2003
Statut
Modérateur
Dernière intervention
18 novembre 2010
13
Hello
Tu est obligé de récupérer le code source, ensuite, supprime les tags (cherche sur google "delphi strip html tags") ça devrait te suffire
bye
Messages postés
8
Date d'inscription
vendredi 3 janvier 2003
Statut
Membre
Dernière intervention
11 octobre 2011

Merci JulioDelphi, ta proposition répond parfaitement à ma question.
Mais... eh oui il y a un mais, j'ai un autre problème, ne connaissant pas grand-chose au langage HTML, mon texte n'est pas dans ma récupération, donc je pense que cette page doit être construite à partir de fonction, peut-être un problème de frame...
Pour faire simple, ce que je vois sur ma page n'est pas dans le texte que je retrouve avec la fonction "InternetOpenUrl".
Je continue mes recherches et merci encore.