Lecture d'une page web sans récupération du HTML, mais uniquement le texte.

Question

Bonjour,

Je cherche à récupérer le texte d'une page Web, sans le composant TWebBrowser (trop lent), boucle de plus de 200 pages ! Je ne suis intéressé que par le texte.
J'ai testé la fonction InternetOpenUrl, mais je ne récupère que le code source.
Je remercie la personne qui pourrait m'aider à mettre la bonne instruction.

Merci d'avance,

JulioDelphi · Answer

Hello
Tu est obligé de récupérer le code source, ensuite, supprime les tags (cherche sur google "delphi strip html tags") ça devrait te suffire
bye

19hal62 · Answer

Merci JulioDelphi, ta proposition répond parfaitement à ma question.
Mais... eh oui il y a un mais, j'ai un autre problème, ne connaissant pas grand-chose au langage HTML, mon texte n'est pas dans ma récupération, donc je pense que cette page doit être construite à partir de fonction, peut-être un problème de frame... 
Pour faire simple, ce que je vois sur ma page n'est pas dans le texte que je retrouve avec la fonction "InternetOpenUrl".
Je continue mes recherches et merci encore.

Lecture d'une page web sans récupération du HTML, mais uniquement le texte.

2 réponses

Votre réponse

Discussions similaires