Extraire le TEXTE d'une page internet

z980x Messages postés 897 Date d'inscription jeudi 6 juin 2002 Statut Membre Dernière intervention 26 juillet 2007 - 26 janv. 2004 à 21:54
cs_etniqs Messages postés 201 Date d'inscription mardi 7 octobre 2003 Statut Membre Dernière intervention 10 mai 2016 - 5 nov. 2004 à 11:49
Salut a tous !

J'ai déja posé cette question, mais personne ne répond, ou ne sait répondre....

Je cherche à extraire le texte d'une page internet... Je ne veux pas télécharger la source, mais juste avoir le texte !

Comme si par exemple, on ouvrait la page, on fait Ctrl A (pour tout sélectionner) et que l'on faisait Copier Coller dans un fichier texte...

Merci de m'aider !!

5 réponses

pcpunch Messages postés 1243 Date d'inscription mardi 7 mai 2002 Statut Membre Dernière intervention 18 février 2019 5
27 janv. 2004 à 02:19
Je pense t'avoir déja repondu ou alors c'etait une question similaire!!!
a mon avis c faisable en utilisant un controle webbrowser et en recuperant le texte par le presse papier. Il faut automatiser la commande "tous selectionner et copier!!!" Ensuite tu recupére le texte par le presse papier (Clipboard)

Ps: c'est juste une idéé, j'ai pas testé!! mais ça a l'air jouable!!
0
z980x Messages postés 897 Date d'inscription jeudi 6 juin 2002 Statut Membre Dernière intervention 26 juillet 2007 2
27 janv. 2004 à 07:51
Bah je ne sais pas comment faire a partir d'un webbrowser, aucune des sources que j'ai vu ne correspond à ce que je veux faire...

A moins que bien sur on charge la page dans un webbrowser et que dans le webbrowser, on lui dise de tout sélectionner et de copier...

Mais encore une fois, comment faire?
0
pcpunch Messages postés 1243 Date d'inscription mardi 7 mai 2002 Statut Membre Dernière intervention 18 février 2019 5
27 janv. 2004 à 11:55
Re, bon je vais te donner un exemple, Je tiens a te signaler qu'en cherchant sur le site avec le fabuleux moteur de recherche g fais cette exemple en Moins de 2 min!!!

Je suis tj surpris de voir qu'avec autant de src, on en vien a poser encore ce genre de question, et surtout que l'on demande une solution toute faites, mais bon "it's the life!!!"

Private Sub Form_Load()
WebBrowser1.Navigate "www.yahoo.fr"
End Sub

Private Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant)
Clipboard.Clear
'execute tous selectionner
WebBrowser1.ExecWB OLECMDID_SELECTALL, OLECMDEXECOPT_DODEFAULT
'execute copier
WebBrowser1.ExecWB OLECMDID_COPY, OLECMDEXECOPT_DODEFAULT
'recuperation du texte dans le presspapier
Text1 = Clipboard.GetText
End Sub


++
0
z980x Messages postés 897 Date d'inscription jeudi 6 juin 2002 Statut Membre Dernière intervention 26 juillet 2007 2
27 janv. 2004 à 12:30
Merci beaucoup ! C'est exactement ce que je cherchais !

Je pense que je ne suis pas le seul qui cherchait ca, et maintenant grace a toi, on sait le faire !

Merci !
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
cs_etniqs Messages postés 201 Date d'inscription mardi 7 octobre 2003 Statut Membre Dernière intervention 10 mai 2016
5 nov. 2004 à 11:49
yes, mââârci aussi,

ce que je suis en train de faire :
- scanner des codes barres
- les traiter et les stocker dans une bdd
- chercher des infos correspondantes : donc
- automatiser les requêtes de recherches sur ie
- copier la source html
- la parser pour en retirer l'info nécessaire
- placer tout ça dans un doc quelconque
- formatter la doc

alors voilà, y'a du boulot, et si je peux me passer de ce genre de pb de programmation primordial pour l'ensemble, hein,ben je saute sur l'occaz.

voila merci merci merci
0
Rejoignez-nous