Bonjour
Je souhaite parser le code dune page html pour récuper liens et URL d'images
Jutilise un webbrowser caché.
Le probleme c'est que le webbrowser charge toute la page comme un vrai browser (images, bannieres, video, musique alors que moi jai juste besoin du code!
par exemple si je charche ce site
http://www.annabella.net/music.html jentend la music en background...
Mon idée est d'arréter le chargement de la page des que je récupere les liens comme sa
les liens sont chargés dès le readystate Interactive. donc jessai:
Private Sub WebBrowser1_ProgressChanged(Byval ..., Byref...) Handles WebBrowser1.ProgressChanged
htmldoc = WebBrowser1.Document()
For i = 0 To htmldoc.Links.Count - 1
ListBox1.Items.Add(htmldoc.Links.Item(i).GetAttribute("HREF"))
Next
If WebBrowser1.ReadyState = WebBrowserReadyState.Interactive Then
WebBrowser1.Stop() << cette methode ne marche pas
Exit Sub
End If
End sub
Cependant la méthode WebBrowser1.Stop() ne marche pas et la page se charge completement jusqu'à
completed et ...la music se lance
Jai tester une autre méthode sans webbrowser avec .createDocumentFromURL(url) de IHTMLDOCUMENT de la library MSHTML
bon sa marche....mais le probleme c'est que jaimerai pouvoir récupérer les images de pages qui demandent un windows Login/mot de passe et récupérer les liens/images en passant par un proxy...
Jignore si c'est possible avec les interfaces de MSHTML
J'attend bcp de vous!! sa fé des jours que je cherche une méthode...
Merci davance pour votre aide