Récupérer affichage page WEB

Signaler
-
 Utilisateur anonyme -
Je cherche comment faire, à l'aide VB.Net dans Visual Studio Express 2012, pour récupérer le contenu réel qui est affiché sur une page WEB, et non le code source de la page, c'est-à-dire ce qui est réellement affiché à l'écran ?

Merci

10 réponses


Pas bonjour non plus,

Ils ont supprimé le contrôle WebBrowser sur la nouvelle version VS2012 ???


Cordialement


CF2i - Guadeloupe
Ingénierie Informatique
Cette fois-ci, bonjour,

Le contrôle WebBrowser est toujours là, et s'est même enrichi : 115 propriétés, 244 méthodes et 80 événements. Alors la difficulté est de trouver la bonne composition de paramètres pour mon besoin.

Merci de votre aide.

Bonjour,

Je ne sais pas ce que cela donne, mais tu peux toujours jeter un œil là-dessus.
Malheureusement, ce n'est pas ce que je recherche.

Merci quand même.

Ok, alors avec 115 propriétés, 244 méthodes et 80 événements tu n'arrives pas à trouver ce que tu veux?

pour récupérer le contenu réel qui est affiché sur une page WEB

A ton avis, que contient une page web? (mis à part le code de mise en forme, et/ou le code source de la page)
Page, elle, qui d'ailleurs on ignore avec quel type de code elle a été conçue ainsi ce que tu veux récupérer réellement.

Le:
Malheureusement, ce n'est pas ce que je recherche.
Merci quand même.

Ne nous indique en rien ce que tu veux récupérer !!!

Et comme je le disais dans un autre Post, ma boule de cristal n'a plus de piles...


Cordialement


CF2i - Guadeloupe
Ingénierie Informatique
Excusez-moi pour le manque de détail !

Voici donc :

Le texte est chargé à l'aide de script assez complexe : http://www.nyse.com/about/listed/lc_...ListedComp=All
J'essais de récupérer le « listing » des compagnies.

Ouais... ce que tu veux récupérer ce sont des liens, plus précisément tu veux récupérer le texte de ces liens.
Avec 115 propriétés, 244 méthodes et 80 événements nous allons donc trouver ce qu'il faut pour obtenir notre bonheur:
Private Sub Form1_Load(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles MyBase.Load
        WebBrowser1.Navigate("http://www.nyse.com/about/listed/lc_ny_name_A.html?ListedComp=All")
    End Sub

    Private Sub WebBrowser1_DocumentCompleted(ByVal sender As System.Object, ByVal e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) Handles WebBrowser1.DocumentCompleted
        Dim Str As String = ""
        For rt As Integer = 77 To 96
            Str &= WebBrowser1.Document.Links(rt).OuterText & vbCrLf
        Next
        MsgBox(Str)
    End Sub



Cordialement


CF2i - Guadeloupe
Ingénierie Informatique

Bien entendu, le jour où le nombre de liens change le 'Rt' de 77 à 96 ne sera plus bon...

Toujours avec les mêmes 115 propriétés, 244 méthodes et 80 événements, nous allons chercher le lien qui se situe juste derrière ce qui nous intéresse:
    Private Sub WebBrowser1_DocumentCompleted(ByVal sender As System.Object, ByVal e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) Handles WebBrowser1.DocumentCompleted
        Dim Rt As Integer
        Dim Str As String = ""
        For Rt = 0 To WebBrowser1.Document.Links.Count - 1
            Try
                If WebBrowser1.Document.Links(Rt).OuterText.Contains("NYSE Technologies Global Market Data") Then Exit For
            Catch ex As Exception
            End Try
        Next
        For i As Integer = Rt + 1 To Rt + 20
            Str &= WebBrowser1.Document.Links(i).OuterText & vbCrLf
        Next
        MsgBox(Str)
    End Sub



Cordialement


CF2i - Guadeloupe
Ingénierie Informatique

Ton site offre la possibilité de télécharger des xml générés en temps réel sur cette page.
Tu aurais tort de t'en priver puisque l'espace de noms System.Xml gère ces ressources nativement.
Utilise un simple Net.WebClient pour rapatrier les xml utiles.