URL : sortir titre et premières lignes d'un article web

YSAINDON - 31 mai 2016 à 17:00
cs_Le Pivert Messages postés 7903 Date d'inscription jeudi 13 septembre 2007 Statut Contributeur Dernière intervention 11 mars 2024 - 2 juin 2016 à 11:57
Bonjour,

Un peu comme dans Facebook ou autres outils, je voudrais sortir à partir de l'URL le titre d'un article dans le web ainsi que les 30 premiers mots... Je suis à mes débuts, vous avez une piste? Aussi, je présume que je dois adapter selon la source...

Merci!

7 réponses

Whismeril Messages postés 19028 Date d'inscription mardi 11 mars 2003 Statut Non membre Dernière intervention 24 avril 2024 656
31 mai 2016 à 18:18
Bonsoir,

Avec quel VB programmes tu?
  • VBA
  • VB6
  • VBS
  • VB.Net


Peux tu poster un url exemple et les données que tu souhaites en extraire?
0
avec VB.net
0
Whismeril Messages postés 19028 Date d'inscription mardi 11 mars 2003 Statut Non membre Dernière intervention 24 avril 2024 656
31 mai 2016 à 20:13
Deux questions, une seule réponse....
0
excuse moi voici un exemple.
lien: http://www.lapresse.ca/actualites/national/201606/01/01-4987211-debut-du-retour-des-habitants-dans-fort-mcmurray.php
j'aimerai a partir de ce lien ressortir le titre et le resumé.

titre: Début du retour des habitants dans Fort McMurray
résumé: Les premiers habitants de Fort McMurray devaient commencer à regagner mercredi une ville évacuée il y a tout juste un mois avec l'embrasement d'un gigantesque feu de forêt qui a détruit une partie de cette ville, coeur de l'industrie pétrolière du Canada.
avec vb.net
0
excuse moi voici un autre exemple.
http://www.camfoot.com/a-la-une/mondial-u17-les-lionnes-fixees-sur-leurs-adversaires,24089.html

j'aimerai a partir de ce lien ressortir le titre et le résumé.
titre: Mondial U17 : les Lionnes fixées sur leurs adversaires
résumé: Le tirage au sort de la phase de groupe de la Coupe du monde des moins de 17 ans de football féminin n’a pas été clément envers la sélection camerounaise. Les Little Lionnesses sont logées dans le groupe B, en compagnie du Venezuela, du Canada et de l’Allemagne.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Whismeril Messages postés 19028 Date d'inscription mardi 11 mars 2003 Statut Non membre Dernière intervention 24 avril 2024 656
1 juin 2016 à 16:16
Bonjour,

il s'agit donc d'accéder au site et d'en extraire des infos.
Ca je ne sais pas faire.

A la première lecture, je pensais que tu voulais extraire les infos de l'adresse, ça j'aurais peut être su faire...


0
cs_loulou69 Messages postés 672 Date d'inscription mercredi 22 janvier 2003 Statut Membre Dernière intervention 2 juin 2016 1
2 juin 2016 à 10:40
Bonjour
je sais que je suis hors sujet concernant le langage de developpement car j'aborde le langage PowerShell depuis quelques jours et je réponds au sujet de manière fonctionnelle

Je créé un fichier d'extension .ps1 exemple camfoot.ps1

Function Get-Title {
param([string] $url)
$wc = New-Object System.Net.WebClient
$wc.Proxy.Credentials = [System.Net.CredentialCache]::DefaultNetworkCredentials
$data = $wc.downloadstring($url)
$title = [regex] '(?<=<title>)([\S\s]*?)(?=</title>)'
write-output $title.Match($data).value.trim()
$content = [regex] '(?<=<meta name=)([\S\s]*?/>)'
write-output $content.Match($data).value.trim()
}

Get-Title "http://www.camfoot.com/a-la-une/mondial-u17-les-lionnes-fixees-sur-leurs-adversaires,24089.html"

et j'execute dans une boite DOS :
Powershell -file camfoot.ps1

--j'obtiens
Mondial U17 : les Lionnes fixǸes sur leurs adversaires - Camfoot.com
"description" content=" Le tirage au sort de la phase de groupe de la Coupe du monde des moins de 17 ans de football féminin n'a pas été clément envers la sélection (...) " />
0
cs_Le Pivert Messages postés 7903 Date d'inscription jeudi 13 septembre 2007 Statut Contributeur Dernière intervention 11 mars 2024 137
2 juin 2016 à 11:57
Bonjour,

Mettre dans un Form, un WebBrowser et une RichTextBox avec ce code:

Option Strict On
Public Class Form1
    Public element As HtmlElement ' Element de la page WEB 
    Public texte As String
    Dim adresse As String
    Private Sub Form1_Load(sender As System.Object, e As System.EventArgs) Handles MyBase.Load
        adresse = "http://www.lapresse.ca/actualites/national/201606/01/01-4987211-debut-du-retour-des-habitants-dans-fort-mcmurray.php "
        Navigate(adresse)
    End Sub
    ' Navigates to the given URL if it is valid.
    Private Sub Navigate(ByVal address As String)
        If String.IsNullOrEmpty(address) Then Return
        If address.Equals("about:blank") Then Return
        If Not address.StartsWith("http://") And _
            Not address.StartsWith("https://") Then
            address = "http://" & address
        End If
        Try
            webBrowser1.Navigate(New Uri(address))
        Catch ex As System.UriFormatException
            Return
        End Try
    End Sub
    Private Sub webBrowser1_DocumentCompleted(sender As System.Object, e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) Handles webBrowser1.DocumentCompleted
        element = webBrowser1.Document.GetElementsByTagName("html").Item(0)
        texte = element.InnerText ' Conversion du HTML en texte 
        RichTextBox1.Text = texte
    End Sub
End Class


0
Rejoignez-nous