URL : sortir titre et premières lignes d'un article web

- - Dernière réponse : cs_Le Pivert
Messages postés
5606
Date d'inscription
jeudi 13 septembre 2007
Statut
Contributeur
Dernière intervention
14 décembre 2018
- 2 juin 2016 à 11:57
Bonjour,

Un peu comme dans Facebook ou autres outils, je voudrais sortir à partir de l'URL le titre d'un article dans le web ainsi que les 30 premiers mots... Je suis à mes débuts, vous avez une piste? Aussi, je présume que je dois adapter selon la source...

Merci!
Afficher la suite 

Votre réponse

7 réponses

Messages postés
12388
Date d'inscription
mardi 11 mars 2003
Statut
Contributeur
Dernière intervention
14 décembre 2018
0
Merci
Bonsoir,

Avec quel VB programmes tu?
  • VBA
  • VB6
  • VBS
  • VB.Net


Peux tu poster un url exemple et les données que tu souhaites en extraire?
Commenter la réponse de Whismeril
Messages postés
12388
Date d'inscription
mardi 11 mars 2003
Statut
Contributeur
Dernière intervention
14 décembre 2018
0
Merci
Deux questions, une seule réponse....
Commenter la réponse de Whismeril
0
Merci
excuse moi voici un exemple.
lien: http://www.lapresse.ca/actualites/national/201606/01/01-4987211-debut-du-retour-des-habitants-dans-fort-mcmurray.php
j'aimerai a partir de ce lien ressortir le titre et le resumé.

titre: Début du retour des habitants dans Fort McMurray
résumé: Les premiers habitants de Fort McMurray devaient commencer à regagner mercredi une ville évacuée il y a tout juste un mois avec l'embrasement d'un gigantesque feu de forêt qui a détruit une partie de cette ville, coeur de l'industrie pétrolière du Canada.
avec vb.net
Commenter la réponse de maxime
0
Merci
excuse moi voici un autre exemple.
http://www.camfoot.com/a-la-une/mondial-u17-les-lionnes-fixees-sur-leurs-adversaires,24089.html

j'aimerai a partir de ce lien ressortir le titre et le résumé.
titre: Mondial U17 : les Lionnes fixées sur leurs adversaires
résumé: Le tirage au sort de la phase de groupe de la Coupe du monde des moins de 17 ans de football féminin n’a pas été clément envers la sélection camerounaise. Les Little Lionnesses sont logées dans le groupe B, en compagnie du Venezuela, du Canada et de l’Allemagne.
Commenter la réponse de maxime
Messages postés
12388
Date d'inscription
mardi 11 mars 2003
Statut
Contributeur
Dernière intervention
14 décembre 2018
0
Merci
Bonjour,

il s'agit donc d'accéder au site et d'en extraire des infos.
Ca je ne sais pas faire.

A la première lecture, je pensais que tu voulais extraire les infos de l'adresse, ça j'aurais peut être su faire...


Commenter la réponse de Whismeril
Messages postés
672
Date d'inscription
mercredi 22 janvier 2003
Dernière intervention
2 juin 2016
0
Merci
Bonjour
je sais que je suis hors sujet concernant le langage de developpement car j'aborde le langage PowerShell depuis quelques jours et je réponds au sujet de manière fonctionnelle

Je créé un fichier d'extension .ps1 exemple camfoot.ps1

Function Get-Title {
param([string] $url)
$wc = New-Object System.Net.WebClient
$wc.Proxy.Credentials = [System.Net.CredentialCache]::DefaultNetworkCredentials
$data = $wc.downloadstring($url)
$title = [regex] '(?<=<title>)([\S\s]*?)(?=</title>)'
write-output $title.Match($data).value.trim()
$content = [regex] '(?<=<meta name=)([\S\s]*?/>)'
write-output $content.Match($data).value.trim()
}

Get-Title "http://www.camfoot.com/a-la-une/mondial-u17-les-lionnes-fixees-sur-leurs-adversaires,24089.html"

et j'execute dans une boite DOS :
Powershell -file camfoot.ps1

--j'obtiens
Mondial U17 : les Lionnes fixǸes sur leurs adversaires - Camfoot.com
"description" content=" Le tirage au sort de la phase de groupe de la Coupe du monde des moins de 17 ans de football féminin n'a pas été clément envers la sélection (...) " />
Commenter la réponse de cs_loulou69
Messages postés
5606
Date d'inscription
jeudi 13 septembre 2007
Statut
Contributeur
Dernière intervention
14 décembre 2018
0
Merci
Bonjour,

Mettre dans un Form, un WebBrowser et une RichTextBox avec ce code:

Option Strict On
Public Class Form1
    Public element As HtmlElement ' Element de la page WEB 
    Public texte As String
    Dim adresse As String
    Private Sub Form1_Load(sender As System.Object, e As System.EventArgs) Handles MyBase.Load
        adresse = "http://www.lapresse.ca/actualites/national/201606/01/01-4987211-debut-du-retour-des-habitants-dans-fort-mcmurray.php "
        Navigate(adresse)
    End Sub
    ' Navigates to the given URL if it is valid.
    Private Sub Navigate(ByVal address As String)
        If String.IsNullOrEmpty(address) Then Return
        If address.Equals("about:blank") Then Return
        If Not address.StartsWith("http://") And _
            Not address.StartsWith("https://") Then
            address = "http://" & address
        End If
        Try
            webBrowser1.Navigate(New Uri(address))
        Catch ex As System.UriFormatException
            Return
        End Try
    End Sub
    Private Sub webBrowser1_DocumentCompleted(sender As System.Object, e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) Handles webBrowser1.DocumentCompleted
        element = webBrowser1.Document.GetElementsByTagName("html").Item(0)
        texte = element.InnerText ' Conversion du HTML en texte 
        RichTextBox1.Text = texte
    End Sub
End Class


Commenter la réponse de cs_Le Pivert

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.