Html Extractor: extraction de données d'une page web

- - Dernière réponse : cs_Jack
Messages postés
14008
Date d'inscription
samedi 29 décembre 2001
Statut
Modérateur
Dernière intervention
28 août 2015
- 4 janv. 2015 à 02:06
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/100397-html-extractor-extraction-de-donnees-d-une-page-web

Afficher la suite 
cybermanin
Messages postés
2
Date d'inscription
samedi 12 février 2011
Statut
Membre
Dernière intervention
9 février 2014
-
intéressant code :)
Bonjour,

J'ai cherché longtemps comment je peut extraire les données automatiquement en grande quantité à partir d'un site web. J'ai trouvé un service qui m'a beaucoup aidé, et rapidement. Je partage le lien: http://affairesoft.com/extraction-collecte-donnees/


Bon chance
cs_Jack
Messages postés
14008
Date d'inscription
samedi 29 décembre 2001
Statut
Modérateur
Dernière intervention
28 août 2015
61 -
Salut
Le principe me semble intéressant, mais j'ai un comportement bizarre que je ne m'explique pas :

Avec la plupart de sites, cela fonctionne bien, mais j'ai sur une adresse comme
http://forum.pokerstarslive.fr/
une réponse "404" sur le WebClient.DownloadString
(que l'on soit logué en tant qu'utilisateur ou pas)
alors que l'utilisation d'un WebBrowser est Ok.
Les autres pages du même site ne posent pas de problème

Une idée ?

L'exception System.Net.WebException s'est produite
HResult=-2146233079
Message=Le serveur distant a retourné une erreur : (404) Introuvable.
Source=System
StackTrace:
à System.Net.HttpWebRequest.GetResponse()
InnerException: