Pompeur Pagesjaunes

Résolu
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008 - 29 juin 2005 à 18:44
DrChal Messages postés 28 Date d'inscription dimanche 22 décembre 2002 Statut Membre Dernière intervention 30 mars 2012 - 13 avril 2006 à 11:26
Bonjour, je voudrais faire un logiciel qui pompe les adresses et les emails de certaines sociétés présentes sur le site pagesjaunes.fr. Je voudrais le faire avec winsock. Comment peux t'on savoir ce que Internet Explorer envoie à PagesJaunes.fr quand on fait une recherche ? Jvoudrais précisément que le programme se connecte à pagesjaunes.fr, envoie exactement la même chose comme ce qu'envoie Internet explorer quand on fait une recherche dessus, et comment pourra-t-il recevoir les résultats ?

Merci beaucoup, votre aide me sera extremement précieuse !
Axel

20 réponses

nhervagault Messages postés 6063 Date d'inscription dimanche 13 avril 2003 Statut Membre Dernière intervention 15 juillet 2011 37
29 juin 2005 à 19:39
Pour ce faire il faut que tu formes une requete POST vers la page

"pj.cgi"





avec les différents champs hidden et les input



<form name="form" target="_self" method="POST" action="pj.cgi" onSubmit="return check_form_PJ(this);">
<input type=hidden name="ACTIVITE_VALIDATED_ASCII" value="">
<input type=hidden name="ID_THEME_SDE" value="">
<input type=hidden name="LISTE_RUB_AVEC_THEME" value="">
<input type="hidden" name="faire" value="decode_input_image">
<input type="hidden" name="DEFAULT_ACTION" value="jf_inscriptions_req">
<input type="hidden" name="SESSION_ID" value="FG-A55B0F0-D1FC">
<input type="hidden" name="VID" value="FC-A443C10-EF26">
<input type="hidden" name="INFO_VILLE" value="non">
<input type="hidden" name="CODE_LOC_INFO_VILLE" value="000000000">


<input type="hidden" name="IV_ACTIVATION" value="oui">
<input type="hidden" name="lang" value="FR">
<input type="hidden" name="pays" value="FR">
<input type="hidden" name="srv" value="PJ">

change la value des champs suivants.

FRM_ACTIVITE
FRM_ADRESSE
FRM_NOM
FRM_LOCALITE
FRM_DEPARTEMENT

<input type="hidden" name="TYPE_RECHERCHE" value="ZZZ">




Pour faire la requete tu peux de baser sur le p rogramme

http://www.vbfrance.com/code.aspx?id=7676



Je crois que pour faire la requete post tu fais comme la get



param=value&param1=value1



voila
3
steb359842 Messages postés 69 Date d'inscription samedi 5 juin 2004 Statut Membre Dernière intervention 24 janvier 2008
29 juin 2005 à 19:04
Il te suffit de chercher une source contenant un navigateur en VB, de t'inspirer et de recréer ca dans un environement different.
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 19:09
Ok mais le site pagesjaunes.fr utilise des scriptes CGI donc, comment le prog pour récupérer la source qui contient les résultats de la recherche afin de trier le nom, l'adresse email,... ?
0
steb359842 Messages postés 69 Date d'inscription samedi 5 juin 2004 Statut Membre Dernière intervention 24 janvier 2008
29 juin 2005 à 19:16
Suivant quel script à été utilisé il ne te renvoie que du code HTML. et
la tu dois trier tout ca avec la fonction de recherche InStr car
certainement qu'achaque recherche sur les pagesjaunes, il renvoie le
même model de code html. Ce qui peut aider à trier

*°*°*°*°*°*°*°*°*°*°*°*
Marmote Joyeuse
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 19:20
OK, faut il un minimum de connaissance sur les scripts CGI pour faire ce genre de prog ? Car j'y connais rien en ça, merci :)
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 19:29
Ah ok steb... Merci, donc, le code source de la page

Les InputBox du site pagesjaunes.fr :
<form name="form" target="_self" method="POST" action="pj.cgi" onSubmit="return check_form_PJ(this);">
















Le boutton Rechercher :


Faut-il que winsock envoie JF_INSCRIPTIONS_REQ suivi des contenus des inputbox ? ya un logiciel qui permet de voir toutes les requetes envoyées par Internet Explorer ?

Merci :)
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 21:06
OK merci jva essayer ca :)
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 21:35
[javascript:ChoixGeo('AG_F_58050900;médecins : soins palliatifs et accompagnement')

]ILE-DE-FRANCE

Dans le choix de l'activité et du département, quand on fait un POST a partir de la source que tu ma donné, faut il faire

FRM_ACTIVITE=AG_F_58050900&FRM_DEPARTEMENT=GG_11
?

Merci :)
Axel
0
pastis51forever Messages postés 172 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 8 septembre 2006 1
29 juin 2005 à 22:02
J'essaie d'utiliser la methode post, mais (n'étant pas au top au niveau prog pour internet) en partant du principe que dans la source qui t'a été conseillée, je mette www.pages-jaunes.fr dans le champs chemin, qu'est-ce que je mets dans Host?
Ou si je me plante complètement, comment ca marche??
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 22:25
POST est exactement la méthode utilisée quand tu clic sur le boutton envoyer.
Dans la source du site web, il faut chercher a partir de la balise "<form>" quelles sont les input et on change leurs valeurs et on envoie avec POST ! J'ai pas encore étudié a quoi servait réellement get...
0
nhervagault Messages postés 6063 Date d'inscription dimanche 13 avril 2003 Statut Membre Dernière intervention 15 juillet 2011 37
29 juin 2005 à 22:26
Host pages jaunes

Chemin c'est la suite soit pg.cgi



Voila
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 22:28
Pour pagesjaunes faut utiliser ca : <input tabindex=2 class=txtchamps name="FRM_NOM"

Donc, on voit que la case où on tape le Nom, est bien FRM_NOM
alors il faut cocher post et envoyer

FRM_NOM= suivi d'un nom...
Pour envoyer le département avec, tu peux faire
FRM_NOM=Dupond&FRM_DEPARTEMENT=ILE-DE-FRANCE
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 22:29
HOST il faut mettre l'adresse du site, port laisse le tel qu'il est
0
nhervagault Messages postés 6063 Date d'inscription dimanche 13 avril 2003 Statut Membre Dernière intervention 15 juillet 2011 37
29 juin 2005 à 22:31
Le get est pour les adresses du style

http://www.vbfrance.com/forum.v2.aspx?ID=499294

Mais quand les deux sont renseigné je ne sais plus comment ca fonctionne



soit on met tous dans le post soit le chemin a la partie GET



ID=499294 --> valeur pour le GET
0
pastis51forever Messages postés 172 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 8 septembre 2006 1
29 juin 2005 à 22:40
z'êtes trop forts les gars...
0
pastis51forever Messages postés 172 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 8 septembre 2006 1
29 juin 2005 à 22:45
par contre, je me retrouve avec le code html du formulaire qui est bien rempli, ce qui est très fort, mais ce qui serait encore mieux ce serait de simuler l'appui sur "Lancer la recherche"
C'est possible, ou ca a rien a voir?
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
29 juin 2005 à 22:47
dsl mais qqun peut me donner un exemple pour me montrer comment on utilise la source que tu m'as donné sur www.pagesjaunes.fr svp ? dsl mais j'ai pas très bien compris, je coche POST, j'envoie FRM_ACTIVITE=ACTUAIRES&FRM_DEPARTEMENT=ILE-DE-FRANCE
a partir de la source, ca me met aucun résultats... ca met la mm page mais ac les input modifiés... Comment faire svp ?
0
nhervagault Messages postés 6063 Date d'inscription dimanche 13 avril 2003 Statut Membre Dernière intervention 15 juillet 2011 37
29 juin 2005 à 23:40
Le probleme c'est que chez pages jaunes le script de validation n'est
pas dans la page il est dans un fichier inclus donc le systeme ne peut
pas.

A moins quelle quelqu'un ariive a contourner le probleme



Voila
0
cs_AxeL364 Messages postés 119 Date d'inscription vendredi 11 avril 2003 Statut Membre Dernière intervention 6 juillet 2008
30 juin 2005 à 02:23
OK donc je vais essayer de faire mon pompeur d'adresses autrement, merci de votre aide a tous :)
0
DrChal Messages postés 28 Date d'inscription dimanche 22 décembre 2002 Statut Membre Dernière intervention 30 mars 2012
13 avril 2006 à 11:26
Salut,
Je suis aussi interessé sur : comment interroger la base de données des pages jaunes via une application vb.
Je serai interessé par un exemple de code.
Merci
0
Rejoignez-nous