badkrist
Messages postés4Date d'inscriptiondimanche 25 juin 2006StatutMembreDernière intervention16 février 2008
-
14 févr. 2008 à 15:42
badkrist
Messages postés4Date d'inscriptiondimanche 25 juin 2006StatutMembreDernière intervention16 février 2008
-
16 févr. 2008 à 18:21
Bonjour,
j'ai besoin de creer sous forme d'arbre, une representation d'un site internet quelconque. Sur un site simple (sans identification) tout se passe bien. Le probleme vient lorsque des variables php utilisant les methodes GET et POST sont utilisées. Je ne sais pas comment faire pour leur attribuer une valeur pour continuer de parcourir le site (on presume que j'ai les noms des variables ainsi que des valeurs qui fonctionnent).
Par exemple, sur http://agenstrauss.free.fr/, il faut definir des variable $login et $mdp qui permettent de se connecter à un compte. Mais si elle n'ont pas de valeurs, on est renvoyé directement sur la page de login. Pour acceder au reste du site, il faut donc s'identifier, et c'est la que je bloque...
cs_DARKSIDIOUS
Messages postés15814Date d'inscriptionjeudi 8 août 2002StatutMembreDernière intervention 4 mars 2013130 15 févr. 2008 à 06:46
Salut,
Et c'est quoi le problème au juste ? La grande majorité des sites demande maintenant d'être identifiés pour pouvoir tout visiter (ce qui est normal je dirais !).
Tu cherche à faire quoi ? Un robot qui parcoure automatiquement les sites qu'il voit ?
______________________________________
DarK Sidious
badkrist
Messages postés4Date d'inscriptiondimanche 25 juin 2006StatutMembreDernière intervention16 février 2008 15 févr. 2008 à 14:30
En effet je cherche à faire un robot qui va parcourir automatiquement le site internet selectionner.
Sachant que l'utilisateur aura obligatoirement les noms des variables ainsi que leurs valeurs pour s'identifier.
Ainsi comment faire pour donner des valeurs aux variables d'identification.
kishkaya
Messages postés365Date d'inscriptionsamedi 26 juin 2004StatutMembreDernière intervention17 avril 2008 15 févr. 2008 à 20:56
Bonjour,
Ou alors tu utilises le DOM XML (ca marchera que si le site est xhtml), et tu cherche un noeud , généralement c'est le champ mot de passe. Tu prend le noeud input frère (regarde Xpath) et tu récupères les "id" et "name" de ces deux champs.
Après tu crées ta requete HTTP, POST ou GET (il vaut mieux que ca soit en POST pour le webmaster ;) ); pour savoir ca, tu remontes au noeud ancetre "form" et tu cherche l'attribut "method".
Apres tu ouvres une socket vers le site et tu balance ta requete.
Si c'est pas du XHTML, c'est moins facile, tu fais ca en récuperant la page et en faisant une recherche "d'input".
PS: Je serais incapable de te dire quelle API spécifique utiliser, je viens de me mettre à JAVA et j'ai pas fini les tutoriaux Sun, mais j'ai une bonne connaissanec de php<=5.
_Marikou
Vous n’avez pas trouvé la réponse que vous recherchez ?
badkrist
Messages postés4Date d'inscriptiondimanche 25 juin 2006StatutMembreDernière intervention16 février 2008 16 févr. 2008 à 18:21
Merci beaucoup! Même si je n'ai pas tout compris des différentes pistes proposées, je sais que la solution est dans ce qui se trouve au dessus, je pense plus dans la réponse d' alexN . Le problème de la solution de kishkaya c'est qu'elle n'est pas assez générique, la plupart des sites n'étant pas en xhtml, et que cela fait un grand nombre de cas à traiter.
Si vous avez d'autres explications ou d'autres pistes, je suis prenneur!