Récuperer code sources page

Signaler
Messages postés
3
Date d'inscription
samedi 13 décembre 2008
Statut
Membre
Dernière intervention
26 février 2010
-
Messages postés
3
Date d'inscription
samedi 13 décembre 2008
Statut
Membre
Dernière intervention
26 février 2010
-
Bonjour à tous et à toutes,

J'ai passé plus de 4h sur le net pour trouver comment récupéré le code source d'une page.
En effet, je suis en train de développer un programme de test qui permet de regarder si les normes ergonomiques sont respectées.

Avec Sélénium, j'arrive à me connecter, et à faire des choses assez sympathiques, mais rien ne me permet de récupérer entièrement le code source d'une page.
J'ai essayé avec file_gets_contents(); mais c'est que je doit passé par une phases d'authentification et quant je mêle cela avec sélénium, je récupère que le code source de la page d'authentification.

J'ai aussi essayé avec CURL, mais le problème c'est que les données de l'input submit n'a pas d'attribut value.

<li></li>


Je commence à avoir envie de laissé tomber mais je dois le faire...

Merci
En espérant de l'aide.
Chris

5 réponses

Messages postés
74
Date d'inscription
dimanche 2 avril 2006
Statut
Membre
Dernière intervention
23 juin 2010

Copie ce code dans un formulaire qui pointe vers test.php


Dans test.php met

<?php

var_dump($_POST);


Et regarde le résultat.

Si tu ne comprend pas, n'hésite pas ;)
Messages postés
3708
Date d'inscription
lundi 5 juillet 2004
Statut
Membre
Dernière intervention
27 avril 2012
30
Salut,

si les normes ergonomiques sont respectées

Bon courage !!

Si tu as une authentification la solution passe surement par cUrl.
Le mieux pour se simplifier la vie reste le couple "étude du code HTML/JS" / "analyse des trames" (type WireShark)

Sans ce couple tu risques de galérer si le site est un peu complexe : ajax, cookies, bidouilles du DOM, redirections HTTP, etc ...

Cordialement,


Kohntark -
Messages postés
3
Date d'inscription
samedi 13 décembre 2008
Statut
Membre
Dernière intervention
26 février 2010

Bonjour

J'ai trouver une solution intermédiaire.
Je passe avec Selenium RC.
Avec Curl le problème c'est qu'il y avait des champs cacher et des valeurs non défini.
Je vous remercie de vos réponse tout de même.

Cordialement

Christhemagic
Messages postés
3708
Date d'inscription
lundi 5 juillet 2004
Statut
Membre
Dernière intervention
27 avril 2012
30
Avec Curl le problème c'est qu'il y avait des champs cacher et des valeurs non défini.

D'où mon conseil d'utiliser un analyseur de trames pour connaitre avec exactitude les requêtes client / serveur échangées.
... et ce n'est certainement pas les champs cachés ou les valeurs non définies qui empêcherons cUrl de fonctionner

Cordialement,


Kohntark -
Messages postés
3
Date d'inscription
samedi 13 décembre 2008
Statut
Membre
Dernière intervention
26 février 2010

Oui mais bon j'allais pas utilisé un sniffer pour cela, surtout que c'est dans le cadre d'un stage...
Curl est puissant c'est vrai mais pas très intuitif alors qu'avec Sélénium RC tu fais juste un :
$ma_variable=this->getSource();

Un inconvénient étant que je ne prend que ce qui est entre <html></html>
mais bon...

Merci quant même ;)

Cordialement
Christhemagic