récuperer code sources page

Question

Bonjour à tous et à toutes, J'ai passé plus de 4h sur le net pour trouver comment récupéré le code source d'une page. En effet, je suis en train de développer un programme de test qui permet de regarder si les normes ergonomiques sont respectées. Avec Sélénium, j'arrive à me connecter, et à faire des choses assez sympathiques, mais rien ne me permet de récupérer entièrement le code source d'une page. J'ai essayé avec file_gets_contents(); mais c'est que je doit passé par une phases d'authentification et quant je mêle cela avec sélénium, je récupère que le code source de la page d'authentification. J'ai aussi essayé avec CURL, mais le problème c'est que les données de l'input submit n'a pas d'attribut value.

Je commence à avoir envie de laissé tomber mais je dois le faire... Merci En espérant de l'aide. Chris

thedeejay · Answer

Copie ce code dans un formulaire qui pointe vers test.php


Dans test.php met 

<?php

var_dump($_POST);

Et regarde le résultat.

Si tu ne comprend pas, n'hésite pas ;)

kohntark · Answer

Salut,

si les normes ergonomiques sont respectées
Bon courage !!

Si tu as une authentification la solution passe surement par cUrl.
Le mieux pour se simplifier la vie reste le couple "étude du code HTML/JS" / "analyse des trames" (type WireShark)

Sans ce couple tu risques de galérer si le site est un peu complexe : ajax, cookies, bidouilles du DOM, redirections HTTP, etc ...

Cordialement,


Kohntark -

cs_christhemagic · Answer

Bonjour

J'ai trouver une solution intermédiaire.
Je passe avec Selenium RC.
Avec Curl le problème c'est qu'il y avait des champs cacher et des valeurs non défini.
Je vous remercie de vos réponse tout de même.

Cordialement

Christhemagic

kohntark · Answer

Avec Curl le problème c'est qu'il y avait des champs cacher et des valeurs non défini. 
D'où mon conseil d'utiliser un analyseur de trames pour connaitre avec exactitude les requêtes client / serveur échangées.
... et ce n'est certainement pas les champs cachés ou les valeurs non définies qui empêcherons cUrl de fonctionner 

Cordialement,


Kohntark -

cs_christhemagic · Answer

Oui mais bon j'allais pas utilisé un sniffer pour cela, surtout que c'est dans le cadre d'un stage... Curl est puissant c'est vrai mais pas très intuitif alors qu'avec Sélénium RC tu fais juste un : $ma_variable=this->getSource(); Un inconvénient étant que je ne prend que ce qui est entre mais bon... Merci quant même ;) Cordialement Christhemagic

Récuperer code sources page

5 réponses

Votre réponse

Discussions similaires