akazukin_chacha
Messages postés8Date d'inscriptionmercredi 2 juin 2004StatutMembreDernière intervention 6 octobre 2004
-
3 oct. 2004 à 21:37
akazukin_chacha
Messages postés8Date d'inscriptionmercredi 2 juin 2004StatutMembreDernière intervention 6 octobre 2004
-
5 oct. 2004 à 17:09
Salut,
dans le but de récupérer toutes les infos de prix de plusieurs sites (pas d'espionnage mais future base de données de magasin), je voudrais récupérer les pages web de ces sites.
Malheureusement, dès que les requêtes au serveur deviennent trop nombreuses ou à cause d'une autre raison, je n'en sais rien, je finis par avoir des réponses du type
"Aborted...
The page you requested can not be displayed. Reasons for this can be
Your web browser does not conform to HTTP3.2 standards
You used a non-qualified robot to access our pages
If you have problems scanning our pages by a robot, please make sure your robot uses a proper HTTP User Agent and quote it in your e-mail to robots@play-asia.com along with supporting information.
You may try to refresh the page to see if the problem persists. Press F5 for this in most browsers.
We apologize for any inconvenience caused. "
Bon je me doute bien qu'il doit y avoir une feinte avec le champ user-agent mais j'ai même essayé de générer des strings différentes pour chaque requête, rien n'y fait.
cs_Crazyht
Messages postés1522Date d'inscriptionmardi 18 décembre 2001StatutMembreDernière intervention21 août 20108 5 oct. 2004 à 13:32
En fait tu tombes sur un anti-aspirateur de site, dommage pour toi, mais soit le site en question te donne les acces (et dans ce cas, il t'expliqueront quoi mettre où), soit tu est bloqué :)
D'ailleurs, ce genre de chose peut etre considéré comme une attaque DoS et est à la limite de la legalité !