Coder un aspirateur de site

monoski Messages postés 132 Date d'inscription mercredi 15 avril 2009 Statut Membre Dernière intervention 13 mai 2013 - 19 oct. 2011 à 15:01
monoski Messages postés 132 Date d'inscription mercredi 15 avril 2009 Statut Membre Dernière intervention 13 mai 2013 - 23 oct. 2011 à 01:02
J'aimerai créer un aspirateur de site paramétrable.

Une sorte de robot évoluant au sein de l'architecture d'un site et repérant par exemple les photos et les enregistrant sur mon serveur. Ou repérant le contenu d'une div au fur et à mesure de l'analyse du code.

Comment dois-je m'y prendre conceptuellement, existe-t-il des projets open-source en la matière ?

Bonne journée à tous =)

3 réponses

coucou747 Messages postés 12303 Date d'inscription mardi 10 février 2004 Statut Membre Dernière intervention 30 juillet 2012 43
20 oct. 2011 à 13:21
Bonjour,

Quand je vois une question aussi vague, j'ai toujours quelques questions :

Qu'as tu tenté ?
Qu'as tu cherché sur google ?
Ou as tu bloqué ?

Pour ce cas particulier, on peut ajouter :

Est-ce légal ?

Pour ton problème, on peut t'orienter vers les librairies de récupération de pages webs : curl par exemple, vers les librairies d'expressions régulières (pour scanner les liens et les images) comme preg_match par exemple.

Bonne recherche.

Je serais ravi de répondre plus clairement à des questions plus précises.

Cordialement,

Maxime
0
TychoBrahe Messages postés 1309 Date d'inscription samedi 31 janvier 2009 Statut Membre Dernière intervention 5 juin 2013 12
22 oct. 2011 à 00:46
Salut,

man wget pour aspirer un site.
man grep pour prendre le contenu de ton div.
0
monoski Messages postés 132 Date d'inscription mercredi 15 avril 2009 Statut Membre Dernière intervention 13 mai 2013 1
23 oct. 2011 à 01:02
Merci beaucoup :-)

Bonne journée à tous =)
0