Aspirateur d' urls dans le code html d'une page web

Soyez le premier à donner votre avis sur cette source.

Vue 17 131 fois - Téléchargée 631 fois

Description

tout est dans le titre, ce code est simple il cherche les urls dans le code source
d' une page internet spécifiée.

Source / Exemple :


#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys

if len(sys.argv) != 2:
        print "\n\n****************************************************"
        print "Aspirateur d' URL dans une Page web !!!          "
        print "********************************************************"
        print "\nUsage : ./aspy.py <page_web>            "
        print "ex: ./aspy.py http://www.exemple.com          "
        print "\n******************************************************"
        sys.exit(1)

# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
        def reset(self):
                SGMLParser.reset(self)
                self.urls = []

        def start_a(self, attrs):
                href = [v for k, v in attrs if k=='href']
                if href:
                        self.urls.extend(href)

if __name__ == "__main__":

        import urllib
        print "\n##########################################################"
        print "#                                                        #"
        print "#               ASPY-1.0 By tOnyH2 JfF                   #"
        print "#           contact : grunt_tony@hotmail.fr              #"
        print "#                                                        #"
        print "##########################################################\n"
        link = sys.argv[1]
        try:
                usock = urllib.urlopen(link)
                parser = URLLister()
                parser.feed(usock.read())
                parser.close()
                usock.close()
                for url in parser.urls: print url
        except:
                print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"

Codes Sources

A voir également

Ajouter un commentaire

Commentaire

cs_miss fafa
Messages postés
46
Date d'inscription
mercredi 4 avril 2007
Statut
Membre
Dernière intervention
25 février 2009
-
mais comment utiliser ce programme

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.