Aspirateur d' urls dans le code html d'une page web

Description

tout est dans le titre, ce code est simple il cherche les urls dans le code source
d' une page internet spécifiée.

Source / Exemple :


#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys

if len(sys.argv) != 2:
        print "\n\n****************************************************"
        print "Aspirateur d' URL dans une Page web !!!          "
        print "********************************************************"
        print "\nUsage : ./aspy.py <page_web>            "
        print "ex: ./aspy.py http://www.exemple.com          "
        print "\n******************************************************"
        sys.exit(1)

# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
        def reset(self):
                SGMLParser.reset(self)
                self.urls = []

        def start_a(self, attrs):
                href = [v for k, v in attrs if k=='href']
                if href:
                        self.urls.extend(href)

if __name__ == "__main__":

        import urllib
        print "\n##########################################################"
        print "#                                                        #"
        print "#               ASPY-1.0 By tOnyH2 JfF                   #"
        print "#           contact : grunt_tony@hotmail.fr              #"
        print "#                                                        #"
        print "##########################################################\n"
        link = sys.argv[1]
        try:
                usock = urllib.urlopen(link)
                parser = URLLister()
                parser.feed(usock.read())
                parser.close()
                usock.close()
                for url in parser.urls: print url
        except:
                print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"

Codes Sources

A voir également

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.