Extraire des informations d'un fichier texte

med93100 Messages postés 53 Date d'inscription lundi 24 décembre 2007 Statut Membre Dernière intervention 1 juin 2011 - 12 sept. 2009 à 15:46
tlabbe Messages postés 1 Date d'inscription dimanche 4 octobre 2009 Statut Membre Dernière intervention 4 octobre 2009 - 4 oct. 2009 à 12:48
Bonjour la compagnie ,

Je tiens deja à vous dire que je suis débutant en python ,
donc mon prolbème est la , j'ai un texte avec plein de code html
par exemple .

<html>http://salut//123415</html>
<html>http://salut//923151</html>
<html>http://salut//223424</html>
<html>http://salut//623402</html>
<html>http://salut//823411</html>

Et donc j'aimerais à chaque fois que python récupère le http://salut//######
##### etant un nombre différent à chaque fois , mais j'ai aucune mais alors aucune idée de comment procéder , pensé vous qu'il faudrait un autre language?

2 réponses

bowbz Messages postés 8 Date d'inscription jeudi 21 décembre 2000 Statut Membre Dernière intervention 2 octobre 2009
2 oct. 2009 à 14:25
Salut,

Je suis aussi débutant mais je pense que tu devrais pouvoir le faire en python, soit en utilisant un module qui "parse" du html soit en utilisant judicieusement la fonction split.
0
tlabbe Messages postés 1 Date d'inscription dimanche 4 octobre 2009 Statut Membre Dernière intervention 4 octobre 2009
4 oct. 2009 à 12:48
Bonjour med93100,

pour quelque chose de plus générique qu'un split et de plus léger qu'un parse :
Creuse du coté des exprssions régulières ( le module re en python )

exemple :

>>> import re
>>> regex = re.compile('http://salut//([0-9]+)')
>>> s = '<html>http://salut//123415</html>'
>>> print regex.search(s).group(1)
123415
>>>
0
Rejoignez-nous