Récupérer des sous-chaines dans un code html

cs_zarzar Messages postés 38 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 7 juillet 2006 - 1 juin 2006 à 22:44
cs_coq Messages postés 6349 Date d'inscription samedi 1 juin 2002 Statut Membre Dernière intervention 2 août 2014 - 2 juin 2006 à 19:30
bonsoir
voici le problème auquel je suis confronté
j'aimerais etre capable d'aller chercher dans un code source html (peut importe en fait que ça soit du html, mais c'est mon cas) du texte à des endroits précis
je m'explique, je veux récupérer quelques éléments textuels générés par une page web
j'arrive à récupérer dans mon code c# ma page (son source) : j'ai tout mon source dans une string maPage par exemple

maintenant imaginons que cette page est tjs présentée pareil mais que le texte peut changer
exemple au beau milieu du code :


...etc <td width="158" align="right" valign="bottom">Blabla</td>....etc
et puis un autre coup
<td width="158" align="right" valign="bottom">Blibli</td>

moi l'info pertinente que je veux extraire de la string maPage c'est justement par exemple ces Blabla et Blibli

je ne sais pas trop comment m'y prendre ? entre les substring ? les expressions régulières ?

si vous avez pas trop pigé, dites-moi, je completerais

merci bcp d'avance à ceux qui me débloqueraint

5 réponses

cs_coq Messages postés 6349 Date d'inscription samedi 1 juin 2002 Statut Membre Dernière intervention 2 août 2014 101
1 juin 2006 à 22:58
Salut,

Essaie de regarder du côté des expressions régulières, tu devrais trouver pas mal d'exemples permettant de parser du code html.

/*
coq
MVP Visual C#
*/
0
cs_Bidou Messages postés 5487 Date d'inscription dimanche 4 août 2002 Statut Membre Dernière intervention 20 juin 2013 61
1 juin 2006 à 23:04
Hi,
Si tu décides d'utiliser la solution de coq, alors tu peux jeter un oeil sur cette source.
Elle utilise les expressions régulières pour retrouver les informations (en l'occurance, des films).

<hr size= "2" /> VC# forever
=13319
0
sebmafate Messages postés 4936 Date d'inscription lundi 17 février 2003 Statut Membre Dernière intervention 14 février 2014 37
2 juin 2006 à 09:49
Regex power

donc : l'expression régulière pour recherche un tag html : (<[^>]+>)

pour épurer ton text : string stripHtml = Regex.Replace( html, "(<[^>]+>)", string.Empty );

où html est la variable contenant ton code HTML.

Sébastien FERRAND (
blog)
Consultant Indépendant
[Microsoft MVP Visual C#]
0
sebmafate Messages postés 4936 Date d'inscription lundi 17 février 2003 Statut Membre Dernière intervention 14 février 2014 37
2 juin 2006 à 09:50
j'oublié... pour tester les expressions régulières : http://www.csharpfr.com/codes/MAFTOOLS-TESTEUR-EXPRESSIONS-REGULIERES_36931.aspx

Sébastien FERRAND (
blog)
Consultant Indépendant
[Microsoft MVP Visual C#]
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
cs_coq Messages postés 6349 Date d'inscription samedi 1 juin 2002 Statut Membre Dernière intervention 2 août 2014 101
2 juin 2006 à 19:30
Ah oui j'avais complètement oublier l'existance de ta source Bidou

/*
coq
MVP Visual C#
*/
0
Rejoignez-nous