[vb.net] Extraire tables d'une page html vers datatable
Julian50
Messages postés13Date d'inscriptionmardi 4 mai 2010StatutMembreDernière intervention18 août 2011
-
4 juin 2011 à 12:43
nhervagault
Messages postés6063Date d'inscriptiondimanche 13 avril 2003StatutMembreDernière intervention15 juillet 2011
-
4 juin 2011 à 23:44
Cette page contient plusieurs tables. J'aimerais extraire le contenu textuel de toutes les tables et les stocker dans des datatables.
J'ai essayé avec le regex mais j'ai l'impression de ré-inventer la poudre. De plus, avec le regex il faut nettoyer le contenu des tableaux (ex liens, gras, souligné, etc) et je trouve cela lourd car il faut penser à toutes les balises possibles.
Il y a t-il des fonctions du framework permettant cette extraction ? Si oui, merci de me donner un petit exemple.
Merci
A voir également:
[vb.net] Extraire tables d'une page html vers datatable
nhervagault
Messages postés6063Date d'inscriptiondimanche 13 avril 2003StatutMembreDernière intervention15 juillet 201137 4 juin 2011 à 23:44
salut,
Les regexp semblent adaptés,
il y a aussi la possibilité d'utiliser des split pour les tableaux internes.
Technique :
regexp de regexp
une regexp pour capturer les differents tableaux,
une regexp pour capturer chaque ligne
une formule pour nettoyer les données
trim, suppression gras, gestion absences de données....