Gestion des fichiers html

danny3D Messages postés 6 Date d'inscription lundi 30 juin 2008 Statut Membre Dernière intervention 30 novembre 2008 - 16 juil. 2008 à 11:39
cs_AlexN Messages postés 694 Date d'inscription lundi 5 décembre 2005 Statut Membre Dernière intervention 8 janvier 2014 - 16 juil. 2008 à 12:59
Bonjour à tous,

je suis dans un projet où je manipulait au paravant des fichiers xml et la vie allait bon train. Mais il se fait que depuis un certain temps, les fichiers me sont envoyés au format html et c'est là que plus rien ne marche. Pour être claire et précis, les fichiers html qui me sont envoyés contiennent des tableaux d'où je dois extraire les valeurs spécifique de certaines colonnes. En voulant manipuler directement les codes sources html, je suis buté à un problème: pour une colonne donnée certain champs ont 1, 3 ou 4 caractère comme valeur; alors je me suis dit qu'il faut que je convertisse le html en xml pour que je continu mon chemin comme je le faisais avant (j'ai beau chercher comment faire cette transition...). si quelqu'un est déjà passé par cette difficulté et qu'il l'a résolue, son aide me sera très utile:
-  traitement direct du fichier en html
-  passe html vers xml
peu importe, tant que ça peut me permettre de voir le problème autrement, votre solution est la bien venue.
merci d'avance pour votre aide

3 réponses

tlaloctzin Messages postés 136 Date d'inscription mercredi 21 juin 2006 Statut Membre Dernière intervention 12 septembre 2013 3
16 juil. 2008 à 12:23
Salut , bin pour la manipulation HTML tu récuperes le code sources et tu le traite comme une String non ?

Il vaut mieu être riche et en bonne santé que pauvre et malade .
0
Twinuts Messages postés 5375 Date d'inscription dimanche 4 mai 2003 Statut Modérateur Dernière intervention 14 juin 2023 111
16 juil. 2008 à 12:33
Salut,

sinon je sais qu'il existe une API qui permet de faire la translation HTML->XML mais je ne me souvient plus du nom...

------------------------------------
"On n'est pas au resto : ici on ne fait pas dans les plats tout cuits ..."

OoWORAoO
0
cs_AlexN Messages postés 694 Date d'inscription lundi 5 décembre 2005 Statut Membre Dernière intervention 8 janvier 2014 19
16 juil. 2008 à 12:59
sourceforge -> htmlparser est un bon analyseur de html,
Permet l'extraction de nœuds, de liste de nœuds et de données, la manipulation du DOM et la conversion html -> xml
0
Rejoignez-nous