danny3D
Messages postés6Date d'inscriptionlundi 30 juin 2008StatutMembreDernière intervention30 novembre 2008
-
16 juil. 2008 à 11:39
cs_AlexN
Messages postés694Date d'inscriptionlundi 5 décembre 2005StatutMembreDernière intervention 8 janvier 2014
-
16 juil. 2008 à 12:59
Bonjour à tous,
je suis dans un projet où je manipulait au paravant des fichiers xml et la vie allait bon train. Mais il se fait que depuis un certain temps, les fichiers me sont envoyés au format html et c'est là que plus rien ne marche. Pour être claire et précis, les fichiers html qui me sont envoyés contiennent des tableaux d'où je dois extraire les valeurs spécifique de certaines colonnes. En voulant manipuler directement les codes sources html, je suis buté à un problème: pour une colonne donnée certain champs ont 1, 3 ou 4 caractère comme valeur; alors je me suis dit qu'il faut que je convertisse le html en xml pour que je continu mon chemin comme je le faisais avant (j'ai beau chercher comment faire cette transition...). si quelqu'un est déjà passé par cette difficulté et qu'il l'a résolue, son aide me sera très utile:
- traitement direct du fichier en html
- passe html vers xml
peu importe, tant que ça peut me permettre de voir le problème autrement, votre solution est la bien venue.
merci d'avance pour votre aide
cs_AlexN
Messages postés694Date d'inscriptionlundi 5 décembre 2005StatutMembreDernière intervention 8 janvier 201419 16 juil. 2008 à 12:59
sourceforge -> htmlparser est un bon analyseur de html,
Permet l'extraction de nœuds, de liste de nœuds et de données, la manipulation du DOM et la conversion html -> xml