cs_EricLeRouge
Messages postés46Date d'inscriptionmardi 3 février 2004StatutMembreDernière intervention 7 décembre 2005
-
29 mai 2005 à 10:33
cs_Anthomicro
Messages postés9433Date d'inscriptionmardi 9 octobre 2001StatutMembreDernière intervention13 avril 2007
-
29 mai 2005 à 19:24
Bonjour, etudiant dans les systemes d'informations, j'aimerai me documenter afin de concevoir une mini application en php qui consisterai à extraire de l'information de documents (au format word) afin de constituer une base de conaisances.
Le probleme c'est que je n'ai pas trouvé sur internet de la documentation à ce sujet me permettant de réaliser une telle application. Je débute en php (mais je maitrise le C et java), et je connais bien le SQL.
Pourriez vous m'aider ?
Connaissez vous des liens interressants ?
Merci d'avance pour vos aides.....
cs_Anthomicro
Messages postés9433Date d'inscriptionmardi 9 octobre 2001StatutMembreDernière intervention13 avril 20078 29 mai 2005 à 13:37
Salut,
ouvrir et analyser un fichier .doc est je pense très compliqué, tu ne devrais pas trouver beaucoup de doc là dessus...
Par contre je te conseille de convertir tes fichiers en RTF ou, mieux,
en XHTML (ou XML), il te sera beaucoup plus facile d'en extraire le
contenu ensuite.
cs_EricLeRouge
Messages postés46Date d'inscriptionmardi 3 février 2004StatutMembreDernière intervention 7 décembre 2005 29 mai 2005 à 19:11
D'accord pour la conversion sous word, mais si j'ai des milliers de fichiers à traiter c'est pas génial. Il n'y a pas un mecanisme ou un algo ? Un endroit où je peux trouver ca?
Merci d'avance.
Le dire c'est bien, le faire c'est mieux ^^
Vous n’avez pas trouvé la réponse que vous recherchez ?