Aide GED/Base de connaisance

Signaler
Messages postés
46
Date d'inscription
mardi 3 février 2004
Statut
Membre
Dernière intervention
7 décembre 2005
-
Messages postés
9433
Date d'inscription
mardi 9 octobre 2001
Statut
Membre
Dernière intervention
13 avril 2007
-
Bonjour, etudiant dans les systemes d'informations, j'aimerai me documenter afin de concevoir une mini application en php qui consisterai à extraire de l'information de documents (au format word) afin de constituer une base de conaisances.
Le probleme c'est que je n'ai pas trouvé sur internet de la documentation à ce sujet me permettant de réaliser une telle application. Je débute en php (mais je maitrise le C et java), et je connais bien le SQL.
Pourriez vous m'aider ?
Connaissez vous des liens interressants ?
Merci d'avance pour vos aides.....

Le dire c'est bien, le faire c'est mieux ^^

5 réponses

Messages postés
9433
Date d'inscription
mardi 9 octobre 2001
Statut
Membre
Dernière intervention
13 avril 2007
8
Salut,



ouvrir et analyser un fichier .doc est je pense très compliqué, tu ne devrais pas trouver beaucoup de doc là dessus...



Par contre je te conseille de convertir tes fichiers en RTF ou, mieux,
en XHTML (ou XML), il te sera beaucoup plus facile d'en extraire le
contenu ensuite.



a +

<hr size="2" width="100%">




<li>Entraide, dépannage et vulgarisation informatique: Mon site de vulgarisation informatique</li>
Messages postés
46
Date d'inscription
mardi 3 février 2004
Statut
Membre
Dernière intervention
7 décembre 2005

Oui, j'ai vaguement entendu parlé de XML, d'ailleurs c'est au programme l'année prochaine. Mais comment convertir un document word au format XML ?


C'est automatique, ou il faut se débrouiller?

Le dire c'est bien, le faire c'est mieux ^^
Messages postés
9433
Date d'inscription
mardi 9 octobre 2001
Statut
Membre
Dernière intervention
13 avril 2007
8
"Mais comment convertir un document word au format XML ?"



Tu peux déjà commencer par le convertir au format HTML via Word (manuellement)



Ensuite tu extrais toutes les infos via des expressions régulières et tu convertis le tout en XML

<hr size="2" width="100%">




<li>Entraide, dépannage et vulgarisation informatique: Mon site de vulgarisation informatique</li>
Messages postés
46
Date d'inscription
mardi 3 février 2004
Statut
Membre
Dernière intervention
7 décembre 2005

D'accord pour la conversion sous word, mais si j'ai des milliers de fichiers à traiter c'est pas génial. Il n'y a pas un mecanisme ou un algo ? Un endroit où je peux trouver ca?

Merci d'avance.

Le dire c'est bien, le faire c'est mieux ^^
Messages postés
9433
Date d'inscription
mardi 9 octobre 2001
Statut
Membre
Dernière intervention
13 avril 2007
8
Je n'en connais pas, mais une recherche sur google te donnera surement plus d'infos ;-)



a ++

<hr size="2" width="100%">




<li>Entraide, dépannage et vulgarisation informatique: Mon site de vulgarisation informatique</li>