Récuperer le contenu d'un document Word pour indexation
Vince66
Messages postés28Date d'inscriptionmardi 10 février 2004StatutMembreDernière intervention 5 octobre 2011
-
13 févr. 2006 à 18:59
coucou747
Messages postés12303Date d'inscriptionmardi 10 février 2004StatutMembreDernière intervention30 juillet 2012
-
13 févr. 2006 à 19:12
Bonjour,
je suis actuellement en train de développer en PHP un gestionnaire de documents avec un système d'indexation.
Pour l'instant, je n'index que les documents pdf grâce à pdftotext qui fonctionne à merveille.
Seulement, maintenant, je voudrais attaquer Word et Excel mais je n'ai trouvé aucun moyen de lire le contenu des fichiers en clair (il reste tout cet amas de hieroglyphes autour du texte). Evidemment, il faut que la solution fonctionne sous Linux :-)
Avez vous une idée sur la manière de procéder ?
Merci d'avance pour vos réponses. :-)
A voir également:
Récuperer le contenu d'un document Word pour indexation