Indexation avec lucene et J2EE

ninasili Messages postés 2 Date d'inscription vendredi 13 mai 2011 Statut Membre Dernière intervention 8 juin 2011 - 7 juin 2011 à 17:31
ninasili Messages postés 2 Date d'inscription vendredi 13 mai 2011 Statut Membre Dernière intervention 8 juin 2011 - 8 juin 2011 à 19:57
Bonsoir à tous,
je suis débutante avec l'utilisation du lucene, je suis en stage de fin d’étude et on m'a charger de développer un moteur de recherche pour l'entreprise qui permet d'indexer et de récupérer tous les types de documents
je travail avec Netbeans et J2EE (jsp et sevlet),
d'aprés mes recherche, j'ai trouvé que lucene ne permet que l'indexation du fichiers txt,donc j'assaye de convertir le contenu des pdf et documents office en txt à l'aide de PDFBox et POI pour les documents Office, mais ça marche pas
si quelqu’un aurait des suggestions je serai très reconnaissante
je vous remercie par avance.

2 réponses

cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
8 juin 2011 à 14:59
Que signifie "mais ça marche pas", quelle est l'erreur précisément ?
0
ninasili Messages postés 2 Date d'inscription vendredi 13 mai 2011 Statut Membre Dernière intervention 8 juin 2011
8 juin 2011 à 19:57
Pour l'instant j'ai commencé avec les pdf.
Au début il y avait des erreurs de bibliothèque, il ne détectait pas une classe de pdfbox, j'ai ajouté fontbox et il ne retourne plus d'erreurs, mais quand je tape un mot qui existe dans le fichier pdf, il m’affiche qu'il n'y a aucun fichier qui correspond à ma recherche
merci pour vos réponses
0
Rejoignez-nous