indexation avec lucene et J2EE

Question

Bonsoir à tous,
je suis débutante avec l'utilisation du lucene, je suis en stage de fin d&#8217;étude et on m'a charger de développer un moteur de recherche pour l'entreprise qui permet d'indexer et de récupérer tous les types de documents
je travail avec Netbeans et J2EE  (jsp et sevlet),
d'aprés mes recherche, j'ai trouvé que lucene ne permet que l'indexation du fichiers txt,donc j'assaye de convertir le contenu des pdf et documents office en txt à l'aide de PDFBox et POI pour les documents Office, mais ça marche pas
si quelqu&#8217;un aurait des suggestions je serai très reconnaissante 
je vous remercie par avance.

cs_Julien39 · Answer

Que signifie "mais ça marche pas", quelle est l'erreur précisément ?

ninasili · Answer

Pour l'instant j'ai commencé avec les pdf.
Au début il y avait des erreurs de bibliothèque, il ne détectait pas une classe de pdfbox, j'ai ajouté fontbox et il ne retourne plus d'erreurs, mais quand je tape un mot qui existe dans le fichier pdf, il m&#8217;affiche qu'il n'y a aucun fichier qui correspond à ma recherche
merci pour vos réponses

Indexation avec lucene et J2EE

2 réponses

Votre réponse

Discussions similaires