ninasili
Messages postés2Date d'inscriptionvendredi 13 mai 2011StatutMembreDernière intervention 8 juin 2011
-
7 juin 2011 à 17:31
ninasili
Messages postés2Date d'inscriptionvendredi 13 mai 2011StatutMembreDernière intervention 8 juin 2011
-
8 juin 2011 à 19:57
Bonsoir à tous,
je suis débutante avec l'utilisation du lucene, je suis en stage de fin d’étude et on m'a charger de développer un moteur de recherche pour l'entreprise qui permet d'indexer et de récupérer tous les types de documents
je travail avec Netbeans et J2EE (jsp et sevlet),
d'aprés mes recherche, j'ai trouvé que lucene ne permet que l'indexation du fichiers txt,donc j'assaye de convertir le contenu des pdf et documents office en txt à l'aide de PDFBox et POI pour les documents Office, mais ça marche pas
si quelqu’un aurait des suggestions je serai très reconnaissante
je vous remercie par avance.
ninasili
Messages postés2Date d'inscriptionvendredi 13 mai 2011StatutMembreDernière intervention 8 juin 2011 8 juin 2011 à 19:57
Pour l'instant j'ai commencé avec les pdf.
Au début il y avait des erreurs de bibliothèque, il ne détectait pas une classe de pdfbox, j'ai ajouté fontbox et il ne retourne plus d'erreurs, mais quand je tape un mot qui existe dans le fichier pdf, il m’affiche qu'il n'y a aucun fichier qui correspond à ma recherche
merci pour vos réponses