Lucene API

ramzisigne Messages postés 1 Date d'inscription dimanche 10 décembre 2000 Statut Membre Dernière intervention 6 mai 2008 - 6 mai 2008 à 20:36
cs_Malti Messages postés 1 Date d'inscription mardi 3 février 2009 Statut Membre Dernière intervention 3 février 2009 - 3 févr. 2009 à 13:48
Bonjour.
j'utilise l'API lucene. Le pb que je rencontre et avec la langue francaise. Les mots avec les lettres accntuées cedille et autre... sont divisés en deux . par exemple le token "française" est divisée en deux autre "franç" et "aise".
J'utilisais l'analyzer standard. Puis j'ai importé l'analyzer francai, mais tjrs le meme pb. Je travaille sur le systeme windows(XP), le codage utilisé est Cp1252. les fichiers sur lesquels l'indexation s efauit sont en UTF-8.
Ou est ce qu'il est le pb!!
Mrci d'avance!!

1 réponse

cs_Malti Messages postés 1 Date d'inscription mardi 3 février 2009 Statut Membre Dernière intervention 3 février 2009
3 févr. 2009 à 13:48
Lucene est un moteur contenant une librairie avec des  API pouvant suporter les caracteres autre que latin. Si votre source a généré les .class, assurez vous que le conteneur contient les .class et le descripteur
0
Rejoignez-nous