Lucene API

ramzisigne
Messages postés
1
Date d'inscription
dimanche 10 décembre 2000
Statut
Membre
Dernière intervention
6 mai 2008
- 6 mai 2008 à 20:36
cs_Malti
Messages postés
1
Date d'inscription
mardi 3 février 2009
Statut
Membre
Dernière intervention
3 février 2009
- 3 févr. 2009 à 13:48
Bonjour.
j'utilise l'API lucene. Le pb que je rencontre et avec la langue francaise. Les mots avec les lettres accntuées cedille et autre... sont divisés en deux . par exemple le token "française" est divisée en deux autre "franç" et "aise".
J'utilisais l'analyzer standard. Puis j'ai importé l'analyzer francai, mais tjrs le meme pb. Je travaille sur le systeme windows(XP), le codage utilisé est Cp1252. les fichiers sur lesquels l'indexation s efauit sont en UTF-8.
Ou est ce qu'il est le pb!!
Mrci d'avance!!

1 réponse

cs_Malti
Messages postés
1
Date d'inscription
mardi 3 février 2009
Statut
Membre
Dernière intervention
3 février 2009

3 févr. 2009 à 13:48
Lucene est un moteur contenant une librairie avec des  API pouvant suporter les caracteres autre que latin. Si votre source a généré les .class, assurez vous que le conteneur contient les .class et le descripteur
0