ramzisigne
Messages postés1Date d'inscriptiondimanche 10 décembre 2000StatutMembreDernière intervention 6 mai 2008
-
6 mai 2008 à 20:36
cs_Malti
Messages postés1Date d'inscriptionmardi 3 février 2009StatutMembreDernière intervention 3 février 2009
-
3 févr. 2009 à 13:48
Bonjour.
j'utilise l'API lucene. Le pb que je rencontre et avec la langue francaise. Les mots avec les lettres accntuées cedille et autre... sont divisés en deux . par exemple le token "française" est divisée en deux autre "franç" et "aise".
J'utilisais l'analyzer standard. Puis j'ai importé l'analyzer francai, mais tjrs le meme pb. Je travaille sur le systeme windows(XP), le codage utilisé est Cp1252. les fichiers sur lesquels l'indexation s efauit sont en UTF-8.
Ou est ce qu'il est le pb!!
Mrci d'avance!!
cs_Malti
Messages postés1Date d'inscriptionmardi 3 février 2009StatutMembreDernière intervention 3 février 2009 3 févr. 2009 à 13:48
Lucene est un moteur contenant une librairie avec des API pouvant suporter les caracteres autre que latin. Si votre source a généré les .class, assurez vous que le conteneur contient les .class et le descripteur