Analyse linguistique d'un texte français

oumaimaouma Messages postés 2 Date d'inscription lundi 9 mai 2011 Statut Membre Dernière intervention 10 mai 2011 - 9 mai 2011 à 12:53
oumaimaouma Messages postés 2 Date d'inscription lundi 9 mai 2011 Statut Membre Dernière intervention 10 mai 2011 - 10 mai 2011 à 22:37
bonjour tout le monde svp je veux un code source en Java qui permet de faire la tokenisation d'un texte en mots ensuite l'élimination des mots vides j'espère une repense urgente
Merci d'avance

3 réponses

cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
9 mai 2011 à 13:51
Pour cela, utilise les StringTokenizer


//Il y a deux expaces entre chaine et de
String chaine = "une chaine  de caractères";
StringTokenizer st = new StringTokenizer(chaine);
while (st.hasMoreTokens()) {
     System.out.println(st.nextToken());
}


Le résultat de l'output est :
une
chaine
de
caractères
0
cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
10 mai 2011 à 16:13
C'est bien quand on a un retour...
0
oumaimaouma Messages postés 2 Date d'inscription lundi 9 mai 2011 Statut Membre Dernière intervention 10 mai 2011
10 mai 2011 à 22:37
[size=100]/size

Merci bcp
0
Rejoignez-nous