Classification de document xml, textmining

Utilisateur anonyme - 3 juin 2011 à 14:44
 Utilisateur anonyme - 12 juil. 2011 à 16:56
salut à tous, c'est ma première question que je pose dans ce forum.:)
voilà, je suis en stage et je suis entrain de développer un outil pour détecter les cv.
mais mon problème se pose au niveau des attributs, je sais que je doit trouver des attributs caractéristique des cv mais j'arrive pas à développer une application qui fait ça, en plus je trouve que c'est une perte de temps d'écrire un algo complexe pour l'utiliser juste une fois, j'essaye de savoir si il existe un outil qui fait ce genre de chose. et pour le calcule des poids des attributs existe il une formule pour ça.
je sais que ma question est un peu vague et je développerais mon problème en fonction des questions que vous allez me poser.
je suis ouvert à toute suggestion.
Ps :je travail sous java.

4 réponses

cs_Julien39
Messages postés
6414
Date d'inscription
mardi 8 mars 2005
Statut
Modérateur
Dernière intervention
29 juillet 2020
366
4 juin 2011 à 17:45
Que doit faire ton application ? que signifie "Détecter les cv" ? Je ne comprend rien.
0
Utilisateur anonyme
6 juil. 2011 à 12:16
salut, Merci de me repondre,
detecter les cv veut dire que j'essaye de faire un classifieur pour classer les document en deux classes, une classe qui represente les cv, et une classe qui represente les non cv.
donc en resumé mon appli est un classifieur de cv et non-cv
0
cs_Julien39
Messages postés
6414
Date d'inscription
mardi 8 mars 2005
Statut
Modérateur
Dernière intervention
29 juillet 2020
366
8 juil. 2011 à 11:40
L'idée est de lister les caractéristiques d'un cv : les mots qu'on y retrourve généralement.

Puis en fonction des mots présent dans le document, tu créé une note et en fonction de la note tu dit si oui ou non le doc est un cv.

A toi de jouer.
0
Utilisateur anonyme
12 juil. 2011 à 16:56
Bonjour,
J'utilise le même principe mais un peut plus poussé, mais mon problème est que mon deco (...les mots qu'on y retrourve généralement) n'est pas beaucoup riche, et je cherche sur le net je n'en trouve pas, donc j'essaye d'enrechire mon deco si vous avez des liens ou de la doc qui se rapporte à ce contexte
0