theemilog
Messages postés3Date d'inscriptionmercredi 17 février 2010StatutMembreDernière intervention20 novembre 2012
-
14 mars 2012 à 04:46
theemilog
Messages postés3Date d'inscriptionmercredi 17 février 2010StatutMembreDernière intervention20 novembre 2012
-
15 mars 2012 à 10:40
bonjour,
je travaille sur un sujet qui concerne "l'extraction des termes".
pour extraire les mots composés je vais utiliser la méthode de l'information mutuelle adaptée(IMA) qui a la formule suivante:
IMA(mi,mj)=-log2(f(mi,mj)/f(mi)*f(mj))
donc pour selectionner les mots qui sont des mots composés il faut que la valeur de l'IMA dépasse un certain seuil.
svp qu'elle est la valeur de ce seuil??? s'il y'a des gens qu'ils ont travaillé sur des sujets parailles dites moi le seuil que vous aviez fixé
merciiiii.
cordialement.
cs_Julien39
Messages postés6414Date d'inscriptionmardi 8 mars 2005StatutModérateurDernière intervention29 juillet 2020371 14 mars 2012 à 08:29
Bonjour,
Je ne connais rien à tout ca mais je pense que tu peux la déterminer empiriquement non ? Tu testes pour un ensemble de mots et tu vois quel seuil est adapté...
theemilog
Messages postés3Date d'inscriptionmercredi 17 février 2010StatutMembreDernière intervention20 novembre 2012 15 mars 2012 à 10:40
Julien39
non ce n'est pas pratique car les documents se different l'un par rapport aux autres..ce qui est adapté à un document il ne sera pas le meme pour d'autres.ca dependera tjrs du contenu du texte...car j'ai essayé un exemple pour un texte..et j'ai essayé avec un autre le seuil que j'ai pris a ignoré enormemnts de mots importants dans le 2eme texte...donc c'est pas evident du tt !!!
mercii pour votre contribution