L'information mutuelle adaptée(IMA)..

theemilog Messages postés 3 Date d'inscription mercredi 17 février 2010 Statut Membre Dernière intervention 20 novembre 2012 - 14 mars 2012 à 04:46
theemilog Messages postés 3 Date d'inscription mercredi 17 février 2010 Statut Membre Dernière intervention 20 novembre 2012 - 15 mars 2012 à 10:40
bonjour,
je travaille sur un sujet qui concerne "l'extraction des termes".
pour extraire les mots composés je vais utiliser la méthode de l'information mutuelle adaptée(IMA) qui a la formule suivante:
IMA(mi,mj)=-log2(f(mi,mj)/f(mi)*f(mj))
donc pour selectionner les mots qui sont des mots composés il faut que la valeur de l'IMA dépasse un certain seuil.
svp qu'elle est la valeur de ce seuil??? s'il y'a des gens qu'ils ont travaillé sur des sujets parailles dites moi le seuil que vous aviez fixé
merciiiii.
cordialement.

2 réponses

cs_Julien39 Messages postés 6414 Date d'inscription mardi 8 mars 2005 Statut Modérateur Dernière intervention 29 juillet 2020 371
14 mars 2012 à 08:29
Bonjour,

Je ne connais rien à tout ca mais je pense que tu peux la déterminer empiriquement non ? Tu testes pour un ensemble de mots et tu vois quel seuil est adapté...
0
theemilog Messages postés 3 Date d'inscription mercredi 17 février 2010 Statut Membre Dernière intervention 20 novembre 2012
15 mars 2012 à 10:40
Julien39

non ce n'est pas pratique car les documents se different l'un par rapport aux autres..ce qui est adapté à un document il ne sera pas le meme pour d'autres.ca dependera tjrs du contenu du texte...car j'ai essayé un exemple pour un texte..et j'ai essayé avec un autre le seuil que j'ai pris a ignoré enormemnts de mots importants dans le 2eme texte...donc c'est pas evident du tt !!!
mercii pour votre contribution
0
Rejoignez-nous