Vbdico : faire un glossaire des mots hors dictionnaire

Description

En parcourant un document Word, la liste des mots non trouvés dans le dictionnaire standard de Word (mots hors "dico") constitue de fait une liste des mots clés propres à ce document. A partir de cette liste, vous pouvez donc commencer à établir un glossaire (dictionnaire limité aux mots particuliers à un domaine) ou un index (références des mots principaux cités dans un document, avec les numéros de page correspondants). Je n'ai pas réussi à obtenir le numéro de page où chaque mot hors dico a été trouvé (cela dépend de la mise en page), mais le numéro du paragraphe est précisé. Lorsqu'un mot hors dico est présent à plusieurs reprises, la liste des numéros de paragraphe distincts est affichée après le nombre d'occurrences trouvées. Enfin, le glossaire est constitué par le tri de cette liste de mots hors dico par ordre alphabétique. Pour les gros documents, un parcours du document par la liste des sections permet de commencer l'indexation plus rapidement, et d'indiquer dans les listes les numéros de section au lieu des numéros de paragraphes. VBDico fonctionne aussi avec des documents compatibles Word : fichiers html, ...

Source / Exemple :


.zip

Conclusion :


Bonus :

- On peut aussi indexer tous les mots. Dans ce cas, on parcourt la liste complète des mots du document et on ne retient pas le numéro du mot, car cela n'a pas beaucoup d'intérêt ;

- Tri fréquentiel : au lieu de trier le glossaire par ordre aphabétique, on peut trier par ordre de fréquence décroissante des mots indexés, par exemple les néologismes les plus fréquents, ou bien carrément tous les mots les plus fréquents !

- Un mode multi-documents a été prévu. Dans ce cas, on retient le code mnémonique du document que l'on doit préciser au préalable, ce qui est beaucoup plus parlant qu'un numéro de paragraphe ou de section. Pour cela, une sauvegarde de la collection de mots du glossaire est effectuée dans un fichier VBDico.tmp, puis renommée en VBDico.dat si on souhaite conserver le résultat. Au lancement de VBDico, si ce fichier est présent, on passe automatiquement en mode multi-documents. L'indexation de tous les mots est disponible aussi en mode multi-documents (mais on ne vérifie pas si le mode d'indexation change sur plusieurs documents).

Limitations :
- Sous Word, on peut atteindre un numéro de page, de ligne ou de section, mais pas de paragraphe, ce qui limite l'intérêt de cette dernière numérotation ;
- Une seule instance de VBDico peut fonctionner à la fois, et mieux vaut ne pas utiliser Word pendant ce temps ! (en cas d'erreur, une instance invisible de VBDico.exe risque de rester en mémoire RAM).

Codes Sources

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.