Ocr (utilisation de tessnet2.dll)

Soyez le premier à donner votre avis sur cette source.

Vue 22 666 fois - Téléchargée 3 181 fois


Description

Après de longue recherche pour extraire du texte depuis une image, j'ai enfin trouvé la dll Tessnet2.dll (open source)
Il s'agit d'une adaptation en .Net du code maintenu par google : tesseract-ocr

Le code présent ici n'est qu'un exemple d'utilisation de la DLL. Il s'agit d'une traduction et adaptation de l'exemple en C# fourni avec le CS de la DLL.

Rien de plus simple. Vous choisissez une image, puis vous cliquez sur OCR.

Attention : pour fonctionner vous devez posséder
1° - la dll tessnet2_32.dll disponible dans ce zip : http://www.pixel-technology.com/freeware/tessnet2/bin.zip
2° - le dictionnaire français (à placer dans le dossier Lang) disponible ici : http://tesseract-ocr.googlecode.com/files/tesseract-2.00.fra.tar.gz

Conclusion :


Code source de la DLL disponible ici :
http://www.pixel-technology.com/freeware/tessnet2/

Tous les dictionnaires disponibles ici :
http://code.google.com/p/tesseract-ocr/downloads/list

Codes Sources

A voir également

Ajouter un commentaire

Commentaires

wahab007
Messages postés
7
Date d'inscription
lundi 31 décembre 2007
Statut
Membre
Dernière intervention
17 août 2010
-
salut bouv il est formidable ce code, c'est une grande avancée. courage. il n ya pas un moyen d'utiliser cette dll avec vb6. merci
Adn56
Messages postés
1220
Date d'inscription
jeudi 24 mai 2007
Statut
Membre
Dernière intervention
28 septembre 2013
1 -
Clair ! sympa comme tout, merci !
Tu crois que bientôt il corrigera les fautes d'hortographes MDR ^__^
bouv
Messages postés
1429
Date d'inscription
mercredi 6 août 2003
Statut
Membre
Dernière intervention
3 mars 2019
-
Merci pour vos commentaires.

Wahab007>>Avec VB6 je ne pense pas. Va falloir te mettre en .NET

Adn56>>Pour l'orthographe... ça dois pouvoir se faire sans trop de mal grâce au dictionnaire fourni. Mais ce n'est pas dans mes projets.

Par contre j'envisage d'utiliser ce code dans mon logiciel de OpenTwain pour la génération de PDF.
Plutot que d'ajouter un JPG au PDF je pourrais ajouter directement le texte du document pour réduire la taille des fichiers.
Ou pourquoi pas ajouter le texte masqué derrière le JPG pour conserver une fidélité au document source et également pouvoir effectuer des recherches Full Text dans le contenu des PDF.
Les PDF pourraient être générés au choix avec ou sans OCR. Mais il faut que je trouve un peu de temps pour tout ça.

Bonne prog
++
cs_bigboss9
Messages postés
162
Date d'inscription
jeudi 22 janvier 2004
Statut
Membre
Dernière intervention
20 juillet 2013
-
Enfin quelqu'un se réveil sur ce site !
cs_Patrice99
Messages postés
1222
Date d'inscription
jeudi 23 août 2001
Statut
Membre
Dernière intervention
9 septembre 2018
-
Super : je vais sans doute pouvoir récupérer les dico dans plusieurs langues pour mon indexeur de documents ! (VBTextFinder)

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.