Pilotage Scanner et/ou Adobe Capture

cs_lawraC Messages postés 90 Date d'inscription mercredi 11 juin 2003 Statut Membre Dernière intervention 3 février 2011 - 7 déc. 2004 à 17:18
cs_lawraC Messages postés 90 Date d'inscription mercredi 11 juin 2003 Statut Membre Dernière intervention 3 février 2011 - 8 déc. 2004 à 14:54
Bon, je sais que la question va en effrayer plus d'un et/ou plus d'une, mais voilà ce que j'aimerais faire. Un service utilise Adobe Capture pour transformer des documents papiers en documents pdf OCR-isés (c'est à dire avec reconnaissance des caractères, le document pdf contient un ensemble de mots et pas une image des mots).
Et je me demandais s'il était imaginable, depuis une appli .net, de piloter ce genre de truc.

Et qu'en est-il de la transformation d'un document numérique en document pdf ?

En bref, vous feriez comment-vous ? Hein ?

lawraC
A voir également:

2 réponses

nimp0001 Messages postés 26 Date d'inscription vendredi 19 septembre 2003 Statut Membre Dernière intervention 14 mars 2007
8 déc. 2004 à 13:51
Bonjour,
Voilà un sujet interessant !

Pour ma part, je me suis un peu renseigné la dessus.
Pour le pilotage de scanner, je crois, que, dans les anciennes version de windows, les pilots TWAIN servent à ça. Mais je pense que c'est plus ou moins plus à la mode.
Voici quelques liens que j'ai trouvé il y a 3 ou 4 mois ur ce sujet :

http://www.atalasoft.com/components/dotImage/Twain.aspx
C'est une boite qui propose une api (a vendre bien) pour piloter le scan

http://www.buzzsoft.com/fra/devtk.html
La même chose, mais en français et pour 150$ environ

http://www.accusoft.com/imaging/imagegear/ig_about.asp
Pareil, encore une boite qui dit que son api est meilleure que les autres.

http://www.leadtools.com/utilities/utilities.htm
Encore pareil...

http://msdn.microsoft.com/library/default.asp?url=/library/en-us/stillimg/sti_7e2b.asp
Le lien MSDN vers l'acquisition d'image. Très interessant.

http://www.twain.org/
Le site Twain officiel.

Pour la partie OCR, je n'ai pas retrouvé mes liens, c'est un peu le souk dans mes favoris. Cependant, si ma mémoire est bonne, il y a des API à vendre dans les 300/400$. Tout dépend de ce qu'il faut reconnaitre. S'il s'agit de document imprimé, ça doit rester assez simple de trouver un produit OCR interessant et abordable en terme de tarif.

Pour ce qui est de l'export des documents, en PDF,je n'ai pas cherché mais j'imagine qu'il doit y avoir des librairies gratuites un peu partout. Etant donné qu'on trouve des logiciels de transformation en PDF dans tous les coins, doit y avoir des choses simples un peu partout.

Pour ma part, j'aurais tendance à faire un soft en 2 parties. Une première brique, optionnelle, qui permettrait de scanner un document et une seconde brique, plus complexe, qui émule une imprimante et qui se charge de la partie OCR et sauvegarde du document dans un format approprié. L'émulation d'imprimante est interessante car on peut alors sauvegarder des documents qui sorte de Word, Excel ou autre. Bien sûr, tout dépend ensuite de ce que vous voulez OCRiser.

Cdt,

Nimp
0
cs_lawraC Messages postés 90 Date d'inscription mercredi 11 juin 2003 Statut Membre Dernière intervention 3 février 2011
8 déc. 2004 à 14:54
En fait, il s'agit pour moi de faire une V2 d'un outil de gestion de document que j'avais déjà réalisé.
Le truc, c'est que dans la V1, y'avait d'un coté l'appli (web) d'indexation et de consultation et de l'autre Adobe Acrobate Capture qui gère la numérisation et l'OCR-isation à l'issue du scanner.

Pour l'instant j'en suis là :
- plutôt que de devoir fournir deux logiciels séparés, dont un externe à l'entreprise, j'aimerais pouvoir faciliter le pilotage à partir d'une seule console.
- j'ai surfé un peu hier, et il semble que la transformation pdf soit possible. C'est à creuser également.
- les documents à scanner peuvent être à OCR-iser ou non
- je ne suis absolument pas sûre de pouvoir y arriver, ou de faire en sorte que mon équipe y arrive dans les délais impartis.

Mais, il faut chercher. Peut-être essayer de combiner plusieurs pistes.

On se tient informé.
Lawra C.
0
Rejoignez-nous