Conversion PDF vers TEXT

cs_deadisdead Messages postés 31 Date d'inscription jeudi 12 février 2004 Statut Membre Dernière intervention 30 septembre 2008 - 16 févr. 2007 à 11:08
nikal86 Messages postés 3 Date d'inscription lundi 5 avril 2004 Statut Membre Dernière intervention 15 juillet 2008 - 10 juil. 2008 à 21:09
Bonjour à tous,

Je cherche simplement à récupérer le texte contenu dans un PDF pour l'analyser. Sur le papier, ça ne semble pas très compliqué car je n'ai ni besoin de la mise en forme, ni besoin des images, ... mais après de nombreuses heures de recherche, je n'ai rien pu trouver. Est-ce que quelqu'un aurait une idée, voir un OCX à me proposer ?

Merci d'avance de votre aide !

7 réponses

tikrimi Messages postés 192 Date d'inscription dimanche 5 janvier 2003 Statut Membre Dernière intervention 9 mars 2007 1
16 févr. 2007 à 11:24
Hello,

Je recherche la même chose que toi.
Pour l'insant j'ai touvé http://itextsharp.sourceforge.net/ dont tu peux avoir un exemple d'utilisation ((http://www.codeproject.com/useritems/PDFToText.asp) pour extraire le texte.
Ca marche, mais le résultat est pas top, et surtout moins bon que si on fait un copier coller depuis acrobat reader.
Si tu trouves mieux, je suis preneur.

TiK - MCSD.NET
http://www.blogatik.com/
http://www.objectif-services.com/
0
cs_thephil Messages postés 189 Date d'inscription mercredi 21 août 2002 Statut Membre Dernière intervention 19 janvier 2011
16 févr. 2007 à 12:06
il existe un outil : Convert Doc, y'a un mode manuel et mode batch (qui permet donc de l'utiliser via Vb)
Très efficace. Après si c'est pour une utilisation pro, y'a une licence.
Mais c'est toujours bon à connaitre à mon avis !
0
cs_deadisdead Messages postés 31 Date d'inscription jeudi 12 février 2004 Statut Membre Dernière intervention 30 septembre 2008
16 févr. 2007 à 13:45
J'ai trouvé également un truc qui s'appelle PDFText mais comme Convert Doc, ce sont des shareware et j'aimerais trouver quelque chose de non limité. De plus, étant donné que c'est pour une toute petite partie de mon programme, je ne veux pas mettre des ronds dans un truc pareil.
0
benjislide Messages postés 2 Date d'inscription mardi 10 juin 2003 Statut Membre Dernière intervention 16 mars 2007
16 mars 2007 à 11:59
après plusieurs jours de recherche pour le même problème, j'ai téléchargé xpdf
qui est un open source donc gratuit et dans le répertoire de xpdf il y a un exe qui est pdftotext.exe.
en lançant un shell depuis vb shell pdftotexte.exe nomfichier.pdf nomfichier.text,vbhide
il fonctionne parfaitement et en masquant la fenetre dos avec vbhide le résultat est pour moi parfait
polo
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
cs_thephil Messages postés 189 Date d'inscription mercredi 21 août 2002 Statut Membre Dernière intervention 19 janvier 2011
16 mars 2007 à 12:09
à essayer.
merci pour l'info en tout cas !
0
cs_thephil Messages postés 189 Date d'inscription mercredi 21 août 2002 Statut Membre Dernière intervention 19 janvier 2011
16 mars 2007 à 14:37
j'ai testé, parfait ce p'tit open source,
marche impec !
+ d'autres fonctions intéressantes

merci Benjislide pour tes recherches.
0
nikal86 Messages postés 3 Date d'inscription lundi 5 avril 2004 Statut Membre Dernière intervention 15 juillet 2008
10 juil. 2008 à 21:09
Bonjour,
Je débute dans vb et j'aurai besoin d'utiliser xpdf. J'ai télécharger le fichier .zip. Mais je ne sais pas comment l'utiliser dans mon code. Comment je dois faire pour que visual basic comprenne que j'ai xpdf??

Nico
0
Rejoignez-nous