Conversion PDF vers TEXT

Signaler
Messages postés
31
Date d'inscription
jeudi 12 février 2004
Statut
Membre
Dernière intervention
30 septembre 2008
-
nikal86
Messages postés
3
Date d'inscription
lundi 5 avril 2004
Statut
Membre
Dernière intervention
15 juillet 2008
-
Bonjour à tous,

Je cherche simplement à récupérer le texte contenu dans un PDF pour l'analyser. Sur le papier, ça ne semble pas très compliqué car je n'ai ni besoin de la mise en forme, ni besoin des images, ... mais après de nombreuses heures de recherche, je n'ai rien pu trouver. Est-ce que quelqu'un aurait une idée, voir un OCX à me proposer ?

Merci d'avance de votre aide !

7 réponses

Messages postés
192
Date d'inscription
dimanche 5 janvier 2003
Statut
Membre
Dernière intervention
9 mars 2007
1
Hello,

Je recherche la même chose que toi.
Pour l'insant j'ai touvé http://itextsharp.sourceforge.net/ dont tu peux avoir un exemple d'utilisation ((http://www.codeproject.com/useritems/PDFToText.asp) pour extraire le texte.
Ca marche, mais le résultat est pas top, et surtout moins bon que si on fait un copier coller depuis acrobat reader.
Si tu trouves mieux, je suis preneur.

TiK - MCSD.NET
http://www.blogatik.com/
http://www.objectif-services.com/
Messages postés
189
Date d'inscription
mercredi 21 août 2002
Statut
Membre
Dernière intervention
19 janvier 2011

il existe un outil : Convert Doc, y'a un mode manuel et mode batch (qui permet donc de l'utiliser via Vb)
Très efficace. Après si c'est pour une utilisation pro, y'a une licence.
Mais c'est toujours bon à connaitre à mon avis !
Messages postés
31
Date d'inscription
jeudi 12 février 2004
Statut
Membre
Dernière intervention
30 septembre 2008

J'ai trouvé également un truc qui s'appelle PDFText mais comme Convert Doc, ce sont des shareware et j'aimerais trouver quelque chose de non limité. De plus, étant donné que c'est pour une toute petite partie de mon programme, je ne veux pas mettre des ronds dans un truc pareil.
Messages postés
2
Date d'inscription
mardi 10 juin 2003
Statut
Membre
Dernière intervention
16 mars 2007

après plusieurs jours de recherche pour le même problème, j'ai téléchargé xpdf
qui est un open source donc gratuit et dans le répertoire de xpdf il y a un exe qui est pdftotext.exe.
en lançant un shell depuis vb shell pdftotexte.exe nomfichier.pdf nomfichier.text,vbhide
il fonctionne parfaitement et en masquant la fenetre dos avec vbhide le résultat est pour moi parfait
polo
Messages postés
189
Date d'inscription
mercredi 21 août 2002
Statut
Membre
Dernière intervention
19 janvier 2011

à essayer.
merci pour l'info en tout cas !
Messages postés
189
Date d'inscription
mercredi 21 août 2002
Statut
Membre
Dernière intervention
19 janvier 2011

j'ai testé, parfait ce p'tit open source,
marche impec !
+ d'autres fonctions intéressantes

merci Benjislide pour tes recherches.
Messages postés
3
Date d'inscription
lundi 5 avril 2004
Statut
Membre
Dernière intervention
15 juillet 2008

Bonjour,
Je débute dans vb et j'aurai besoin d'utiliser xpdf. J'ai télécharger le fichier .zip. Mais je ne sais pas comment l'utiliser dans mon code. Comment je dois faire pour que visual basic comprenne que j'ai xpdf??

Nico