cs_deadisdead
Messages postés31Date d'inscriptionjeudi 12 février 2004StatutMembreDernière intervention30 septembre 2008
-
16 févr. 2007 à 11:08
nikal86
Messages postés3Date d'inscriptionlundi 5 avril 2004StatutMembreDernière intervention15 juillet 2008
-
10 juil. 2008 à 21:09
Bonjour à tous,
Je cherche simplement à récupérer le texte contenu dans un PDF pour l'analyser. Sur le papier, ça ne semble pas très compliqué car je n'ai ni besoin de la mise en forme, ni besoin des images, ... mais après de nombreuses heures de recherche, je n'ai rien pu trouver. Est-ce que quelqu'un aurait une idée, voir un OCX à me proposer ?
tikrimi
Messages postés192Date d'inscriptiondimanche 5 janvier 2003StatutMembreDernière intervention 9 mars 20071 16 févr. 2007 à 11:24
Hello,
Je recherche la même chose que toi.
Pour l'insant j'ai touvé http://itextsharp.sourceforge.net/ dont tu peux avoir un exemple d'utilisation ((http://www.codeproject.com/useritems/PDFToText.asp) pour extraire le texte.
Ca marche, mais le résultat est pas top, et surtout moins bon que si on fait un copier coller depuis acrobat reader.
Si tu trouves mieux, je suis preneur.
cs_thephil
Messages postés189Date d'inscriptionmercredi 21 août 2002StatutMembreDernière intervention19 janvier 2011 16 févr. 2007 à 12:06
il existe un outil : Convert Doc, y'a un mode manuel et mode batch (qui permet donc de l'utiliser via Vb)
Très efficace. Après si c'est pour une utilisation pro, y'a une licence.
Mais c'est toujours bon à connaitre à mon avis !
cs_deadisdead
Messages postés31Date d'inscriptionjeudi 12 février 2004StatutMembreDernière intervention30 septembre 2008 16 févr. 2007 à 13:45
J'ai trouvé également un truc qui s'appelle PDFText mais comme Convert Doc, ce sont des shareware et j'aimerais trouver quelque chose de non limité. De plus, étant donné que c'est pour une toute petite partie de mon programme, je ne veux pas mettre des ronds dans un truc pareil.
benjislide
Messages postés2Date d'inscriptionmardi 10 juin 2003StatutMembreDernière intervention16 mars 2007 16 mars 2007 à 11:59
après plusieurs jours de recherche pour le même problème, j'ai téléchargé xpdf
qui est un open source donc gratuit et dans le répertoire de xpdf il y a un exe qui est pdftotext.exe.
en lançant un shell depuis vb shell pdftotexte.exe nomfichier.pdf nomfichier.text,vbhide
il fonctionne parfaitement et en masquant la fenetre dos avec vbhide le résultat est pour moi parfait
polo
Vous n’avez pas trouvé la réponse que vous recherchez ?
nikal86
Messages postés3Date d'inscriptionlundi 5 avril 2004StatutMembreDernière intervention15 juillet 2008 10 juil. 2008 à 21:09
Bonjour,
Je débute dans vb et j'aurai besoin d'utiliser xpdf. J'ai télécharger le fichier .zip. Mais je ne sais pas comment l'utiliser dans mon code. Comment je dois faire pour que visual basic comprenne que j'ai xpdf??