ZedMaTrix
Messages postés178Date d'inscriptionvendredi 25 octobre 2002StatutMembreDernière intervention14 août 2008
-
1 avril 2008 à 09:54
cs_daviddd
Messages postés1Date d'inscriptionlundi 26 mai 2003StatutMembreDernière intervention24 juillet 2008
-
24 juil. 2008 à 18:51
Bonjours à tous !
Je recherche actuellement le moyen de lire le contenu d'un PDF selon son organisation.
C'est à dire que mon PDF de test comporte des colonnes contenant du texte des dates et des nombres.
Le but final est de récupérer soit une chaine de caractères ayant un
séparateur pour séparer les valeurs des colonnes soit un tableau.
Mes recherche mon permis de trouver l'OCX PDFLib qui m'as bien extrait
tout le Texte du PDF, mais ne prenant pas en compte le layout du PDF,
je me retrouve avec toutes valeurs sans séparateur...
Ensuite j'ai trouvé le programme PDFGrabber qui me ressort le texte
cette fois ci en respectant le layout, et donc avec des espaces entre
les colonnes ( qui me permet aussi de définir les séparations... seule
hic ... c'est un programmes ... pas une OCX.
J'ai contacté l'équipe de développement de PDFGrabber .. mais ils ne fournissent pas d'OCX.
J'en suis donc à ce point ...
Connaitriez vous un OCX ( gratuit ou payant n'est pas un probleme ) me
permettant d'extraire un texte d'un PDF en respectant la forme du
contenue utilisable dans VB6 ?
ZedMaTrix
Messages postés178Date d'inscriptionvendredi 25 octobre 2002StatutMembreDernière intervention14 août 2008 9 avril 2008 à 15:36
C'est bon, mes recherches m'ont apporté ce que je cherchais.
Pour ceux qui sont dans le même cas que moi, je vais donner la solution ( Simpas hun ?? )
Il existait un outils, enfin ... un OCX développé par iSEQ : QuickPDF qui fait exactement ce que je désire :
Extraire le/les texts et valeurs d'un fichier PDF en les séparants !
( l'objet me retourne un string contenant la police utilisé, la couleur, la taille, les positions (X et Y selon un cadre, donc X1 - Y1, X2 - Y2, X3 - Y3, et X4 - Y4, puis le texte.
La dernière version officiel est la 5.11 ($50 la liscence perso utilisable à souhait ! ).
Mais une équipe fans continue le développement est en sont à la 6.02 Beta. ( Pas besoin de repayer une liscence. ).
Vous pourrez retrouver cette équipe sur leur forum : http://www.quickpdf.org/forum/