Extraire du texte d'un PDF avec layout

Résolu
ZedMaTrix Messages postés 178 Date d'inscription vendredi 25 octobre 2002 Statut Membre Dernière intervention 14 août 2008 - 1 avril 2008 à 09:54
cs_daviddd Messages postés 1 Date d'inscription lundi 26 mai 2003 Statut Membre Dernière intervention 24 juillet 2008 - 24 juil. 2008 à 18:51
Bonjours à tous !


Je recherche actuellement le moyen de lire le contenu d'un PDF selon son organisation.

C'est à dire que mon PDF de test comporte des colonnes contenant du texte des dates et des nombres.

Le but final est de récupérer soit une chaine de caractères ayant un
séparateur pour séparer les valeurs des colonnes soit un tableau.


Mes recherche mon permis de trouver l'OCX PDFLib qui m'as bien extrait
tout le Texte du PDF, mais ne prenant pas en compte le layout du PDF,
je me retrouve avec toutes valeurs sans séparateur...


Ensuite j'ai trouvé le programme PDFGrabber qui me ressort le texte
cette fois ci en respectant le layout, et donc avec des espaces entre
les colonnes ( qui me permet aussi de définir les séparations... seule
hic ... c'est un programmes ... pas une OCX.

J'ai contacté l'équipe de développement de PDFGrabber .. mais ils ne fournissent pas d'OCX.


J'en suis donc à ce point ...


Connaitriez vous un OCX ( gratuit ou payant n'est pas un probleme ) me
permettant d'extraire un texte d'un PDF en respectant la forme du
contenue utilisable dans VB6 ?

ZedMaTriX

3 réponses

ZedMaTrix Messages postés 178 Date d'inscription vendredi 25 octobre 2002 Statut Membre Dernière intervention 14 août 2008
9 avril 2008 à 15:36
C'est bon, mes recherches m'ont apporté ce que je cherchais.

Pour ceux qui sont dans le même cas que moi, je vais donner la solution ( Simpas hun ?? )

Il existait un outils, enfin ... un OCX développé par iSEQ : QuickPDF qui fait exactement ce que je désire :
Extraire le/les texts et valeurs d'un fichier PDF en les séparants !
( l'objet me retourne un string contenant la police utilisé, la couleur, la taille, les positions (X et Y selon un cadre, donc X1 - Y1, X2 - Y2, X3 - Y3, et X4 - Y4, puis le texte.

La dernière version officiel est la 5.11 ($50 la liscence perso utilisable à souhait ! ).

Mais une équipe fans continue le développement est en sont à la 6.02 Beta. ( Pas besoin de repayer une liscence. ).
Vous pourrez retrouver cette équipe sur leur forum : http://www.quickpdf.org/forum/

J'éspère que ce poste servira à d'autre !!

ZedMaTriX
3
ZedMaTrix Messages postés 178 Date d'inscription vendredi 25 octobre 2002 Statut Membre Dernière intervention 14 août 2008
2 avril 2008 à 07:41
Help

ZedMaTriX
0
cs_daviddd Messages postés 1 Date d'inscription lundi 26 mai 2003 Statut Membre Dernière intervention 24 juillet 2008
24 juil. 2008 à 18:51
Merci pour ces infos [auteur/ZEDMATRIX/16982.aspx ZedMaTrix] j'avais exactement la meme problematique.
0
Rejoignez-nous