Extraire du texte d'un PDF avec layout [Résolu]

Signaler
Messages postés
178
Date d'inscription
vendredi 25 octobre 2002
Statut
Membre
Dernière intervention
14 août 2008
-
Messages postés
1
Date d'inscription
lundi 26 mai 2003
Statut
Membre
Dernière intervention
24 juillet 2008
-
Bonjours à tous !


Je recherche actuellement le moyen de lire le contenu d'un PDF selon son organisation.

C'est à dire que mon PDF de test comporte des colonnes contenant du texte des dates et des nombres.

Le but final est de récupérer soit une chaine de caractères ayant un
séparateur pour séparer les valeurs des colonnes soit un tableau.


Mes recherche mon permis de trouver l'OCX PDFLib qui m'as bien extrait
tout le Texte du PDF, mais ne prenant pas en compte le layout du PDF,
je me retrouve avec toutes valeurs sans séparateur...


Ensuite j'ai trouvé le programme PDFGrabber qui me ressort le texte
cette fois ci en respectant le layout, et donc avec des espaces entre
les colonnes ( qui me permet aussi de définir les séparations... seule
hic ... c'est un programmes ... pas une OCX.

J'ai contacté l'équipe de développement de PDFGrabber .. mais ils ne fournissent pas d'OCX.


J'en suis donc à ce point ...


Connaitriez vous un OCX ( gratuit ou payant n'est pas un probleme ) me
permettant d'extraire un texte d'un PDF en respectant la forme du
contenue utilisable dans VB6 ?

ZedMaTriX

3 réponses

Messages postés
178
Date d'inscription
vendredi 25 octobre 2002
Statut
Membre
Dernière intervention
14 août 2008

C'est bon, mes recherches m'ont apporté ce que je cherchais.

Pour ceux qui sont dans le même cas que moi, je vais donner la solution ( Simpas hun ?? )

Il existait un outils, enfin ... un OCX développé par iSEQ : QuickPDF qui fait exactement ce que je désire :
Extraire le/les texts et valeurs d'un fichier PDF en les séparants !
( l'objet me retourne un string contenant la police utilisé, la couleur, la taille, les positions (X et Y selon un cadre, donc X1 - Y1, X2 - Y2, X3 - Y3, et X4 - Y4, puis le texte.

La dernière version officiel est la 5.11 ($50 la liscence perso utilisable à souhait ! ).

Mais une équipe fans continue le développement est en sont à la 6.02 Beta. ( Pas besoin de repayer une liscence. ).
Vous pourrez retrouver cette équipe sur leur forum : http://www.quickpdf.org/forum/

J'éspère que ce poste servira à d'autre !!

ZedMaTriX
Messages postés
178
Date d'inscription
vendredi 25 octobre 2002
Statut
Membre
Dernière intervention
14 août 2008

Help

ZedMaTriX
Messages postés
1
Date d'inscription
lundi 26 mai 2003
Statut
Membre
Dernière intervention
24 juillet 2008

Merci pour ces infos [auteur/ZEDMATRIX/16982.aspx ZedMaTrix] j'avais exactement la meme problematique.