Parcourir fichiers pdf

cs_Liro Messages postés 159 Date d'inscription jeudi 7 septembre 2006 Statut Membre Dernière intervention 30 septembre 2011 - 2 juin 2009 à 00:46
Mayzz Messages postés 2813 Date d'inscription mardi 15 avril 2003 Statut Membre Dernière intervention 2 juin 2020 - 2 juin 2009 à 13:28
Bonjour,

Je cherche à parcourir tous les fichiers pdf d'un dossier et de lister les références à 8 chiffres que contient chacun de ces fichiers pdf.

Je ne sais pas comment faire, par où commencer. Quel language choisir.
Bref, es-ce que vous sauriez m'orienter?

Merci de votre aide
Liro

4 réponses

Mayzz Messages postés 2813 Date d'inscription mardi 15 avril 2003 Statut Membre Dernière intervention 2 juin 2020 28
2 juin 2009 à 01:09
Bonsoir,

Pour parcourir les fichiers PDF d'un dossier c'est assez simple :

Public Function Browse(ByVal InputDirectoy As String) As List(Of IO.FileInfo)
    Dim _Files As New List(Of IO.FileInfo)
    Dim _Directory As New IO.DirectoryInfo(InputDirectoy)
    _Files.AddRange(_Directory.GetFiles("*.pdf", IO.SearchOption.AllDirectories))
    Return _Files
End Function

Pour ce qui est de les ouvrir vb ne gère pas nativement le PDF, il te faut donc trouver une source exemple, avec un API, ou un composant te permetant de le faire, recherche ici, il y à quelques jour on n'a poser la question (mais pour vb6).

@+

Si le déboguage est l'art d'enlever les bogues, alors la programmation doit être l'art de les créer.
0
Mayzz Messages postés 2813 Date d'inscription mardi 15 avril 2003 Statut Membre Dernière intervention 2 juin 2020 28
2 juin 2009 à 01:21
Je pensais à une chose, le PDF n'est qu'un language PostScript, donc si tu cherche à récupérer des informations pas trop complexe en intèrne (comme ta référence), tu aura juste à essayer d'ouvrir le fichier en mode texte ou binaire et récupérer l'information que tu recherche (qui se trouvera certainement en claire dans le fichier) si tenté qu'elle soit à la même position dans le fichier, sinon cela t'obligerais à faire une fonction de recherche plus complexe...

Voila, bon courrage.

@+ Mayzz

Si le déboguage est l'art d'enlever les bogues, alors la programmation doit être l'art de les créer.
0
cs_Liro Messages postés 159 Date d'inscription jeudi 7 septembre 2006 Statut Membre Dernière intervention 30 septembre 2011
2 juin 2009 à 07:40
Salut Mayz,

Merci pour ton aide, je vais "explorer"ça.
Pour les pdf j'ai déjà essayer de changer l'extension et ouvrir le fichier en txt mais il semblerait que les infos n'apparaissent pas en claire.
Je vais faire les choses dans l'ordre et commencer par lister les fichiers, ensuite j'essayerai le traitement.

Liro
0
Mayzz Messages postés 2813 Date d'inscription mardi 15 avril 2003 Statut Membre Dernière intervention 2 juin 2020 28
2 juin 2009 à 13:28
Bonjour,


En fait le PDF est un PostScrip cela ressemble un comme le RTF, cela ressemble for au html (mais n'as pas du tout la même syntaxe) en fait les mises en formes sont balisés. Et les contenus comme les images sont sous forme binaires exemple :

16 0 obj
<< /Filter /FlateDecode /Length 218 >>
stream
[données du fchier...]
endsetream

Voila @+




Si le déboguage est l'art d'enlever les bogues, alors la programmation doit être l'art de les créer.
0
Rejoignez-nous