CLASSE PDF POUR IMAGES

cs_windob Messages postés 225 Date d'inscription dimanche 19 octobre 2003 Statut Membre Dernière intervention 25 août 2008 - 5 juin 2006 à 11:14
yan35 Messages postés 185 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 20 juin 2013 - 29 mai 2008 à 13:04
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/37946-classe-pdf-pour-images

yan35 Messages postés 185 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 20 juin 2013
29 mai 2008 à 13:04
Bonjour Benoitdtm,
désolé, je ne peux pas t'aider en ce moment. Ce que tu cherches peut certainement ce faire mais je ne me rappelles + la structure des fichiers pdf, il faudrait que je replonge dedans et pour l'instant j'ai vraiment pas de temps dispo. Regarde bien ma source, tu devrais trouver à partir de la table finale où est le stream de l'image. De là tu le récupère et tu le copies dans ton nouveau pdf en générant les balises voulues et en mettant à jour la table finale, mais vraiment excuses moi c'est trop loin, je ne sais plus.
BenoitDTM Messages postés 2 Date d'inscription mercredi 28 mai 2008 Statut Membre Dernière intervention 28 mai 2008
28 mai 2008 à 15:38
Si jamais vous avez quelque chose pour moi envoye moi un couriel a bbolduc@gdtm.com je serais ravis de lire vos reponse merci beaucoup .
BenoitDTM Messages postés 2 Date d'inscription mercredi 28 mai 2008 Statut Membre Dernière intervention 28 mai 2008
28 mai 2008 à 15:37
Avez vous trouver comment prendre une image d un pdf et l enregistrer dans un autre pdf ? je voudrais aller chercher les images d un pdf et les sauvegarders dans un autre pdf pour la job c est tres importants nous avons un logiciel de dessin qui cree des pdf mes en dessous du dessin ( graphique ) on a un 15 aine de ligne de texte que nous ne voulons pas nous voulon par contre les graphiques de chaque page du document pdf et les copier dans un autres pdf pour pouvoir envoye ce nouveau document de dessin ( graphique ) au client sans qu il ait le text en dessous de l image merci ! j'ai chercher partout sans succes sa commence a etre asser urgent !!! merci beaucoup tous pour votre aide !
yan35 Messages postés 185 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 20 juin 2013
6 mars 2007 à 09:55
Bonjour Jose,

Merci de tes infos, c'est sympa. Je n'ai pas encore eu le temps de regarder cette extraction d'images du PDF, mais d'après ce que tu dis tu y es parvenu. Bien sûr l'extraction ne peut pas modifier qualité de l'image d'origine. Par contre j'ai pas tout compris dans ton explication sur ton truc (modification du pdf ...).
Quoiqu'il en soit, je crois que, dans l'intérêt de tous, ça serait sympa que tu communiques les lignes de code qui extraient l'image.
Bonne continuation.
perezjos Messages postés 3 Date d'inscription mercredi 31 janvier 2007 Statut Membre Dernière intervention 6 mars 2007
6 mars 2007 à 03:21
Salut Yan.
Des nouvelles sur le project.
Le service tourne comme un utilisateur sur une machine, donc office sera installe car d'autre logiciels clients doivent etre installees aussi. (c'est un peu complexe d'expliquer pourquoi, mais c'est un fait:-))
J'arrive a extraire les images d'un PDF et proceder a l'OCR/ICR mais le resultat peut etre bon ou mauvais selon la qualite des images qui etaitent dans le pdf. Si tu remplace le contenu du PDF, tu peux te retrouver avec du texte tronce car non reconnu par le moteur. Donc le truc c'est de modifier le PDF, mais en laissant l'original en premier plan, et d'inclure l'OCR derriere l'image en quelque sorte (invisible). Je ne sais pas si cela est possible avec PDF mais voila ou j'en suis ....

a +
Jose
yan35 Messages postés 185 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 20 juin 2013
3 févr. 2007 à 09:48
Intéressant ton projet, mais encore 1 fois désolé, je manque de temps pour t'aider ! Dès que je peux je regarde à nouveau l'organisation des PDF d'autant que j'ai encore un projet en cours à ce sujet .... Par contre juste une réflexion sur ton projet, y'a pas 1 problème de licence dans l'utilisation de MODI ? penses-y si t'as 1 problème de budget !
Bonne continuation.
perezjos Messages postés 3 Date d'inscription mercredi 31 janvier 2007 Statut Membre Dernière intervention 6 mars 2007
2 févr. 2007 à 02:16
Merci de ta reponse.
Je travaille sur un project OCR et bien entendu pas de budget. L'idee est donc d'utiliser MODI (Office document Imaging) pour l'OCR. Ca marche tres bien avec des fichiers tiff et je peux sauvegarder le contenu de l'OCR separement pour pour l'utiliser dans un autre process (index pour la recherche dans les documents fax etc..). Il arrive que je recois des documents pdf qui contiennent une ou plusieurs images. Je n'ai pas besoin de transformer le pdf, mais pour l'indexer je voudrais en extraire les images et faire comme cite plus haut.
a+
Jose
yan35 Messages postés 185 Date d'inscription dimanche 29 juin 2003 Statut Membre Dernière intervention 20 juin 2013
2 févr. 2007 à 00:50
Je ne sais pas, il faudrait que je me repenche dans la structure d'un pdf car il y a longtemps que je n'y ai pas touché. Je me rappelle qu'il y a une table des références qui donne où se trouve les objets et donc où récupérer les streams des images mais il me semble qu'à partir de l'image on passe par un codeur pour stocker son contenu dans le pdf dans un format pdf. seulement ce codeur fonctionne- t-il dans les 2 sens ? je ne sais pas ! c'est loin tout ça ... Ceci-dit, c'est vrai que l'idée est interessante, mais pour l'instant je suis un peu surbooked et je ne peux pas regarder ça rapidement. Cependant si personne ne répond à ta question d'ici là, je regarderai ça dans quelques mois. Désolé de ne pas pouvoir t'aider plus pour l'instant.
perezjos Messages postés 3 Date d'inscription mercredi 31 janvier 2007 Statut Membre Dernière intervention 6 mars 2007
1 févr. 2007 à 05:15
Merci Yan pour ton code.
Je suis interresse de faire le contraire, c'est a dire de pouvoir extraire l'image ou les images d'un fichier PDF et de les manipuler (ex sauver sur disque).
Pense tu que ce serait difficile ?

Merci
Jose
cs_windob Messages postés 225 Date d'inscription dimanche 19 octobre 2003 Statut Membre Dernière intervention 25 août 2008
5 juin 2006 à 11:14
"on en trouve maintenant comme une poignée de confettis à la sortie d'un cimetière" -> Je l'avais jamais enetendue celle la !
Rejoignez-nous