Convertir PDF en HTML ou page WEB

Signaler
Messages postés
14
Date d'inscription
mercredi 29 mars 2006
Statut
Membre
Dernière intervention
20 mai 2010
-
Messages postés
6063
Date d'inscription
dimanche 13 avril 2003
Statut
Modérateur
Dernière intervention
15 juillet 2011
-
Bonjour a tous
Pour mon programme, je dois convertir un fichier PDF en HTML ou page WEB. est ce que quelqu'un peut m'aider ( en utilisant javascript ou autre langage) !! Merci d'avance

12 réponses

Messages postés
1251
Date d'inscription
mercredi 7 août 2002
Statut
Modérateur
Dernière intervention
10 avril 2013

Bonjour,

en utilisant javascript ou autre langage :
En fait tout dépend où se trouve le fichier pdf, coté serveur ou coté client ?

Nickadele
----------------------------------------------
non, ma belle ne s'appel pas Adèle
Messages postés
14
Date d'inscription
mercredi 29 mars 2006
Statut
Membre
Dernière intervention
20 mai 2010

On travaille sur l'annotation de documents. on a commencé par des documents Web, et maintenant on va travailler sur des fichiers PDF et doc coté serveur


merci pour votre reponse  
Messages postés
13616
Date d'inscription
jeudi 13 février 2003
Statut
Membre
Dernière intervention
15 octobre 2013
32
Bonjour,

>>PDF ===> HTML,page WEB..
curieux ? ... en général c'est le contraire
on part d'un fichier html,doc, ou autre.... que l'on convertit en pdf.
on ne crée pas directement un pdf, il n'est d'ailleurs pas fait pour être modifier
et comme on dispose des documents originaux, ce sont eux qu'on modifie.




<hr />



Cordialement            Bul        
Messages postés
14
Date d'inscription
mercredi 29 mars 2006
Statut
Membre
Dernière intervention
20 mai 2010

Je voudrais savoir comment récupérer le texte du fichier PDF pour transformer en fichier HTML ou page Web
Merci
Messages postés
13616
Date d'inscription
jeudi 13 février 2003
Statut
Membre
Dernière intervention
15 octobre 2013
32
       on avait bien compris touriste80.
        mais le texte qui a permis de créer le PDF, tu en disposes, non ?
  car reprendre directement le PDF, pas sûr que cela soit possible
                    avec un quoi que ce soit d'ailleurs. peut-être me trompe-je ??
<hr />


Cordialement            Bul        
Messages postés
14
Date d'inscription
mercredi 29 mars 2006
Statut
Membre
Dernière intervention
20 mai 2010

j'ai deja le fichier en PDF. mon but est de séléctionner des parties du texte de ce fichier, qui se fera, je pense, via HTML.
J'espere que cette fois, j'ai bien éclairci le pb !!
Messages postés
13616
Date d'inscription
jeudi 13 février 2003
Statut
Membre
Dernière intervention
15 octobre 2013
32
ben... je ne vois plus comment t'expliquer cela alors...
on ne crée pas directement un fichier pdf, on ne le modifie pas, on
    n'en traite pas le texte, ni les images, ni une selection, ni quoi que ce soit.
( sauf avec copier/coller, et on peut mettre du javascript dans un .pdf  )
on crée, à partir d'un fichier html, word, ... ou autres, un fichier .pdf
    en l'imprimant vers une "imprimante, virtuelle, factice... " .
le résultat, ce fichier .pdf, on ne peut alors que le visualiser, rien d'autre,
    avec le logiciel Adobe Reader ou Foxit...

si tu as déjà le .pdf, tu disposes des fichiers qui ont permis de le créer.



<hr />



Cordialement                Bul            
Messages postés
1251
Date d'inscription
mercredi 7 août 2002
Statut
Modérateur
Dernière intervention
10 avril 2013

Bultez, faut pas chercher à comprendre le pourquoi du comment ! 

Sinon pour répondre à la question de touriste80, c'est pas avec du javascript que cela va se passer puisque c'est coté serveur.
Donc, ma question : quelle technologie serveur utilises-tu (php, asp, .net, ...) ?
Il existe également des modules (API, SDK) qui font se type d'opérations (du moins récupérer le texte), à toi après de le mettre en forme html.
Voir : http://www.adobe.com
http://www.pdf-tools.com/asp/products.asp?name=EXPA&gclid=COfr9OOZn4oCFSJ4MAodBVo9kg

A la main : dans adobe, Menu Fichier>> Enregistrer Sous...>> Choisir dans Type Texte(Accessible) Txt

Nickadele
----------------------------------------------
non, ma belle ne s'appel pas Adèle
Messages postés
13616
Date d'inscription
jeudi 13 février 2003
Statut
Membre
Dernière intervention
15 octobre 2013
32
salut Nick,
>>..faut pas chercher à comprendre le pourquoi du comment..
tu as probablement raison, mais je pense que ce qu'il veut faire
    est très très difficile, voire impossible, pas réaliste pour le moins.


<hr />



Cordialement            Bul        
Messages postés
6063
Date d'inscription
dimanche 13 avril 2003
Statut
Modérateur
Dernière intervention
15 juillet 2011
28
Salut

http://pdftohtml.sourceforge.net/

Voila surement le logiciel qu'il faut mais je ne garantis pas le résultat sur tous les pdfs (crytés, impossible de copier, impossible d'imprimer) (peut être nouveau format de pdf depuis la création du logiciel)
mais si ce logiciel te traite 50% de tes pdf ca sera beau.

Les mot de passe semble gérer et j'ai fait quelques essais ca l'air de fonctionner correctement

Pour l'annotation de document je pense que ca sera dur, mais pour l'indexation ca doit le faire. (il faut un logiciel adobe dans ce cas)

Car pour moi annotation de document = injection à l'intérieurs à moins que tu sauvegarde dans un autre format au bout?

Voila
Messages postés
136
Date d'inscription
vendredi 19 novembre 2004
Statut
Membre
Dernière intervention
25 mai 2012

Moi je pense que ce touriste n'a pas la source du pdf justement et qu'il veut récupérer le contenu comme tu pourrais le faire a partir d'un fichier texte et le tout en automatique :p

Moi aussi je suis interressé si vous trouvez ;)

Bonne journée
Messages postés
6063
Date d'inscription
dimanche 13 avril 2003
Statut
Modérateur
Dernière intervention
15 juillet 2011
28
L'outil pdftohtml que je propose dans mon précédent post.
Recupere le texte et les images dans les pdf.

Je l'ai fait tourner sur 3 ou 4 pdf, et je n'ai pas eu de problème.
Le seul inconvénient qui en n'est pas pas sur la demande.

c'est que le texte extrait est non formaté;
pas de distinction des titres par exemples.

Je l'ai fais tourner sur des brochures pdf (journal de ma ville)

les décorations (dessin vectioriel) je pense ne sont pas extraite non plus.

Un sommaire (par page est réaliser quand même)

voila