Aspirateur des sites web

Résolu
mouzzat Messages postés 3 Date d'inscription dimanche 11 décembre 2005 Statut Membre Dernière intervention 21 août 2007 - 20 août 2007 à 19:34
mouzzat Messages postés 3 Date d'inscription dimanche 11 décembre 2005 Statut Membre Dernière intervention 21 août 2007 - 21 août 2007 à 11:11
Bonjour,


j'ai un site web a réaliser est son contenu il faut que je l'aspire ds


un ancien site ya plein de produit qu'on peut pas toutes les tapez donc je veut un


logiciel qui permet d'aspirer le contenu pas de balise des language


mais du texte simple(les produit) et les classer ds un fichier texte


Cad je veut un logiciel ou un script qui permet de distinguer entre le texte simple afficher sur le navigateur et les balises html puisque il s'agit d'un document html


c'est un grand probleme que j'ai ca fait 3 mois
merci de bien m'aidé


désolé j'ai oublie de vous dire que j'ai trouvé plein de logiciel et il


permet que d'aspirer les images et l'audio ,video et les balise des


languages et les emails moi j'ai besoin d'un permet d'aspirer les


produits


cordialement

5 réponses

Reacen Messages postés 282 Date d'inscription mardi 22 août 2006 Statut Membre Dernière intervention 21 décembre 2010
20 août 2007 à 19:41
Il fo donner un exemple !

Sinon si j'ai comrpis : Ta page a bcp  de produit
Tu veu un programme , qui dechifre le tout , enleve depuis le codes HTML toutes les balises , et groupe les produit dans un fichier  .txt comme ça :

produit1:
blablabla
blablablabla
blablablablabla

Produit2:
blabla ....

 C ca non ?

Technologie Reacen²
3
cs_Exploreur Messages postés 4821 Date d'inscription lundi 11 novembre 2002 Statut Membre Dernière intervention 15 novembre 2016 15
20 août 2007 à 19:40
Salut,

Aspirer un site....Hum...Est-ce bien légal tout cela ???

A+
Exploreur

 Linux a un noyau, Windows un pépin

 
0
Kristof_Koder Messages postés 918 Date d'inscription vendredi 3 août 2007 Statut Membre Dernière intervention 27 octobre 2008 10
20 août 2007 à 22:29
Avec un aspirateur de site comme HTTrack , tu peux récupérer ce que tu veux.
ensuite, tu n'auras qu'à prendre le ficheir HTML et un petit dégraissage dans un bon éditeur de texte (je parle pas de Notepad.exe hein !! Un vrai éditeur de texte, comme PsPad par ex.) devrait te donner ce que tu veux.

Explorateur < Pour info, l'aspiration de site est légale ! Il suffit sous IE de faire un "Enregistrer sous ..." sur chaque pages d'un site pour aboutir au même résultat qu'avec un aspirateur ! C'est juste un peu plus rapide de netoyer ta maison avec un aspirateur plutôt qu'avec un pinceau ! Pareil pour le net !
Certains sites sont protégés contre l'aspiration. Pour ceux-la, toute tentative de crackage de cette protection deviendrait effectivement illégal

Ce qui peut devenir illégal par contre, c'est l'utilisation de ce que tu as aspiré ! Les droits d'auteur et autres droits d'utilisation et/ou d'exposition des données aspirées restent à leur ayant-droits légaux ! Cela va de soit !
0
mouzzat Messages postés 3 Date d'inscription dimanche 11 décembre 2005 Statut Membre Dernière intervention 21 août 2007
21 août 2007 à 10:55
salut

je vous remerciez pr cette rapidité de répondre a mon problème

oui c'est vraiment ca ce que je veut parceque j'ai deja aspirer les pages html avec httrack et je veut enfin de compte un logiciel ou un script qui permet de distinguer entre les balise de l'html et mon texte simple c'est vraiment comme ton exemple
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
mouzzat Messages postés 3 Date d'inscription dimanche 11 décembre 2005 Statut Membre Dernière intervention 21 août 2007
21 août 2007 à 11:11
oui Kristof_Koder  j'ai utilisé bcp de logiciel pour aspirer un site httrack , memoweb4 ,naja ,plucker et ........
mais il ne permet pas de distinguer entre les balise du n'importequ'il language et le texte simple
par contre il permet d'aspirer les images , video ,les pages html ,l' audio ,les adresse mail ds un fichier texte et les liens de la page avec experience
0
Rejoignez-nous