mouzzat
Messages postés3Date d'inscriptiondimanche 11 décembre 2005StatutMembreDernière intervention21 août 2007
-
20 août 2007 à 19:34
mouzzat
Messages postés3Date d'inscriptiondimanche 11 décembre 2005StatutMembreDernière intervention21 août 2007
-
21 août 2007 à 11:11
Bonjour,
j'ai un site web a réaliser est son contenu il faut que je l'aspire ds
un ancien site ya plein de produit qu'on peut pas toutes les tapez donc je veut un
logiciel qui permet d'aspirer le contenu pas de balise des language
mais du texte simple(les produit) et les classer ds un fichier texte
Cad je veut un logiciel ou un script qui permet de distinguer entre le texte simple afficher sur le navigateur et les balises html puisque il s'agit d'un document html
c'est un grand probleme que j'ai ca fait 3 mois
merci de bien m'aidé
désolé j'ai oublie de vous dire que j'ai trouvé plein de logiciel et il
permet que d'aspirer les images et l'audio ,video et les balise des
languages et les emails moi j'ai besoin d'un permet d'aspirer les
Reacen
Messages postés282Date d'inscriptionmardi 22 août 2006StatutMembreDernière intervention21 décembre 2010 20 août 2007 à 19:41
Il fo donner un exemple !
Sinon si j'ai comrpis : Ta page a bcp de produit
Tu veu un programme , qui dechifre le tout , enleve depuis le codes HTML toutes les balises , et groupe les produit dans un fichier .txt comme ça :
Kristof_Koder
Messages postés918Date d'inscriptionvendredi 3 août 2007StatutMembreDernière intervention27 octobre 200810 20 août 2007 à 22:29
Avec un aspirateur de site comme HTTrack , tu peux récupérer ce que tu veux.
ensuite, tu n'auras qu'à prendre le ficheir HTML et un petit dégraissage dans un bon éditeur de texte (je parle pas de Notepad.exe hein !! Un vrai éditeur de texte, comme PsPad par ex.) devrait te donner ce que tu veux.
Explorateur < Pour info, l'aspiration de site est légale ! Il suffit sous IE de faire un "Enregistrer sous ..." sur chaque pages d'un site pour aboutir au même résultat qu'avec un aspirateur ! C'est juste un peu plus rapide de netoyer ta maison avec un aspirateur plutôt qu'avec un pinceau ! Pareil pour le net !
Certains sites sont protégés contre l'aspiration. Pour ceux-la, toute tentative de crackage de cette protection deviendrait effectivement illégal
Ce qui peut devenir illégal par contre, c'est l'utilisation de ce que tu as aspiré ! Les droits d'auteur et autres droits d'utilisation et/ou d'exposition des données aspirées restent à leur ayant-droits légaux ! Cela va de soit !
mouzzat
Messages postés3Date d'inscriptiondimanche 11 décembre 2005StatutMembreDernière intervention21 août 2007 21 août 2007 à 10:55
salut
je vous remerciez pr cette rapidité de répondre a mon problème
oui c'est vraiment ca ce que je veut parceque j'ai deja aspirer les pages html avec httrack et je veut enfin de compte un logiciel ou un script qui permet de distinguer entre les balise de l'html et mon texte simple c'est vraiment comme ton exemple
Vous n’avez pas trouvé la réponse que vous recherchez ?
mouzzat
Messages postés3Date d'inscriptiondimanche 11 décembre 2005StatutMembreDernière intervention21 août 2007 21 août 2007 à 11:11
oui Kristof_Koder j'ai utilisé bcp de logiciel pour aspirer un site httrack , memoweb4 ,naja ,plucker et ........
mais il ne permet pas de distinguer entre les balise du n'importequ'il language et le texte simple
par contre il permet d'aspirer les images , video ,les pages html ,l' audio ,les adresse mail ds un fichier texte et les liens de la page avec experience