PARSEUR DE LIEN DE FICHIER HTML VERS FICHIER TEXTE
quiaimeflash
Messages postés270Date d'inscriptionsamedi 29 novembre 2003StatutMembreDernière intervention11 juillet 2007
-
27 juin 2004 à 23:18
Skypetarius
Messages postés9Date d'inscriptionmercredi 6 juillet 2005StatutMembreDernière intervention14 juillet 2005
-
6 juil. 2005 à 11:47
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.
Skypetarius
Messages postés9Date d'inscriptionmercredi 6 juillet 2005StatutMembreDernière intervention14 juillet 2005 6 juil. 2005 à 11:47
Bonjour !
Je me demandais s'il étais possible de faire le contraire :
Au lieu de supprimer tout ce qui n'est pas un lien, le script pourrait seulement extraire les infos voulues.
Il stockerai dans des variables ce qui est contenu entre les '', par exemple...
Est-ce possible ? (je suis débutant alors ne m'en voulez pas...)
kegi
Messages postés164Date d'inscriptionjeudi 23 octobre 2003StatutMembreDernière intervention25 août 2008 7 janv. 2005 à 01:19
désolé, je me suis rendu compte qu'il y avais une erreur...
le script est bien ce que je cherche mais...
chez moi il ne fonctionne pas super bien :(
il me lesse tout le texte entre les liens
désolé, le cadrage est pourrit ici :D
cordialement,
kevin (kegi@hotmail.com)
kegi
Messages postés164Date d'inscriptionjeudi 23 octobre 2003StatutMembreDernière intervention25 août 2008 7 janv. 2005 à 01:15
merci bien,
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)
cordialement,
kevin (kegi@hotmail.com)
defkrie
Messages postés435Date d'inscriptionvendredi 20 septembre 2002StatutMembreDernière intervention20 novembre 2004 6 janv. 2005 à 17:13
Il sert à récuperer les liens html d'un fichier et à les afficher.
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+
kegi
Messages postés164Date d'inscriptionjeudi 23 octobre 2003StatutMembreDernière intervention25 août 2008 2 janv. 2005 à 23:27
le script est suposer faire quoi ?
moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:
defkrie
Messages postés435Date d'inscriptionvendredi 20 septembre 2002StatutMembreDernière intervention20 novembre 2004 28 juin 2004 à 16:24
oui tu as raison jai pas fait gaffe je laisse toujours trainer le + or inutile ct vrai en lecture...
je travaille sur une autre source qui fait la meme chose mais en moins de ligne si ja la fini un jour.
Merci.
quiaimeflash
Messages postés270Date d'inscriptionsamedi 29 novembre 2003StatutMembreDernière intervention11 juillet 2007 27 juin 2004 à 23:18
Il est plutot sympa ton script, j'avais commencer un truc du genre moi aussi...
Mais je supprimais pqs asser de truc.
Par contre, dit si je me trompe mais je crois que le script fonctionne mieux si on ouvre pas le fichier en lecture/ecriture mais juste en lecture, faut juste enlever le + mais bn je recolle ton code :
<?
//[lien.php textelien]
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r");//on ouvre
$texte = fread ($fp, 255000); //on prend le max
fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><head></head><style></style>');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace(" "," ",$texte);
$texte = preg_replace('`<head.*?/head>`', '', $texte);
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte);
$texte = preg_replace('`<style.*?/style>`', '', $texte);
$texte = preg_replace('`/a>.*?
`', '>', $texte);
$texte = preg_replace('`
`', '
', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!
$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`
`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>
6 juil. 2005 à 11:47
Je me demandais s'il étais possible de faire le contraire :
Au lieu de supprimer tout ce qui n'est pas un lien, le script pourrait seulement extraire les infos voulues.
Il stockerai dans des variables ce qui est contenu entre les '', par exemple...
Est-ce possible ? (je suis débutant alors ne m'en voulez pas...)
7 janv. 2005 à 01:19
le script est bien ce que je cherche mais...
chez moi il ne fonctionne pas super bien :(
il me lesse tout le texte entre les liens
désolé, le cadrage est pourrit ici :D
cordialement,
kevin (kegi@hotmail.com)
7 janv. 2005 à 01:15
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)
cordialement,
kevin (kegi@hotmail.com)
6 janv. 2005 à 17:13
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+
2 janv. 2005 à 23:27
moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:
http://www.monsite1.com
http://www.monsite2.com
merci de me répondre...
cordialement,
kevin (kegi@hotmail.com)
28 juin 2004 à 16:24
je travaille sur une autre source qui fait la meme chose mais en moins de ligne si ja la fini un jour.
Merci.
27 juin 2004 à 23:18
Mais je supprimais pqs asser de truc.
Par contre, dit si je me trompe mais je crois que le script fonctionne mieux si on ouvre pas le fichier en lecture/ecriture mais juste en lecture, faut juste enlever le + mais bn je recolle ton code :
<?
//[lien.php textelien]
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r");//on ouvre
$texte = fread ($fp, 255000); //on prend le max
fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><head></head><style></style>');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace(" "," ",$texte);
$texte = preg_replace('`<head.*?/head>`', '', $texte);
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte);
$texte = preg_replace('`<style.*?/style>`', '', $texte);
$texte = preg_replace('`/a>.*?
`', '>', $texte);
$texte = preg_replace('`
`', '
', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!
$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`
`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>
Et pis voila...