Parseur de lien de fichier html vers fichier texte

Soyez le premier à donner votre avis sur cette source.

Snippet vu 8 723 fois - Téléchargée 27 fois

Contenu du snippet

Voila quelqu'1 ma demander sur le forum comment récupérer tout les liens d'1 fichier html pour les enregistrer dans un fichier texte donc voila une source qui répondra à cette question

Source / Exemple :


<?
//<a href="lien.php">textelien</a>
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r+");//on ouvre
	$texte = fread ($fp, 255000); //on prend le max
	fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule 
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><a></a><head></head><style></style>'); 
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte); 
$texte = str_replace("&nbsp;"," ",$texte); 
$texte = preg_replace('`<head.*?/head>`', '', $texte); 
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte); 
$texte = preg_replace('`<style.*?/style>`', '', $texte); 
$texte = preg_replace('`/a>.*?<a`', '/a><br><a', $texte);
$texte = str_replace("    "," ",$texte);
    
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
$texte = preg_replace('`<br>`', '<br>', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!<br>$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`<br>`', '\n', $texte); 
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>

Conclusion :


juste une petite source pour répondre à un sujet que je vois depuis lontemps trainer sur le forum et vu que cest mon dernier jour de vacance

A voir également

Ajouter un commentaire

Commentaires

quiaimeflash
Messages postés
271
Date d'inscription
samedi 29 novembre 2003
Statut
Membre
Dernière intervention
11 juillet 2007
-
Il est plutot sympa ton script, j'avais commencer un truc du genre moi aussi...
Mais je supprimais pqs asser de truc.

Par contre, dit si je me trompe mais je crois que le script fonctionne mieux si on ouvre pas le fichier en lecture/ecriture mais juste en lecture, faut juste enlever le + mais bn je recolle ton code :

<?
//[lien.php textelien]
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r");//on ouvre
$texte = fread ($fp, 255000); //on prend le max
fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><head></head><style></style>');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace(" "," ",$texte);
$texte = preg_replace('`<head.*?/head>`', '', $texte);
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte);
$texte = preg_replace('`<style.*?/style>`', '', $texte);
$texte = preg_replace('`/a>.*?
`', '>', $texte);
$texte = preg_replace('`
`', '
', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!
$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`
`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>

Et pis voila...
defkrie
Messages postés
438
Date d'inscription
vendredi 20 septembre 2002
Statut
Membre
Dernière intervention
20 novembre 2004
-
oui tu as raison jai pas fait gaffe je laisse toujours trainer le + or inutile ct vrai en lecture...
je travaille sur une autre source qui fait la meme chose mais en moins de ligne si ja la fini un jour.
Merci.
kegi
Messages postés
164
Date d'inscription
jeudi 23 octobre 2003
Statut
Membre
Dernière intervention
25 août 2008
-
le script est suposer faire quoi ?

moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:

http://www.monsite1.com
http://www.monsite2.com

merci de me répondre...

cordialement,
kevin (kegi@hotmail.com)
defkrie
Messages postés
438
Date d'inscription
vendredi 20 septembre 2002
Statut
Membre
Dernière intervention
20 novembre 2004
-
Il sert à récuperer les liens html d'un fichier et à les afficher.
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+
kegi
Messages postés
164
Date d'inscription
jeudi 23 octobre 2003
Statut
Membre
Dernière intervention
25 août 2008
-
merci bien,
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)

cordialement,
kevin (kegi@hotmail.com)

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.