Parseur de lien de fichier html vers fichier texte

Soyez le premier à donner votre avis sur cette source.

Snippet vu 8 888 fois - Téléchargée 27 fois

Contenu du snippet

Voila quelqu'1 ma demander sur le forum comment récupérer tout les liens d'1 fichier html pour les enregistrer dans un fichier texte donc voila une source qui répondra à cette question

Source / Exemple :


<?
//<a href="lien.php">textelien</a>
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r+");//on ouvre
	$texte = fread ($fp, 255000); //on prend le max
	fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule 
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><a></a><head></head><style></style>'); 
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte); 
$texte = str_replace("&nbsp;"," ",$texte); 
$texte = preg_replace('`<head.*?/head>`', '', $texte); 
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte); 
$texte = preg_replace('`<style.*?/style>`', '', $texte); 
$texte = preg_replace('`/a>.*?<a`', '/a><br><a', $texte);
$texte = str_replace("    "," ",$texte);
    
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
$texte = preg_replace('`<br>`', '<br>', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!<br>$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`<br>`', '\n', $texte); 
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>

Conclusion :


juste une petite source pour répondre à un sujet que je vois depuis lontemps trainer sur le forum et vu que cest mon dernier jour de vacance

A voir également

Ajouter un commentaire

Commentaires

Messages postés
9
Date d'inscription
mercredi 6 juillet 2005
Statut
Membre
Dernière intervention
14 juillet 2005

Bonjour !
Je me demandais s'il étais possible de faire le contraire :
Au lieu de supprimer tout ce qui n'est pas un lien, le script pourrait seulement extraire les infos voulues.
Il stockerai dans des variables ce qui est contenu entre les '', par exemple...

Est-ce possible ? (je suis débutant alors ne m'en voulez pas...)
Messages postés
164
Date d'inscription
jeudi 23 octobre 2003
Statut
Membre
Dernière intervention
25 août 2008

désolé, je me suis rendu compte qu'il y avais une erreur...
le script est bien ce que je cherche mais...
chez moi il ne fonctionne pas super bien :(
il me lesse tout le texte entre les liens

désolé, le cadrage est pourrit ici :D

cordialement,
kevin (kegi@hotmail.com)
Messages postés
164
Date d'inscription
jeudi 23 octobre 2003
Statut
Membre
Dernière intervention
25 août 2008

merci bien,
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)

cordialement,
kevin (kegi@hotmail.com)
Messages postés
435
Date d'inscription
vendredi 20 septembre 2002
Statut
Membre
Dernière intervention
20 novembre 2004

Il sert à récuperer les liens html d'un fichier et à les afficher.
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+
Messages postés
164
Date d'inscription
jeudi 23 octobre 2003
Statut
Membre
Dernière intervention
25 août 2008

le script est suposer faire quoi ?

moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:

http://www.monsite1.com
http://www.monsite2.com

merci de me répondre...

cordialement,
kevin (kegi@hotmail.com)
Afficher les 7 commentaires

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.