PARSEUR DE LIEN DE FICHIER HTML VERS FICHIER TEXTE

quiaimeflash Messages postés 270 Date d'inscription samedi 29 novembre 2003 Statut Membre Dernière intervention 11 juillet 2007 - 27 juin 2004 à 23:18
Skypetarius Messages postés 9 Date d'inscription mercredi 6 juillet 2005 Statut Membre Dernière intervention 14 juillet 2005 - 6 juil. 2005 à 11:47
Cette discussion concerne un article du site. Pour la consulter dans son contexte d'origine, cliquez sur le lien ci-dessous.

https://codes-sources.commentcamarche.net/source/13443-parseur-de-lien-de-fichier-html-vers-fichier-texte

Skypetarius Messages postés 9 Date d'inscription mercredi 6 juillet 2005 Statut Membre Dernière intervention 14 juillet 2005
6 juil. 2005 à 11:47
Bonjour !
Je me demandais s'il étais possible de faire le contraire :
Au lieu de supprimer tout ce qui n'est pas un lien, le script pourrait seulement extraire les infos voulues.
Il stockerai dans des variables ce qui est contenu entre les '', par exemple...

Est-ce possible ? (je suis débutant alors ne m'en voulez pas...)
kegi Messages postés 164 Date d'inscription jeudi 23 octobre 2003 Statut Membre Dernière intervention 25 août 2008
7 janv. 2005 à 01:19
désolé, je me suis rendu compte qu'il y avais une erreur...
le script est bien ce que je cherche mais...
chez moi il ne fonctionne pas super bien :(
il me lesse tout le texte entre les liens

désolé, le cadrage est pourrit ici :D

cordialement,
kevin (kegi@hotmail.com)
kegi Messages postés 164 Date d'inscription jeudi 23 octobre 2003 Statut Membre Dernière intervention 25 août 2008
7 janv. 2005 à 01:15
merci bien,
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)

cordialement,
kevin (kegi@hotmail.com)
defkrie Messages postés 435 Date d'inscription vendredi 20 septembre 2002 Statut Membre Dernière intervention 20 novembre 2004
6 janv. 2005 à 17:13
Il sert à récuperer les liens html d'un fichier et à les afficher.
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+
kegi Messages postés 164 Date d'inscription jeudi 23 octobre 2003 Statut Membre Dernière intervention 25 août 2008
2 janv. 2005 à 23:27
le script est suposer faire quoi ?

moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:

http://www.monsite1.com
http://www.monsite2.com

merci de me répondre...

cordialement,
kevin (kegi@hotmail.com)
defkrie Messages postés 435 Date d'inscription vendredi 20 septembre 2002 Statut Membre Dernière intervention 20 novembre 2004
28 juin 2004 à 16:24
oui tu as raison jai pas fait gaffe je laisse toujours trainer le + or inutile ct vrai en lecture...
je travaille sur une autre source qui fait la meme chose mais en moins de ligne si ja la fini un jour.
Merci.
quiaimeflash Messages postés 270 Date d'inscription samedi 29 novembre 2003 Statut Membre Dernière intervention 11 juillet 2007
27 juin 2004 à 23:18
Il est plutot sympa ton script, j'avais commencer un truc du genre moi aussi...
Mais je supprimais pqs asser de truc.

Par contre, dit si je me trompe mais je crois que le script fonctionne mieux si on ouvre pas le fichier en lecture/ecriture mais juste en lecture, faut juste enlever le + mais bn je recolle ton code :

<?
//[lien.php textelien]
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r");//on ouvre
$texte = fread ($fp, 255000); //on prend le max
fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><head></head><style></style>');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace(" "," ",$texte);
$texte = preg_replace('`<head.*?/head>`', '', $texte);
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte);
$texte = preg_replace('`<style.*?/style>`', '', $texte);
$texte = preg_replace('`/a>.*?
`', '>', $texte);
$texte = preg_replace('`
`', '
', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!
$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`
`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>

Et pis voila...
Rejoignez-nous