Problème extraction liens

Tasslekender Messages postés 1 Date d'inscription lundi 22 décembre 2003 Statut Membre Dernière intervention 12 février 2004 - 12 févr. 2004 à 22:00
cs_abir123 Messages postés 8 Date d'inscription mercredi 8 mars 2006 Statut Membre Dernière intervention 3 mai 2006 - 8 mars 2006 à 14:54
Bonjour ^^
Voilà, je dois réaliser un crawler dans le but de simplifier des sites de presse (dans le cadre d'un projet scolaire) et j'ai un problème dans l'extraction des liens.

Quand je le teste sur des exemples banals, ça marche mais quand je le teste sur des sites de presse, ben ça marche plus >_<

voilà sur quoi je le teste :
$url = "[ofpolitique.asp?idDOC=121880&idCLA=3635

La gauche dépose un recours devant le Conseil constitutionnel
La loi Perben II contestée sitôt votée
L'Assemblée nationale a voté hier le projet de loi sur la grande criminalité par 340 voix (UMP, UDF) contre 173 (PS, PCF) et 9 abstentions. Pour le Parlement, le texte est maintenant définitivement adopté. Mais le PS en appelle déjà au Conseil constitutionnel pour en obtenir l'annulation, au moins partielle.][ofpolitique.asp?idDOC =121880&idCLA=3635 Lire l'article]";

et voici mon code :

while($x = stristr($url, "") -3);
$texte = $x;

if (($debut=strpos($href, """))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, """);
$href = substr($href, 0, $fin);
}

elseif (($debut=strpos($href, "'"))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, "'");
$href = substr($href, 0, $fin);
}

else {
$debut=strpos($href, "=");
$href = substr($href, $debut+1);
}

$texte = substr($texte, strpos($texte, ">") +1);
$texte = substr($texte,0, strpos($texte, ""));

$liens[$href] = $texte;

$url = substr($url, strpos($url, "") +4);
}
print_r($liens);

donc le problème est que sur les deux liens que je veux récupérer (dans la variable $url), il ne m'en sort qu'une seule et je ne vois absolument pas pourquoi :(

Quelqu'un aurait-il la bonté de m'aider ? ^^

2 réponses

myki23 Messages postés 1 Date d'inscription lundi 14 juin 2004 Statut Membre Dernière intervention 14 juin 2004
14 juin 2004 à 10:16
salut! jsais pas ce kil en est de ton probleme mais moi jai a faire un programme ki test les liens! jai le code de test des liens, mais il me faut celui du parcours et de l'extraction des liens... donc si tu peu m'aider merci beaucoup
0
cs_abir123 Messages postés 8 Date d'inscription mercredi 8 mars 2006 Statut Membre Dernière intervention 3 mai 2006
8 mars 2006 à 14:54
0
Rejoignez-nous