Extraire les urls dans fichier js avec php

maamourihechmi Messages postés 4 Date d'inscription lundi 14 juillet 2014 Statut Membre Dernière intervention 21 août 2014 - 21 août 2014 à 11:53
jordane45 Messages postés 38136 Date d'inscription mercredi 22 octobre 2003 Statut Modérateur Dernière intervention 16 avril 2024 - 22 août 2014 à 15:40
Bonjour,
je suis en train de développer un script php qui faire le scanne d'un site web(comme l'outil Xenu ).
pour ce faire j'ai utilisé le CURL pour extraire tout les types d'urls générer par le code source,de même pour le css j'ai trouvé une solution pour extraire tout les urls.
il me reste seulement d'extraire les urls qui se trouvent dans les fichiers js.
j'ai cherché sur internet mais je trouve rien.
est ce qu'il existe une solution??
et grand merci pour votre aide.

2 réponses

NHenry Messages postés 15112 Date d'inscription vendredi 14 mars 2003 Statut Modérateur Dernière intervention 13 avril 2024 159
22 août 2014 à 14:29
Une technique serait de lire le contenu du fichier et de repérer les chaines "http://" ou "https://", puis d'aller au prochain caractère " ou espace pour trouver la fin de l'URL.
0
jordane45 Messages postés 38136 Date d'inscription mercredi 22 octobre 2003 Statut Modérateur Dernière intervention 16 avril 2024 344
22 août 2014 à 15:40
Bonjour,
Nherny a raison....
1 - Récupérer le contenu du fichier (lecture)
http://php.net/manual/fr/function.file-get-contents.php

2 - Détecter les URLs ( Utilise des expressions régulières.. c'est le plus simple).
function getAllUrlFromString($string)
{
    $regex = '/https?\:\/\/[^" ]+/i';
    preg_match_all($regex, $string, $matches);
    return ($matches[0]);
}
0
Rejoignez-nous