regex pour extraire du code entre 2 balises

Question

bonjour, ça fait quelques heures que je cherche, je trouve pas comment faire, je voudrais extraire du texte d'une page html, ce texte est compris entre 2 balises et je n'arrive pas et je me pause une question en plus, les expressions régulières de ce type sont faites pour fonctionner sur une ligne, donc si il y a des retours à la ligne, et bien comment ça se passe. parce que si je veux extraire un bloc de données contenant des retours à la ligne, des vrais " ", pas des , et ben il faut tester sur plusieurs ligne, mais justement, je crois que ça le fait pas les regex. Je pense qu'il faudrait déjà linéariser tout sur une seule ligne, non ??? merci

audayls · Answer

Salut, Tu essaye d'extraire les valeurs dans les balises (genre : "") ou ce que contenus (genre "Contenu) ? For every choice, a consequence (Fable)

cs_PaDa · Answer

Hi, PHP gère bien le multiligne dans ses regex, aucun souci. Donc tu passes dans une seule variable chaine ce que tu veux traiter, en effet, mais ensuite plus aucun souci PHP se débrouille. Tu peux utiliser un pattern du type : "!]+)?>(.*)!Ui" L'option "U" va chercher à raccourcir au maximum le matching, ca rend le "*" non gourmand, pour éviter de chopper plusieurs blocs ... dans ton retour. L'option "i" c'est juste pour que ce soit insensible a la casse (possibilité d'avoir par exemple) Code final : PaDa

cs_PaDa · Answer

Oups. Oublié le code final: if (preg_match("!]+)?>(.*)!Ui",$tontext,$matches)) { echo "Il y a bien des blocs TR !"; print_r($matches); } PaDa

Regex pour extraire du code entre 2 balises

3 réponses

Votre réponse

Discussions similaires