Trouver une chaine de caractères entre deux balises [Résolu]

Signaler
Messages postés
26
Date d'inscription
dimanche 9 septembre 2001
Statut
Membre
Dernière intervention
23 janvier 2006
-
Messages postés
2448
Date d'inscription
samedi 21 février 2004
Statut
Modérateur
Dernière intervention
29 janvier 2010
-
Bonjour,

Je n'utilise pas souvent java ... mais voilà ... en ce moment je l'utilise. Je bloque sur un détail. Lorsque je récupère une page web, j'aimerais bien en extraire le titre. Je me suis penché sur les expressions régulières mais toujours rien, je n'y arrive pas ... Quelqu'un pourrait il m'aider ?

Il faut donc extraire ce qu'il y a entre <title> et </title>.

Merci pour votre aide!
charly

5 réponses

Messages postés
2448
Date d'inscription
samedi 21 février 2004
Statut
Modérateur
Dernière intervention
29 janvier 2010
12
import java.io.BufferedReader;


import java.io.File;


import java.io.FileReader;


import java.io.IOException;


import java.net.MalformedURLException;


import java.util.regex.Matcher;


import java.util.regex.Pattern;


public class HTMLutils {


public HTMLutils(){


}


public static String getHtmlTitleMarkup(String htmlFile){


try {


BufferedReader in = new BufferedReader(new FileReader(new File(htmlFile)));


StringBuilder input = new StringBuilder();


int ch;


while ((ch = in.read()) != -1) input.append((char) ch);


String patternString = "<title>+[^"]+</title>";


Pattern pattern = Pattern.compile(patternString, Pattern.CASE_INSENSITIVE);


Matcher matcher = pattern.matcher(input);


while (matcher.find())


{


int start = matcher.start();


int end = matcher.end();


String match = input.substring(start, end);


toreturn = match;


}


} catch (MalformedURLException e) {


e.printStackTrace();


} catch (IOException e) {


e.printStackTrace();


}


return toreturn.substring(7,toreturn.length()-8).trim();


}


public static String toreturn;


}

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Messages postés
750
Date d'inscription
mardi 9 mars 2004
Statut
Membre
Dernière intervention
23 décembre 2008
19
Salut,
le package javax.swing.text.html comporte des classes qui permet de lire du HTML et d'extraire les balises

Voilà

le monde a des idées : la preuve, c'est qu'il y en a de mauvaises
ne comprends pas tout, mais je parle de tout : c'est ce qui compte
Messages postés
2448
Date d'inscription
samedi 21 février 2004
Statut
Modérateur
Dernière intervention
29 janvier 2010
12
heuu si t pas content apres ca ... enfin voila quoi ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Messages postés
26
Date d'inscription
dimanche 9 septembre 2001
Statut
Membre
Dernière intervention
23 janvier 2006

désolé pour le retard ! je vais tester ça tout de suite, en tout cas un graaaaaaaaaaaaaaaaaaaaaaaand merci, ça fait plaisir, vraiment !
Messages postés
2448
Date d'inscription
samedi 21 février 2004
Statut
Modérateur
Dernière intervention
29 janvier 2010
12
lol c rien mais j'avais trimmer pour arriver a faire ce put1 de code avec les expression reguliere ^^
enfin bon bonne utilisation ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"