Trouver une chaine de caractères entre deux balises

Résolu
CrowEye Messages postés 26 Date d'inscription dimanche 9 septembre 2001 Statut Membre Dernière intervention 23 janvier 2006 - 23 janv. 2006 à 00:36
sheorogath Messages postés 2448 Date d'inscription samedi 21 février 2004 Statut Modérateur Dernière intervention 29 janvier 2010 - 23 janv. 2006 à 18:53
Bonjour,

Je n'utilise pas souvent java ... mais voilà ... en ce moment je l'utilise. Je bloque sur un détail. Lorsque je récupère une page web, j'aimerais bien en extraire le titre. Je me suis penché sur les expressions régulières mais toujours rien, je n'y arrive pas ... Quelqu'un pourrait il m'aider ?

Il faut donc extraire ce qu'il y a entre <title> et </title>.

Merci pour votre aide!
charly

5 réponses

sheorogath Messages postés 2448 Date d'inscription samedi 21 février 2004 Statut Modérateur Dernière intervention 29 janvier 2010 17
23 janv. 2006 à 17:15
import java.io.BufferedReader;


import java.io.File;


import java.io.FileReader;


import java.io.IOException;


import java.net.MalformedURLException;


import java.util.regex.Matcher;


import java.util.regex.Pattern;


public class HTMLutils {


public HTMLutils(){


}


public static String getHtmlTitleMarkup(String htmlFile){


try {


BufferedReader in = new BufferedReader(new FileReader(new File(htmlFile)));


StringBuilder input = new StringBuilder();


int ch;


while ((ch = in.read()) != -1) input.append((char) ch);


String patternString = "<title>+[^"]+</title>";


Pattern pattern = Pattern.compile(patternString, Pattern.CASE_INSENSITIVE);


Matcher matcher = pattern.matcher(input);


while (matcher.find())


{


int start = matcher.start();


int end = matcher.end();


String match = input.substring(start, end);


toreturn = match;


}


} catch (MalformedURLException e) {


e.printStackTrace();


} catch (IOException e) {


e.printStackTrace();


}


return toreturn.substring(7,toreturn.length()-8).trim();


}


public static String toreturn;


}

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
3
indiana_jules Messages postés 750 Date d'inscription mardi 9 mars 2004 Statut Membre Dernière intervention 23 décembre 2008 21
23 janv. 2006 à 11:13
Salut,
le package javax.swing.text.html comporte des classes qui permet de lire du HTML et d'extraire les balises

Voilà

le monde a des idées : la preuve, c'est qu'il y en a de mauvaises
ne comprends pas tout, mais je parle de tout : c'est ce qui compte
0
sheorogath Messages postés 2448 Date d'inscription samedi 21 février 2004 Statut Modérateur Dernière intervention 29 janvier 2010 17
23 janv. 2006 à 17:16
heuu si t pas content apres ca ... enfin voila quoi ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
0
CrowEye Messages postés 26 Date d'inscription dimanche 9 septembre 2001 Statut Membre Dernière intervention 23 janvier 2006
23 janv. 2006 à 17:30
désolé pour le retard ! je vais tester ça tout de suite, en tout cas un graaaaaaaaaaaaaaaaaaaaaaaand merci, ça fait plaisir, vraiment !
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
sheorogath Messages postés 2448 Date d'inscription samedi 21 février 2004 Statut Modérateur Dernière intervention 29 janvier 2010 17
23 janv. 2006 à 18:53
lol c rien mais j'avais trimmer pour arriver a faire ce put1 de code avec les expression reguliere ^^
enfin bon bonne utilisation ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
0