Trouver une chaine de caractères entre deux balises [Résolu]

CrowEye 26 Messages postés dimanche 9 septembre 2001Date d'inscription 23 janvier 2006 Dernière intervention - 23 janv. 2006 à 00:36 - Dernière réponse : sheorogath 2465 Messages postés samedi 21 février 2004Date d'inscription 29 janvier 2010 Dernière intervention
- 23 janv. 2006 à 18:53
Bonjour,

Je n'utilise pas souvent java ... mais voilà ... en ce moment je l'utilise. Je bloque sur un détail. Lorsque je récupère une page web, j'aimerais bien en extraire le titre. Je me suis penché sur les expressions régulières mais toujours rien, je n'y arrive pas ... Quelqu'un pourrait il m'aider ?

Il faut donc extraire ce qu'il y a entre <title> et </title>.

Merci pour votre aide!
charly
Afficher la suite 

5 réponses

Répondre au sujet
sheorogath 2465 Messages postés samedi 21 février 2004Date d'inscription 29 janvier 2010 Dernière intervention - 23 janv. 2006 à 17:15
+3
Utile
import java.io.BufferedReader;


import java.io.File;


import java.io.FileReader;


import java.io.IOException;


import java.net.MalformedURLException;


import java.util.regex.Matcher;


import java.util.regex.Pattern;


public class HTMLutils {


public HTMLutils(){


}


public static String getHtmlTitleMarkup(String htmlFile){


try {


BufferedReader in = new BufferedReader(new FileReader(new File(htmlFile)));


StringBuilder input = new StringBuilder();


int ch;


while ((ch = in.read()) != -1) input.append((char) ch);


String patternString = "<title>+[^"]+</title>";


Pattern pattern = Pattern.compile(patternString, Pattern.CASE_INSENSITIVE);


Matcher matcher = pattern.matcher(input);


while (matcher.find())


{


int start = matcher.start();


int end = matcher.end();


String match = input.substring(start, end);


toreturn = match;


}


} catch (MalformedURLException e) {


e.printStackTrace();


} catch (IOException e) {


e.printStackTrace();


}


return toreturn.substring(7,toreturn.length()-8).trim();


}


public static String toreturn;


}

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Cette réponse vous a-t-elle aidé ?  
Commenter la réponse de sheorogath
indiana_jules 750 Messages postés mardi 9 mars 2004Date d'inscription 23 décembre 2008 Dernière intervention - 23 janv. 2006 à 11:13
0
Utile
Salut,
le package javax.swing.text.html comporte des classes qui permet de lire du HTML et d'extraire les balises

Voilà

le monde a des idées : la preuve, c'est qu'il y en a de mauvaises
ne comprends pas tout, mais je parle de tout : c'est ce qui compte
Commenter la réponse de indiana_jules
sheorogath 2465 Messages postés samedi 21 février 2004Date d'inscription 29 janvier 2010 Dernière intervention - 23 janv. 2006 à 17:16
0
Utile
heuu si t pas content apres ca ... enfin voila quoi ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Commenter la réponse de sheorogath
CrowEye 26 Messages postés dimanche 9 septembre 2001Date d'inscription 23 janvier 2006 Dernière intervention - 23 janv. 2006 à 17:30
0
Utile
désolé pour le retard ! je vais tester ça tout de suite, en tout cas un graaaaaaaaaaaaaaaaaaaaaaaand merci, ça fait plaisir, vraiment !
Commenter la réponse de CrowEye
sheorogath 2465 Messages postés samedi 21 février 2004Date d'inscription 29 janvier 2010 Dernière intervention - 23 janv. 2006 à 18:53
0
Utile
lol c rien mais j'avais trimmer pour arriver a faire ce put1 de code avec les expression reguliere ^^
enfin bon bonne utilisation ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Commenter la réponse de sheorogath

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.