Trouver une chaine de caractères entre deux balises [Résolu]

Messages postés
26
Date d'inscription
dimanche 9 septembre 2001
Dernière intervention
23 janvier 2006
- 23 janv. 2006 à 00:36 - Dernière réponse :
Messages postés
2465
Date d'inscription
samedi 21 février 2004
Dernière intervention
29 janvier 2010
- 23 janv. 2006 à 18:53
Bonjour,

Je n'utilise pas souvent java ... mais voilà ... en ce moment je l'utilise. Je bloque sur un détail. Lorsque je récupère une page web, j'aimerais bien en extraire le titre. Je me suis penché sur les expressions régulières mais toujours rien, je n'y arrive pas ... Quelqu'un pourrait il m'aider ?

Il faut donc extraire ce qu'il y a entre <title> et </title>.

Merci pour votre aide!
charly
Afficher la suite 

Votre réponse

5 réponses

Meilleure réponse
Messages postés
2465
Date d'inscription
samedi 21 février 2004
Dernière intervention
29 janvier 2010
23 janv. 2006 à 17:15
3
Merci
import java.io.BufferedReader;


import java.io.File;


import java.io.FileReader;


import java.io.IOException;


import java.net.MalformedURLException;


import java.util.regex.Matcher;


import java.util.regex.Pattern;


public class HTMLutils {


public HTMLutils(){


}


public static String getHtmlTitleMarkup(String htmlFile){


try {


BufferedReader in = new BufferedReader(new FileReader(new File(htmlFile)));


StringBuilder input = new StringBuilder();


int ch;


while ((ch = in.read()) != -1) input.append((char) ch);


String patternString = "<title>+[^"]+</title>";


Pattern pattern = Pattern.compile(patternString, Pattern.CASE_INSENSITIVE);


Matcher matcher = pattern.matcher(input);


while (matcher.find())


{


int start = matcher.start();


int end = matcher.end();


String match = input.substring(start, end);


toreturn = match;


}


} catch (MalformedURLException e) {


e.printStackTrace();


} catch (IOException e) {


e.printStackTrace();


}


return toreturn.substring(7,toreturn.length()-8).trim();


}


public static String toreturn;


}

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"

Merci sheorogath 3

Avec quelques mots c'est encore mieux Ajouter un commentaire

Codes Sources a aidé 92 internautes ce mois-ci

Commenter la réponse de sheorogath
Messages postés
750
Date d'inscription
mardi 9 mars 2004
Dernière intervention
23 décembre 2008
23 janv. 2006 à 11:13
0
Merci
Salut,
le package javax.swing.text.html comporte des classes qui permet de lire du HTML et d'extraire les balises

Voilà

le monde a des idées : la preuve, c'est qu'il y en a de mauvaises
ne comprends pas tout, mais je parle de tout : c'est ce qui compte
Commenter la réponse de indiana_jules
Messages postés
2465
Date d'inscription
samedi 21 février 2004
Dernière intervention
29 janvier 2010
23 janv. 2006 à 17:16
0
Merci
heuu si t pas content apres ca ... enfin voila quoi ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Commenter la réponse de sheorogath
Messages postés
26
Date d'inscription
dimanche 9 septembre 2001
Dernière intervention
23 janvier 2006
23 janv. 2006 à 17:30
0
Merci
désolé pour le retard ! je vais tester ça tout de suite, en tout cas un graaaaaaaaaaaaaaaaaaaaaaaand merci, ça fait plaisir, vraiment !
Commenter la réponse de CrowEye
Messages postés
2465
Date d'inscription
samedi 21 février 2004
Dernière intervention
29 janvier 2010
23 janv. 2006 à 18:53
0
Merci
lol c rien mais j'avais trimmer pour arriver a faire ce put1 de code avec les expression reguliere ^^
enfin bon bonne utilisation ^^

"n'est pas mort ce qui semble a jamais dormir et en d'etrange temps meme la mort peut mourrir"
Commenter la réponse de sheorogath

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.