Recupérer le code source d'une page web avec httpclient

cs_fraisa1985 Messages postés 52 Date d'inscription jeudi 12 juillet 2007 Statut Membre Dernière intervention 15 avril 2013 - 8 mai 2008 à 18:19
the_wwt Messages postés 177 Date d'inscription jeudi 5 octobre 2006 Statut Membre Dernière intervention 16 janvier 2009 - 14 mai 2008 à 09:26
Salut,Je suis entrain de développer une application qui nécessite la récupération du code source de cette page.
Pour cela je suis entrain d'utiliser la fonction présenté ci-dessous,la probléme que cette fonction marche parfois et dans beaucoup de cas elle ne marche surtout lorsque je vais avois le code source d'une page distante(et encore plus lorsque j'ai un proxy).
Pour rémedier cette probléme j'ai entendu de l'api httpclient ,je l'ai installé en utilisant de faire l'equivalence du fonction ci dessous mais toujours sans aucune resultat.


voila le code que je l'utilise mais pour beaucoup des sites il m'affiche des erreurs donc priére de m'aider à resoudre cette problemeet merci d'avance:


 public StringBuffer getURLContent(String link) {
  StringBuffer sb = new StringBuffer();
  List len = new ArrayList();
  lineCount = 0;
  try {
   URL url = new URL(link);


   
   
   
   
   BufferedReader in = new BufferedReader(new InputStreamReader(url
     .openStream()));
   String line;
   while ((line = in.readLine()) != null) {
    sb.append(line + "\n\n"); //$NON-NLS-1$
    lineCount++;
   }
   in.close();


   return sb;
  } catch (IOException e) {
   e.printStackTrace();//$NON-NLS-1$
  }
  return sb;
 }



et donc mon probleme est comment recupérer le code source du page (link), avec le code ci dessous
elle marche parfois et parfois non , c pourquois je veux utiliser httpclient en espérant quelle soit plus performants.Toute autre information sera le bien venue

5 réponses

the_wwt Messages postés 177 Date d'inscription jeudi 5 octobre 2006 Statut Membre Dernière intervention 16 janvier 2009 1
9 mai 2008 à 14:46
Bonjour,
un petit test de httpclient ci-dessous.
A noter que ton class-path doit contenir les jars suivants:
commons-codec-1.3.jar
commons-logging-1.1.jar
commons-httpclient-3.0.1.jar

PS: "Tue à dé prograit a fer en FRANCAIS"
Pierrick

import

java.io.BufferedInputStream;
import

java.io.IOException;
import

org.apache.commons.httpclient.DefaultHttpMethodRetryHandler;
import

org.apache.commons.httpclient.HttpClient;
import

org.apache.commons.httpclient.HttpException;
import

org.apache.commons.httpclient.HttpStatus;
import

org.apache.commons.httpclient.methods.GetMethod;
import

org.apache.commons.httpclient.params.HttpMethodParams;
/**

* Test de http client

*

@author phymbert*

*/

public

classTestHtmlClient
{


/***

@param args N/A*/

publicstaticvoidmain(String[]
args)
{


// Le client HTTP

HttpClient
client
=
new HttpClient();

// La méthode GET du protoccol HTTP

GetMethod
method
=
newGetMethod(
"http://www.google.com");


// Provide custom retry handler is necessary

method.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,

newDefaultHttpMethodRetryHandler(
1,
false));

try{


// Execute la méthode HTTP

intstatusCode
=
client . executeMethod(method);

// Vérifie le code de retour

if(
statusCode! =
HttpStatus.SC_OK)
{


return;


}


// Le buffer de lecture des données

BufferedInputStream
br
=
null;


// 5 MO de buffer

byte[]
buffer
=
newbyte[(
int)(
5*
Math.pow(
2,
20)
)];


// La taille total de la page

longsize
=
0 ;


// La taille actuellement lue

intread
=
-
1;


try{


//Ouvre le buffer de lecture

br
=
new BufferedInputStream(
method.getResponseBodyAsStream()
);


// C'est partit on lit la page

while(
(
read
=
br.read(buffer,
0,
buffer.length)
)
>
0){


// Traite les données

processData(buffer,
0,
read,
size);

size
+=
read ;

}


}
catch
(
Exceptione)
{


}
finally{


if(
br
! =
null)


try{


br.close();

}
catch
(
Exceptione)
{


}


}


}
catch(
HttpExceptione)
{


}
catch(
IOExceptione)
{


}
finally{


// Release the connection.

method.releaseConnection();

}


}


/*** Traite les données.

*

@param buffer Le buffer contenant les données*

@param i L'index de départ des données à traiter*

@param size La taille des données à traiter*

@param total Le nombre de données total déjà traités*/

privatestaticvoidprocessData(
byte[]
buffer,
inti,
intsize,
longtotal)
{


// Affiche le résultat dans la console

String
data
=
newString(buffer,
i,
size);

System.out.println(
data
);


}}
0
cs_fraisa1985 Messages postés 52 Date d'inscription jeudi 12 juillet 2007 Statut Membre Dernière intervention 15 avril 2013
10 mai 2008 à 14:17
Merci pour votre aide ,
J'ai essayé ce code mais il m'affiche l'erreur suivante:
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory

at org.apache.commons.httpclient.HttpClient.<clinit>(

HttpClient.java:66)at test.TestHtmlClient.main(

TestHtmlClient.java:59)
0
the_wwt Messages postés 177 Date d'inscription jeudi 5 octobre 2006 Statut Membre Dernière intervention 16 janvier 2009 1
10 mai 2008 à 15:11
BONJOUR,
j'ai écrit:
"A noter que ton class-path doit contenir les jars suivants:
commons-codec-1.3.jar
commons-logging-1.1.jar
commons-httpclient-3.0.1.jar"

Cordialement,
0
cs_fraisa1985 Messages postés 52 Date d'inscription jeudi 12 juillet 2007 Statut Membre Dernière intervention 15 avril 2013
13 mai 2008 à 22:20
merci beaucoup ,elle marche parfaitement mais lorsque je met en paramétre une fichier locale (par exemple [file://c:/index.html file://c:/index.html]) il m'affiche l'erreur suivante :


Exception in thread "main" java.lang.IllegalStateException: unsupported protocol: 'file'


at org.apache.commons.httpclient.protocol.Protocol.lazyRegisterProtocol(Protocol.java:149)


at org.apache.commons.httpclient.protocol.Protocol.getProtocol(Protocol.java:117)


at org.apache.commons.httpclient.HttpHost.(HttpHost.java:107)


at org.apache.commons.httpclient.HttpMethodBase.setURI(HttpMethodBase.java:280)


at org.apache.commons.httpclient.HttpMethodBase.(HttpMethodBase.java:220)


at org.apache.commons.httpclient.methods.GetMethod.(GetMethod.java:89)


at test.TestHtmlClient.main(TestHtmlClient.java:52)


Qu'est ce que je dois faire et merci beaucoup
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
the_wwt Messages postés 177 Date d'inscription jeudi 5 octobre 2006 Statut Membre Dernière intervention 16 janvier 2009 1
14 mai 2008 à 09:26
Bonjour,
c'est normal http client gère le protocole http donc avec un client et un serveur web.
Pour lire un fichier local tu n'as pas besoin de http client, utilise l'api de gestions des fichiers de java, et là c'est hors sujet.
A plus,
Pierrick
0
Rejoignez-nous