Recupérer le code source d'une page web avec httpclient

Messages postés
52
Date d'inscription
jeudi 12 juillet 2007
Statut
Membre
Dernière intervention
15 avril 2013
- - Dernière réponse : the_wwt
Messages postés
177
Date d'inscription
jeudi 5 octobre 2006
Statut
Membre
Dernière intervention
16 janvier 2009
- 14 mai 2008 à 09:26
Salut,Je suis entrain de développer une application qui nécessite la récupération du code source de cette page.
Pour cela je suis entrain d'utiliser la fonction présenté ci-dessous,la probléme que cette fonction marche parfois et dans beaucoup de cas elle ne marche surtout lorsque je vais avois le code source d'une page distante(et encore plus lorsque j'ai un proxy).
Pour rémedier cette probléme j'ai entendu de l'api httpclient ,je l'ai installé en utilisant de faire l'equivalence du fonction ci dessous mais toujours sans aucune resultat.


voila le code que je l'utilise mais pour beaucoup des sites il m'affiche des erreurs donc priére de m'aider à resoudre cette problemeet merci d'avance:


 public StringBuffer getURLContent(String link) {
  StringBuffer sb = new StringBuffer();
  List len = new ArrayList();
  lineCount = 0;
  try {
   URL url = new URL(link);


   
   
   
   
   BufferedReader in = new BufferedReader(new InputStreamReader(url
     .openStream()));
   String line;
   while ((line = in.readLine()) != null) {
    sb.append(line + "\n\n"); //$NON-NLS-1$
    lineCount++;
   }
   in.close();


   return sb;
  } catch (IOException e) {
   e.printStackTrace();//$NON-NLS-1$
  }
  return sb;
 }



et donc mon probleme est comment recupérer le code source du page (link), avec le code ci dessous
elle marche parfois et parfois non , c pourquois je veux utiliser httpclient en espérant quelle soit plus performants.Toute autre information sera le bien venue
Afficher la suite 

5 réponses

Messages postés
177
Date d'inscription
jeudi 5 octobre 2006
Statut
Membre
Dernière intervention
16 janvier 2009
1
0
Merci
Bonjour,
un petit test de httpclient ci-dessous.
A noter que ton class-path doit contenir les jars suivants:
commons-codec-1.3.jar
commons-logging-1.1.jar
commons-httpclient-3.0.1.jar

PS: "Tue à dé prograit a fer en FRANCAIS"
Pierrick

import

java.io.BufferedInputStream;
import

java.io.IOException;
import

org.apache.commons.httpclient.DefaultHttpMethodRetryHandler;
import

org.apache.commons.httpclient.HttpClient;
import

org.apache.commons.httpclient.HttpException;
import

org.apache.commons.httpclient.HttpStatus;
import

org.apache.commons.httpclient.methods.GetMethod;
import

org.apache.commons.httpclient.params.HttpMethodParams;
/**

* Test de http client

*

@author phymbert*

*/

public

classTestHtmlClient
{


/***

@param args N/A*/

publicstaticvoidmain(String[]
args)
{


// Le client HTTP

HttpClient
client
=
new HttpClient();

// La méthode GET du protoccol HTTP

GetMethod
method
=
newGetMethod(
"http://www.google.com");


// Provide custom retry handler is necessary

method.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,

newDefaultHttpMethodRetryHandler(
1,
false));

try{


// Execute la méthode HTTP

intstatusCode
=
client . executeMethod(method);

// Vérifie le code de retour

if(
statusCode! =
HttpStatus.SC_OK)
{


return;


}


// Le buffer de lecture des données

BufferedInputStream
br
=
null;


// 5 MO de buffer

byte[]
buffer
=
newbyte[(
int)(
5*
Math.pow(
2,
20)
)];


// La taille total de la page

longsize
=
0 ;


// La taille actuellement lue

intread
=
-
1;


try{


//Ouvre le buffer de lecture

br
=
new BufferedInputStream(
method.getResponseBodyAsStream()
);


// C'est partit on lit la page

while(
(
read
=
br.read(buffer,
0,
buffer.length)
)
>
0){


// Traite les données

processData(buffer,
0,
read,
size);

size
+=
read ;

}


}
catch
(
Exceptione)
{


}
finally{


if(
br
! =
null)


try{


br.close();

}
catch
(
Exceptione)
{


}


}


}
catch(
HttpExceptione)
{


}
catch(
IOExceptione)
{


}
finally{


// Release the connection.

method.releaseConnection();

}


}


/*** Traite les données.

*

@param buffer Le buffer contenant les données*

@param i L'index de départ des données à traiter*

@param size La taille des données à traiter*

@param total Le nombre de données total déjà traités*/

privatestaticvoidprocessData(
byte[]
buffer,
inti,
intsize,
longtotal)
{


// Affiche le résultat dans la console

String
data
=
newString(buffer,
i,
size);

System.out.println(
data
);


}}
Commenter la réponse de the_wwt
Messages postés
52
Date d'inscription
jeudi 12 juillet 2007
Statut
Membre
Dernière intervention
15 avril 2013
0
Merci
Merci pour votre aide ,
J'ai essayé ce code mais il m'affiche l'erreur suivante:
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory

at org.apache.commons.httpclient.HttpClient.<clinit>(

HttpClient.java:66)at test.TestHtmlClient.main(

TestHtmlClient.java:59)
Commenter la réponse de cs_fraisa1985
Messages postés
177
Date d'inscription
jeudi 5 octobre 2006
Statut
Membre
Dernière intervention
16 janvier 2009
1
0
Merci
BONJOUR,
j'ai écrit:
"A noter que ton class-path doit contenir les jars suivants:
commons-codec-1.3.jar
commons-logging-1.1.jar
commons-httpclient-3.0.1.jar"

Cordialement,
Commenter la réponse de the_wwt
Messages postés
52
Date d'inscription
jeudi 12 juillet 2007
Statut
Membre
Dernière intervention
15 avril 2013
0
Merci
merci beaucoup ,elle marche parfaitement mais lorsque je met en paramétre une fichier locale (par exemple [file://c:/index.html file://c:/index.html]) il m'affiche l'erreur suivante :


Exception in thread "main" java.lang.IllegalStateException: unsupported protocol: 'file'


at org.apache.commons.httpclient.protocol.Protocol.lazyRegisterProtocol(Protocol.java:149)


at org.apache.commons.httpclient.protocol.Protocol.getProtocol(Protocol.java:117)


at org.apache.commons.httpclient.HttpHost.(HttpHost.java:107)


at org.apache.commons.httpclient.HttpMethodBase.setURI(HttpMethodBase.java:280)


at org.apache.commons.httpclient.HttpMethodBase.(HttpMethodBase.java:220)


at org.apache.commons.httpclient.methods.GetMethod.(GetMethod.java:89)


at test.TestHtmlClient.main(TestHtmlClient.java:52)


Qu'est ce que je dois faire et merci beaucoup
Commenter la réponse de cs_fraisa1985
Messages postés
177
Date d'inscription
jeudi 5 octobre 2006
Statut
Membre
Dernière intervention
16 janvier 2009
1
0
Merci
Bonjour,
c'est normal http client gère le protocole http donc avec un client et un serveur web.
Pour lire un fichier local tu n'as pas besoin de http client, utilise l'api de gestions des fichiers de java, et là c'est hors sujet.
A plus,
Pierrick
Commenter la réponse de the_wwt