Ironpython et htmlunit

Signaler
Messages postés
2
Date d'inscription
vendredi 30 mars 2012
Statut
Membre
Dernière intervention
21 mai 2012
-
Bonjour, voila
je sais que ce que j'essaie de faire est un peu ambitieux pour un tout petit but, mais je suis sur un petit projet pour faire du webscrapping de certains sites, qui doit pouvoir être redistribué, notamment sur les ordis de la pme où je travail, et tourner sous windows.
un de ces sites génère tout son contenu par du javascript, tout étant "packé", ne connaissant pas grand chose au javascript je me suis mis à la recherche d'un headless browser utilisale en python et supportant le javascript (tout le monde parle de selenium et de windmill, mais bon, pour la redistribution je suppose que c'est pas le pied, et j'aimerai éviter de faire dépendre mon programme de l'ouverture d'un "vrai" navigateur)apparemment, sous linux on a spider-monkey qui peut aider, rien sous windows .. ! Bon, finalement, me suis dit que c'etait sans doute le moment de m’intéresser à Ironpython et de faire mon appli sur .NET, avec toutes les librairies qui existent et la WPF ou windows forms qui ont l'air si simples d'utilisation.mais en fait.. ben pas grand chose pour ce que je demande. c'est la que ça devient drôle pour qqun qui ne connait pas grand-chose à .net ni à java, il semblerait que la meilleure solution pour ce que je cherche est htmlunit, librairie java, qu'on peut compiler par ikvm pour .NEt, trouvé tout ça là : http://blog.stevensanderson.com/2010/03/30/using-htmlunit-on-net-for-headless-browser-automation/
ok, compilé htmlunit avec ikvm dans un fichier htmlunit.dll, et c'est là que ma méconnaissance de l’environnement .net se montre
apres
import clr
clr.AddReferenceToFile('html.dll')
import com.gargoylesoftware.htmlunit as htmlunit

br = htmlunit.WebClient() 

pas d'erreur, mais tout appel a une methode du WebClient lance une exception, et si j'essaie de definir un BrowserVersion avant ça envoie la même exception, à savoir : une exception a été levée par l'initialiseur de type

quelqu'un aurait une idée de quel côté chercher ? parce que là, après moultes et moultes requêtes google, et sachant que j'ai sans doute trop peu de connaissance du sujet, je m'exaspère et abandonne.
A voir également: