Faire les statistiques (keywords,contenu) d'une page html
jinines
Messages postés4Date d'inscriptionmercredi 9 février 2005StatutMembreDernière intervention 6 mars 2005
-
25 févr. 2005 à 20:21
sisadel
Messages postés29Date d'inscriptionmardi 4 avril 2006StatutMembreDernière intervention12 août 2006
-
30 mai 2006 à 10:48
Salut à tous,
Je cherche à créer mon propre moteur de recherche mais qui ferait une recherche uniquement sur les url déjà visités.Pour ça il faudrait que je trouve un moyen de mettre dans un Set tous les keywords, et dans un autre tous les autres mots contenus.
J'ai déjà commencé, j'ai le contenu de toute la page html de l'url (avec les tags etc...) dans un fichier .txt, et maintenant il faut que je fasse le tri entre keywords,mots contenus, tags et ponctuation (qui ne me servent à rien).
Est-ce que quelqu'un pourrait m'aider et me dire ce qu'il faut que je fasse.
Je suis débutante et je fais ça par plaisir (et un peu maso aussi ).
Merci d'avance !
A voir également:
Faire les statistiques (keywords,contenu) d'une page html
jinines
Messages postés4Date d'inscriptionmercredi 9 février 2005StatutMembreDernière intervention 6 mars 2005 6 mars 2005 à 22:00
Coucou,merci pour ta réponse. Utiliser les collections n'est pas une contrainte...d'ailleurs j'ai aucune contrainte vu que je le fais toute seule :-), disons que ma seule contrainte est que ce ne soit pas trop dur pour moi :-). Sinon j'avais pensé à ça parce que je ferai la recherche uniquement sur les pages web déjà visitées (donc pas très nombreuses logiquement)...donc aucune prétention googelienne :-). J'ai déjà l'algo pour trouver tous les mots significatifs contenus dans un code html (pas la ponctuation,ni les chiffres,ni les tags), il ne me reste plus que celui pour les keywords (dans le tag <meta name="keywords" contents="blablabla">), et c'est le blabla qu'il reste à mettre dans un Set. :-), mais j'y arriverais bien :-)
Merci beaucoup, @ + !
sisadel
Messages postés29Date d'inscriptionmardi 4 avril 2006StatutMembreDernière intervention12 août 2006 30 mai 2006 à 10:48
bonjour moi en fait je develope un meta moteur de recherche ,et je voudrai reccuperer les tag meta pour faire des statistiques sur le nombre d'occurence de chaque keyword dans le document j'utilise un HtmlDocument.Iterator pour le tag META mais il ne marche pas meme si il fonctionne avec d'autre tag(A,BR,..)avez vous une solution .merci