Base de moteur de recherche

Description

Voici les bases d'un moteur de recherche.
En fait, il s'agit plutôt d'un parseur html/css...

Vous entrez l'adresse d'une page html, et il récupère la taille de chaque mot, sa couleur, la couleur de fond, si le mot est en gras, etc.
Il compte aussi les lignes et supporte les css (enfin quand ils sont pas trop compliqués...)

Le script utilise les sockets, il ne marchera donc pas si vous êtes derrière un proxy.

A partir du html décomposé, vous pouvez attribuer des points à chaque mot de chaque page, stocker le tout dans une base de données et créer un magnifique moteur de recherche.

C'était mon projet mais quand j'ai fini le parseur html, je me suis rendu compte qu'il me faudrait encore quelques années avant de le finir, donc j'ai abandonné...

Pour faire fonctionner le parseur, lancez la page index.php, et le résultat s'affichera sous vos yeux.
La fonction qui affiche le résultat se trouve dans le fichier php/robot.php. A partir de là ,au lieu d'afficher le résultat, il suffit de l'enregistrer dans une base de données...

Le script récupère aussi les entête html envoyées au navigateur...

Amusez-vous bien et bon courage pour comprendre le code...

Source / Exemple :


Tout est dans le zip...

Codes Sources

A voir également

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.