Conception d'un moteur de recherche

Résolu
cs_moniteur Messages postés 4 Date d'inscription mardi 6 avril 2004 Statut Membre Dernière intervention 22 décembre 2008 - 22 déc. 2008 à 22:04
cs_moniteur Messages postés 4 Date d'inscription mardi 6 avril 2004 Statut Membre Dernière intervention 22 décembre 2008 - 22 déc. 2008 à 22:39
Bonjour,

Je cherche à réaliser un moteur de recherche en php ( / mysql ? ) afin de rechercher dans des fichiers textes (pour simplifier). En faisant quelques recherches, je tombe sur des dizaines de personnes qui ont déjà posé la question mais aucun n'a de réponse :( .
En fait, pour être précis, mon problème est comment organisé ma base de données de façon efficace et afin qu'elle ne se retrouve pas aussi grosse que l'ensemble de mes fichiers textes. C'est à dire 50 Mo de texte = 50 Mo de BDD voire pire.
J'ai bien pensé à créer un BDD où chaque enregistrement ne contienne qu'un seul champ texte (un enregistrement = 1 texte). Mais je trouve ça très bourrin, trop consommateur de CPU et crée une BDD trop grosse.
L'autre possibilité est de créer des enregistrements non pas par fichier texte mais par mot. Chaque enregistrement contient 2 champs, le premier le mot recherché et le deuxième, le ou les fichiers contenant le mot recherché. Peut-être ma meilleur solution.

Actuellement, ce n'est qu'au stade de la réflexion mais comment vous, vous imaginez la chose et surtout, comment ne pas se retrouver avec une base de données absoluement gigantesque dans laquelle chaque recherche nécessite plusieurs heures de CPU par mysql.

Merci pour vos idées.

2 réponses

kohntark Messages postés 3705 Date d'inscription lundi 5 juillet 2004 Statut Membre Dernière intervention 27 avril 2012 30
22 déc. 2008 à 22:21
Salut,

Personnellement je ne vois pas beaucoup d'autres possibilités que de tout mettre en DB. Il y a d'autres possibilités mais qui seraient bien plus complexes à implémenter, et qui ne sont pas du tout nécessaires pour une "si petite" base (50 Mo ce n'est pas la mort) Par contre les requêtes doivent être soignées.

... il y aura sans doute d'autres avis plus pertinent que le mien.

Kohntark -
3
cs_moniteur Messages postés 4 Date d'inscription mardi 6 avril 2004 Statut Membre Dernière intervention 22 décembre 2008
22 déc. 2008 à 22:39
Merci pour cette réponse. En fait, actuellement, je ne connais pas exactement la taille mais au vue du nombre de pdfs, ppt, doc et autres que j'aimerais indexer, je risque malheureusement d'être plus proche des 5000 Mo que des 50 Mo. En fait, ce n'est pas la taille qui me fait peur (même si je trouve ça du gâchis de disque dur d'être obligé de tout avec en double) mais le temps de recherche avec une grosse base de données.

Si d'autre avis sont disponibles...
0
Rejoignez-nous