flopad
Messages postés528Date d'inscriptionmercredi 28 septembre 2005StatutMembreDernière intervention 6 mars 2009
-
15 févr. 2007 à 10:54
flopad
Messages postés528Date d'inscriptionmercredi 28 septembre 2005StatutMembreDernière intervention 6 mars 2009
-
15 févr. 2007 à 11:24
Bonjour tout le monde,
j'avais sur mon intranet un moteur de recherche interne qui fonctionnait parfaitement.
J'ai changé le mode de fonctionnement, le contenu de mes pages s'affiche via une bdd. Mon ancien moteur ne fonctionne donc plus puiqu'il indexait mes pages lorsque le contenu était en dur dans les pages.
Est ce que qq'un pourrait m'aider pour adapter mon moteur à ce nouveau fonctionnement...?
Voici mon code actuel :
Il faudrait peut être modifier la valeur de la variable textedocument..?
Je ne sais pas comment m'y prendre.
Ma bdd est structurée de la manière suivante :
une table correspond à une page intranet avec un champ id, un champ texte1 et il faudrait surement que je rejoute aussi un champ adresse avec le chemin d'accès à la page?
// *******************************************************************************
// Localisation de l'index dans lequel doit être effectuée la recherche
// *******************************************************************************
$fichierIndex= "indexsite.dat";
// *******************************************************************************
// Liste des "mots vides", dont les valeurs ne doivent pas être prises en compte
// lors des recherches dans l'index
// *******************************************************************************
$motsVides=" and or et ou le la les un une du de des a à au aux son sa ses ne ni non sauf ce ces cet je tu il elle on nous vous ils elles etc mon ma ton ta vos se y en ";
// *******************************************************************************
// Affichage d'un message d'avertissement dans le cas où le site n'a pas encore
// été indexé
// *******************************************************************************
$requete = isset($_POST['requete']) ? $_POST['requete'] : false;
if(!file_exists("indexsite.dat")) {
print("Le site Web n'a pas encore été indexé : veuillez exécuter le script d'indexation avant d'effectuer votre première recherche.\n");
exit;
}
// *******************************************************************************
// Affichage d'un message d'avertissement dans le cas de figure où l'utilisateur
// a activé la recherche sans avoir préalablement saisi de requête ($requete est nul)
// *******************************************************************************
if(!$requete) {
print("<center>\n");
print("\n");
print("Vous avez activé la recherche sans avoir préalablement saisi votre requête.
");
print("Cliquez ici pour effectuer une nouvelle recherche.
\n");
print("\n");
print("</center>\n");
}
else {
// *******************************************************************************
// Cas de figure où l'utilisateur a bien saisi une requête
// *******************************************************************************
// *******************************************************************************
// Analyse de la requête et préparation de la recherche. La requête (entrée par
// l'utilisateur dans la valeur $requete) est décomposée en une série de mots clés,
// stockés dans les tableaux $expressions et $motsCles
// *******************************************************************************
// == = Premier nettoyage de la requête formulée par l'utilisateur ===
$requete=trim(stripslashes($requete));
// *************************************************** // Extraction des expressions entre guillemets // ***************************************************
$nombreMotsCles=count($motsCles)-1; // Nombre de mots-clés à analyser
// ************************************************************************************
// Ouverture du fichier indexsite.dat et stockage des lignes dans le tableau $contenuIndex
// ************************************************************************************
foreach($caractere_special as $caractere_code=>$caractere_traduction){
$titreDocument = str_replace("$caractere_code","$caractere_traduction",$titreDocument);
$texteDocument = str_replace("$caractere_code","$caractere_traduction",$texteDocument);
}
// *************************************************************************** // // Lancement de la procédure d'évaluation des pages ===
// ========================================================
//
// Chaque page est passée en revue et se voit attribuer des points
// selon les règles suivantes :
//
// - 2 point si la requête (considérée comme expression) est présente dans le titre
// - 1 point si la requête (considérée comme expression) est présente dans le texte indexé
//
// - 2 point par expression présente dans le titre
// - 2 point par mot-clé présent dans le titre
//
// - 1 point par expression présente dans le texte indexé
// - 1 point par mot-clé présent dans le texte indexé
//
// Note : une ou plusieurs expressions présentes donnent naturellement un meilleur
// score à la page
//
// ***************************************************************************
// Les différents documents indexés spnt passés en revue et analysés
// === Recherche de la requête (considérée comme expression) dans le titre du document : 2 points
//if(eregi("(^|[ .,:;!?'()])".$requete."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;
// === Recherche de la requête (considérée comme expression) dans le texte indexé : 1 points
if(eregi("(^|[ .,:;!?'()])".$requete."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;
for($a=1;$a<=$nombreExpressions;$a++) { // Recherche des expressions
// === Recherche de l'expression dans le titre du document : 2 points s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$expressions[$a]."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;
// === Recherche de l'expression dans le texte indexé : 1 point s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$expressions[$a]."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;
}
for($b=1;$b<=$nombreMotsCles;$b++) { // Recherche des mots-clés
// l'utilisateur a fait suivre le mot-clé d'une astérisque (il faut donc étendre la recherche)
// === Recherche du mot-clé dans le titre du document : 2 points s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$corMotCle[1],$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;
// === Recherche du mot-clé dans le texte indexé : 1 point s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$corMotCle[1],$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;
}
else {
// le mot-clé ne comporte pas d'astérisque
// === Recherche du mot-clé dans le titre du document : 2 points s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$motsCles[$b]."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;
// === Recherche du mot-clé dans le texte indexé : 1 point s'il y a correspondance
if(eregi("(^|[ .,:;!?'()])".$motsCles[$b]."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;
}
}
}
// ************************************************************************************
// Tri des résultats en vue de leur affichage :
// Les pages seront affichées de la plus pertinente à la moins pertinente
// ************************************************************************************
// Détermination du score le plus élevé parmi toutes les pages analysées
$HiScore=max($score);
// TRI du tableau à l'aide de la fonction asort
arsort($score);
// Création du tableau $documentsCorrespondantsOrd
$documentsCorrespondantsOrd[]=0;
// ************************************************************************************
// Les résultats sont affichés dans un tableau, dont les caractéristiques ont été
// précisées en début de script.
// Note : les pages sont affichées dans l'ordre décroissant de leur pertinence
// ************************************************************************************
print("<table width="$largeurTableau" border="0" align="center"> \n"); // Début du code pour l'affichage du tableau
print("<tr><td> \n");
if($nombreCorrespondances<1) {
print("<center> \n");
print(" \n");
print("Désolé, aucune page ne correspond à la recherche : ' $requete '.
// **************************************************************************
// Sauvegarde de la requête dans le fichier req.txt
// **************************************************************************
Teclis01
Messages postés1423Date d'inscriptionmardi 14 décembre 2004StatutMembreDernière intervention29 décembre 20124 15 févr. 2007 à 11:06
Mon dieu des expression régulières de partout au secourssssss
Euh tu veux adapter ce truc à une bdd ?
Cette url t'explique comment te connecter a une bdd MySQL et je te laisse "découvrir le reste"
http://fr.php.net/manual/fr/function.mysql-connect.php --------------------------------------------------------------------------------------------------
Il vaut mieux poser une question et passer pour bête que le rester toute sa vie
flopad
Messages postés528Date d'inscriptionmercredi 28 septembre 2005StatutMembreDernière intervention 6 mars 2009 15 févr. 2007 à 11:12
Aie....désolé, on fait ce qu'on peut ;-)
En fait, ce n'est pas le fait de me connecter à ma bdd qui me pose problème, c'est la manière de fonctionner.
Je ne sais pas comment m'y prendre pour aller remonter la bonne page correspondant à la recherche...
Teclis01
Messages postés1423Date d'inscriptionmardi 14 décembre 2004StatutMembreDernière intervention29 décembre 20124 15 févr. 2007 à 11:17
fais un echo de $_POST['requete']
--------------------------------------------------------------------------------------------------
Ilvaut mieux poser une question et passer pour bête que le rester toutesa vie
flopad
Messages postés528Date d'inscriptionmercredi 28 septembre 2005StatutMembreDernière intervention 6 mars 2009 15 févr. 2007 à 11:24
Ben le $_POST['requete'] devrait me donner ce qui est à rechercher.
Après, il suffit que je cherche ça dans ma base via un select * from table1, table2,etc... like $_POST['requete'].
Ensuite, je dois pouvoir récupérer l'adresse de la page sans soucis.
Je vais essayer de voir ça, j'aurais aimé garder le fonctionnement d'affichage des résultats que j'avais avant qui se faisait selon le nombre d'occurences...
Il faudrait aussi que je conserve la lecture des pages et des keywords, c'est pourquoi j'aimerais intégrer cette nouvelle recherche à celle existante...