Recherche dans bdd

flopad Messages postés 528 Date d'inscription mercredi 28 septembre 2005 Statut Membre Dernière intervention 6 mars 2009 - 15 févr. 2007 à 10:54
flopad Messages postés 528 Date d'inscription mercredi 28 septembre 2005 Statut Membre Dernière intervention 6 mars 2009 - 15 févr. 2007 à 11:24
Bonjour tout le monde,

j'avais sur mon intranet un moteur de recherche interne qui fonctionnait parfaitement.
J'ai changé le mode de fonctionnement, le contenu de mes pages s'affiche via une bdd. Mon ancien moteur ne fonctionne donc plus puiqu'il indexait mes pages lorsque le contenu était en dur dans les pages.

Est ce que qq'un pourrait m'aider pour adapter mon moteur à ce nouveau fonctionnement...?

Voici mon code actuel :

Il faudrait peut être modifier la valeur de la variable textedocument..?
Je ne sais pas comment m'y prendre.
Ma bdd est structurée de la manière suivante :
une table correspond à une page intranet avec un champ id, un champ texte1 et il faudrait surement que je rejoute aussi un champ adresse avec le chemin d'accès à la page?

// *******************************************************************************
// Localisation de l'index dans lequel doit être effectuée la recherche
// *******************************************************************************


$fichierIndex= "indexsite.dat";


// *******************************************************************************
// Liste des "mots vides", dont les valeurs ne doivent pas être prises en compte
// lors des recherches dans l'index
// *******************************************************************************


$motsVides=" and or et ou le la les un une du de des a à au aux son sa ses ne ni non sauf ce ces cet je tu il elle on nous vous ils elles etc mon ma ton ta vos se y en ";


// *******************************************************************************
// Affichage d'un message d'avertissement dans le cas où  le site n'a pas encore
// été indexé
// *******************************************************************************


$requete = isset($_POST['requete']) ? $_POST['requete'] : false;
if(!file_exists("indexsite.dat")) {
  print("Le site Web n'a pas encore été indexé : veuillez exécuter le script d'indexation avant d'effectuer votre première recherche.\n");
  exit;
}


// *******************************************************************************
// Affichage d'un message d'avertissement dans le cas de figure où l'utilisateur
// a activé la recherche sans avoir préalablement saisi de requête ($requete est nul)
// *******************************************************************************


if(!$requete) {
  print("<center>\n");
  print("\n");
  print("Vous avez activé la recherche sans avoir préalablement saisi votre requête.
");
  print("Cliquez ici pour effectuer une nouvelle recherche.
\n");
  print("\n");
  print("</center>\n");
}


else {


// *******************************************************************************
// Cas de figure où l'utilisateur a bien saisi une requête
// *******************************************************************************


  // *******************************************************************************
  // Analyse de la requête et préparation de la recherche. La requête (entrée par
  // l'utilisateur dans la valeur $requete) est décomposée en une série de mots clés,
  // stockés dans les tableaux $expressions et $motsCles
  // *******************************************************************************


  // == = Premier nettoyage de la requête formulée par l'utilisateur ===


  $requete=trim(stripslashes($requete));


  // ***************************************************  // Extraction des expressions entre guillemets
  // ***************************************************


  $requete1=$requete;


  $expressions[]="Liste des expressions";


  while($testExpress=ereg("["]([^"]+)["]",$requete1,$corresExpress)) {
    $exp=$corresExpress[1];
    $expressions[]=$exp;
    $requete1=ereg_replace($corresExpress[0],"",$requete1);
  }


  $nombreExpressions=count($expressions)-1; // Nombre d'expressions à analyser
 
  // ********************************  // Extraction des mots-clés
  // ********************************
 


 


  // ********************************  // Extraction des mots-clés
  // ********************************


  // === Définition de la fonction netGuil,
  // utilisée pour le nettoyage des termes
  // isolés compris entre guillemets ===


  function netGuil($term) {
    if(ereg("^["]*([^"]+)["]*$",$term,$corres)) {
      $reps=$corres[1];
      return $reps;
    }
    else {
      return($term);
    }
  }


  // Stockage des valeurs dans le tableau $motsCles


  $requete2=$requete;


  $motsCles[]="Liste des mots-clés";


  $mot=trim(stripslashes(strtok($requete2," ")));
  if(!(ereg("[ ]".$mot."[ ]",$motsVides))) {
    $motsCles[]=netGuil($mot);
  }
  while($mot=trim(stripslashes(strtok(" ")))) {
    if($mot and (!(ereg("[ ]".$mot."[ ]",$motsVides)))) {
      $motsCles[]=netGuil($mot);
    }
  }


  $nombreMotsCles=count($motsCles)-1;       // Nombre de mots-clés à analyser




  // ************************************************************************************
  // Ouverture du fichier indexsite.dat et stockage des lignes dans le tableau $contenuIndex
  // ************************************************************************************


  $contenuIndex=file($fichierIndex);


  $nlignesIndex=count($contenuIndex);
  $nombreDocumentsIndexes=($nlignesIndex-1)/4;


  // ************************************************************************************
  // Stockage des données dans les tableaux $cheminDocument, $titreDocument,
  // $descriptionDocument, $texteDocument
  // ************************************************************************************


  for($compt=1;$compt<=$nombreDocumentsIndexes;$compt++) {
    $cheminDocument[$compt]=trim(stripslashes($contenuIndex[(4*($compt-1))+1]));
    $titreDocument[$compt]=trim(stripslashes($contenuIndex[(4*($compt-1))+2]));
    $descriptionDocument[$compt]=trim(stripslashes($contenuIndex[(4*($compt-1))+3]));
    $texteDocument[$compt]=trim(stripslashes($contenuIndex[(4*($compt-1))+4]));
  }


    // Liste des codes htmls spéciaux
$caractere_special=array(
"&agrave;"=>"à",
"&aacute;"=>"á",
"&acirc;"=>"â",
"&atilde;"=>"ã",
"&auml;"=>"ä",
"&aring;"=>"å",
"&aelig;"=>"æ",
"&ccedil;"=>"ç",
"&egrave;"=>"è",
"&eacute;"=>"é",
"&ecirc;"=>"ê",
"&euml;"=>"ë",
"&icirc;"=>"î",
"&iuml;"=>"ï",
"&ocirc;"=>"ô",
"&ouml;"=>"ö",
"&ugrave;"=>"ù",
"&uacute;"=>"ú",
"&ucirc;"=>"û",
"&uuml;"=>"ü",
"&amp;"=>"&",
);




foreach($caractere_special as $caractere_code=>$caractere_traduction){
$titreDocument = str_replace("$caractere_code","$caractere_traduction",$titreDocument);
$texteDocument = str_replace("$caractere_code","$caractere_traduction",$texteDocument);
 }
  // ***************************************************************************  //            //          Lancement de la procédure d'évaluation des pages ===
  //          ========================================================
  //
  // Chaque page est passée en revue et se voit attribuer des points
  // selon les règles suivantes :
  //
  // - 2 point si la requête (considérée comme expression) est présente dans le titre
  // - 1 point si la requête (considérée comme expression) est présente dans le texte indexé
  //
  // - 2 point par expression présente dans le titre
  // - 2 point par mot-clé présent dans le titre
  //
  // - 1 point par expression présente dans le texte indexé
  // - 1 point par mot-clé présent dans le texte indexé
  //
  // Note : une ou plusieurs expressions présentes donnent naturellement un meilleur
  // score à la page
  //
  // ***************************************************************************


  // Les différents documents indexés spnt passés en revue et analysés


  for($compt=1;$compt<=$nombreDocumentsIndexes;$compt++) {


    $score[$compt]=0;


    // === Recherche de la requête (considérée comme expression) dans le titre du document : 2 points
    //if(eregi("(^|[ .,:;!?'()])".$requete."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;


    // === Recherche de la requête (considérée comme expression) dans le texte indexé : 1 points
    if(eregi("(^|[ .,:;!?'()])".$requete."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;




    for($a=1;$a<=$nombreExpressions;$a++) {    // Recherche des expressions


      // === Recherche de l'expression dans le titre du document : 2 points s'il y a correspondance
      if(eregi("(^|[ .,:;!?'()])".$expressions[$a]."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;


      // === Recherche de l'expression dans le texte indexé : 1 point s'il y a correspondance
      if(eregi("(^|[ .,:;!?'()])".$expressions[$a]."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;


    }


    for($b=1;$b<=$nombreMotsCles;$b++) {    // Recherche des mots-clés


      if(eregi("([^*]*)[*]",$motsCles[$b],$corMotCle)) {


      // l'utilisateur a fait suivre le mot-clé d'une astérisque (il faut donc étendre la recherche)


        // === Recherche du mot-clé dans le titre du document : 2 points s'il y a correspondance
        if(eregi("(^|[ .,:;!?'()])".$corMotCle[1],$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;


        // === Recherche du mot-clé dans le texte indexé : 1 point s'il y a correspondance
        if(eregi("(^|[ .,:;!?'()])".$corMotCle[1],$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;


      }


      else {
       // le mot-clé ne comporte pas d'astérisque


        // === Recherche du mot-clé dans le titre du document : 2 points s'il y a correspondance
        if(eregi("(^|[ .,:;!?'()])".$motsCles[$b]."([ .,:;!?'()]|$)",$titreDocument[$compt])) $score[$compt]=$score[$compt]+2;


        // === Recherche du mot-clé dans le texte indexé : 1 point s'il y a correspondance
        if(eregi("(^|[ .,:;!?'()])".$motsCles[$b]."([ .,:;!?'()]|$)",$texteDocument[$compt])) $score[$compt]=$score[$compt]+1;


      }
    }
  }


  // ************************************************************************************
  // Tri des résultats en vue de leur affichage :
  // Les pages seront affichées de la plus pertinente à la moins pertinente
  // ************************************************************************************


  // Détermination du score le plus élevé parmi toutes les pages analysées


  $HiScore=max($score);




  // TRI du tableau à l'aide de la fonction asort


  arsort($score);


  // Création du tableau $documentsCorrespondantsOrd
  $documentsCorrespondantsOrd[]=0;


  for(reset($score);$cle=key($score);next($score)) {
    if(current($score)>0) {
      $documentsCorrespondantsOrd[]=$cle;
    }
  }


  $nombreCorrespondances=count($documentsCorrespondantsOrd)-1;




  // ************************************************************************************
  // Les résultats sont affichés dans un tableau, dont les caractéristiques ont été
  // précisées en début de script.
  // Note : les pages sont affichées dans l'ordre décroissant de leur pertinence
  // ************************************************************************************


  print("<table width="$largeurTableau" border="0" align="center"> \n");  // Début du code pour l'affichage du tableau
  print("<tr><td> \n");


  if($nombreCorrespondances<1) {
    print("<center> \n");
    print(" \n");
    print("Désolé, aucune page ne correspond à la recherche : ' $requete '.

\n");
    print(" \n");
    print("</center> \n");
  }


  else {
    if(@ !$p) $p =1;


    if($nombreCorrespondances= =1) {
      print(" \n");
      print("La requête ' $requete ' a donné 1 résultat.
\n");
      print(" \n");
    }


    else {
      if($nombreCorrespondances> =$NombreRepMax) {
        print(" \n");
        print("La requête '$requete' a donné plus de $NombreRepMax résultats.
\n");
        print(" \n");
        $nombreCorrespondances= $NombreRepMax;
      }


      else {
        print(" \n");
        print("La requête ' $requete ' a donné $nombreCorrespondances résultats.
\n");
        print(" \n");
      }
    }


    print(" \n");
    print("Liste des pages ".$p." à ".(min(($p+$NombreRepPages-1),$nombreCorrespondances))." :

");
    print(" \n");


 


    for($compt =$p;$compt<= min(($p+$NombreRepPages-1),$nombreCorrespondances);$compt++) {
      print(" \n");
      print(" $compt . ".$titreDocument[$documentsCorrespondantsOrd[$compt]]."
\n");
      print($descriptionDocument[$documentsCorrespondantsOrd[$compt]]."

\n");
      print(" \n");
    }


    print("<center> \n");


    if(($p-$NombreRepPages)>0) {
      print(" \n");
      print("&lt;&lt; page précédente &nbsp; \n");
      print(" \n");
    }


    if($nombreCorrespondances>$NombreRepPages) {
      print(" \n");
      for($a =1;$a<=(floor(($nombreCorrespondances-1)/$NombreRepPages)+1);$a++) {
        if((floor($p/$NombreRepPages)+1)==$a) {
          print("$a &nbsp; \n");
        }
        else {
          @ print("$a &nbsp; \n");
        }
      }
      print(" \n");
    }


    if(($p+$NombreRepPages)<=$nombreCorrespondances) {
      print(" \n");
      @ print(" &nbsp; page suivante &gt;&gt; \n");
      print(" \n");
    }


    print("</center> \n");
  }


  // **************************************************************************
  // Sauvegarde de la requête dans le fichier req.txt
  // **************************************************************************


  $idFiqReq=fopen("req.txt","a+");
  fputs($idFiqReq,$requete."\n");
  fclose($idFiqReq);
}

4 réponses

Teclis01 Messages postés 1423 Date d'inscription mardi 14 décembre 2004 Statut Membre Dernière intervention 29 décembre 2012 4
15 févr. 2007 à 11:06
Mon dieu des expression régulières de partout au secourssssss
Euh tu veux adapter ce truc à une bdd ?

Cette url t'explique comment te connecter a une bdd MySQL et je te laisse "découvrir le reste"

http://fr.php.net/manual/fr/function.mysql-connect.php
--------------------------------------------------------------------------------------------------
         Il vaut mieux poser une question et passer pour bête que le rester toute sa vie
0
flopad Messages postés 528 Date d'inscription mercredi 28 septembre 2005 Statut Membre Dernière intervention 6 mars 2009
15 févr. 2007 à 11:12
Aie....désolé, on fait ce qu'on peut ;-)

En fait, ce n'est pas le fait de me connecter à ma bdd qui me pose problème, c'est la manière de fonctionner.
Je ne sais pas comment m'y prendre pour aller remonter la bonne page correspondant à la recherche...
0
Teclis01 Messages postés 1423 Date d'inscription mardi 14 décembre 2004 Statut Membre Dernière intervention 29 décembre 2012 4
15 févr. 2007 à 11:17
fais un echo de $_POST['requete']

--------------------------------------------------------------------------------------------------
         Ilvaut mieux poser une question et passer pour bête que le rester toutesa vie
0
flopad Messages postés 528 Date d'inscription mercredi 28 septembre 2005 Statut Membre Dernière intervention 6 mars 2009
15 févr. 2007 à 11:24
Ben le $_POST['requete'] devrait me donner ce qui est à rechercher.
Après, il suffit que je cherche ça dans ma base via un select * from table1, table2,etc... like $_POST['requete'].
Ensuite, je dois pouvoir récupérer l'adresse de la page sans soucis.

Je vais essayer de voir ça, j'aurais aimé garder le fonctionnement d'affichage des résultats que j'avais avant qui se faisait selon le nombre d'occurences...
Il faudrait aussi que je conserve la lecture des pages et des keywords, c'est pourquoi j'aimerais intégrer cette nouvelle recherche à celle existante...
0
Rejoignez-nous