Generateur de sitemap pour google

Contenu du snippet

Google a ouvert un nouveau service qui propose de générer une carte de votre site, dans cette carte se trouve les liens principaux de votre site, ainsi que leur date de modification. Cette outil vous aidera donc à mieux référencer votre site .Grâce à cette outil Google Sitemap Generator, vous serez à méme de générer vous même le fichier sitemap.xml nécéssaire à cette opération.

Source / Exemple :


<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr"><head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<meta name="generator" content="HAPedit 3.1" />
<style type="text/css">
body {
    text-align: left;
    background-color: #FFFFFF;
}

.center {
    text-align: center;
}

.italic  {
    font-style: italic;
}
</style>
<title>Générateur de fichier sitemap</title>

</head>
<body id="haut">
<h2 class="center">Générateur de sitemap en xml</h2>
<p class="center">Copyright <a href="http://topflood.com" title="flood">Top flood</a><br />
Contributeurs : <br />
Kloh : <a href="http://timesplittersgames.free.fr" title="Le Site Web de Kloh">TimeSplitters' Games</a>; ImmortalPC :<a href="immortalpc.free.fr" title="Le site Web d'ImmortalPC">Immortal-PC</a>
</p>

<h2>Listages des urls autorisés pour le sitemap</h2>

<?php
//set_time_limit(60*10); pas forcément utile : fixe le temps d'exécution du script à 10 minutes (10*60 seconde)

define('LIMITLIENPARFICHIER',1000); // 1000 liens maximums dans chaque fichier
define('LIMITLIENINDEXE',50000); // 50 000 liens maximum au total

// générateur de fichiers sitemap.xml pour google
// 1- éditer les fichiers, extensions et dossiers interdits ainsi que leur mode de fonctionnement (0 par défaut) ( sans /)
// 2- éditez la variable $compressionGZ pour avoir ou non une compression sur vos fichiers (valable uniquement si vous avez plus de 1000 liens)
// 3- uploadez le fichier sur votre compte et lancez à partir d'un navigateur

/** note :

Si vous avez
./image/
./image/ete
./image/hiver

alors si vous mettez "image" dans dossier interdit, tous les sous dossiers seront interdits
si vous mettez "hiver" alors le dossier hiver sera interdit
ne mettez pas "/image/hiver"

  • /
$racine= 'http://'.$_SERVER['HTTP_HOST']; $compressionGZ = false; // false pas de compression true compression $Goption=0;// option de filtrage (laissez 0 si vous ne comprenez pas) // 0 - filtrage bit à bit (du type dossiercherche==dossierencour) // 1 - présence d'une partie du mot dans le dossier // 2 - filtrage par expressions réguliéres $ExtensionsAutorises= array('php','php3','html','htm'); $DossiersInterdits = array('includes','modules','sessions','images','pnadodb','webanalyse','_flood','javascript','language','parameters','smileys','themes','_streifer'); $FichiersInterdits = array('config.php','config_i.php','streifer_forum.gif.php','xmlrpc.php','referer.php','config-old.php','test.php','admin.php','image.php','header.php','footer.php','error.php','confige.php','banners.php','pntables.php','print.php','mainfile.php','modules.php','backend.php'); $myfiles=GetDirContents('.'); /** function Dossier_Autorisé param : $DossierCourant return : vrai si dossier autorisé faux sinon
  • /
function Dossier_Autorisé($DossierCourant){ global $DossiersInterdits; return Est_Autorisé($DossierCourant, $DossiersInterdits); } /** function Dossier_Autorisé param : $DossierCourant return : vrai si dossier autorisé faux sinon
  • /
function Fichier_Autorisé($FichierCourant){ global $FichiersInterdits; return Est_Autorisé($FichierCourant, $FichiersInterdits); } /** function Extension_Autorisé
  • /
function Extension_Autorisé($ExtensionCourante){ global $ExtensionsAutorises; return !Est_Autorisé($ExtensionCourante,$ExtensionsAutorises); } /** permet de réaliser les deux fonctions précédentes
  • /
function Est_Autorisé($DossierCourant,$Interdits){ global $Goption; $drapeau = true; while ($drapeau && list(,$Dossier)=each($Interdits) ){ if ( ComparaisonFichier($DossierCourant,$Dossier,$Goption))$drapeau = false; } reset($Interdits); return $drapeau; } function ComparaisonFichier($DossierCourant,$Dossier,$option=0){ switch ($option){ case 0: // faire une comparaison bit à bit return ($DossierCourant == $Dossier); break; case 1: // faire un filtre avec strpos $pos = strpos($mystring, $findme); if ($pos === false) { return false; } else { return true; } break; case 2: // faire un filtre avec les expressions réguliéres return ereg($Dossier,$DossierCourant); break; } } /** fonction getextension : retourne l'extension d'un fichier source : nexen.net param : $fichier return: extension du fichier
  • /
function getextension($fichier){ $bouts = explode('.', $fichier); return array_pop($bouts); } /** fonction GetDirContents param : $dir dossier racine (le test est récursif) return : liste des urlsDossier_Autorisé
  • /
function GetDirContents($dir){ global $racine; $i=0; ini_set('max_execution_time',10); if (!is_dir($dir)){die ('PROBLEME: '.$dir.'!');} if ($root=@opendir($dir)){ while ($file=readdir($root)){ if($file=='.' || $file=='..'){continue;} if(is_dir($dir.'/'.$file) && Dossier_Autorisé($file)){ if(!IsSet($files)){$files = NULL;} $files=array_merge($files,GetDirContents($dir.'/'.$file)); }else{ $extension=getextension($file); if (Extension_Autorisé($extension) && Fichier_Autorisé($file)){ echo '<strong>',$dir,'</strong>/',htmlentities($file),'<br />',"\r\n"; $files[$i]['lien']=utf8_encode($racine.substr($dir,1).'/'.$file); // rajout de la date // source : http://www.orvinfait.fr/scripts_web_performant.html $modi_fich=filemtime($dir.'/'.$file); $files[$i]['date']=date('Y-m-d', $modi_fich); $i++; } } } } if(!IsSet($files)){$files = NULL;} return $files; } $nbliens=count($myfiles); echo '<span class="italic">'.$nbliens.' liens référencés dans les fichiers.</span><br />',"\r\n"; if ($nbliens>LIMITLIENPARFICHIER){ // utilisation de la norme pour les sites souhaitant référencés plus de 1000 liens // un fichier sitemap à générer en plus $numfichier=1; echo '<h2>Génération des fichiers sitemapXX.xml...</h2>',"\r\n"; }else { $numfichier=''; echo '<h2>Génération du fichier sitemap.xml...</h2>',"\r\n"; } if ($compressionGZ) { //http://docs.php.net/en/ref.zlib.html $open='gzopen'; $write='gzwrite'; $close='gzclose'; $GZ='.gz'; } else { $open='fopen'; $write='fwrite'; $close='fclose'; $GZ=''; } $CurLiens=0; while ($CurLiens<$nbliens && $CurLiens<LIMITLIENINDEXE ) { if ($fp = $open('sitemap'.$numfichier.'.xml'.$GZ, 'w')){ $write($fp,'<?xml version="1.0" encoding="UTF-8"?>'."\r\n"); $write($fp,'<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">'."\r\n"); $Limite = $CurLiens + LIMITLIENPARFICHIER; // si lien courant vaut 20000 dés qu'on arrive à 21000 on arrete while ($CurLiens< $Limite && $CurLiens<LIMITLIENINDEXE && list(,$file)=each($myfiles)) { $write($fp,'<url> '."\r\n".' <loc>'.$file['lien'].'</loc> '."\r\n \r\n"); $write($fp,"\t\t".'<lastmod>'.$file['date'].'</lastmod>'."\n"); $write($fp,'<changefreq>monthly</changefreq>'); $write($fp,'<priority>0.5</priority></url>'); $CurLiens ++; } $write($fp, '</urlset>'); $close($fp); echo '<a href="./sitemap'.$numfichier.'.xml'.$GZ.'" target="_blank">fichier sitemap'.$numfichier.'.xml'.$GZ.'</a><br />',"\r\n"; }else{ echo 'sitemap'.$numfichier.'.xml',"\r\n" ,'<br /><br /><textarea rows="30" cols="100">',"\r\n" ,'<?xml version="1.0" encoding="UTF-8"?>',"\r\n" ,'<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">',"\r\n"; $Limite = $CurLiens + LIMITLIENPARFICHIER; while ($CurLiens< $Limite && $CurLiens<LIMITLIENINDEXE && list(,$file)=each($myfiles)) { echo '<url> '."\r\n".' <loc>'.$file['lien'].'</loc> '."\r\n "; echo '<lastmod>'.$file['date'].'</lastmod>'."\r\n"; echo '<changefreq>monthly</changefreq>'."\r\n"; echo '<priority>0.5</priority></url>'."\r\n"; $CurLiens ++; } echo '</urlset></textarea><br />'; } $numfichier++; } if ($numfichier!=1) { echo '<h2>Génération du fichier sitemap index file.xml...</h2>'; // génération du sitemap index file if ($fp = fopen('sitemap.xml', 'w+')){ fwrite($fp, '<?xml version="1.0" encoding="UTF-8"?>'."\r\n"); fwrite($fp, '<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">'."\r\n"); $date=date('Y-m-d'); for($k=1;$k<$numfichier;$k++) { fwrite($fp, '<sitemap>'."\r\n"); fwrite($fp,'<loc>'.$racine.'/sitemap'.$k.'.xml'.$GZ.'</loc>'."\r\n"); fwrite($fp, '<lastmod>'.$date.'</lastmod>'."\r\n"); fwrite($fp,'</sitemap>'."\r\n"); } fwrite($fp, '</sitemapindex>'."\r\n"); fclose($fp); echo '<a href="./sitemap.xml" target="_blank">fichier sitemap.xml</a><br />',"\r\n"; } else { echo '<br /><br /><textarea rows="30" cols="100">',"\r\n" ,'<?xml version="1.0" encoding="UTF-8"?>',"\r\n" ,'<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">',"\r\n"; $date=date("Y-m-d"); for($k=1;$k<$numfichier;$k++) { echo '<sitemap>',"\r\n" ,'<loc>',$racine,'/sitemap',$k,'.xml</loc>',"\r\n" ,'<lastmod>',$date,'</lastmod>',"\r\n" ,'</sitemap>',"\r\n"; } echo '</sitemapindex>',"\r\n"; } } ?> <span class="italic">génération du sitemap terminé</span> <p class="center"><a href="#haut" title="Retourner en Haut de la page">Haut de la page</a></p> </body> </html>

Conclusion :


utilisation
---------------
1- Editez $compressionGZ si vous voulez compresser vos fichiers sitemaps
2- Editez les variables $DossiersInterdits, $ExtensionsAutorisés et $FichiersInterdits pour exclure les fichiers à ne pas référencer
3- Editez $Goption si nécéssaire (pour pouvoir utiliser les expressions réguliéres par exemple)
4- Uploadez le fichier à la racine de votre compte
5- Lancez le , ca y'est votre site map est généré
6- (facultatif) vous pouvez soumettre votre lien à Google

Liens connexes
---------------
La derniére version de ce générateur se trouvera ici
http://topflood.free.fr/generateur_de_sitemap.html
http://topflood.free.fr/test.php

Plus d'explications sur les sites maps
http://www.webrankinfo.com/actualites/200506-sitemaps.htm

On en discute ici
http://www.webrankinfo.com/forums/viewtopic_29844.htm

Liens officiels sur google + soumission de votre sitemap
https://www.google.com/webmasters/sitemaps/stats

Utilisation pour des sites statiques sans Php
----------------------------------------------
Vous n'avez pas php sur votre serveur, mais vous voulez quand méme générer un sitemap. C'est possible, il suffit juste de faire un miroir de votre site en local, d'installer easyphp et d'éditer la variable $racine à remplacer par la racine de votre site web.Ensuite lancez le script et uploadez le sitemap sur votre site web.

Perspective
--------------

- rajouter un gestionnaire permettant l'édition des priorités voir méme l'édition des fichiers interdits
- faire un gestion par onglet à base de DIV (onglet1 listes des fichiers, onglet2 code xml, onglet 3 paramétrage)
- faire un parser Xml pour vérifier la validité du fichier généré
liens : http://tecfa.unige.ch/guides/tie/html/php-xml/php-xml-4.html
http://fr3.php.net/xml

/!\ Ce script ne gére pas l'url rewriting et ne peut pas le gérer dans sa forme actuelle. essayer plutot ce genre d'outils dans ces cas là
http://www.blocklayer.com/googlesitemap/

A voir également

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.