robots.txt pour MediaWiki : Différence entre versions

De Vulgum Techus
Aller à : Navigation, rechercher
(Procédure)
Ligne 1 : Ligne 1 :
'''[[Lien court]]''' vers cette page : http://vt.cx/rtMW<br/>
+
<!-- Links checked 22/04/19 -->
'''[[QR code]]''' vers cette page : http://vt.cx/rtMW.qr<br/>
+
[[Catégorie:Sécurité]]
 +
'''[[Lien court]]''' vers cette page : http://vt.cx/rtMW
 +
'''[[QR code]]''' vers cette page : http://vt.cx/rtMW.qr
 
<br/>
 
<br/>
 
[[Versions MediaWiki]] : Toutes
 
[[Versions MediaWiki]] : Toutes
 
<br/>
 
<br/>
 
 
<html>
 
<html>
<script type="text/javascript"><!--
+
<script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
google_ad_client = "ca-pub-3341840374417340";
+
<!-- VT2 -->
/* VT2 */
+
<ins class="adsbygoogle"
google_ad_slot = "6349432125";
+
    style="display:inline-block;width:468px;height:60px"
google_ad_width = 468;
+
    data-ad-client="ca-pub-3341840374417340"
google_ad_height = 60;
+
    data-ad-slot="6349432125"></ins>
//-->
+
<script>
</script>
+
(adsbygoogle = window.adsbygoogle || []).push({});
<script type="text/javascript"
+
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
+
 
</script>
 
</script>
 
</html>
 
</html>
Ligne 21 : Ligne 20 :
  
 
= Présentation =
 
= Présentation =
Par défaut le fichier '''[[robots-txt|robots.txt]]''' donnant la liste des répertoires à ne pas indexer au moteurs de recherches n'est pas installé par '''[[MediaWiki]]'''. Il peut donc être utile de l'ajouter pour éviter que des fichiers stratégiques soit indexés. Si le '''[[robots-txt|robots.txt]]''' n'est pas toujours pris en compte par certains moteurs de recherches, il reste utile pour les principaux.
+
Par défaut le fichier '''[[robots-txt|robots.txt]]''' donnant la liste des répertoires à ne pas indexer au moteurs de recherches n'est pas installé par '''[[MediaWiki]]'''. Il peut donc être utile de l'ajouter pour éviter que des fichiers stratégiques soit indexés. Si le robots.txt n'est pas toujours pris en compte par certains moteurs de recherches, il reste utile pour les principaux.
  
 
= Procédure =
 
= Procédure =
Le '''[[robots-txt|robots.txt]]''' de base comprend les principaux répertoires d'une installation '''[[MediaWiki]]''' standard. Il convient d'y ajouter les dossiers spécifiques à chaque site en ajoutant l'intitulé du répertoire ne devant pas être indexé.
+
Le fichier robots.txt de base comprend les principaux répertoires d'une installation MediaWiki standard. Il convient d'y ajouter les dossiers spécifiques à chaque site en ajoutant l'intitulé du répertoire ne devant pas être indexé.
 
  ex. /images-perso/enfances/moi/ pour ne pas indexer le contenu du répertoire enfances et de ceux qui suivent.
 
  ex. /images-perso/enfances/moi/ pour ne pas indexer le contenu du répertoire enfances et de ceux qui suivent.
'''[[robots-txt|robots.txt]]''' est un fichier texte '''[[ASCII]]''' pur comme ceux produits par '''[[Notepad]], [[Notepad++]]''' et tout autre éditeur texte. Son contenu pour '''[[MediaWiki]]''' conseillé est :
+
robots.txt est un fichier texte '''[[ASCII]]''' comme ceux produits par '''[[Notepad]], [[Notepad++]]''' et tout autre éditeur texte. Son contenu pour MediaWiki conseillé est :
 
  User-agent: *
 
  User-agent: *
 
  Disallow: /cache/  
 
  Disallow: /cache/  

Version du 22 avril 2019 à 23:27

Lien court vers cette page : http://vt.cx/rtMW
QR code vers cette page : http://vt.cx/rtMW.qr


Versions MediaWiki : Toutes

Présentation

Par défaut le fichier robots.txt donnant la liste des répertoires à ne pas indexer au moteurs de recherches n'est pas installé par MediaWiki. Il peut donc être utile de l'ajouter pour éviter que des fichiers stratégiques soit indexés. Si le robots.txt n'est pas toujours pris en compte par certains moteurs de recherches, il reste utile pour les principaux.

Procédure

Le fichier robots.txt de base comprend les principaux répertoires d'une installation MediaWiki standard. Il convient d'y ajouter les dossiers spécifiques à chaque site en ajoutant l'intitulé du répertoire ne devant pas être indexé.

ex. /images-perso/enfances/moi/ pour ne pas indexer le contenu du répertoire enfances et de ceux qui suivent.

robots.txt est un fichier texte ASCII comme ceux produits par Notepad, Notepad++ et tout autre éditeur texte. Son contenu pour MediaWiki conseillé est :

User-agent: *
Disallow: /cache/ 
Disallow: /docs/
Disallow: /extensions/
Disallow: /includes/
Disallow: /languages/
Disallow: /maintenance
Disallow: /mw-config/
Disallow: /resources/
Disallow: /serialized
Disallow: /skins
Disallow: /temp
Disallow: /tests
Disallow: /upload_tmp_dir

Commentaires

blog comments powered by Disqus