Robots.txt is a file that tells search engines what pages to crawl and which ones to avoid. It uses both “allow” and “disallow” instructions to guide crawlers to the pages you want indexed.

Where did robots.txt come from?

Back in 1994, the robots.txt file was known as the RobotsNotWanted.txt (named in response to a web crawler overloading a server), with the shared goal of giving webmasters the ability to tell crawlers what not to crawl. The name (RobotsNotWanted.txt) didn’t stick. The protocol was renamed robots.txt in the same year and got adopted by search engines of the day, like AltaVista. More than two decades later, Google formalized robots.txt’s management through the Internet Engineering Task Force (IETF). IETF focuses on standardizing robots.txt’s: Naming, like calling the file “robots.txt” Implementation, like placing the file on the root folder Encoding, like using UTF-8 Structure, like having groups and rules It’s worth mentioning that while Google initialized formalizing robots.txt management, it does not own the protocol. IETF is a non-profit organization (and a child of another non-profit, the Internet Society) separate from Google and its parent company, Alphabet.

Why is robots.txt important?

So, why does robots.txt matter? Why do you need to worry about integrating this file into your website? Here are some reasons robots.txt is crucial for your search engine optimization (SEO) strategy: 1. It keeps your website from getting overloaded One of the biggest reasons to implement a robots.txt file is to prevent your website from getting overloaded with crawl requests. Google will send crawl requests to crawl and index pages on your website — it can send dozens of requests at once. With the robots.txt file in place, you help manage the crawl traffic on your website so that it doesn’t overwhelm and slow down your website. A slow website has negative consequences for SEO, since Google wants to deliver fast-loading websites in search results. So, by implementing the robots.txt file, you ensure that Google doesn’t overload and slow down your website while crawling it. Keep in mind, your robots.txt file isn’t exclusive to search engine crawlers like Google or Bing. You can also use your robots.txt file to direct crawlers from others websites. As an example, look at the robots.txt file for Starbucks, which delays a certain bot: 2. It helps you optimize your crawl budget Every website has a crawl budget, which is the number of pages Google crawls within a specific amount of time. If you have more pages on your website than you can allow within your crawl budget, it leads to pages not getting indexed, which means they can’t rank. Using robots.txt helps you optimize your crawl budget. It helps guide Google bots towards the pages you want indexed. While your robots.txt file can’t keep pages from getting indexed, it can keep the crawl bots focused on the pages that need to be indexed most. 3. It helps block crawlers from crawling non-public pages Every company has pages on their website that they don’t want to appear in search results, like login and duplicate pages. Robots.txt can help keep these pages from ranking in search results and blocks the pages from crawlers.

When should you update a robots.txt file?

Even after you create a robots.txt file, you’ll likely need to update it at some point. But when might you need to do that, exactly? Here are a few times when you might update your robots.txt file: When you migrate to a new content management system (CMS) When you want to improve how Google crawls your site When you add a new section or subdomain to your site When you change to a new website altogether All of these changes require you to go in and edit your robots.txt file to reflect what’s happening on your site.

Qu'est-ce que le fichier Robots.txt? Apprendre les bases avec les pros du référencement

Écrit par Macy Storm

Dernière mise à jour le 15 mai 2026

Robots.txt

Un fichier robots.txt est un fichier texte qui indique aux moteurs de recherche les pages que vous voulez ou ne voulez pas qu'ils explorent.

Écrit par Macy Storm

Dernière mise à jour le 15 mai 2026

En-tête de bas de page en dégradé de violet à blanc

Qu'est-ce que le fichier robots.txt ?

Robots.txt est un fichier qui indique aux moteurs de recherche les pages à explorer et celles à éviter. Il utilise les instructions "allow" et "disallow" pour guider les robots vers les pages que vous souhaitez voir indexées.

Pour que votre site web soit classé dans les résultats de recherche, Google doit l'explorer et l'indexer. Ce processus permet à Google de découvrir le contenu de votre site web, de comprendre ce qu'il contient et d'afficher vos pages dans les résultats de recherche appropriés.

Pour aider Google à explorer vos pages, vous devez utiliser un fichier robots.txt. Sur cette page, nous répondrons à toutes les questions brûlantes que vous vous posez sur les fichiers robots.txt :

Qu'est-ce que Robots.txt ?
Anatomie du fichier Robots.txt
D'où vient le fichier Robots.txt ?
Exemple de Robots.txt
Pourquoi Robots.txt est-il important ?
Comment créer un fichier Robots.txt ?
Problèmes courants avec les fichiers Robots.txt
Quand faut-il mettre à jour un fichier Robots.txt ?
6 conseils pour réussir à utiliser Robots.txt pour l'optimisation des moteurs de recherche

Anatomie du fichier Robots.txt

En savoir plus sur robots.txt grâce à cette analyse anatomique :

Composant	Objectif	Exemple
Agent utilisateur	Définit à qui la règle s'applique, par exemple à tous les robots d'exploration ou à certains d'entre eux.	User-agent : Googlebot
Désactiver	Définit les dossiers que l'agent utilisateur ne doit pas explorer.	Disallow : /confidentiel/
Autoriser	Définit les dossiers que l'agent utilisateur doit explorer dans les dossiers interdits.	Autoriser : /confidentiel/rapport-public.pdf
Commentaires	Définit les règles applicables aux téléspectateurs	# Empêche Googlebot d'explorer /confidential/ à l'exception de public-report.pdf
Plan du site	Définit l'emplacement du sitemap XML	Plan du site : https://example.com/sitemap.xml

D'où vient le fichier robots.txt ?

En 1994, le fichier robots.txt était connu sous le nom de RobotsNotWanted.txt (nommé ainsi en réponse à un robot d'exploration qui surchargeait un serveur), dans le but commun de donner aux webmestres la possibilité de dire aux robots d'exploration ce qu'ils ne doivent pas explorer.

Le nom (RobotsNotWanted.txt) n'a pas été retenu.

Le protocole a été renommé robots.txt la même année et a été adopté par les moteurs de recherche de l'époque, comme AltaVista. Plus de vingt ans plus tard, Google a formalisé la gestion de robots.txt par l'intermédiaire de l'IETF (Internet Engineering Task Force).

L'IETF se concentre sur la normalisation des fichiers robots.txt :

Nommer, comme appeler le fichier "robots.txt"
Mise en œuvre, comme placer le fichier dans le dossier racine
Encodage, comme l'utilisation de UTF-8
Structure, comme l'existence de groupes et de règles

Il convient de préciser que si Google a initié la formalisation de la gestion de robots.txt, il n'est pas propriétaire du protocole. L'IETF est une organisation à but non lucratif (et un enfant d'une autre organisation à but non lucratif, l'Internet Society) distincte de Google et de sa société mère, Alphabet.

Exemple de Robots.txt

À quoi ressemble un fichier robots.txt ? Chaque fichier robots.txt est différent en fonction de ce que vous autorisez ou non Google à explorer.

Exemple de Robots.txt

Si vous autorisez les robots à explorer certaines pages, le code ressemblera à ceci :

User-agent: Googlebot

Allow: /

L'agent utilisateur est le robot que vous autorisez (ou non) à explorer votre site web. Dans cet exemple de fichier robots.txt, vous autorisez Googlebot à explorer les pages de votre site web.

Si vous ne voulez pas qu'un robot explore les pages de votre site web, le code ressemble à ceci :

User-agent: Bingbot

Disallow: /

Pour cet exemple de robots.txt, ce code indique que le Bingbot ne peut pas explorer les pages d'un site web.

Pourquoi le fichier robots.txt est-il important ?

Pourquoi le fichier robots.txt est-il important ? Pourquoi devez-vous vous préoccuper de l'intégration de ce fichier dans votre site web ?

Voici quelques raisons pour lesquelles le fichier robots.txt est essentiel à votre stratégie d'optimisation des moteurs de recherche (SEO) :

1. Il évite à votre site web d'être surchargé

L'une des principales raisons de mettre en place un fichier robots.txt est d'éviter que votre site web ne soit surchargé de requêtes d'exploration.

La mise en place du fichier robots.txt permet de gérer le trafic de crawl sur votre site web afin qu'il ne soit pas trop important et qu'il ne ralentisse pas votre site web.

Google envoie des requêtes pour explorer et indexer les pages de votre site web - il peut envoyer des dizaines de requêtes à la fois. La mise en place du fichier robots.txt permet de gérer le trafic de crawl sur votre site web afin d'éviter qu'il ne le submerge et ne le ralentisse.

Un site web lent a des conséquences négatives sur le référencement, car Google veut proposer des sites web à chargement rapide dans les résultats de recherche. En mettant en place le fichier robots.txt, vous vous assurez donc que Google ne surcharge pas et ne ralentit pas votre site web lorsqu'il l'explore.

N'oubliez pas que votre fichier robots.txt n'est pas réservé aux robots d'indexation des moteurs de recherche tels que Google ou Bing. Vous pouvez également utiliser votre fichier robots.txt pour diriger les robots d'autres sites web. Prenons l'exemple du fichier robots.txt de Starbucks, qui retarde l'arrivée d'un certain robot :

Exemple d'agent utilisateur Robots.txt

2. Il vous aide à optimiser votre budget d'exploration

Chaque site web dispose d'un budget d'exploration, qui correspond au nombre de pages que Google explore dans un laps de temps donné. Si votre site web contient plus de pages que ne le permet votre budget d'exploration, certaines pages ne seront pas indexées, ce qui signifie qu'elles ne pourront pas être classées.

Bien que votre fichier robots.txt ne puisse pas empêcher l'indexation des pages, il peut indiquer aux robots d'indexation où ils doivent passer leur temps.

L'utilisation du fichier robots.txt vous permet d'optimiser votre budget d'exploration. Il permet de guider les robots de Google vers les pages que vous souhaitez voir indexées. Bien que votre fichier robots.txt ne puisse pas empêcher l'indexation de certaines pages, il peut permettre aux robots de se concentrer sur les pages qui ont le plus besoin d'être indexées.

3. Il permet d'empêcher les robots d'explorer les pages non publiques.

Chaque entreprise possède sur son site web des pages qu'elle ne souhaite pas voir apparaître dans les résultats de recherche, comme les pages de connexion et les pages dupliquées. Le fichier Robots.txt peut aider à empêcher ces pages d'apparaître dans les résultats de recherche et les bloquer pour les robots d'exploration.

Comment créer un fichier robots.txt

Suivez les étapes suivantes pour créer votre fichier robots.txt :

Créez un nouveau fichier dans un éditeur de texte tel que Notepad (Windows) ou TextEdit (Mac).
Définir vos règles, organisées en groupes et en directives
Expliquez vos règles à d'autres spectateurs, comme vos coéquipiers, à l'aide de commentaires.
Ajoutez l'emplacement de votre sitemap XML à la fin de votre fichier
Enregistrez votre fichier sous robots.txt
Téléchargez votre fichier robots.txt dans le dossier racine de votre site.
Testez les règles de votre fichier robots.txt dans Google Search Console et Bing Webmaster Tools

Problèmes courants avec les fichiers robots.txt

Les sites web rencontrent parfois des problèmes lorsqu'ils utilisent le fichier robots.txt. L'un des problèmes potentiels est que le fichier empêche Google (ou d'autres moteurs de recherche) d'explorer votre site web. Si vous constatez ce genre de problème, vous devez mettre à jour votre fichier robots.txt pour y remédier.

Un autre problème potentiel est qu'il y a des données sensibles ou privées quelque part sur votre site (privées pour votre entreprise ou pour vos clients), et que le fichier robots.txt ne les bloque pas, ce qui permet à Google de les explorer librement. Il s'agit là d'une faille importante, et vous devez donc vous assurer que ces données ne sont pas accessibles aux robots d'indexation.

Quand faut-il mettre à jour un fichier robots.txt ?

Même après avoir créé un fichier robots.txt, vous devrez probablement le mettre à jour à un moment ou à un autre. Mais à quel moment exactement ?

Voici quelques cas où vous pouvez mettre à jour votre fichier robots.txt :

Lorsque vous migrez vers un nouveau système de gestion de contenu (CMS)
Lorsque vous souhaitez améliorer la façon dont Google explore votre site
Lorsque vous ajoutez une nouvelle section ou un nouveau sous-domaine à votre site
Lorsque vous changez complètement de site web

Tous ces changements nécessitent que vous modifiiez votre fichier robots.txt pour refléter ce qui se passe sur votre site.

6 conseils pour réussir à utiliser robots.txt pour le référencement

Vous êtes prêt à intégrer un fichier robots.txt à votre site web ? Voici 6 conseils pour vous aider à réussir :

1. Veillez à ce que toutes vos pages importantes puissent être explorées.

Avant de créer votre fichier robots.txt, il est important d'identifier les pages les plus importantes de votre site web. Vous voulez vous assurer que ces pages sont explorées, afin qu'elles puissent être classées dans les résultats de recherche.

Avant de créer votre fichier robots.txt, documentez les pages importantes que vous souhaitez autoriser les robots de recherche à explorer. Il peut s'agir de pages telles que votre :

Pages de produits
A propos de nous
Pages d'information
Articles de blog
Page de contact

2. N'utiliser chaque user-agent qu'une seule fois

Lorsque vous créez votre fichier robots.txt, il est important que chaque user-agent ne soit utilisé qu'une seule fois. Cette façon de procéder permet de conserver un code propre et organisé, en particulier si vous souhaitez interdire un grand nombre de pages.

Voici un exemple de fichier robots.txt montrant la différence :

User-agent: Googlebot

Disallow: /pageurl

User-agent: Googlebot

Disallow: /loginpage

Imaginez maintenant que vous deviez le faire pour plusieurs URL. Cela deviendrait répétitif et rendrait votre fichier robots.txt difficile à suivre. Il est préférable de l'organiser comme suit :

User-agent: Googlebot

Disallow: /pageurl/

Disallow: /loginpage/

Avec cette configuration, tous les liens interdits sont organisés sous l'agent utilisateur spécifique. Cette approche organisée vous permet de trouver plus facilement les lignes que vous devez ajuster, ajouter ou supprimer pour des robots spécifiques.

3. Utiliser de nouvelles lignes pour chaque directive

Lorsque vous créez votre fichier robots.txt, il est essentiel de placer chaque directive sur sa propre ligne. Là encore, cette astuce vous permettra de gérer plus facilement votre fichier.

Ainsi, chaque fois que vous ajoutez un agent utilisateur, il doit être sur sa propre ligne avec le nom du bot. La ligne suivante doit contenir l'information "disallow" ou "allow". Chaque ligne d'interdiction suivante doit être indépendante.

Voici un exemple de ce qu'il ne faut pas faire dans le fichier robots.txt :

User-agent: Googlebot Disallow: /pageurl/ Disallow: /loginpage/

Comme vous pouvez le constater, il est plus difficile de lire votre fichier robots.txt et de savoir ce qu'il contient.

Si vous faites une erreur, par exemple, il sera difficile de trouver la bonne ligne à corriger.

Le fait de placer chaque directive sur sa propre ligne facilitera les modifications ultérieures.

4. Veillez à utiliser des cas d'utilisation appropriés

S'il y a une chose à savoir sur le fichier robots.txt pour le référencement, c'est qu'il est sensible à la casse. Vous devez vous assurer que vous utilisez les cas d'utilisation appropriés, afin qu'il fonctionne correctement sur votre site web.

Tout d'abord, votre fichier doit être étiqueté comme "robots.txt" dans ce cas d'utilisation.

Deuxièmement, vous devez tenir compte des variations de capitalisation des URL. Si vous avez une URL qui utilise toutes les majuscules, vous devez la saisir comme telle dans votre fichier robots.txt.

5. Utiliser le symbole "*" pour donner des indications

Si vous avez plusieurs URL sous la même adresse et que vous voulez empêcher les robots d'explorer, vous pouvez utiliser le symbole "*", appelé caractère générique, pour bloquer tous ces URL en même temps.

Supposons par exemple que vous souhaitiez interdire toutes les pages relatives aux recherches internes. Au lieu de bloquer chaque page individuellement, vous pouvez simplifier votre fichier.

Au lieu de ressembler à ceci :

User-agent: *

Disallow: /search/hoodies/

Disallow: /search/red-hoodies/

Disallow: /search/sweaters

Vous pouvez utiliser le symbole "*" pour le simplifier :

User-agent: *

Disallow: /search/*

Cette étape permet d'empêcher les robots des moteurs de recherche d'explorer toutes les URL situées dans le sous-dossier "search". L'utilisation du symbole du caractère générique est un moyen facile d'interdire des pages par lots.

6. Utiliser le "$" pour simplifier le codage

Il existe de nombreuses astuces de codage que vous pouvez utiliser pour faciliter la création de votre fichier robots.txt. L'une d'entre elles consiste à utiliser le symbole "$" pour indiquer la fin d'une URL.

Si vous souhaitez interdire des pages similaires, vous pouvez gagner du temps en utilisant le "$" pour l'appliquer à toutes les URL similaires.

Par exemple, imaginons que vous souhaitiez empêcher Google d'explorer vos vidéos. Voici à quoi pourrait ressembler ce code si vous faites chacune de ces opérations :

User-agent: Googlebot

Disallow: /products.3gp

Disallow: /sweaters.3gp

Disallow: /hoodies.3gp

Au lieu de les placer sur des lignes distinctes, vous pouvez utiliser le "$" pour les interdire tous. Voici à quoi cela ressemble :

User-agent: GooglebotDisallow: /*.3gp$

L'utilisation de ce symbole indique aux robots d'exploration que les pages se terminant par " .3gp " ne peuvent pas être explorées.

Élargissez vos connaissances en matière de référencement

L'ajout du fichier robots.txt à votre site web est essentiel pour aider Google à explorer vos pages sans le surcharger. C'est l'un des aspects qui vous aideront à faire du référencement de manière efficace.

Vous souhaitez améliorer le référencement de votre site ? Notre équipe d'experts peut vous aider à mettre en œuvre des stratégies robots.txt efficaces et à optimiser votre site web pour une meilleure indexation. Contactez-nous en ligne dès aujourd'hui pour savoir comment nous pouvons soutenir vos initiatives de référencement !

Des services de référencement qui n'ont rien d'un jeu d 'enfant

Bénéficiez d'une stratégie de référencement adaptée à votre entreprise, à votre secteur d'activité et à vos objectifs de revenus.

Une femme souriante aux cheveux longs sur fond vert.

Macy Storm est consultante en marketing de contenu chez SEO.com. Elle possède plus de 8 ans d’expérience dans la création de contenu pour toutes sortes de stratégies numériques et dans plus de 10 secteurs d’activité. Titulaire d’une licence en communication, elle a mis à profit ses compétences rédactionnelles pour rédiger plus de 1 000 pages pour WebFX et SEO.com. Son travail a été mis en avant par Search Engine Journal, HubSpot, Entrepreneur, Clutch et bien d’autres. Quand elle n'est pas en train de taper sur son clavier, elle joue à des jeux vidéo, lit ou compte le nombre de fois où les gens disent que sa chienne Daisy est mignonne (c'est très souvent).

Qu'est-ce que le fichier Robots.txt? Apprendre les bases avec les pros du référencement

Robots.txt

Qu'est-ce que le fichier robots.txt ?

Anatomie du fichier Robots.txt

D'où vient le fichier robots.txt ?

Exemple de Robots.txt

Pourquoi le fichier robots.txt est-il important ?

1. Il évite à votre site web d'être surchargé

2. Il vous aide à optimiser votre budget d'exploration

3. Il permet d'empêcher les robots d'explorer les pages non publiques.

Comment créer un fichier robots.txt

Problèmes courants avec les fichiers robots.txt

Quand faut-il mettre à jour un fichier robots.txt ?

6 conseils pour réussir à utiliser robots.txt pour le référencement

1. Veillez à ce que toutes vos pages importantes puissent être explorées.

2. N'utiliser chaque user-agent qu'une seule fois

3. Utiliser de nouvelles lignes pour chaque directive

4. Veillez à utiliser des cas d'utilisation appropriés

5. Utiliser le symbole "*" pour donner des indications

6. Utiliser le "$" pour simplifier le codage

Élargissez vos connaissances en matière de référencement

Des services de référencement qui n'ont rien d'un jeu d 'enfant

Table des matières

Des services de référencement qui n'ont rien d'un jeu d 'enfant

Écrivains

Ensemble, obtenons des résultats

Découvrez nos stratégies de référencement primées

Dépassez vos concurrents dans les résultats de recherche basés sur l'IA

Résultats 1 à 10 sur 832 pour :

Qu'est-ce que le fichier Robots.txt? Apprendre les bases avec les pros du référencement

Robots.txt

Qu'est-ce que le fichier robots.txt ?

Anatomie du fichier Robots.txt

D'où vient le fichier robots.txt ?

Exemple de Robots.txt

Pourquoi le fichier robots.txt est-il important ?

1. Il évite à votre site web d'être surchargé

2. Il vous aide à optimiser votre budget d'exploration

3. Il permet d'empêcher les robots d'explorer les pages non publiques.

Comment créer un fichier robots.txt

Problèmes courants avec les fichiers robots.txt

Quand faut-il mettre à jour un fichier robots.txt ?

6 conseils pour réussir à utiliser robots.txt pour le référencement

1. Veillez à ce que toutes vos pages importantes puissent être explorées.

2. N'utiliser chaque user-agent qu'une seule fois

3. Utiliser de nouvelles lignes pour chaque directive

4. Veillez à utiliser des cas d'utilisation appropriés

5. Utiliser le symbole "*" pour donner des indications

6. Utiliser le "$" pour simplifier le codage

Élargissez vos connaissances en matière de référencement

Des services de référencement qui n'ont rien d'un jeu d 'enfant

Table des matières

Des services de référencement qui n'ont rien d'un jeu d 'enfant

Écrivains

Ressources connexes

Ensemble, obtenons des résultats

Découvrez nos stratégies de référencement primées

Dépassez vos concurrents dans les résultats de recherche basés sur l'IA