Glossaire SEO : tous les termes du référencement expliqués

Toutes les définitions du référencement naturel en un seul endroit. Des termes techniques aux concepts éditoriaux, ce glossaire couvre l'ensemble du vocabulaire SEO utilisé par les professionnels du secteur.

A

AEO (Answer Engine Optimization) Optimisation orientée vers les moteurs de réponse : systèmes qui fournissent une réponse directe à une question plutôt qu’une liste de liens. L’AEO cible les featured snippets, les assistants vocaux et les interfaces IA conversationnelles. Terme voisin de l’AIO, parfois utilisé de façon interchangeable, mais l’AEO insiste davantage sur le format question-réponse et les extraits optimisés, là où l’AIO couvre plus largement la présence dans tous les systèmes d’IA génératifs.

Above the fold Partie d’une page web visible sans faire défiler l’écran. Les contenus placés above the fold bénéficient généralement d’une meilleure visibilité et d’un taux d’engagement plus élevé.

Accessibilité web Ensemble des pratiques permettant aux personnes en situation de handicap d’accéder aux contenus d’un site. L’accessibilité est un critère de qualité pris en compte indirectement par Google, notamment via les Core Web Vitals et la structure sémantique.

Algorithme Programme automatisé utilisé par un moteur de recherche pour analyser, classer et ordonner les pages dans ses résultats. Google met à jour ses algorithmes plusieurs fois par an, avec des mises à jour majeures (core updates) et des mises à jour ciblées (spam, avis, contenu utile, etc.).

AIO (AI Optimization) Optimisation du contenu pour être cité et mis en avant par les moteurs de réponse basés sur l’IA, comme ChatGPT, Claude, Gemini ou Perplexity. L’AIO complète le SEO traditionnel en ciblant les systèmes de récupération augmentée (RAG) utilisés par ces assistants. L’objectif n’est plus seulement d’être premier dans les SERP classiques, mais d’être la source citée par l’IA lorsqu’elle répond à une question. Ce statut de source de référence repose sur la clarté structurelle du contenu, sa densité informationnelle et son autorité thématique.

Alt text (attribut alt) Texte alternatif associé à une image via la balise HTML alt="". Il décrit le contenu visuel pour les moteurs de recherche et les lecteurs d’écran. Un alt text optimisé inclut le mot-clé principal sans être rédigé comme une liste de mots-clés.

Ancre (anchor text) Texte cliquable d’un lien hypertexte. L’ancre donne aux moteurs de recherche une indication sur le contenu de la page cible. Une ancre optimisée contient le mot-clé principal ou une variation sémantique pertinente. À utiliser avec modération pour éviter la sur-optimisation.

Autorité de domaine (Domain Authority) Indicateur développé par Moz (noté de 0 à 100) estimant la capacité d’un domaine à se positionner dans les résultats de recherche, en fonction du nombre et de la qualité de ses backlinks. Google utilise son propre système interne (PageRank) et ne reconnaît pas la DA comme métrique officielle.

Autorité de page (Page Authority) Indicateur Moz similaire à la Domain Authority, mais appliqué à une URL spécifique plutôt qu’à l’ensemble d’un domaine.

B

Backlink Lien entrant pointant vers votre site depuis un site tiers. Les backlinks de qualité (provenant de sites pertinents et autoritaires) restent l’un des signaux de classement les plus puissants pour Google. Synonyme : lien entrant, lien externe entrant, inbound link. À noter : un backlink toxique (provenant d’un site spam, d’une ferme de liens ou d’un réseau artificiel) peut théoriquement nuire au profil de liens d’un site. Depuis Penguin 4.0 (2016), Google affirme ignorer la plupart des liens spam plutôt que de les pénaliser. En cas de doute sur un profil de liens dégradé, l’outil de désaveu (Disavow Tool) de Google Search Console permet de signaler les liens à ne pas prendre en compte.

Balise canonique (canonical tag) Balise HTML <link rel="canonical" href="..."> indiquant aux moteurs de recherche quelle version d’une URL est la référence principale lorsque plusieurs URL affichent un contenu identique ou similaire. Essentielle pour éviter le contenu dupliqué.

Balise H1 Titre principal d’une page web, défini par la balise HTML <h1>. Il ne doit y en avoir qu’un seul par page. Le H1 est lu par Google comme le titre éditorial de la page et doit contenir le mot-clé principal.

Balise meta description Courte description d’une page (environ 155 caractères) affichée sous le titre dans les résultats de recherche. Elle n’influence pas directement le classement mais impacte le taux de clic (CTR). Une meta description efficace est incitative et contient le mot-clé cible.

Balise title Titre HTML d’une page, défini dans la balise <title>. C’est l’un des signaux on-page les plus importants pour le classement. Il est affiché dans l’onglet du navigateur et dans les résultats de recherche (SERP). Longueur recommandée : 50 à 60 caractères.

Bing Moteur de recherche de Microsoft, deuxième moteur le plus utilisé en Europe. Depuis l’intégration de Copilot (basé sur GPT-4), Bing joue un rôle croissant dans les recherches assistées par IA.

Black hat SEO Ensemble de pratiques d’optimisation qui contournent ou enfreignent les consignes des moteurs de recherche (cloaking, spam de liens, contenu généré automatiquement de mauvaise qualité, etc.). Peut générer des gains à court terme mais expose le site à des pénalités manuelles ou algorithmiques.

Boucle de crawl Phénomène où un robot d’indexation tourne indéfiniment sur des URL identiques ou quasi-identiques, gaspillant le budget de crawl sans indexer de nouvelles pages utiles.

Breadcrumb (fil d’Ariane) Chemin de navigation hiérarchique affiché sur une page, indiquant la position de l’utilisateur dans l’arborescence du site. Les breadcrumbs améliorent l’UX, renforcent le maillage interne et peuvent apparaître dans les SERP via les données structurées Schema.org.

Budget de crawl (crawl budget) Nombre de pages qu’un robot d’indexation (Googlebot) est prêt à explorer sur un site dans un intervalle de temps donné. Un budget de crawl optimisé évite de gaspiller cette ressource sur des pages inutiles (pages filtrées, paramètres URL, pages en erreur).

C

Cocon sémantique Stratégie d’organisation du contenu d’un site proposée par Laurent Bourrelly, qui pousse le concept de siloing plus loin. Dans un cocon sémantique, les pages sont liées entre elles selon une logique de proximité sémantique stricte : une page mère traite le sujet global, ses pages filles approfondissent les sous-thèmes, et les pages sœurs couvrent des aspects de même niveau hiérarchique. L’objectif est de guider les robots d’indexation selon un parcours de liens optimisé, en concentrant le jus de lien vers les pages stratégiques tout en couvrant exhaustivement un domaine thématique. Plus contraignant à mettre en œuvre que le cluster classique, mais potentiellement très efficace sur des sujets concurrentiels.

Cannibalisation de mots-clés Phénomène où deux pages ou plus d’un même site ciblent le même mot-clé principal, créant une concurrence interne. Google ne sait plus quelle page mettre en avant et peut alterner leur positionnement de façon erratique, ou pénaliser les deux. La cannibalisation se détecte en analysant les rapports de Google Search Console (plusieurs URL classées sur la même requête). Elle se résout par une fusion de pages, une redirection 301, une différenciation des intentions ciblées ou un renforcement du maillage interne vers la page à privilégier.

Canonicalisation Processus de désignation d’une URL de référence (URL canonique) parmi plusieurs variantes d’une même page. Permet d’éviter les problèmes de contenu dupliqué et de concentrer le jus de lien sur une seule URL.

Champ sémantique Ensemble des mots, expressions et concepts liés à un sujet principal. Enrichir le champ sémantique d’une page aide les moteurs de recherche à en comprendre le contexte et améliore la pertinence thématique. Google utilise des techniques de traitement du langage naturel (NLP) pour analyser ce champ.

Chunk (chunking) En AIO et RAG, un chunk est un fragment de texte extrait d’un document plus long pour être indexé et récupéré par un système d’IA. Structurer son contenu en blocs cohérents et bien délimités améliore les chances d’être cité par les assistants IA.

Cloaking Technique black hat consistant à présenter un contenu différent aux robots d’indexation et aux visiteurs humains. Pénalisé sévèrement par Google.

CMS (Content Management System) Système de gestion de contenu permettant de créer, modifier et publier des pages web sans écrire de code. Exemples : WordPress, Drupal, TinaCMS, Webflow, Contentful.

Contenu dupliqué (duplicate content) Contenu identique ou très similaire présent sur plusieurs URL d’un même site ou entre différents sites. Peut diluer l’autorité des pages et générer des confusions pour les moteurs de recherche. À traiter via les balises canoniques, les redirections 301 ou les directives noindex.

Contenu Evergreen Contenu dont la pertinence reste stable dans le temps, indépendamment de l’actualité. Les articles evergreen génèrent du trafic organique durable et nécessitent moins de mises à jour fréquentes.

Contenu fin (thin content) Contenu de faible valeur, trop court, superficiel ou quasi-vide. Google pénalise les pages avec du thin content via des mises à jour algorithmiques comme Panda ou la mise à jour Helpful Content.

Contenu généré par l’utilisateur (UGC) Contenu produit par les visiteurs ou clients d’un site : avis, commentaires, forums, contributions. L’UGC peut enrichir la longue traîne d’un site mais doit être modéré pour éviter le spam.

Core Update Mise à jour majeure de l’algorithme de Google, déployée plusieurs fois par an. Les core updates réévaluent la qualité globale des sites et peuvent entraîner des hausses ou des baisses significatives de positionnement. Elles ne ciblent pas de critères spécifiques mais réajustent la pondération de l’ensemble des signaux.

Core Web Vitals (CWV) Ensemble de métriques de performance défini par Google pour mesurer l’expérience utilisateur : LCP (Largest Contentful Paint), INP (Interaction to Next Paint) et CLS (Cumulative Layout Shift). Intégrés aux signaux de classement depuis 2021.

Cluster thématique (topic cluster) Groupe de pages traitant un même sujet sous différents angles, structuré autour d’une page pilier centrale. Les pages du cluster (articles de blog, FAQ, guides) approfondissent les sous-thèmes et sont toutes liées à la page pilier via le maillage interne. Cette architecture renforce l’autorité thématique du site aux yeux de Google. À distinguer du cocon sémantique, plus contraignant dans la logique de liaison mère/fille/sœur.

CLS (Cumulative Layout Shift) Métrique Core Web Vitals mesurant la stabilité visuelle d’une page pendant son chargement. Elle quantifie les déplacements inattendus d’éléments (texte, boutons, images) qui font “sauter” la mise en page sous les yeux de l’utilisateur. Un score CLS inférieur à 0,1 est considéré comme bon par Google. Causes fréquentes : images sans dimensions définies, publicités à chargement différé, polices web qui s’affichent en retard (FOUT). Un CLS élevé dégrade l’expérience utilisateur et le classement.

Crawl Processus par lequel un robot d’indexation (spider ou bot) explore les pages d’un site web en suivant les liens hypertextes. Première étape du référencement : une page non crawlée ne peut pas être indexée.

Crawl depth (profondeur de crawl) Nombre de clics nécessaires pour atteindre une page depuis la page d’accueil en suivant les liens internes. Plus une page est profonde dans l’architecture du site, moins elle reçoit de jus de lien et moins elle est crawlée fréquemment. Règle empirique : les pages stratégiques doivent être accessibles en 3 clics ou moins depuis la home. Un audit de crawl depth révèle souvent des pages orphelines ou des silos trop profonds à aplatir.

CSR (Client-Side Rendering) Rendu côté client : technique où le contenu d’une page est généré dans le navigateur de l’utilisateur via JavaScript, après le chargement d’un fichier HTML minimal. Opposé au SSR (rendu côté serveur). Problématique pour le SEO car Googlebot doit exécuter le JavaScript pour voir le contenu réel, ce qui peut retarder l’indexation (second wave of indexing). Les frameworks comme React, Vue ou Angular fonctionnent par défaut en CSR.

CTR (Click-Through Rate) Taux de clic : rapport entre le nombre d’impressions d’une URL dans les SERP et le nombre de clics reçus. Un CTR élevé indique que le title et la meta description sont attractifs. Un CTR anormalement bas peut signaler un problème de pertinence ou d’attractivité du snippet.

D

DA (Domain Authority) Voir Autorité de domaine.

Données structurées (structured data) Code ajouté dans le HTML d’une page pour décrire son contenu de manière formalisée, selon le vocabulaire Schema.org. Les données structurées permettent à Google de générer des rich snippets (avis, recettes, FAQ, événements, etc.) dans les SERP. Format recommandé : JSON-LD.

Doorway page Page créée uniquement pour intercepter du trafic de recherche sur un mot-clé, sans valeur pour l’utilisateur, qui redirige ensuite vers une autre page. Pratique black hat sanctionnée par Google.

Domaine référent (referring domain) Site tiers qui pointe vers votre site via au moins un backlink. Le nombre de domaines référents uniques est un indicateur plus fiable que le nombre brut de backlinks : 100 liens provenant de 100 domaines différents valent bien plus que 100 liens issus du même domaine. Les outils comme Ahrefs ou Semrush distinguent clairement backlinks (nombre total de liens) et referring domains (nombre de domaines sources uniques).

DR (Domain Rating) Indicateur d’Ahrefs similaire à la Domain Authority de Moz, mesurant la puissance du profil de backlinks d’un domaine sur une échelle de 0 à 100.

E

E-E-A-T Acronyme de Experience, Expertise, Authoritativeness, Trustworthiness (Expérience, Expertise, Autorité, Fiabilité). Cadre d’évaluation de la qualité du contenu défini dans les Quality Rater Guidelines de Google. Particulièrement important pour les contenus YMYL (Your Money or Your Life). Le premier E (Experience) a été ajouté en 2022.

Erreurs 5xx (erreurs serveur) Codes HTTP indiquant une défaillance côté serveur (500 Internal Server Error, 503 Service Unavailable, 504 Gateway Timeout, etc.). Contrairement aux erreurs 4xx (côté client), les 5xx signalent que le serveur n’a pas pu traiter la requête. En SEO, des erreurs 5xx récurrentes gaspillent le budget de crawl, empêchent l’indexation des pages concernées et dégradent l’expérience utilisateur. Une page renvoyant une erreur 503 trop longtemps peut être désindexée. À surveiller en priorité dans Google Search Console (rapport Couverture) et les logs serveur.

E-commerce SEO Voir SEO e-commerce.

Entité (entity) Objet du monde réel reconnu par Google dans son Knowledge Graph : personne, marque, lieu, produit, concept. Le SEO basé sur les entités (entity-based SEO) vise à clarifier et renforcer les entités associées à un site pour améliorer sa pertinence sémantique et sa présence dans les résultats enrichis.

Extrait optimisé (featured snippet) Bloc d’information affiché en position 0 dans les SERP, au-dessus des résultats organiques classiques. Il répond directement à une question de l’utilisateur (définition, liste, tableau, procédure). Se conquiert en structurant le contenu de manière claire et en répondant précisément aux requêtes interrogatives.

F

Facettes (navigation à facettes) Système de filtres permettant aux utilisateurs d’affiner une liste de produits ou de résultats (par prix, couleur, taille, etc.). Sur les sites e-commerce, la navigation à facettes génère souvent de nombreuses URL avec du contenu dupliqué ou du thin content, à gérer via canonical, noindex ou paramètres URL.

FAQ SEO Format de contenu structuré en questions-réponses, optimisé pour capter les featured snippets et les requêtes conversationnelles. Les pages FAQ peuvent être balisées avec les données structurées Schema.org FAQPage pour générer des rich results dans les SERP. Attention : depuis 2023, Google a considérablement réduit l’affichage des FAQ rich results, les limitant aux sites gouvernementaux et de santé. L’intérêt des FAQ reste réel pour le contenu et la longue traîne, mais l’effet rich snippet est désormais très limité pour la majorité des sites.

Footer (pied de page) Zone inférieure d’une page web. Les liens dans le footer ont une valeur de maillage interne plus faible que les liens placés dans le corps du contenu, mais restent utiles pour la navigation.

Fraîcheur du contenu (content freshness) Signal de qualité pris en compte par Google pour certaines requêtes sensibles à la date (actualités, tendances). Mettre à jour régulièrement un contenu peut améliorer son positionnement sur des requêtes où la fraîcheur est un critère de pertinence.

G

GEO (Generative Engine Optimization) Optimisation du contenu pour les moteurs de recherche génératifs : systèmes d’IA (ChatGPT, Gemini, Perplexity, Claude) qui produisent des réponses de synthèse en s’appuyant sur des sources indexées. Terme voisin de l’AIO, avec une nuance : le GEO insiste sur l’optimisation spécifiquement pour les moteurs de recherche qui intègrent une couche générative (comme Google AI Overviews ou Bing Copilot), là où l’AIO couvre l’ensemble des interfaces IA. Les deux termes tendent à converger dans l’usage professionnel.

Google Business Profile (GBP) Fiche d’établissement gratuite proposée par Google, permettant aux entreprises d’apparaître dans Google Maps et dans le local pack. L’optimisation du GBP inclut : catégories précises, description complète, photos régulières, réponse aux avis, publications et horaires à jour. Anciennement appelé Google My Business (GMB).

Google Analytics (GA) Outil d’analyse d’audience de Google permettant de suivre le trafic, les comportements utilisateurs, les conversions et les sources d’acquisition sur un site. La version actuelle est GA4.

Google Search Console (GSC) Outil gratuit de Google permettant de monitorer l’indexation d’un site, les performances dans les SERP (impressions, clics, positions), les erreurs d’exploration et les pénalités manuelles.

Googlebot Robot d’indexation de Google qui explore le web pour découvrir et analyser les pages. Il existe plusieurs versions : Googlebot pour le web, Googlebot-Image pour les images, etc.

Grounding En IA, processus consistant à ancrer les réponses générées sur des sources vérifiables et réelles, pour limiter les hallucinations. Les systèmes RAG (Retrieval-Augmented Generation) utilisent le grounding pour s’assurer que les réponses de l’IA s’appuient sur des documents récupérés, et non sur des connaissances internes potentiellement obsolètes ou incorrectes. Pour l’AIO, produire un contenu bien structuré, factuel et citable améliore les chances d’être utilisé comme source de grounding par ces systèmes.

Gray hat SEO Pratiques SEO situées dans une zone grise entre le white hat et le black hat. Elles ne violent pas explicitement les consignes de Google mais restent risquées sur le long terme.

H

Hallucination (IA) Phénomène où un modèle d’IA génère des informations fausses, inventées ou inexactes présentées avec assurance. Les hallucinations sont un problème structurel des grands modèles de langage (LLM) car ils génèrent du texte statistiquement probable, sans vérifier la vérité factuelle. En AIO, comprendre ce risque est utile pour deux raisons : d’une part, il justifie d’ancrer les réponses IA sur des sources fiables (grounding) ; d’autre part, un contenu clair, précis et bien structuré réduit le risque qu’un modèle en tire des conclusions erronées.

HCU (Helpful Content Update) Mise à jour algorithmique de Google lancée en 2022 visant à pénaliser les contenus créés principalement pour les moteurs de recherche plutôt que pour les utilisateurs. Intégrée depuis 2023 au signal de qualité global de Google.

Heading (balises de titre) Balises HTML structurant la hiérarchie d’un contenu : H1, H2, H3, H4, H5, H6. Elles organisent le texte pour les lecteurs et pour les moteurs de recherche. Un H1 unique par page, des H2 pour les sections principales, des H3 pour les sous-sections. L’ordre logique de la hiérarchie doit être respecté : passer d’un H2 directement à un H4 sans H3 intermédiaire est une erreur de structure que Google et les lecteurs d’écran interprètent comme un défaut de cohérence. Une hiérarchie Hn rigoureuse facilite aussi l’extraction de featured snippets.

Headless CMS Architecture de gestion de contenu qui sépare le back-office éditorial (où le contenu est créé et stocké) du front-end (la couche d’affichage). Contrairement à un CMS traditionnel comme WordPress, un headless CMS diffuse le contenu via une API (REST ou GraphQL) vers n’importe quel canal : site web, application mobile, enceinte connectée, kiosque interactif. Exemples : TinaCMS, Contentful, Sanity, Strapi, Prismic. Sur le plan SEO, le headless CMS impose une vigilance accrue : le rendu côté client (JavaScript) peut ralentir l’indexation si le SSR (Server-Side Rendering) ou la génération statique (SSG) ne sont pas correctement configurés. En revanche, il offre une liberté totale sur la performance, la structure des URL et l’implémentation des données structurées.

Hreflang Attribut HTML indiquant aux moteurs de recherche la langue et la cible géographique d’une page. Essentiel pour les sites multilingues afin d’éviter le contenu dupliqué inter-langue et d’afficher la bonne version aux bons utilisateurs. L’attribut hreflang="x-default" est une valeur spéciale à utiliser pour désigner la page de repli lorsqu’aucune version ne correspond à la langue ou au pays de l’utilisateur — typiquement la page d’accueil internationale ou la version en anglais par défaut. Exemple : <link rel="alternate" hreflang="x-default" href="https://example.com/">.

HTTP / HTTPS HyperText Transfer Protocol / version sécurisée avec chiffrement SSL/TLS. Google favorise les sites en HTTPS depuis 2014. Un site en HTTP est signalé comme non sécurisé dans les navigateurs modernes.

I

Impressions Nombre de fois qu’une URL de votre site est apparue dans les résultats de recherche Google, qu’elle ait été cliquée ou non. Donnée disponible dans Google Search Console. Les impressions permettent d’évaluer la visibilité brute d’une page sur une requête, indépendamment du CTR. Une page avec beaucoup d’impressions mais un CTR faible signale souvent un title ou une meta description peu attractifs.

Index bloat (pollution d’index) Phénomène où un site possède un nombre excessif de pages indexées par Google, dont beaucoup sont de faible valeur : pages filtrées, pages de tags, URL avec paramètres, pages de pagination, contenus fins, pages de résultats de recherche interne. L’index bloat dilue l’autorité du site, gaspille le budget de crawl et peut nuire à la perception globale de la qualité du site par Google. Se corrige par des directives noindex, des canoniques, des règles robots.txt et une meilleure gestion des URL.

Indexation Processus par lequel Google analyse et enregistre le contenu d’une page dans sa base de données (index) après l’avoir crawlée. Une page indexée est susceptible d’apparaître dans les résultats de recherche. Nuance importante : la balise noindex empêche l’indexation d’une page si elle peut être crawlée. Le fichier robots.txt, lui, bloque le crawl — mais ne garantit pas la non-indexation : Google peut indexer une URL qu’il n’a jamais explorée s’il la découvre via des liens externes. Pour bloquer à la fois le crawl et l’indexation, les deux mécanismes doivent être utilisés correctement selon l’objectif.

INP (Interaction to Next Paint) Métrique Core Web Vitals mesurant la réactivité globale d’une page aux interactions de l’utilisateur (clics, saisies clavier, tapotements sur mobile). Elle calcule le délai entre l’action de l’utilisateur et la mise à jour visuelle correspondante de la page. Un INP inférieur à 200 ms est considéré comme bon par Google. L’INP a remplacé le FID (First Input Delay) en mars 2024 car il mesure l’ensemble des interactions sur la durée de la session, et non uniquement la première. Causes fréquentes d’un INP dégradé : scripts JavaScript lourds bloquant le thread principal, animations CSS non optimisées, requêtes réseau synchrones.

Intention de recherche (search intent) Objectif sous-jacent d’un utilisateur lorsqu’il tape une requête. Les quatre types d’intention sont : informationnelle (comprendre), navigationnelle (trouver un site), transactionnelle (acheter) et commerciale (comparer avant d’acheter). Aligner le contenu sur l’intention de recherche est fondamental pour se positionner.

IP (adresse IP) Identifiant numérique unique attribué à chaque appareil connecté à internet. En SEO, les adresses IP sont liées à la localisation des serveurs (hébergement) et peuvent être un signal géographique pour le référencement local.

J

JavaScript SEO Optimisation du référencement pour les sites utilisant massivement JavaScript pour générer leur contenu. Googlebot peut exécuter du JavaScript mais avec un délai (second wave of indexing). Le rendu côté serveur (SSR) ou la génération statique (SSG) sont préférés pour le SEO.

Jus de lien (link juice / link equity) Valeur transmise d’une page à une autre via un lien hypertexte. Plus une page reçoit de liens entrants de qualité, plus elle dispose de jus de lien à redistribuer. Un lien en nofollow ne transmet pas ou peu de jus de lien.

K

Keyword Difficulty (KD) Indice (généralement de 0 à 100) utilisé par les outils SEO comme Ahrefs ou Semrush pour estimer la difficulté à se positionner sur un mot-clé face à la concurrence actuelle. Plus le KD est élevé, plus les pages déjà classées sont autoritaires et difficiles à déloger. Le KD est à analyser en rapport avec le volume de recherche et le potentiel de trafic réel : un KD de 20 sur un mot-clé à 50 000 recherches/mois est souvent plus stratégique qu’un KD de 5 sur une requête à 100 recherches. À noter : chaque outil calcule son propre KD selon sa méthodologie — les scores ne sont pas comparables entre Ahrefs, Semrush et Moz.

Keyword stuffing Pratique black hat consistant à répéter excessivement un mot-clé dans une page pour tenter d’en manipuler le positionnement : dans le texte, les balises, les attributs alt, les ancres. Sanctionnée par Google depuis l’algorithme Panda (2011). Le keyword stuffing dégrade l’expérience de lecture, est facilement détectable par les algorithmes modernes et peut entraîner une pénalité manuelle. À distinguer de l’utilisation naturelle et raisonnée du mot-clé cible dans les emplacements stratégiques (title, H1, premier paragraphe).

Knowledge Graph Base de données sémantique de Google regroupant des entités (personnes, lieux, marques, concepts) et leurs relations. Alimente les panneaux de connaissances (Knowledge Panels) affichés dans les SERP. Optimiser la présence d’une entité dans le Knowledge Graph renforce l’E-E-A-T.

Knowledge Panel Encadré d’informations affiché sur le côté droit des SERP Google (ou en haut sur mobile) pour des entités reconnues dans le Knowledge Graph : marques, personnalités, lieux, organisations. Il affiche des données structurées (description, logo, réseaux sociaux, coordonnées) directement extraites du Knowledge Graph et de sources tierces comme Wikipedia. Pour les entreprises, revendiquer et optimiser son Knowledge Panel renforce l’E-E-A-T et la crédibilité perçue. À distinguer du Knowledge Graph, qui est la base de données sous-jacente.

KPI (Key Performance Indicator) Indicateur clé de performance utilisé pour mesurer l’efficacité d’une stratégie SEO. Exemples : trafic organique, positions moyennes, CTR, taux de conversion, nombre de backlinks.

KW (Keyword) Voir Mot-clé.

L

Lazy Loading Technique d’optimisation de la vitesse de chargement consistant à ne charger les images, vidéos ou iframes que lorsqu’elles entrent dans la zone visible du navigateur (viewport), plutôt qu’au chargement initial de la page. Réduit le poids initial de la page et améliore le LCP. Implémentable nativement via l’attribut HTML loading="lazy". Attention : ne pas appliquer le lazy loading à l’image principale above the fold, au risque de dégrader précisément le LCP que l’on cherche à améliorer.

LCP (Largest Contentful Paint) Métrique Core Web Vitals mesurant le temps d’affichage du plus grand élément visible d’une page (image, bloc de texte). Un LCP inférieur à 2,5 secondes est considéré comme bon par Google.

Lien brisé (broken link) Lien hypertexte pointant vers une URL qui renvoie une erreur (généralement 404). Les liens brisés nuisent à l’expérience utilisateur et gaspillent le budget de crawl. Outils de détection : Screaming Frog, Ahrefs, SEMrush.

Lien entrant Voir Backlink.

Lien interne (internal link) Lien hypertexte reliant deux pages d’un même site. Le maillage interne distribue le jus de lien entre les pages, renforce l’architecture thématique et facilite le crawl des robots.

Log (analyse de logs) Analyse des fichiers journaux du serveur web pour observer précisément comment et quand Googlebot explore un site : quelles URL sont crawlées, à quelle fréquence, quelles pages sont ignorées, quels codes HTTP sont renvoyés. C’est le juge de paix du SEO technique. Contrairement aux données de Google Search Console (qui montrent ce que Google a indexé), l’analyse de logs révèle ce que le robot fait réellement sur le serveur, y compris les zones de gaspillage de budget de crawl. Outils : Screaming Frog Log Analyzer, Botify, OnCrawl.

Linkbait (linkable asset) Contenu délibérément conçu pour attirer des backlinks naturels : études originales, données exclusives, outils interactifs, infographies, guides de référence, classements. Le linkbait ne s’achète pas, il se mérite par la valeur perçue du contenu. C’est l’une des stratégies de link building les plus durables et les plus conformes aux consignes de Google.

Lien sitewide Lien apparaissant sur toutes les pages d’un site, généralement dans le header, le footer ou la barre latérale. En termes de jus de lien, Google comptabilise un lien sitewide comme un seul lien, quelle que soit sa répétition. Un lien sitewide provenant d’un site autoritaire peut être puissant, mais un profil de liens dominé par des sitewide links artificiels est un signal négatif.

Local Finder Interface Google affichant une liste étendue de résultats locaux lorsque l’utilisateur clique sur “Plus de lieux” depuis le Local Pack. Le Local Finder affiche davantage d’établissements avec leur positionnement sur la carte, leurs avis et leurs horaires. Optimiser sa fiche Google Business Profile améliore à la fois la présence dans le Local Pack et dans le Local Finder.

Local Pack Bloc de résultats locaux affiché par Google dans les SERP en réponse à une requête géolocalisée (restaurant Paris, plombier Lyon, etc.). Il affiche généralement trois établissements sur une carte Google Maps. Apparaître dans le local pack nécessite un Google Business Profile optimisé, des citations NAP cohérentes et des avis clients réguliers.

Local SEO Voir SEO local.

Lien nofollow Lien comportant l’attribut rel="nofollow" signalant aux moteurs de recherche de ne pas suivre ce lien pour transmettre du jus de lien. Depuis 2019, Google traite le nofollow comme un hint (indice), non comme une directive absolue : il peut choisir de suivre le lien et d’en tenir compte selon le contexte. Utilisé pour les commentaires, les contributions utilisateurs et les contenus non vérifiés.

Lien sponsored Attribut rel="sponsored" utilisé pour signaler les liens payants ou d’affiliation. Introduit par Google en 2019 en complément de nofollow.

Lien UGC Attribut rel="ugc" (User Generated Content) pour les liens générés par les utilisateurs dans les commentaires, forums ou contributions. Introduit en 2019 par Google.

Link building Ensemble des actions visant à obtenir des backlinks de qualité vers un site. Techniques légitimes : création de contenu à haute valeur (linkbait), relations presse digitale, partenariats éditoriaux, mentions de marque, etc.

Longue traîne (long tail) Requêtes de recherche composées de plusieurs mots, plus spécifiques et moins concurrentielles que les requêtes génériques (head terms). La longue traîne représente la majorité du volume de recherche global et convertit souvent mieux.

M

Maillage interne Voir Lien interne. Le maillage interne désigne la stratégie globale de liaison entre les pages d’un site pour structurer l’autorité et guider les robots comme les utilisateurs.

Mention de marque (brand mention / implied link) Citation du nom d’une marque ou d’un site sur le web, avec ou sans lien hypertexte. Google est capable de détecter les mentions non liées (unlinked mentions) et peut les interpréter comme un signal de popularité ou d’autorité, similaire à un backlink implicite. Les mentions dans des médias reconnus, des forums spécialisés ou des publications sectorielles contribuent à construire l’E-E-A-T et la notoriété de marque au sens large.

Méta-données Informations encodées dans le code HTML d’une page et non affichées directement dans le contenu visible. En SEO, les principales méta-données sont la balise title et la meta description.

Mise à jour d’algorithme Modification apportée par un moteur de recherche à ses critères de classement. Google déploie des centaines de mises à jour par an, dont des core updates majeures annoncées publiquement.

Mobile-first indexing Approche de Google consistant à utiliser la version mobile d’un site comme référence pour l’indexation et le classement. Actif sur tous les sites depuis 2023. Un site non responsive pénalise son référencement. Point souvent sous-estimé : Google n’explore quasiment plus la version desktop des sites. Si votre version mobile masque du contenu, des liens ou des données structurées présents sur la version desktop, ces éléments risquent d’être ignorés lors de l’indexation. La parité de contenu entre les deux versions est impérative.

Mot-clé (keyword) Terme ou expression qu’un utilisateur tape dans un moteur de recherche. En SEO, les mots-clés sont analysés selon leur volume de recherche, leur difficulté de positionnement (KD) et leur intention. Ils servent de base à la stratégie de contenu.

Mot-clé de courte traîne (short tail / head term) Requête courte et générique, composée de 1 à 2 mots. Volume de recherche élevé, concurrence forte, intention de recherche peu précise. Exemple : “chaussures running”.

N

NAP (Name, Address, Phone) Acronyme désignant le nom, l’adresse et le numéro de téléphone d’une entreprise. La cohérence du NAP sur toutes les citations locales (Google Business Profile, annuaires) est un signal de référencement local.

NLP (Natural Language Processing) Traitement automatique du langage naturel. Google utilise des modèles NLP (comme BERT et MUM) pour comprendre le sens et le contexte des requêtes et des contenus, au-delà de la simple correspondance de mots-clés.

Noindex Directive indiquant aux robots de ne pas indexer une page. S’implémente via la balise meta robots (<meta name="robots" content="noindex">) ou l’en-tête HTTP X-Robots-Tag. Utilisé pour les pages de remerciement, les filtres, les pages de résultats de recherche interne, etc.

O

Off-page SEO Ensemble des optimisations réalisées en dehors du site web lui-même pour améliorer son positionnement. L’activité off-page principale est le link building, mais inclut aussi la gestion de l’e-réputation, les mentions de marque, les réseaux sociaux et la présence dans les annuaires.

On-page SEO Ensemble des optimisations réalisées directement sur les pages d’un site : balises title, H1, meta description, contenu, images, maillage interne, données structurées, vitesse de chargement.

Organic traffic Trafic provenant des résultats naturels (non payants) des moteurs de recherche. Le trafic organique est l’objectif principal du SEO.

Orpheline (page orpheline) Page web qui n’est reliée par aucun lien interne provenant du reste du site. Elle est quasiment impossible à découvrir pour les robots d’indexation (qui suivent les liens pour explorer le site) et ne reçoit aucun jus de lien. Même si elle est indexée, une page orpheline reste invisible dans l’architecture du site et ne peut pas monter en autorité. À détecter via un crawl complet (Screaming Frog) et à corriger en ajoutant des liens internes depuis des pages thématiquement proches.

P

PageRank (PR) Algorithme fondateur de Google, mesurant l’importance d’une page en fonction du nombre et de la qualité des liens qui pointent vers elle. Google n’affiche plus la valeur de PageRank publiquement depuis 2016, mais le principe reste au cœur de son algorithme.

PAA (People Also Ask / Autres questions posées) Module de questions-réponses affiché dans les SERP Google, proposant des questions connexes à la requête initiale. Chaque question déploie une réponse extraite d’une page web. Le PAA est dynamique : répondre à une question dans le PAA peut générer du trafic qualifié et renforcer la visibilité sur des requêtes informationnelles. Apparaître dans le PAA nécessite un contenu structuré en Q&R avec des réponses concises et directes.

Page orpheline Voir Orpheline (page orpheline).

Page pilier (pillar page) Page de contenu exhaustive couvrant un sujet principal dans sa globalité. Elle est liée à des articles de cluster qui approfondissent les sous-thèmes. La structure pilier-cluster renforce l’autorité thématique du site.

Pénalité manuelle Sanction appliquée par un employé de Google à la suite d’une violation des consignes aux webmasters. Visible dans Google Search Console sous “Actions manuelles”. Distincte des pénalités algorithmiques.

Pénalité algorithmique Baisse de classement provoquée par une mise à jour d’algorithme (Panda, Penguin, SpamBrain, etc.) sans intervention humaine directe.

Pagination Découpage d’un contenu long ou d’une liste de résultats en plusieurs pages numérotées (/page/2, /page/3, etc.). En SEO, la pagination pose des questions de budget de crawl et de contenu dupliqué. Google a supprimé le support officiel des attributs rel="prev" et rel="next" en 2019, recommandant désormais soit de laisser Google gérer la pagination seul, soit d’utiliser des balises canoniques pointant vers la page principale, soit de proposer une page “tout afficher” si techniquement possible.

PBN (Private Blog Network) Réseau de sites web appartenant à la même personne ou entité, utilisé pour créer des backlinks artificiels vers un site cible (dit “money site”). Pratique gray/black hat : efficace à court terme, mais détectable par les algorithmes de Google (notamment SpamBrain) et exposant à des pénalités sévères. L’identification repose sur des signaux comme la co-occurrence d’IP, les patterns d’enregistrement de domaines et les profils de contenu similaires.

Penguin Mise à jour algorithmique de Google lancée en 2012 et intégrée au core algorithm en 2016, ciblant les pratiques de link building artificielles (achats de liens, fermes de liens, sur-optimisation des ancres).

Perplexity Moteur de recherche basé sur l’IA, fournissant des réponses synthétiques avec citations de sources. Représentatif de la catégorie des moteurs de réponse (answer engines) dont l’optimisation relève de l’AIO.

Position 0 Voir Extrait optimisé (featured snippet).

Position moyenne Classement moyen d’une URL ou d’un site pour une requête donnée dans les SERP, calculé par Google Search Console sur une période définie. Une position moyenne de 3,5 signifie que la page oscille généralement entre les positions 3 et 4. À interpréter avec le volume d’impressions et le CTR : une position moyenne élevée sur une requête à faible volume d’impressions peut avoir moins d’impact qu’une position 8 sur une requête très recherchée.

Profil de liens (link profile) Ensemble des backlinks pointant vers un site, analysé en termes de quantité, de qualité, de diversité des domaines référents et de types d’ancres. Un profil de liens naturel et diversifié est un signal positif pour Google.

Q

Quality Rater Guidelines Document de plusieurs centaines de pages publié par Google, décrivant les critères d’évaluation de la qualité des pages utilisés par ses évaluateurs humains (quality raters). Ce document explicite les attentes de Google en matière d’E-E-A-T, de contenu utile et de qualité de l’expérience utilisateur.

Requête Terme ou phrase tapé dans un moteur de recherche par un utilisateur. Synonyme de mot-clé dans le contexte de la recherche.

R

RankBrain Composant de l’algorithme de Google basé sur le machine learning, déployé en 2015. RankBrain aide Google à interpréter les requêtes jamais tapées auparavant (environ 15 % des recherches quotidiennes selon Google) en les rapprochant de requêtes connues aux intentions similaires. Il évalue aussi la pertinence d’une page par rapport à l’intention réelle de la requête, au-delà de la correspondance lexicale exacte. RankBrain est l’un des trois signaux de classement les plus importants aux côtés des liens et du contenu.

Rich results Terme officiel de Google désignant les résultats de recherche enrichis générés grâce aux données structurées (Schema.org). Englobe les rich snippets (résultats avec étoiles, prix, etc.) mais aussi des formats plus interactifs comme les carrousels, les panneaux de connaissances, les résultats d’événements ou les FAQ. À distinguer du terme “rich snippet”, qui est souvent utilisé de façon générique mais désigne techniquement un sous-ensemble des rich results.

Robots meta (balise meta robots) Balise HTML placée dans l’en-tête <head> d’une page pour contrôler le comportement des robots d’indexation. Les directives principales sont : index / noindex (autoriser ou bloquer l’indexation), follow / nofollow (autoriser ou bloquer le suivi des liens), noarchive (empêcher la mise en cache de la page), nosnippet (empêcher l’affichage d’un extrait dans les SERP). Exemple : <meta name="robots" content="noindex, follow">. À distinguer du fichier robots.txt qui agit au niveau du crawl.

RAG (Retrieval-Augmented Generation) Architecture des assistants IA qui récupèrent des informations dans une base de données externe (web, documents) avant de générer une réponse. Comprendre le fonctionnement RAG est fondamental pour l’AIO : optimiser son contenu pour être bien indexé par ces systèmes augmente les chances d’être cité.

Recherche vocale Requêtes effectuées via des assistants vocaux comme Siri, Alexa, Google Assistant ou Cortana. Les requêtes vocales sont structurellement différentes des requêtes textuelles : plus longues, formulées en langage naturel et sous forme de questions complètes (“Quel est le meilleur restaurant italien à Lyon ?” plutôt que “restaurant italien Lyon”). Elles favorisent les contenus structurés en Q&R, les featured snippets et les pages optimisées pour les requêtes conversationnelles. L’essor des assistants IA (ChatGPT voice, Gemini Live) renforce l’importance de ce format d’interrogation.

Redirections 301 Redirection permanente d’une URL vers une autre. Transmet environ 90 à 99 % du jus de lien à la page de destination. À utiliser lors d’un changement d’URL, d’une migration de site ou d’une suppression de page.

Redirection 302 Redirection temporaire signalant aux moteurs de recherche que l’URL d’origine sera rétablie. À utiliser uniquement si le retour de l’URL d’origine est effectivement prévu. Pour tout changement permanent, la 301 reste la bonne pratique. Note : Google traite aujourd’hui les codes 3xx de manière plus nuancée selon le contexte, mais la distinction 301/302 reste pertinente pour signaler clairement l’intention.

Erreur 404 (Not Found) Code HTTP indiquant qu’une page n’existe plus ou n’a jamais existé sur le serveur. Ce n’est pas une redirection : la page est simplement absente. Les pages en 404 doivent être soit redirigées (301) vers une page pertinente, soit laissées telles quelles si elles n’ont aucune valeur. À ne pas confondre avec le code 410 (Gone), qui signale une suppression définitive et intentionnelle.

Erreur 410 (Gone) Code HTTP signalant qu’une page a été supprimée définitivement et intentionnellement, sans redirection prévue. Préférable au 404 lorsque vous souhaitez indiquer explicitement à Google que la page ne reviendra jamais, ce qui accélère le désindexage. Particulièrement utile sur les sites e-commerce pour les produits définitivement retirés.

Référencement naturel Synonyme de SEO en français. Ensemble des techniques visant à améliorer la visibilité d’un site dans les résultats organiques des moteurs de recherche.

Rendu côté serveur (SSR – Server-Side Rendering) Technique de génération de pages HTML côté serveur, facilitant l’indexation par les robots de recherche, par opposition au rendu côté client (JavaScript rendu dans le navigateur).

Rich snippet Résultat enrichi dans les SERP, affichant des informations supplémentaires extraites des données structurées : étoiles d’avis, prix, durée de recette, événement, FAQ, etc.

Robots.txt Fichier texte placé à la racine d’un domaine, indiquant aux robots d’indexation les zones à explorer ou à ignorer. Ne garantit pas la non-indexation : utiliser la balise noindex pour cela.

S

Schema.org Vocabulaire standardisé de données structurées créé par Google, Bing, Yahoo et Yandex. Permet de décrire le type de contenu d’une page (article, produit, événement, organisation, personne, recette, FAQ, etc.) dans un format compréhensible par les moteurs de recherche.

Score de qualité Voir Quality Score dans le contexte SEA/Google Ads, ou plus généralement tout indicateur évaluant la pertinence et la qualité d’une page ou d’un site.

Screaming Frog Logiciel d’audit SEO technique permettant de crawler un site pour détecter les erreurs d’indexation, les liens brisés, les problèmes de balises, les redirections, les pages lentes, etc.

Search Console Voir Google Search Console.

SEA (Search Engine Advertising) Référencement payant via des annonces dans les moteurs de recherche (Google Ads, Bing Ads). Distinct du SEO (référencement naturel), avec lequel il est souvent utilisé conjointement dans une stratégie SEM globale.

SEM (Search Engine Marketing) Terme générique désignant l’ensemble des actions marketing sur les moteurs de recherche, incluant le SEO (organique) et le SEA (payant).

SEO (Search Engine Optimization) Optimisation pour les moteurs de recherche. Ensemble des techniques visant à améliorer la visibilité et le positionnement d’un site web dans les résultats organiques des moteurs de recherche comme Google, Bing ou d’autres.

SEO technique Volet du SEO portant sur la structure et la performance technique du site : vitesse de chargement, mobile-first, structure des URL, fichier robots.txt, sitemap XML, données structurées, Core Web Vitals, sécurité HTTPS, gestion du crawl.

SERP (Search Engine Results Page) Page de résultats affichée par un moteur de recherche en réponse à une requête. Les SERP modernes combinent résultats organiques, annonces payantes, knowledge panels, featured snippets, images, vidéos et autres modules enrichis.

Sémantique (SEO sémantique) Approche du référencement centrée sur le sens et le contexte plutôt que sur la répétition exacte de mots-clés. Le SEO sémantique s’appuie sur l’enrichissement du champ sémantique, les entités nommées, les relations entre concepts et l’intention de recherche. Depuis BERT (2019) et MUM (2021), Google comprend le langage naturel : il ne cherche plus une correspondance mot à mot mais une pertinence thématique globale. Concrètement, cela implique de traiter un sujet en profondeur, d’utiliser le vocabulaire propre à un domaine, de répondre aux questions connexes et de structurer le contenu en clusters thématiques.

SEO local Ensemble des techniques d’optimisation visant à améliorer la visibilité d’un site ou d’un établissement dans les résultats de recherche géolocalisés. Couvre trois piliers : le Google Business Profile (anciennement Google My Business), les citations locales (cohérence NAP dans les annuaires), et les signaux on-page (pages locales, balisage Schema LocalBusiness, mots-clés géolocalisés). Essentiel pour les commerces physiques, les artisans, les professions libérales et toute entreprise ciblant une zone géographique précise.

SEO e-commerce Application des techniques de référencement naturel aux sites de vente en ligne. Ses enjeux spécifiques incluent : l’optimisation des fiches produit (title, meta description, contenu unique, données structurées Product), la gestion de la navigation à facettes (contenu dupliqué, budget de crawl), l’architecture des catégories, les avis clients (UGC et rich snippets), les pages de marque et les pages de comparaison. Le volume d’URL à gérer et la fréquence des ruptures de stock ajoutent une dimension technique forte par rapport au SEO éditorial classique.

Search intent mismatch (désalignement d’intention) Situation où le contenu d’une page ne correspond pas à l’intention de recherche réelle des utilisateurs qui arrivent dessus. Par exemple, une page transactionnelle positionnée sur une requête informationnelle, ou l’inverse. Le mismatch d’intention entraîne un taux de rebond élevé, un CTR dégradé et un faible temps de session — signaux que Google interprète comme une pertinence insuffisante. C’est l’une des causes les plus fréquentes de positionnements instables malgré un contenu bien optimisé techniquement.

SGE / AI Overviews (Search Generative Experience) Interface de recherche de Google intégrant l’IA générative pour produire des réponses synthétiques directement dans les SERP, avant les résultats organiques classiques. Lancée sous le nom SGE en 2023, déployée progressivement sous le nom “AI Overviews” à partir de 2024. Les AI Overviews citent leurs sources : apparaître dans ces citations est l’un des enjeux centraux de l’AIO. Les contenus bien structurés, répondant précisément à des questions, avec une autorité thématique établie, sont favorisés pour être sélectionnés comme sources.

Siloing Organisation du contenu d’un site en thèmes distincts et isolés (silos), chaque silo regroupant un ensemble de pages sur un même sujet. Renforce l’autorité thématique et la cohérence sémantique pour les moteurs de recherche.

Sitelinks Liens secondaires affichés sous le résultat principal d’une marque dans les SERP, pointant vers des sections clés du site (pages de contact, catégories, pages populaires). Générés automatiquement par Google lorsqu’il juge que ces liens faciliteront la navigation de l’utilisateur. Non contrôlables directement, mais favorisés par une architecture claire, un maillage interne cohérent et une page d’accueil bien structurée.

Snippet rewrite (réécriture du title par Google) Phénomène par lequel Google remplace le title tag défini par le webmaster par un texte alternatif qu’il génère lui-même, jugé plus pertinent pour la requête. Cela se produit lorsque le title est trop long, trop répétitif, trompeur ou insuffisamment descriptif. Google peut s’appuyer sur le H1, le contenu de la page ou le nom de domaine pour réécrire le title affiché dans les SERP. La meta description peut également être réécrite. Pour limiter les réécritures : title court, descriptif, aligné sur l’intention.

SSG (Static Site Generation)

SSG (Static Site Generation) Technique de génération de sites web où les pages HTML sont produites au moment du build (compilation), et non à chaque requête utilisateur. Les pages sont servies sous forme de fichiers statiques, ce qui les rend très rapides à charger et faciles à indexer. Idéal pour le SEO : pas de délai de rendu JavaScript, TTFB très bas, performance maximale. Frameworks courants : Next.js (en mode SSG), Gatsby, Astro, Hugo. L’ISR (Incremental Static Regeneration) est une variante qui permet de régénérer certaines pages statiques à intervalles définis sans rebuild complet.

Sur-optimisation (over-optimization) Excès d’optimisation SEO qui finit par nuire au positionnement : répétition excessive du mot-clé cible (keyword stuffing), ancres de liens trop uniformes, structure Hn surchargée, meta description identique sur toutes les pages. Google peut interpréter la sur-optimisation comme une tentative de manipulation et dégrader le classement des pages concernées. L’objectif est d’optimiser pour les utilisateurs d’abord, et pour les moteurs de recherche ensuite.

Sitemap XML Fichier XML listant les URL d’un site et leurs métadonnées (date de modification, fréquence de mise à jour, priorité). Facilite le crawl et l’indexation, en particulier pour les grands sites. À soumettre dans Google Search Console.

Snippet Extrait de texte d’une page web affiché dans les résultats de recherche sous le titre cliquable. Généré automatiquement par Google à partir du contenu de la page ou de la meta description.

SpamBrain Système de détection du spam de Google basé sur l’IA, utilisé pour identifier et pénaliser les liens artificiels, le contenu de faible qualité et les pratiques black hat à grande échelle.

Soft 404 Erreur technique où une page affiche un message du type “page introuvable” ou “aucun résultat” à l’utilisateur, mais renvoie un code HTTP 200 (succès) aux robots d’indexation. Google interprète alors la page comme existante et l’indexe inutilement, gaspillant le budget de crawl. Fréquent sur les sites e-commerce avec des filtres vides, des pages de résultats de recherche interne sans contenu ou des pages de rupture de stock. À corriger en renvoyant un vrai code 404 ou 410, ou en redirigeant vers la catégorie parente.

SSL / TLS Protocoles de chiffrement sécurisant les échanges entre un navigateur et un serveur web. La présence d’un certificat SSL est signalée par le préfixe HTTPS et le cadenas dans la barre d’adresse. Signal de classement positif pour Google depuis 2014.

T

Taux de rebond (bounce rate) Pourcentage de visiteurs quittant un site après n’avoir consulté qu’une seule page, sans interaction. Dans GA4, le taux de rebond a été remplacé par le taux d’engagement. Un taux de rebond élevé n’est pas nécessairement négatif selon l’intention de la page.

TF-IDF (Term Frequency – Inverse Document Frequency) Méthode statistique évaluant l’importance d’un terme dans un document par rapport à un corpus de référence. Utilisée par certains outils SEO pour identifier les mots-clés sous-représentés ou absents d’un contenu par rapport aux pages concurrentes.

Title tag Voir Balise title.

TTFB (Time to First Byte) Temps écoulé entre l’envoi d’une requête HTTP par le navigateur et la réception du premier octet de réponse du serveur. Le TTFB est un indicateur de la réactivité du serveur et de l’infrastructure d’hébergement. Un TTFB élevé (au-delà de 800 ms selon les recommandations Google) pénalise directement le LCP et l’expérience de chargement globale. Causes fréquentes : serveur lent, absence de cache, requêtes base de données non optimisées, hébergement mutualisé sous-dimensionné.

Topical authority Autorité thématique d’un site sur un sujet donné, construite en couvrant ce sujet de manière exhaustive et cohérente (pages piliers, clusters, FAQ, glossaires, etc.). Google favorise les sites qui traitent un domaine en profondeur plutôt que les sites généralistes superficiels.

Trafic organique Voir Organic traffic.

U

URL parameters (paramètres d’URL) Variables ajoutées à une URL après un point d’interrogation pour filtrer, trier ou suivre du contenu : ?couleur=rouge, ?page=2, ?utm_source=newsletter. En SEO, les paramètres d’URL sont une source majeure de contenu dupliqué et de pollution d’index : ils génèrent des milliers d’URL uniques pointant vers un contenu identique ou quasi-identique. À gérer via la Google Search Console (paramètres d’URL), les balises canoniques ou les règles robots.txt selon les cas.

URL (Uniform Resource Locator) Adresse unique identifiant une page web. Une URL SEO-friendly est courte, descriptive, en minuscules, avec des tirets comme séparateurs, sans paramètres inutiles et incluant le mot-clé principal.

URL canonique Voir Balise canonique.

UX (User Experience) Expérience utilisateur : qualité globale de l’interaction entre un visiteur et un site web. Une bonne UX (navigation intuitive, temps de chargement rapide, contenu clair) est un signal indirect de qualité pour Google.

V

Volume de recherche (search volume) Nombre moyen de fois qu’un mot-clé est recherché par mois dans un moteur de recherche. À analyser en contexte avec la concurrence (KD) et l’intention de recherche. Source principale : Google Keyword Planner, Ahrefs, SEMrush.

W

White hat SEO Pratiques SEO respectant les consignes des moteurs de recherche : création de contenu de qualité, link building naturel, optimisation technique rigoureuse. Génère des résultats durables sans risque de pénalité.

Web Vitals Voir Core Web Vitals.

X

X-Robots-Tag En-tête HTTP permettant d’appliquer les mêmes directives que la balise meta robots (noindex, nofollow, noarchive, etc.), mais au niveau serveur plutôt qu’au niveau HTML. Particulièrement utile pour contrôler l’indexation de fichiers non-HTML comme les PDF, les images ou les flux XML, qui ne peuvent pas contenir de balises meta. Exemple d’en-tête HTTP : X-Robots-Tag: noindex. Permet aussi d’appliquer des directives différentes selon le robot ciblé (Googlebot, Bingbot, etc.).

XML Format de données utilisé pour les sitemaps XML et les flux de données structurées. Les sitemaps XML permettent de lister les URL d’un site pour faciliter leur découverte par les robots d’indexation.

Y

YMYL (Your Money or Your Life) Catégorie de contenus définie par Google concernant des sujets pouvant impacter la santé, la sécurité, la stabilité financière ou le bien-être des utilisateurs. Ces pages sont soumises à des exigences E-E-A-T renforcées.

Z

Zero-click search Requête de recherche dont la réponse est affichée directement dans les SERP (featured snippet, knowledge panel, calculatrice, météo, etc.), sans que l’utilisateur clique sur un résultat. La proportion de zero-click searches augmente avec le développement de l’IA dans les moteurs de recherche, rendant l’AIO indispensable.

Zero-position Voir Extrait optimisé (featured snippet).

Termes à éviter / pièges lexicaux

Cette section recense les confusions fréquentes, les termes mal employés et les expressions à bannir dans un contexte professionnel SEO.

“Référencement payant” pour désigner le SEO Le référencement naturel (SEO) est gratuit en termes de clics. Le référencement payant désigne exclusivement le SEA (Google Ads, Bing Ads). Confondre les deux induit des attentes erronées chez les clients.

“Être en première page” comme objectif suffisant La première page de Google compte dix résultats organiques. Les trois premiers captent plus de 50 % des clics. Viser “la première page” sans préciser la position est un objectif trop vague et potentiellement trompeur.

“Keyword stuffing” confondu avec “optimisation des mots-clés” La répétition excessive d’un mot-clé dans une page (keyword stuffing) est une pratique sanctionnée par Google depuis l’algorithme Panda. L’optimisation consiste à intégrer naturellement les mots-clés et leur champ sémantique, pas à les accumuler mécaniquement.

“Backlinks” et “liens internes” confondus Les backlinks proviennent de sites tiers (off-page). Les liens internes relient des pages du même site (on-page). Ce sont deux leviers distincts avec des rôles et des méthodes différentes.

“Taux de rebond élevé = mauvais SEO” Un taux de rebond élevé peut indiquer un problème de pertinence, mais aussi que l’utilisateur a trouvé sa réponse immédiatement (page de définition, numéro de téléphone, horaires). Dans GA4, Google a d’ailleurs remplacé cette métrique par le taux d’engagement, plus représentatif.

“Le SEO est mort” Expression récurrente depuis l’apparition de chaque nouvelle technologie (réseaux sociaux, voice search, IA). Le SEO évolue constamment mais reste le canal d’acquisition organique le plus durable. L’AIO le complète sans le remplacer.

“Google pénalise les contenus IA” Google ne pénalise pas le contenu produit avec l’IA en tant que tel, mais le contenu de faible qualité, sans valeur ajoutée pour l’utilisateur. Un contenu IA bien supervisé, précis et utile peut se positionner. Ce qui est sanctionné, c’est la production de masse automatisée sans contrôle éditorial.

“Nofollow = lien inutile” Depuis 2019, Google traite le nofollow comme un hint (indice), pas comme une directive absolue. Il peut donc choisir de suivre le lien et d’en tenir compte. Par ailleurs, un lien nofollow peut générer du trafic direct, renforcer la notoriété de marque et contribuer à un profil de liens naturel. Il n’est pas à négliger systématiquement.

“Meta keywords” encore utiles La balise meta keywords est ignorée par Google depuis 2009 et par Bing depuis 2011. L’optimiser est une perte de temps. Certains outils et prestataires peu informés continuent pourtant de la mentionner comme critère de classement.

“Un sitemap XML améliore le classement” Un sitemap XML facilite la découverte et l’indexation des URL par les robots, mais n’améliore pas directement les positions. Ce n’est pas un signal de classement, c’est un outil de crawl.

“Autorité de domaine (DA)” comme métrique Google La Domain Authority est un indicateur propriétaire de Moz. Google ne l’utilise pas. Présenter la DA comme une métrique officielle de Google est une erreur fréquente dans les rapports SEO clients.

“Mettre à jour la date d’un article suffit à le faire remonter” Modifier uniquement la date de publication sans enrichir le contenu est une manipulation détectée par Google. La fraîcheur algorithmique est évaluée sur les modifications substantielles du contenu, pas sur les méta-données de date.

“Le contenu long est toujours mieux classé” La longueur n’est pas un critère de classement en soi. Google cherche le contenu le plus pertinent pour une intention de recherche donnée. Une réponse courte et précise surclassera un article de 3 000 mots dilué et répétitif si elle satisfait mieux l’intention.

“SEO” et “SEM” utilisés comme synonymes Le SEM (Search Engine Marketing) englobe le SEO et le SEA. Utiliser SEM pour désigner uniquement le référencement payant, comme c’est parfois fait en France, est une source de confusion avec la définition internationale du terme.

“Les réseaux sociaux influencent directement le SEO” Google a confirmé ne pas utiliser les signaux sociaux (likes, partages, followers) comme facteurs de classement directs. Les réseaux sociaux contribuent indirectement au SEO en amplifiant la diffusion de contenu, en générant des backlinks et en renforçant la notoriété de marque.

Glossaire SEO

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

Termes à éviter / pièges lexicaux

Un site à optimiser ?