Que sont les URL canoniques ?
Une URL canonique, désignée par la balise HTML rel= »canonical », est ce que les moteurs de recherche utilisent pour trouver la version principale du contenu lorsqu’il existe plusieurs versions d’une page, soit sur le même site Web, soit sur des sites Web différents.
Par exemple, disons que vous publiez un article de blog sur votre propre site Web. Ensuite, vous souhaitez également publier cet article de blog sur vos comptes LinkedIn et Medium. Avec une balise canonique, vous pouvez faire savoir aux moteurs de recherche que, même si le même article de blog se trouve sur plusieurs sites Web, celui qui se trouve sur votre site Web est la version principale, celle qui doit apparaître dans les résultats de recherche.
N’oubliez pas que, techniquement, une URL canonique n’est pas vraiment une URL. Il s’agit plutôt d’une balise attachée à une URL pour en communiquer la signification aux moteurs de recherche. Si une URL réelle ressemble à http://example.com/blogpost, la version canonique ressemblerait à ceci :
Vous ne pouvez pas accéder à cette URL canonique comme à l’URL principale. Au lieu de cela, la version canonisée est placée dans le code HTML d’une page (ou désignée pour la page via un plugin).
Pourquoi utiliser les URL canoniques
La canonisation d’une URL indique au moteur de recherche quelle est la version principale d’une page, et c’est cette page qui doit apparaître dans les résultats de recherche, et non les autres doublons de la page. Lorsque les internautes recherchent du contenu vers lequel créer un lien, la page canonisée s’affiche et ils la choisissent, ce qui renforce l’équité des liens. De plus, les mesures d’un élément de contenu sont consolidées pour une seule page, ce qui rend vos rapports de mesure plus fiables.
Comment utiliser correctement les balises Canonical
Supposons que votre site Web (ou deux sites Web différents) comporte du contenu en double, mais que la version principale vers laquelle vous souhaitez orienter les moteurs de recherche est http://example.com/blogpost.
La balise canonique que vous ajoutez au code source de l’article de blog (la section head du code HTML de la page) ressemblera à ceci :
Si vous utilisez WordPress, vous n’avez pas à manipuler le code HTML comme certaines autres plateformes CMS. Au lieu de cela, vous pouvez utiliser un plugin et définir l’URL canonique pour chaque page. Nous y reviendrons dans un instant.
URL canoniques et contenu copié
Le contenu copié peut être un problème. Les URL canoniques permettent à toute personne qui va copier le contenu de savoir quelle balise utiliser dans l’en-tête de sa page. Le copieur, cependant, a la responsabilité d’indiquer aux moteurs de recherche qu’il a copié le contenu en plaçant la balise rel= »canonical » dans l’en-tête de son site et en renvoyant à votre contenu.
Dans d’autres cas, vous pouvez vouloir être le copieur. C’est le cas des communiqués de presse, par exemple. Vous pouvez publier le communiqué de presse sur le site de votre entreprise en premier lieu, mais attribuer la source originale du contenu à un réseau de syndication. Cela ferait de vous un syndiquant, et non l’éditeur original – du moins selon les moteurs de recherche.
Il convient toutefois de noter que l’inclusion de l’URL canonique dans le contenu copié n’est pas toujours nécessaire. Ou parfois, elle est ignorée. Les moteurs de recherche font un excellent travail pour trouver la véritable source originale du contenu. Donc, si vous utilisez une URL canonique pour pointer vers un contenu non original, comme dans l’exemple du communiqué de presse ci-dessus, sachez que le moteur de recherche peut l’ignorer. Utilisez cette tactique à votre propre discrétion. Il s’agit d’une sorte de zone grise pour le référencement, voire d’une tactique de type « black hat ».
Choix d’une structure d’URL
Même si vous ne pensez pas avoir de contenu dupliqué en ligne, la structure de vos URL peut créer accidentellement du contenu dupliqué. Par exemple, même si les URL suivantes affichent le même contenu et que vous les considérez comme la même page, les moteurs de recherche les considèrent comme distinctes :
-
- http://www.examplesite.com
– le « www » est inclus dans cette page
-
- http://examplesite.com
– cette page ne contient pas de « www »
-
- https://examplesite.com
– cette URL comporte « https » au lieu de « http »
- http://www.examplesite.com/
– il y a une barre oblique à la fin de la page
Il existe également des variations au sein de HTTPS et des barres obliques de fin et www. Elles sont toutes considérées comme des pages distinctes par les moteurs de recherche.
Cela signifie que vous devez prendre une décision définitive sur la structure de vos URL. Ensuite, utilisez cette structure partout – sur votre site et partout où vous faites référence à votre site. Si vous devez mettre à jour vos URL, choisissez la structure que vous utilisez le plus souvent pour rendre ce processus moins fastidieux. Toutefois, si votre site Web contient des informations sensibles, comme des données de carte de crédit, vous devez utiliser le protocole HTTPS.
Le contenu dupliqué peut également être créé accidentellement par vos catégories et balises WordPress. Par exemple, ces deux URLs peuvent mener à la même page, mais un moteur de recherche les verra comme deux pages distinctes avec un contenu dupliqué :
- http://examplesite.com/store/candy/chocolate-truffles
- http://examplesite.com/store/foods/chocolate-truffles
Vous souhaitez peut-être que les utilisateurs trouvent des truffes au chocolat, qu’ils cherchent dans la catégorie « Bonbons » ou « Aliments » de votre site Web. Mais les moteurs de recherche ont encore besoin de savoir laquelle classer dans les résultats de recherche. C’est pourquoi la plupart des plugins de référencement comme Yoast et Rank Math offrent une option pour désindexer vos pages d’archives. De cette façon, ces doublons n’apparaîtront pas pour Googlebot et ses pairs.
Quand ne pas utiliser les URL canoniques
Lorsqu’il s’agit de redirections 301, il se peut que vous ne souhaitiez pas utiliser une balise canonique. Voyez la différence de cette façon : Une redirection signifie qu’il n’y a qu’un seul endroit où le contenu apparaît, et vous obligez tous les visiteurs à se rendre sur cette seule page. En revanche, avec une URL canonique, plusieurs pages contenant le même contenu peuvent exister et être consultées, avec une source originale désignée pour les moteurs de recherche.
Par ailleurs, l’élément URL rel= »canonique » n’est pas la solution à tous les problèmes de contenu dupliqué. Le référencement est un sujet complexe, et parfois la solution la plus appropriée est d’utiliser un fichier robots pour ne pas indexer une page. Il est recommandé de ne pas indexer les pages qui ne sont pas des points d’entrée souhaitables sur votre site, ainsi que les pages qui ne sont pas très utiles à la plupart des visiteurs. Par exemple, avez-vous vraiment besoin que votre page de conditions générales apparaisse dans les résultats de recherche ? Probablement pas. Mais vos articles de blog, vos descriptions de produits et vos pages de vente ? Sans aucun doute.
Nous vous conseillons également de consulter l’article de Googlequi présente cinq erreurs courantes dans l’utilisation de la balise canonique. Vous ne pouvez pas faire beaucoup mieux que ce que Google dit directement.
Quel est l’impact des URL canoniques sur le référencement ?
Si nous vous conseillons vivement de résoudre les problèmes de contenu dupliqué à l’aide des URL canoniques, il est important de noter que Google ne pénalise pas techniquement les sites qui publient du contenu dupliqué. Cependant, cela peut nuire à votre classement dans les moteurs de recherche, ce qui revient en quelque sorte à être pénalisé. Lorsque les moteurs de recherche ont du mal à déterminer quelle est la version principale d’un élément de contenu, aucune version n’est bien classée.
Il est également possible que le moteur de recherche choisisse la mauvaise version et établisse un lien vers un site non fiable, ce qui signifie qu’il peut ne pas être cliqué et lu du tout si les utilisateurs n’aiment pas l’apparence de l’URL. En outre, lorsque votre site Web contient du contenu en double, votre budget d’exploration est réduit à néant. Les moteurs de recherche explorent et ré-exploitent les sites Web pour trouver du nouveau contenu. S’il y a du contenu en double sur votre site, l’exploration de l’ensemble du contenu prend plus de temps. Cela signifie que le moteur de recherche mettra plus de temps à indexer ces nouvelles pages et à les classer dans les résultats de recherche.
Vous pouvez approfondir ce sujet en lisant notre Guide ultime du contenu dupliqué et du référencement. Google propose également une page utile sur la consolidation des URL dupliquées.
Comment définir une URL canonique
Dans cette section, nous allons vous expliquer comment définir une URL canonique sur WordPress et sur un site Web non-WordPress.
Définir une URL canonique avec WordPress
Bien que vous puissiez définir des URLs canoniques sans plugin WordPress, nous pensons que la meilleure option, la plus sûre et la plus flexible, est d’utiliser un plugin. Pour cette présentation, nous utilisons Yoast SEO.
Après avoir installé et activé Yoast SEO, ouvrez une page ou un article WordPress. Faites défiler vers le bas de l’article jusqu’à ce que vous arriviez à la boîte Yoast SEO. Si l’onglet SEO est sélectionné (par défaut), faites défiler l’écran jusqu’en bas, puis cliquez sur Avancé. Au bas du menu qui s’affiche, vous verrez un emplacement intitulé Canonical URL.
Saisissez l’URL complète dans ce champ, puis enregistrez les modifications apportées à l’article ou à la page.
All in One SEO et Rank Math SEOsont deux autres plugins que vous pouvez envisager.
Définir une URL canonique en dehors de WordPress
Si vous n’utilisez pas WordPress, vous pouvez toujours définir des URL canoniques. Tout d’abord, vous devrez accéder au code HTML de la page Web. Chaque constructeur de site web aura sa propre procédure, mais elle devrait être assez facile à trouver. Par exemple, voici comment ajouter du code à un site Wix. Le processus est similaire pour la plupart des constructeurs non-WP et des plates-formes CMS ; il vous suffit de trouver l’endroit où ils vous permettent de modifier le code HTML de la page/du message.
Vous devez ensuite ajouter l’URL avec la balise rel= »canonical » incluse dans la section head. Dans l’exemple ci-dessous, remplacez http://example.com/blogpost par votre URL :
La section HTML head est la première partie du code. Elle s’ouvre avec et se ferme avec. Voici un exemple :
Pour ajouter du code à la section head, vous devez le placer quelque part entre les balises ouvrante et fermante. Il est préférable d’ajouter un lien au-dessus de la balise de fermeture pour que tout soit bien organisé.
Comment trouver une URL canonique
Si vous voulez savoir si une page Web a une URL canonique désignée, c’est très facile. Ouvrez la page, puis faites un clic droit, ce qui fait apparaître un menu. Choisissez Afficher la source de la page (ou une option proche de celle-ci, comme Afficher la source de la page). Cela ouvrira une page source avec du code HTML. En haut, vous devriez voir la section head. Vérifiez la présence de la balise rel= »canonical » dans cette section.
Comment supprimer une URL canonique
La suppression d’une URL canonique est également très simple. Il suffit de suivre les mêmes étapes que pour l’ajout de l’URL, mais en la supprimant cette fois. Si vous avez utilisé un plugin comme Yoast, vous pouvez aller dans la page et supprimer l’URL canonique du champ associé. Si vous l’avez ajoutée directement dans le code HTML d’une page, vous pouvez simplement la supprimer, puis mettre à jour la page. C’est aussi pourquoi il est bon de toujours ajouter vos URL canoniques au même endroit, par exemple directement au-dessus de la balise de fermeture head.
Réflexions finales sur les URL canoniques
Plus vous avez de pages sur votre site Web, plus la mise en place de votre stratégie d’URL canoniques demandera du travail. C’est pourquoi il est préférable de s’en occuper le plus tôt possible et de garder un œil sur les endroits où votre contenu est republié en ligne. Grâce à des plugins WordPress utiles comme Yoast SEO, il est plus facile de définir des URL canoniques que de devoir accéder au code HTML de chaque page et de le modifier manuellement.
Quelles sont vos meilleures pratiques pour utiliser les URL canoniques ? Faites-nous en part dans les commentaires !