6 conseils pour éviter le duplicate content sur un site e-commerce

15 min de lecture
Rédigé par Franck Mairot le 29 janvier 2016
Sommaire

Partager sur :

Le duplicate content (ou contenu dupliqué) est un cauchemar pour la plupart des gérants de sites ecommerce. On parle de duplicate content lorsque deux contenus identiques ou très similaires sont présents sur deux pages web différentes. Que ces pages appartiennent au même site ou à deux sites différents, cela ne change rien.

comment eviter duplicate content

Le duplicate content doit être évité (ou corrigé) pour deux raisons principales :

  • Il est pénalisé par Google et peut entraîner une dégradation de votre référencement, voire la désindexation complète de certaines de vos pages. Depuis que Google Panda sévit, il est impossible de passer au travers du filet ! (Impact SEO)
  • Il nuit à la qualité de l’expérience de vos utilisateurs. Il n’est pas agréable pour un internaute de constater des copier-coller sur votre site. Cela est pour lui l’indice de la mauvaise qualité de votre site. (Impact en termes d’image et de notoriété)

La lutte contre le duplicate content peut s’avérer fastidieuse, surtout si vous n’avez pas appliqué les bonnes pratiques dès le départ. Mais clairement, c’est un travail qu’il faut prendre le temps de faire. Voici quelques conseils pour identifier et lutter efficacement contre le duplicate content sur votre site ecommerce.

Les différents types du duplicate content

Il existe deux grands types de contenus dupliqués ou duplicate contents :

  • Le duplicate content interne (ou intrasite) : deux contenus éditoriaux identiques sont présents sur un seul et même site internet. Il y a duplicate content interne lorsque vous copiez-collez des contenus entre les différentes pages de votre site (volontairement ou involontairement) ou bien lorsque deux URL différentes de votre site renvoient à la même page de votre site. Le duplicate content interne est très fréquent sur les sites de ecommerce. Le contenu dupliqué interne est – ou devrait être – la bête noire de tous les ecommerçants.
  • Le duplicate content externe (ou intersite) : deux contenus identiques sont présents sur deux sites différents. Le duplicate content externe s’assimile la plupart du temps à du vol pur et simple de contenus (plagiat). Le duplicate content externe, pour les sites ecommerce, concerne surtout la partie description-produit. Exemple : lorsque vous reprenez la description du fournisseur et que des concurrents ont eu la même idée…

Deux questions se posent concernant le duplicate content :

Question 1 : Dans un cas de duplicate content externe, comment Google fait-il pour savoir qui a copié sur qui (qui est le voleur et qui est la victime) ? Bien sûr, le critère de l’ancienneté est déterminant : le contenu original (on parle de contenu canonique) a forcément été publié en premier. Mais attention, ce n’est pas le seul critère pris en compte par Google bizarrement. La popularité des pages (mesurée via les backlinks notamment) entre en ligne de compte.

Question 2 : à partir de quand peut-on parler de duplicate content ? La question est bien plus complexe qu’il n’y paraît. La réponse est loin d’être évidente. Du duplicate content, il y en a forcément. Par exemple, vous trouverez sur des millions de pages des expressions ou des tournures de phrase comme « Il est vrai que » ou bien « Dans la mesure du possible ». Il ne s’agit d’ailleurs même pas de duplicate content, évidemment. Se pose donc la question du seuil de tolérance. Cette question est très discutée au sein de la communauté des experts-SEO. Selon Olivier Andrieu par exemple, le seuil est de 70%. Autrement dit, Google ne pénaliserait les pages pour duplicate content qu’à partir du moment où 70% de leur contenu est identique à celui d’une autre page. Ce seuil est particulièrement élevé. Pour d’autres, il s’établirait plutôt autour de 40%, voire moins.

Pour finir, il est important de bien se rappeler que le duplicate content ne concerne pas uniquement le contenu texte de vos pages, c’est-à-dire le contenu « sémantique ». Le fait d’utiliser des balises Title ou Meta Description identiques ou similaires est également une forme de duplicate content. Nous reviendrons sur ce point.

1. Créer des descriptions produits originales

Dans le cadre d’un site ecommerce, qui dit duplicate content dit fiche-produit. C’est d’abord au niveau de vos fiches produits que le duplicate content doit être surveillé. Pour éviter le duplicate content, vous devez commencer par travailler sur vos descriptions. La description produit est un des éléments centraux de la fiche produit. Nous avons déjà donné quelques conseils pour construire des fiches produits de qualité.

Vos descriptions doivent être originales, au sens où on ne doit les retrouver nulle part ailleurs sur internet. Typiquement et comme nous le disions plus haut, vous devez à tout prix éviter de réutiliser les descriptions de vos fournisseurs. Au départ, ce copier-coller peut sembler pertinent. Après tout, les descriptions fournisseurs sont généralement bien optimisées pour le web car elles comportent les mots clés essentiels. Le problème, c’est que vous n’êtes sans doute pas le seul à vendre ce produit et que vos concurrents risquent d’avoir la même idée que vous. Résultat : il y a un risque fort de duplicate content.

De même, les descriptions de tous vos produits doivent être différentes. Il est possible que vous vendiez des produits très similaires et que vous soyez tenté par le duplicate partiel de la description. Reprendre des éléments de description d’une fiche à l’autre est un procédé très fréquent. Pourtant il faut évité cela autant que possible, car c’est prendre le risque du duplicate content interne. Conseil : si vous vendez plusieurs variantes d’un même produit (des produits identiques dont seule la couleur change par exemple), ne créez pas plusieurs pages. Regroupez ces variantes sur une seule et même page.

Un autre conseil à propos des descriptions : il peut être intéressant d’utiliser des market places qui ont pignon sur rue (ou plutôt sur internet…) pour étendre sa visibilité et développer son activité d’e-commerce. Par exemple, vous avez un petit site ecommerce qui vend des produits faits maison et souhaitez vendre vos produits sur Amazon ou LeBonCoin. Dans l’absolu, cette solution est très pertinente. Mais attention : la description doit être différente sur chaque page (celle de votre site, celle d’Amazon, de LeBonCoin, etc.). Sans compter que si vous copiez-collez votre description sur Amazon, il y a des chances que ce soit votre site ecommerce qui soit pénalisé pour duplicate content et non Amazon (alors même que vous êtes l’auteur du contenu et peut-être même le fabriquant du produit…). Comme on l’a dit, la popularité du site est un critère pris en compte dans l’attribution des pénalités Google pour duplicate content. La page « canonique » peut être pénalisée si elle est moins populaire que la page qui a repris son contenu.

Boulanger propose des descriptions complètes de ses produits…mais qui sont des copiés-collés des descriptions fournisseurs :

comment eviter duplicate content description originale

Ecrire une description unique pour chaque page produit est un travail de longue haleine, surtout si vous avez plusieurs centaines de pages produits. Le jeu en vaut-il la chandelle, une fois dit le coût de réécriture de toutes vos descriptions ? La réponse est oui, clairement. Les retours d’expérience sont unanimes : la réécriture des descriptions contribue à un meilleur référencement des fiches produits et, de ce fait, à une augmentation du trafic parfois spectaculaire (+ 100%, voire plus).

Faites appel à des rédacteurs web qualifiés et surveillez leur travail pour bien vous assurer qu’ils ne font pas de copier-coller. Pensez à organiser la rédaction de votre contenu pour gagner du temps. Ensuite, si vous avez des centaines de fiches produits, priorisez les fiches et traitez en premier les fiches correspondant à vos produits phares ou aux nouveautés. Si vous décidez de recourir à une market place et que vous devez écrire deux descriptions pour un même produit, soignez la description qui figure sur votre site à vous.

Exemple à ne pas suivre : Yoox.com (photo ci-dessous). La partie description, en bas à droite, est très faible, c’est le moins qu’on puisse dire. Certains experts estiment qu’une description, pour avoir un poids SEO, doit comporter plus de mots que l’ensemble des autres mots présents sur la page. Clairement, ce n’est pas le cas ici. En revanche, il faut noter que la présence d’une option zoom sur la photo est bienvenue. Les photos sont d’ailleurs en HD (ce qui est préférable lorsqu’on utilise une option zoom, bien sûr).

comment eviter duplicate content fiche produit

 

2. Créer des balises Title et des Meta descriptions uniques

Comme on l’a dit rapidement plus haut, la question du duplicate content ne se limite pas uniquement au copier-coller de contenus éditoriaux (des descriptions produits dans le cas d’un site ecommerce). Les autres éléments de vos pages doivent eux aussi être uniques et originaux. Parmi ces éléments, deux d’entre eux doivent retenir votre attention. Il s’agit d’une part des balises Title (<title>) et d’autre part des balises Meta Description (<meta name= “description”>). Le contenu de ces balises doit être à chaque fois unique.

La balise Title tout d’abord. Il s’agit du titre de votre page, qui ne doit pas être confondu avec le titre de votre fiche produit ou le titre de votre article de blog. Pour ces derniers, on utilise une balise H1. Le titre renseigné dans la balise Title apparaît à deux endroits : dans les pages de résultats de Google (et autres) et sur l’onglet du navigateur. Toutes les pages doivent avoir un Title unique. Tandis que la balise Title a une influence directe sur le référencement de votre page, la balise Meta Description a surtout pour but de permettre à l’internaute d’accéder à un résumé très court de votre page sans avoir à cliquer dessus. Malgré l’incidence moins forte de la Meta sur le référencement, l’utilisation de Meta Description identiques équivaut à du duplicate content passible de sanctions de la part de Google.

Le duplicate content sur les balises <title> et <meta name= “description”> doit être banni à la fois pour éviter les sanctions de Google, mais aussi, et tout autant, pour des raisons de pertinences vis-à-vis des internautes. Les internautes qui font une recherche dans Google et tombe sur votre site dans les SERP doivent avoir envie de cliquer sur le lien de votre page. Pour cela, ils doivent savoir à quoi s’attendre. Votre lisibilité dans les pages de résultats des moteurs de recherche sera très amoindrie si vous utilisez des Title et des Meta identiques.

comment eviter duplicate content meta title

3. Soigner l’excerpt dans la liste produits

Les listes de produits constituent également un haut lieu de duplicate content interne. Voici quelques conseils pour éviter les contenus dupliqués au niveau de vos listes produits.

Avec la plupart des CMS, un excerpt (un « extrait ») est utilisé dans les listes produits afin de donner quelques indications sur les produits. Si c’est le cas avec votre CMS, faites attention à une chose : l’excerpt par défaut correspondra aux premières lignes de la description de votre produit qui se trouve dans la fiche produit. Pour éviter que du duplicate content interne soit généré entre d’une part les listes produits et d’autre part les fiches produits, vous devez à tout prix rédiger un excerpt unique pour chaque produit et un excerpt qui ne reprenne pas un élément de votre fiche-produit.

Le site Boulanger ne respecte pas cette règle. Les excerpts proposés sont tirés des fiches produits. Il n’est pas certain pourtant que cela génère du duplicate content et des pénalités Google, étant donné la brièveté des excerpts. Mais mieux aurait valu utiliser des excerpts plus longs et uniques.

comment eviter duplicate content page produits

De manière générale, plus le contenu de vos pages est personnalisé, plus le risque de duplicate content est faible. Pour personnaliser vos listes produits, il peut être intéressant d’intégrer une description de la catégorie dans le listing produit, dans un sidebar par exemple :

comment eviter duplicate content ecommerce page produits

4. Créer des URLs canoniques et ne pas indexer toutes les pages de votre site ecommerce

Le duplicate content est, dans certains cas, difficile à éviter. A deux niveaux notamment :

  • Au niveau des fiches produits : vous vendez par exemple un produit disponible en six couleurs et vous avez créé une fiche pour chaque couleur. Ou, bien plus inévitable : le pull en laine rouge que vous vendez sur votre site ecommerce est accessible depuis la catégorie « pull » et la catégorie « soldes d’hiver ». Autrement dit, deux chemins mènent à la même fiche produit, ce qui aboutit en règle générale à la création de deux URL différentes.
  • Au niveau des listes produits : avec le jeu des filtres et des classements (par prix par exemple), il est très fréquent et quasiment inévitable que surgisse du contenu dupliqué entre vos listes produits.

Heureusement, il existe une solution (qui n’est pas la seule) pour résoudre ce problème : mettre en place des URL canoniques. L’idée va consister à demander à Google de n’indexer qu’une des pages (= qu’une des URL). Par exemple, la liste produits qui présente les produits par pertinence. Les URL des listes de produits qui présentent les produits classés par prix ou par couleur ne seront pas indexées (même si elles resteront bien sûr accessibles depuis le site !).

Pour indiquer l’URL canonique à Google, il suffit d’ajouter une balise dans l’entête HTML de vos pages secondaires. Une fois l’URL canonique définie, Google ne prendra en compte que la page canonique dans ses pages de résultats. Seule l’URL canonique sera indexée dans Google, ce qui évite évidemment le duplicate content.

La balise doit être placée dans le <head> des pages secondaires, de cette manière :

<head>

<link rel = « canonical » href= « URL de la page canonique » />

</head>

Pour permettre une prise en compte rapide et efficace de vos URL canoniques par Google, il est conseillé de créer en parallèle un sitemap dans lequel vous listerez manuellement toutes vos URL canoniques. Cela permet de faciliter le travail des Google bots.

Autre solution : utiliser les valeurs « noindex » dans le robots.txt ou la balise « nofollow ».

5. Faire des redirections 301 en cas de refonte du site

En cas de refonte ou de restructuration de votre site ecommerce, il est vivement conseillé de faire des redirections permanentes 301. Les redirections 301 permettront de rediriger les URL de votre ancien site vers les URL de votre nouveau site. Ces redirections sont souvent longues à mettre en place, car difficilement automatisables. Elles sont pourtant nécessaires pour éviter le duplicate content entre le contenu de vos anciennes et nouvelles URL. Les redirections 301 vous permettront en plus théoriquement de conserver les bonus SEO accumulés sur vos anciennes pages.

Soyez méthodique et commencez en premier par rediriger manuellement les pages les plus importantes de votre site e-commerce. A savoir : les pages qui ont des backlinks, les pages bien positionnées ou à fort trafic organique, les pages clés (page d’accueil, etc.). Pour en savoir plus sur le rôle et le fonctionnement des redirections 301, nous vous invitons à lire notre article qui explique comment conserver ses positions SEO suite à la refonte de son site.

comment eviter duplicate content site ecommerce redirections 301

6. Utiliser des outils de mesure du duplicate content

Avant de supprimer le duplicate content, il faut pouvoir le repérer et l’identifier. Vérité de Lapalisse. Pour identifier les contenus dupliqués, plusieurs outils sont à votre disposition. Voici une liste des principaux outils pour gérer le duplicate content :

  • PlagSpotter, pour repérer les pages en ligne qui copient votre contenu. Vous pouvez aussi utiliser Copyscape, outil de référence.
  • Webconfs, qui détermine le taux de similarité entre deux contenus déjà en ligne. Vous pouvez aussi utiliser pour cela l’outil Duplicatecontent.
  • Web SEO Analytics, qui calcule un taux de duplication entre le contenu de deux URL.
  • Positeo, qui permet entre autres de vérifier le taux de duplicate d’un contenu hors-ligne (qui n’a pas encore été publié sur internet). Plagiarisma permet la chose.
  • DupeCop, qui permet de comparer le duplicate entre plusieurs textes hors ligne.
  • Siteliner, qui permet de connaître le taux de duplicate interne sur votre site.
  • La barre de recherche de Google. Vous vérifiez manuellement si un site copie votre contenu en copiant-collant des bouts de textes issus de vos contenus dans la barre de recherche.

Pour savoir si vous êtes victime d’une pénalité de Google suite à du duplicate content, rendez-vous sur Google Search Console. Si vous avez été pénalisé, Google vous envoie un message sur votre compte. Si à l’inverse vous remarquez qu’un site copie votre contenu, vous pouvez avertir Google en suivant la procédure prévue à cet effet.

Pour aller plus loin
Si le sujet du plagiat et du duplicate content vous inétresse, je vous invite fortement à parcourir ces articles :

Recevez nos actualités chaque semaine

Entrez votre adresse email et recevez chaque semaine les actualitésde La Fabrique du Net, rédigées par nos experts.

En vous inscrivant vous acceptez notre
politique de protection de données personnelles.

Les 3 meilleurs logiciels de SEO

Vous cherchez à optimiser votre stratégie SEO ? Découvrez Semrush, votre solution tout-en-un pour améliorer votre visibilité en ligne. Lisez notre test approfondi pour savoir si c'est l'outil que vous attendiez. Avec Semrush, faites de votre SEO un véritable atout !
Découvrir
Noté 9 / 10 par notre expert
Découvrez Ubersuggest, le logiciel innovant de recherche de mots-clés signé Neil Patel. Conçu pour optimiser votre stratégie SEO, il répond à vos besoins en termes de visibilité en ligne. Lisez notre test détaillé et déterminez si c'est l'outil dont vous avez besoin. Voyez la puissance SEO par vous-même.
Découvrir
Noté 8 / 10 par notre expert
Découvrez SE Ranking, l'outil SEO optimal pour un budget minimal. Vous vous demandez si c'est le bon choix pour vous? Notre analyse détaillée fournit des réponses claires pour vous aider à prendre une décision éclairée. Plongez dans notre revue exhaustive et faites le premier pas vers l'amélioration de votre SEO.
Découvrir
Noté 9 / 10 par notre expert

Nos autre articles en liens avec SEO

Aucun commentaire

Historique

Nos experts mettent à jour nos articles lorsque de nouvelles informations sont disponibles.
  1. 22 janvier 2025
    Modifié par
    Franck Mairot
  2. 29 janvier 2016
    Créé par
    Franck Mairot
Voir plus