Skip to content

Qu’est-ce que le contenu dupliqué et comment l’éviter ?

Partager sur facebook
Partager sur linkedin
Partager sur twitter
Partager sur whatsapp
Partager sur email

Le contenu dupliqué est un élément SEO très important car il est fortement pénalisé par Google. Or, se faire pénaliser par un engin de recherche engendre des conséquences plutôt désastreuses pour votre site Web et son référencement naturel et peut entrainer une perte de trafic considérable. Éviter le contenu dupliqué est donc très important pour votre stratégie SEO.  

Sachant que certains détenteurs de sites Web copient-collent des articles entiers et pensent que cela ne pose aucun souci, les experts de l’agence SEO My Little Big Web vont éclaircir le mystère de la duplication dans cet article, et vous donner quelques conseils qui vous aideront à régler ce problème.

  1. Qu’est-ce que le contenu dupliqué ?
  2. Les différentes causes d’un contenu dupliqué
    1. Le contenu dupliqué présent sur votre site Web
    2. Le contenu dupliqué lié aux erreurs techniques de votre site Web
    3. Le contenu dupliqué volontaire
  3. L’impact du contenu dupliqué sur votre SEO
    1. Google pénalise le contenu dupliqué
  4. Comment repérer le contenu dupliqué ?
  5. Comment éviter le contenu dupliqué ?
    1. Utilisez une balise canonique
    2. L’outil paramètres d’URL de google
    3. La redirection 301
    4. Le contenu dupliqué sur les réseaux sociaux
    5. Le contenu dupliqué et l’indexation
    6. Préférez le contenu original avant tout
  6. Le contenu dupliqué, votre pire ennemi ?

Qu’est-ce que le contenu dupliqué ?

Par définition, le contenu dupliqué, ou duplicate content en anglais, signifie d’avoir sur une ou plusieurs URLs, un contenu identique ou très similaire à celui d’une autre URL. C’est-à-dire que le même texte se trouve sur deux pages Web ou plus, que cela soit sur le même site ou sur deux sites différents. Google qualifie le  contenu en double comme « des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ».

 

exemple contenu dupliqué

 

Les différentes causes d’un contenu dupliqué

 

Le contenu dupliqué présent sur votre site Web

Contre toute attente et à la surprise de beaucoup de propriétaires de site, votre contenu peut être dupliqué entre plusieurs pages de votre propre site Web.  Imaginez que vous ayez deux pages, présentant chacune un tee-shirt. L’une présentant un tee-shirt bleu et l’autre rouge.  Si vous utilisez le même texte descriptif pour ces deux pages, ce contenu sera considéré comme dupliqué.

Dans la mesure où certains gestionnaires de site n’ont pas le choix d’avoir du contenu similaire, il existe des solutions pour aider Google à comprendre votre contenu. Nous allons les aborder dans la suite de l’article 😉. Voilà un exemple de contenu dupliqué avec ces deux pages Web pour des chaussures de course :

 

contenu dupliqué e-commerce

e-commerce contenu dupliqué

Un contenu dupliqué sur plusieurs pages d’un même site peut être le résultat d’une erreur humaine ; en effet un même contenu, comme une image, un texte ou un lien peut se retrouver sur deux URLS différentes du même site Web. Cela arrive fréquemment dans le cas d’utilisation de CMS. Dans le cas de WordPress par exemple, les mêmes articles peuvent être disponibles à des URLs différentes du fait des tags ou catégories appliquées dépendamment des paramétrages choisis. Il faut donc prêter une grande attention au paramétrage des permaliens.

 

Le contenu dupliqué lié aux erreurs techniques de votre site Web

La duplication de contenu est également souvent le cas d’une erreur technique. Il est en effet fréquent d’avoir des milliers de pages dupliquées notamment sur les sites e-commerce.

L’erreur s’explique notamment du fait de la navigation à facettes c’est-à-dire les multiples filtres qui permettent d’accéder au même produit avec des URLs différentes. Le problème dans ce genre de cas est que les robots passent énormément de temps à crawler les milliers de pages générées par la navigation dynamique et cela affecte négativement votre référencement puisque les robots ont un temps de crawl limité. Ces derniers vont donc passer énormément de temps à parcourir des URLs identiques (et donc sans valeur ajoutée) au lieu de parcourir du nouveau contenu ou du contenu qualitatif.

 

contenu dupliqué sélecteur filtres

 

Le contenu dupliqué volontaire

Le cas le plus fréquent est de retrouver du contenu dupliqué sur des sites différents. Cela varie, allant de la description d’un article très similaire sur deux sites de e-commerce, à la reprise d’extraits d’un texte (ou du texte complet) d’un autre site. Plusieurs raisons peuvent expliquer le contenu dupliqué sur des sites différents.

Contenu dupliqué car le fournisseur partage sont contenu à tous ses clients

Il arrive régulièrement que les propriétaires de sites Web utilisent du contenu fourni par le fournisseur. Après tout, pourquoi pas? C’est facile, c’est officiel et c’est rapide. Malheureusement, en utilisant du contenu « standard » qui peut être utilisé par plusieurs revendeurs, votre contenu n’a plus aucune valeur ajoutée auprès de Google.

Si vous êtes un revendeur de pneus par exemple et que vous avez exactement la même description sur votre site que sur le site de votre fournisseur Pirelli, qui pensez-vous que Google va favoriser? Il faut donc impérativement écrire un contenu original sur votre site Web. Nous savons qu’il est long et fastidieux de personnaliser le contenu quand on a des centaines de produits, mais cela peut réellement sauver votre positionnement sur les moteurs de recherche.

contenu dupliqué seo

contenu dupliqué fournisseur

 

Contenu délibérément copié d’un site Web à un autre

Dans certains cas, le contenu est délibérément dupliqué entre les domaines afin d’essayer de manipuler le classement du site sur les moteurs de recherche afin d’augmenter le trafic. Naturellement, à long terme, le SEO se verra fortement pénalisé.

Un autre cas que nous avons vu à plusieurs reprises est le cas « Amazon ». Certains E-commerçants ayant déjà un site Web avec du contenu unique (c’est-à-dire non dupliqué), décident d’ouvrir une boutique Amazon. Au lieu de réecrire tout leur contenu, ils lient leur site Web à Amazon et offre tout leur contenu au géant du E-commerce.

Contenu dupliqué pour cause d’erreur de paramétrage

Il existe de nombreuses autres raisons d’avoir du contenu dupliqué : un site en http et https, un site avec et sans www, un site dupliqué car le site de développement est en ligne en même temps que le site officiel etc.

L’impact du contenu dupliqué sur votre SEO

Google pénalise le contenu dupliqué

Le SEO est négativement impacté par le contenu dupliqué. Dans un souci de présenter des résultats de recherche de qualité, Google ou tout autre moteur de recherche sanctionne lourdement le contenu dupliqué. Cela signifie qu’un site Web ayant trop de contenu dupliqué risque de se retrouver très loin dans les résultats de recherche, voire même complètement disparaître des moteurs.

 

Quelle est la mission de Google ?

Google est un moteur de recherche, il doit donc s’assurer que chaque résultat qu’il affiche est unique afin de ne pas présenter plusieurs fois le même contenu aux internautes. Gardez en tête que ce qui lui importe avant tout, c’est l’expérience utilisateur sur son moteur de recherche.

Rappelez-vous que le but de Google est de présenter les meilleurs résultats possibles aux internautes pour que ces derniers aient la meilleure réponse à leur recherche et continue d’utiliser son moteur de recherche.

Ainsi, mettez-vous à la place d’un internaute qui visite une page en pensant découvrir un nouveau contenu et qui réalise qu’il l’a déjà lu ailleurs. L’internaute pourrait se dire que les résultats ne répondent pas à sa question et pourrait décider de faire ses recherches dans un autre moteur.

OBTENEZ UN COACHING GRATUIT DE 30 MINUTES EN REMPLISSANT LE FORMULAIRE !
  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

Comment Google s’y prend pour identifier et gérer le contenu dupliqué?

Si vous copiez mot pour mot ou similairement du contenu Web provenant d’une autre page pour simplement produire du contenu, Google va savoir qu’il a été publié après l’original. N’oubliez pas que Google possède un index de plusieurs milliards de pages Web avec tout un tas d’informations s’y rattachant y compris la date de publication.

Lorsqu’il se retrouve avec des contenus dupliqués, il réagit souvent en assignant une place plus basse dans les résultats de recherche au contenu qui est le plus récent. Il regarde également de quelles pages est issu le contenu et positionne celle qui possède la plus grande autorité de domaine. Ainsi, si demain vous décidez de mettre les descriptions de vos produits sur Amazon, il y a de bonnes chances qu’Amazon se positionne avant votre site même si vous avez publié le contenu de votre site en premier.

C’est certes, un gain de temps dans la création de contenu, mais cela va à l’encontre d’une stratégie de contenu pertinente, puisque ça ne participe en rien à optimiser votre SEO. Copier le contenu d’autres pages est donc une perte de temps, car vous ne créez aucune valeur ajoutée et n’améliorez pas votre référencement naturel.

 

Comment repérer le contenu dupliqué ?

En vérifiant activement si votre site Web contient du contenu dupliqué et en réglant ce problème, vous améliorez le classement des pages de votre site Web et vous vous assurez que vos visiteurs soient dirigés vers des contenus nouveaux qui les inciteront à revisiter votre site Web pour en savoir plus.

Vous pouvez commencer par simplement entrer un extrait de votre contenu dans un logiciel antiplagiat comme Copyscape par exemple. Il vous montrera rapidement si votre contenu a été copié quelque part sur le Web.

 

vérifier contenu dupliqué copyscape

Une autre manière relativement simple de vérifier si vous avez des contenus dupliqués, c’est de voir combien de vos pages sont indexées sur Google. Vous pouvez le faire en recherchant sur Google de cette manière :          site:exemple.com

trouver contenu dupliqué sur Google

 

Vous obtiendrez alors le nombre de pages qui sont indexées dans Google.

trouver contenu dupliqué avec nombre de résultats

Si vous jugez ce nombre anormalement élevé, cela signifie sûrement que des pages ont été ajoutées à l’index et qu’elles sont possiblement des contenus dupliqués d’autres pages de votre site.

Vous pouvez également utiliser l’outil d’inspection URL de Google sur la Search Console qui vous donnera des informations précises sur la version de votre page indexée par le moteur de recherche ainsi que sur le nombre de pages indexées.

 

utiliser la google search console pour trouver contenu dupliqué

 

Comment éviter le contenu dupliqué ?

Maintenant que vous savez si votre site Web propose du contenu dupliqué, il est temps de passer au plan d’action et de l’éliminer. Voilà les quelques astuces que vous pouvez suivre :

 

Utilisez une balise canonique

Pour vous assurer que votre site ne soit accessible que par une URL, utilisez une balise canonique. Vous indiquez aux moteurs de recherche que cette URL spécifique est la copie originale. Si vous repostez un article qui est déjà publié ailleurs, vous pouvez utiliser cette balise pour indiquer aux moteurs de recherche où la version originale se trouve.

 

balise canonique pour éviter contenu dupliqué

 

De plus, cela permet aux robots de Google de mieux explorer votre site Web. Ils passeront plus de temps à analyser vos nouvelles pages Web ou les mises à jour de vos pages plutôt que d’analyser les versions originales de celles-ci.

 

L’outil paramètres d’URL de google

Vous pouvez encore une fois vous servir de l’outil d’inspection d’URLs de Google. Cet outil vous permettra de lui demander de ne pas parcourir certaines de vos pages grâce à des paramètres spécifiques. Au besoin, il vous permet de faire savoir à Google que votre contenu dupliqué est intentionnel et qu’il ne doit pas être pris en compte à des fins de référencement.

 

outil paramètre url google search console contenu dupliqué

 

La redirection 301

Enfin, la redirection 301 est idéale si vous avez plusieurs URLs qui présentent le même contenu et que vous voulez faire un peu de ménage. Vous choisissez alors l’URL qui vous semble la plus pertinente et vous redirigez toutes les autres vers celle-ci à l’aide d’une redirection 301.  Cela vous permettra de transférer l’autorité des pages redirigées vers la page « maitresse ».

 

redirection 301 contenu dupliqué

 

Le contenu dupliqué sur les réseaux sociaux

Nombreux sont ceux qui dupliquent leur contenu pour le reposter sur d’autres médias, car cela fait partie de leur stratégie de marketing digital. Il s’agit de copier leurs articles de blogue pour les poster sur les réseaux sociaux dans le but promouvoir leur contenu et leur page Web. Si votre contenu est intéressant et attractif, cela créera de l’engagement, mais cela n’engendrera pas de conversion. Les lecteurs n’auront pas besoin de se rendre sur votre site Web puisqu’ils auront déjà les informations qui les intéressent. Or, augmenter votre taux de conversion, c’est sûrement votre objectif final.

Voici ce que vous pouvez faire pour partager votre contenu sur différentes plateformes. Ne publiez qu’une partie de votre contenu en guise d’aguichage et mettez un lien vers l’article original pour inciter à continuer la lecture sur votre blogue. Le but est de générer du trafic provenant des réseaux sociaux.

Soyez cependant rassuré sur le fait que publier un article sur Facebook avec du contenu similaire à votre site Web ne constitue pas du contenu dupliqué. Cela pourrait être amené à évoluer. Dans ce cas, publiez votre contenu sous forme d’images sur les réseaux sociaux et le tour est joué 😊. Google ne comprend pas bien les images, pour une fois, on profite de ses faiblesses.

 

éviter contenu dupliqué sur réseaux sociaux

 

 Le contenu dupliqué et l’indexation

Dans le cas où vous n’avez pas le choix d’afficher du contenu dupliqué et que vous ne pouvez pas non plus utiliser de balises canoniques, vous pourriez utiliser une balise « no index » qui permettra de bloquer l’indexation du contenu dupliqué sur Google.

               

 

Pour cela, veillez à bloquer le robot d’indexation de Google, en utilisant le meta tag « noindex » afin d’éviter de fragiliser votre site Web. Ainsi, vos pages de qualité continueront de se positionner correctement, à raison d’avoir une stratégie SEO pertinente bien sûr, sans que votre site soit affaibli par ce contenu dupliqué.

 

balise noindex contenu dupliqué

 

Préférez le contenu original avant tout

Créer du contenu original vous permettra de favoriser votre expérience utilisateur et de vous assurer que les moteurs de recherche n’aient pas à choisir entre plusieurs de vos pages ayant le même contenu.

Sachez que vos compétences rédactionnelles sont votre meilleur allié pour éliminer le contenu dupliqué. N’oubliez pas que Google favorise la qualité à la quantité. Il est toujours à l’affût du meilleur contenu possible, qui correspond le mieux à l’intention de l’utilisateur. Votre but est de laisser une bonne impression durable!

 

Le contenu dupliqué, votre pire ennemi ?

En conséquence, le contenu en double n’entraîne pas de conséquences trop négatives si la duplication n’est pas volontaire, car elle est modifiable. Cependant, Google se charge de repérer les sites utilisant des techniques trompeuses afin de les évincer définitivement des résultats de recherche, une sanction lourde pour un site de e-commerce !

Vous pouvez cependant demander à Google de réexaminer votre site web si celui-ci a été banni pour duplication. Rendez-vous dans Google Webmaster Tools pour ça. Vous avez aussi la possibilité de déposer une réclamation pour atteinte à vos droits d’auteur sur ce site.

Suivez donc de façon assidue les conseils de My Little Big Web pour ne pas perdre votre place dans les résultats de recherche, et surtout, écrivez du contenu original. Maintenant que vous savez comment éviter le contenu dupliqué, apprenez comment tirer parti du référencement local !

N’hésitez pas à nous contacter au 514 572 7758 ou via notre formulaire de contact si vous souhaitez parler à un conseiller qui répondra à toutes vos questions.

Eugénie
Eugénie

Cofondatrice et Spécialiste SEO-SEM

Eugénie a commencé sa carrière en marketing Web chez Microsoft auprès de partenaires tels que Hewlett-Packard et Dell. En 2013, elle co-fonde My Little Big Web avec Maxence afin d'aider les PME à optimiser leur marketing Web. Ses compétences en SEO, publicité en ligne et expérience utilisateur permettent aux clients de My Little Big Web de se positionner rapidement et durablement en haut des résultats de recherche. Le partage de connaissances fait partie de ses priorités. Elle donne donc de nombreuses formations internes et externes ainsi que des conférences sur de multiples thèmes relatifs au marketing numérique.

Nos dernières publications

Suivez-nous sur Facebook

Demandez une évaluation gratuite

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.
Évaluation gratuite

Chez My Little Big Web, aucun vendeur, c’est l’un des fondateurs qui va vous contacter !

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.