SEO

Qu’est-ce que le contenu dupliqué et comment l’éviter ?

24 mai 2024 Eugénie Delhaye
|éviter contenu dupliqué|exemple contenu dupliqué|e-commerce contenu dupliqué|contenu dupliqué e-commerce|trouver contenu dupliqué sur Google|contenu dupliqué seo|contenu dupliqué fournisseur|éviter contenu dupliqué sur réseaux sociaux|trouver contenu dupliqué avec nombre de résultats|utiliser la google search console pour trouver contenu dupliqué|outil paramètre url google search console contenu dupliqué|redirection 301 contenu dupliqué|contenu dupliqué sélecteur filtres|vérifier contenu dupliqué copyscape|balise canonique pour éviter contenu dupliqué|balise noindex contenu dupliqué

Le contenu dupliqué est un élément SEO très important car il est fortement pénalisé par Google. Or, se faire pénaliser par un engin de recherche engendre des conséquences plutôt désastreuses pour votre site Web et son référencement naturel et peut entrainer une perte de trafic considérable. Éviter le contenu dupliqué est donc très important pour votre stratégie SEO.

Sachant que certains propriétaires de sites Web copient-collent des articles entiers et pensent que cela ne pose aucun souci, les experts de l’agence SEO My Little Big Web vont éclaircir le mystère de la duplication dans cet article, et vous donner quelques conseils qui vous aideront à régler ce problème.

Sommaire

1. Qu’est-ce que le contenu dupliqué ?

Par définition, le contenu dupliqué, ou duplicate content en anglais, signifie avoir sur une ou plusieurs URLs, un contenu identique ou très similaire à celui d’une autre URL.

C’est-à-dire que le même texte se trouve sur deux pages Web ou plus, que cela soit sur le même site ou sur deux sites différents. Google qualifie le contenu en double comme « des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ». Des statistiques SEO montrent que le contenu dupliqué peut être un réel frein au positionnement de vos pages.

Sachez qu’il existe deux types de contenu dupliqué : le contenu dupliqué interne et le contenu dupliqué externe.

exemple contenu dupliqué

1.1. Le contenu dupliqué interne - définition

Le contenu dupliqué interne fait référence à la présence de plusieurs pages identiques ou très similaires au sein d’un même site Web. C’est un cas très fréquent pour des sites e-commerce qui ont des produits extrêmement similaires. Imaginez un site e-commerce qui vend des tasses, il peut être compliqué de créer du contenu diffèrent pour chacune des tasses que le site Web vend.

1.2. Le contenu dupliqué externe

Le contenu dupliqué externe concerne la présence d’un contenu identique ou très similaire sur des sites Web différents.

Cela peut se produire lorsque des informations sont copiées et collées d’une source originale vers d’autres sites sans aucune modification.

Un exemple courant de contenu dupliqué externe est lorsqu’un article est reproduit intégralement sur plusieurs sites Web, sans indiquer la source ou sans apporter de valeur ajoutée.

Cela peut nuire au référencement et à la visibilité d’un site Web, car les moteurs de recherche pénalisent les sites qui recopient le contenu des uns et des autres, que ce soit volontaire ou non.

2. Les différentes causes d’un contenu dupliqué

2.1. Le contenu dupliqué présent sur votre site Web

Contre toute attente et à la surprise de beaucoup de propriétaires de site, votre contenu peut être dupliqué entre plusieurs pages de votre propre site Web. Imaginez que vous ayez deux pages, présentant chacune un pantalon. L’une présentant un pantalon bleu et l’autre rouge. Si vous utilisez le même texte descriptif pour ces deux pages, ce contenu sera considéré comme dupliqué.

Dans la mesure où certains gestionnaires de site n’ont pas le choix d’avoir du contenu similaire, il existe des solutions pour aider Google à comprendre votre contenu. Nous allons les aborder dans la suite de l’article. Voilà un exemple de contenu dupliqué avec ces deux pages Web pour des chaussures de course :

contenu dupliqué e-commerce

e-commerce contenu dupliqué

La duplication de contenu est également souvent le cas d’une erreur technique. Il est en effet fréquent d’avoir des milliers de pages dupliquées notamment sur les sites e-commerce.

L’erreur s’explique notamment du fait de la navigation à facettes c’est-à-dire les multiples filtres qui permettent d’accéder au même produit avec des URLs différentes. Le problème dans ce genre de cas est que les robots passent énormément de temps à crawler les milliers de pages générées par la navigation dynamique et cela affecte négativement votre référencement puisque les robots ont un temps de crawl limité. Ces derniers vont donc passer énormément de temps à parcourir des URLs identiques (et donc sans valeur ajoutée) au lieu de parcourir du nouveau contenu ou du contenu qualitatif.

contenu dupliqué sélecteur filtres

2.3. Contenu dupliqué car le fournisseur partage sont contenu à tous ses clients

Il arrive régulièrement que les propriétaires de sites Web utilisent du contenu fourni par le fournisseur. Après tout, pourquoi pas ? C’est facile, c’est officiel et c’est rapide. Malheureusement, en utilisant du contenu « standard » qui peut être utilisé par plusieurs revendeurs, votre contenu n’a plus aucune valeur ajoutée auprès de Google.

Si vous êtes un revendeur de pneus par exemple et que vous avez exactement la même description sur votre site que sur le site de votre fournisseur Pirelli, qui pensez-vous que Google va favoriser ? Il faut donc impérativement écrire un contenu original sur votre site Web. Nous savons qu’il est long et fastidieux de personnaliser le contenu quand on a des centaines de produits, mais cela peut réellement sauver votre positionnement sur les moteurs de recherche.

contenu dupliqué seo
contenu dupliqué fournisseur

2.4. Contenu délibérément copié sur un autre site

Dans certains cas, le contenu est délibérément dupliqué entre les domaines afin d’essayer de manipuler le classement du site sur les moteurs de recherche et augmenter le trafic. Naturellement, à long terme, le SEO se verra fortement pénalisé.

Un autre cas que nous avons vu à plusieurs reprises est le cas « Amazon ». Certains E-commerçants ayant déjà un site Web avec du contenu unique (c’est-à-dire non dupliqué), décident d’ouvrir une boutique Amazon. Au lieu de réécrire tout leur contenu, ils lient leur site Web à Amazon et offrent tout leur contenu au géant du E-commerce.

2.5. Contenu dupliqué à cause d'une erreur de paramétrage

Il existe de nombreuses autres raisons d’avoir du contenu dupliqué : un site en HTTP et HTTPS, un site avec et sans www, un site dupliqué car le site de développement est en ligne en même temps que le site officiel, etc.

agence seo consultation

3. L’impact du contenu dupliqué sur votre SEO

3.1. Google pénalise le contenu dupliqué

Le SEO est négativement impacté par le contenu dupliqué. Dans un souci de présenter des résultats de recherche de qualité, Google ou tout autre moteur de recherche sanctionne lourdement le contenu dupliqué. Cela signifie qu’un site Web ayant trop de contenu dupliqué risque de se retrouver très loin dans les résultats de recherche, voire même complètement disparaître des moteurs.

3.2. Quelle est la mission de Google ?

Dans certains cas, le contenu est délibérément dupliqué entre les domaines afin d’essayer de manipuler le classement du site sur les moteurs de recherche afin d’augmenter le trafic. Naturellement, à long terme, le SEO se verra fortement pénalisé.

Un autre cas que nous avons vu à plusieurs reprises est le cas « Amazon ». Certains E-commerçants ayant déjà un site Web avec du contenu unique (c’est-à-dire non dupliqué), décident d’ouvrir une boutique Amazon. Au lieu de réécrire tout leur contenu, ils lient leur site Web à Amazon et offrent tout leur contenu au géant du E-commerce.

3.3. Comment Google s’y prend pour identifier et gérer le contenu dupliqué?

Si vous copiez mot pour mot ou similairement du contenu Web provenant d’une autre page pour simplement produire du contenu, Google va savoir qu’il a été publié après l’original. N’oubliez pas que Google possède un index de plusieurs milliards de pages Web avec tout un tas d’informations s’y rattachant y compris la date de publication.

Lorsqu’il se retrouve avec des contenus dupliqués, il réagit souvent en assignant une place plus basse dans les résultats de recherche au contenu qui est le plus récent. Il regarde également de quelles pages est issu le contenu et positionne celle qui possède la plus grande autorité de domaine. Ainsi, si demain vous décidez de mettre les descriptions de vos produits sur Amazon, il y a de bonnes chances qu’Amazon se positionne avant votre site même si vous avez publié le contenu de votre site en premier.

C’est certes, un gain de temps dans la création de contenu, mais cela va à l’encontre d’une stratégie de contenu pertinente, puisque ça ne participe en rien à optimiser votre SEO. Copier le contenu d’autres pages est donc une perte de temps, car vous ne créez aucune valeur ajoutée et n’améliorez pas votre référencement naturel.

4. Comment détecter le contenu dupliqué sur mon site?

En vérifiant activement si votre site Web contient du contenu dupliqué et en réglant ce problème, vous améliorez le classement des pages de votre site Web et vous vous assurez que vos visiteurs soient dirigés vers des contenus nouveaux qui les inciteront à revisiter votre site Web pour en savoir plus.

4.1. Copyscape

Vous pouvez commencer par simplement entrer un extrait de votre contenu dans un logiciel antiplagiat comme Copyscape par exemple. Il vous montrera rapidement si votre contenu a été copié quelque part sur le Web et vous permettra d’éviter le duplicate content.

vérifier contenu dupliqué copyscape

4.2. Duplichecker

L’outil Duplichecker permet aux internautes de comparer deux documents ou de détecter le plagiat potentiel dans un document donné.

Cet outil est gratuit et facile à utiliser. Il permet de gagner du temps précieux dans la recherche de similitudes entre les textes.

Il vous suffit de copier et coller votre texte dans la zone de texte prévue à cet effet, de cliquer sur le bouton de vérification de la similarité et d’attendre les résultats.

Duplichecker analyse ensuite les mots et les phrases dans votre texte et vous renvoie un pourcentage de similitude avec d’autres sources en ligne.

Vous pourrez ainsi vous assurer que votre contenu est original et unique.

4.3. Siteliner

Siteliner est un autre outil de test de contenu dupliqué. Il analyse le contenu d’un site Web pour identifier les problèmes de duplication de contenu.

Il passe en revue chaque page du site et communique également des informations sur la structure du site, le nombre de liens internes et externes, et les pages comportant des erreurs HTTP.

4.4. Kill Duplicate

Kill Duplicate est un outil simple et efficace. Il a été conçu pour trouver et supprimer les doublons dans vos fichiers.

Que vous ayez des fichiers texte, des images, des vidéos ou même des fichiers audios, cet outil peut les analyser rapidement et en toute simplicité. Il utilise un algorithme avancé qui identifie les doublons en se basant sur leur contenu et leurs caractéristiques.

Une fois les doublons détectés, vous pouvez choisir de les supprimer définitivement ou de les déplacer vers un autre dossier. Cela vous permet de libérer de l’espace sur votre disque dur et d’organiser vos fichiers de manière plus efficace. En utilisant l’outil Kill Duplicate, vous pouvez facilement garder votre collection de fichiers propre et sans doublons.

4.5. Vérifiez le nombre de pages indexées

Une autre manière relativement simple de vérifier si vous avez des contenus dupliqués, c’est de voir combien de vos pages sont indexées sur Google. Vous pouvez le faire en recherchant sur Google de cette manière :          site:exemple.com

trouver contenu dupliqué sur Google

Vous obtiendrez alors le nombre de pages qui sont indexées dans Google en cliquant sur l’option Outils :

Si vous jugez ce nombre anormalement élevé, cela signifie sûrement que des pages ont été ajoutées à l’index et qu’elles sont possiblement des contenus dupliqués d’autres pages de votre site.

Vous pouvez également utiliser l’outil d’inspection URL de Google sur la Search Console qui vous communiquera des informations précises sur la version de votre page indexée par le moteur de recherche ainsi que sur le nombre de pages indexées.

utiliser la google search console pour trouver contenu dupliqué

5. Comment éviter le contenu dupliqué ?

5.1. Écrivez du contenu unique

Ça tombe sous le sens, mais la meilleure façon d’éviter le contenu dupliqué est d’écrire du contenu unique. Vous devez donc vous assurer de produire des textes originaux et différents de ceux déjà existants sur internet.

Pour atteindre cet objectif, effectuez des recherches approfondies avant de rédiger un contenu. Remettez en cause le contenu qui vous est fourni par vos fournisseurs, assurez-vous de promouvoir votre propre point de vue sur le sujet. Si vous avez besoin d’aide, n’hésitez pas à vous faire accompagner par une agence de rédaction Web ou consulter un guide de rédaction Web.

Si vous revendez des produits, ajouter votre touche personnelle aux descriptions de produits. Indiquez ce qui vous différencie. À ce sujet, n’hésitez pas à vous renseigner plus en détail sur les techniques pour rédiger une fiche produit pour le SEO.

En suivant ces étapes, vous pouvez garantir la création d’un contenu précieux et original pour vos lecteurs.

5.2. Utilisez les balises canoniques

Parfois, nous n’avons pas le choix d’avoir du contenu dupliqué sur notre site Web. Imaginez que vous présentez un portfolio de 600 réalisations de décoration intérieure. Il ne sera pas facile de trouver une manière de décrire 600 fois différentes le même type de projet.

Les balises canoniques sont particulièrement indiquées dans les cas de contenu similaires à faible valeur ajoutée.

6. Comment faire si j'ai du contenu dupliqué sur mon site Web?

Maintenant que vous savez si votre site Web propose du contenu dupliqué, il est temps de passer au plan d’action et de l’éliminer. Voilà les quelques astuces que vous pouvez suivre :

6.1. Utilisez une balise canonique

Nous l’avons déjà mentionné et c’est la première étape à suivre si vous avez deux contenus identiques et qu’ils ont de bonnes raisons d’être sur votre site Web. Ça peut être plus de deux pages similaires aussi.

Pour vous assurer que votre site ne soit accessible que par une URL, utilisez une balise canonique. Vous indiquez aux moteurs de recherche que cette URL spécifique est la copie originale. Si vous repostez un article qui est déjà publié ailleurs, vous pouvez utiliser cette balise pour indiquer aux moteurs de recherche où la version originale se trouve.

balise canonique pour éviter contenu dupliqué

De plus, cela permet aux robots de Google de mieux explorer votre site Web. Ils passeront plus de temps à analyser vos nouvelles pages Web ou les mises à jour de vos pages plutôt que d’analyser les versions originales de celles-ci.

6.2. L’outil paramètres d’URL de Google

Vous pouvez encore une fois vous servir de l’outil d’inspection d’URLs de Google. Cet outil vous permettra de lui demander de ne pas parcourir certaines de vos pages grâce à des paramètres spécifiques. Au besoin, il vous permet de faire savoir à Google que votre contenu dupliqué est intentionnel et qu’il ne doit pas être pris en compte à des fins de référencement.

outil paramètre url google search console contenu dupliqué

6.3. La redirection 301

Enfin, la redirection 301 est idéale si deux pages (ou plusieurs) présentent le même contenu et que vous voulez faire un peu de ménage. Vous choisissez alors l’URL qui vous semble la plus pertinente et vous redirigez toutes les autres vers celle-ci à l’aide d’une redirection 301. Cela vous permettra de transférer l’autorité des pages redirigées vers la page « maitresse ».

redirection 301 contenu dupliqué

6.4. Le contenu dupliqué sur les réseaux sociaux

Nombreux sont ceux qui dupliquent leur contenu pour le reposter sur d’autres médias, car cela fait partie de leur stratégie de marketing digital. Il s’agit de copier leurs articles de blogue pour les poster sur les réseaux sociaux dans le but de promouvoir leur contenu et leur page Web. Si votre contenu est intéressant et attractif, cela créera de l’engagement, mais cela n’engendrera pas de conversion. Les lecteurs n’auront pas besoin de se rendre sur votre site Web puisqu’ils auront déjà les informations qui les intéressent. Or, augmenter votre taux de conversion, c’est sûrement votre objectif final.

Voici ce que vous pouvez faire pour partager votre contenu sur différentes plateformes. Ne publiez qu’une partie de votre contenu en guise d’aguichage et mettez un lien vers l’article original pour inciter à continuer la lecture sur votre blogue. Le but est de générer du trafic provenant des réseaux sociaux.

Soyez cependant rassuré sur le fait que publier un article sur Facebook avec du contenu similaire à votre site Web ne constitue pas du contenu dupliqué. Cela pourrait être amené à évoluer. Dans ce cas, publiez votre contenu sous forme d’images sur les réseaux sociaux et le tour est joué. Google ne comprend pas bien les images, pour une fois, on profite de ses faiblesses.

éviter contenu dupliqué sur réseaux sociaux

6.5. Le contenu dupliqué sur Amazon

Les sites e-commerce se font souvent piéger par le géant du commerce en ligne. Quoi de plus simple, quand on crée une boutique sur Amazon, que de copier le contenu de votre propre site Web sur Amazon. Après tout, ce sont les mêmes produits n’est-ce pas ?

Cependant, une fois que vous aurez gentiment offert sur un plateau d’argent votre contenu à Amazon, le contenu leur appartiendra. Et devinez qui d’Amazon ou de votre site Web aura la plus grosse autorité de domaine? Probablement pas vous. Alors si vous devez donner du contenu à Amazon rapidement, vous êtes mieux de lui donner un contenu différent de celui de votre site Web. Au besoin, vous pouvez toujours utiliser des outils d’intelligence artificielle.

 6.6. Le contenu dupliqué et l’indexation

Dans le cas où vous n’avez pas le choix d’afficher du contenu dupliqué et que vous ne pouvez pas non plus utiliser de balises canoniques, vous pourriez utiliser une balise « no index » qui permettra de bloquer l’indexation du contenu dupliqué sur Google.

Pour cela, veillez à bloquer le robot d’indexation de Google, en utilisant le meta tag « noindex » afin d’éviter de fragiliser votre site Web. Ainsi, vos pages de qualité continueront de se positionner correctement, à raison d’avoir une stratégie SEO pertinente bien sûr, sans que votre site soit affaibli par ce contenu dupliqué.

balise noindex contenu dupliqué

7. Le contenu dupliqué, votre pire ennemi ?

En conséquence, le contenu en double n’entraîne pas de conséquences trop négatives si la duplication n’est pas volontaire, car elle est modifiable. Cependant, Google se charge de repérer les sites utilisant des techniques trompeuses afin de les évincer définitivement des résultats de recherche, une sanction lourde pour un site de e-commerce !

Vous pouvez cependant demander à Google de réexaminer votre site Web si celui-ci a été banni pour duplication. Rendez-vous dans Google Webmaster Tools pour ça. Vous avez aussi la possibilité de déposer une réclamation pour atteinte à vos droits d’auteur sur ce site.

N’hésitez pas à nous contacter au 514 572 7758 ou via notre formulaire de contact si vous souhaitez parler à un conseiller qui répondra à toutes vos questions.

FAQ Contenu dupliqué et SEO

1. Pourquoi le contenu dupliqué est-il pénalisant en SEO ?

Le contenu dupliqué est pénalisant en SEO car il crée de la confusion pour les moteurs de recherche, rendant difficile la détermination de la source originale et la page la plus pertinente à afficher dans les résultats de recherche. De plus, Google peut pénaliser les sites perçus comme tentant de manipuler les classements en utilisant du contenu dupliqué.

2. Quel est l'impact du contenu dupliqué sur votre site Web ?

Le contenu dupliqué impacte négativement votre site Web en diluant le classement des pages concernées dans les résultats de recherche, en diminuant la visibilité et le trafic. Il peut également entraîner des pénalités de la part des moteurs de recherche, réduisant ainsi l’autorité et la crédibilité de votre site.

3. Quelles sont les pénalités de Google pour du "duplicate content" ?

Google peut pénaliser le «duplicate content» en diminuant le classement des pages concernées, en réduisant la visibilité dans les résultats de recherche, voire en supprimant complètement les pages des index. Cela peut entraîner une perte significative de trafic et d’autorité pour le site internet concerné.

Eugénie Delhaye
Cofondatrice et Spécialiste Marketing Internet et Référencement Naturel (SEO) Ma maîtrise des techniques de référencement, combinée à une analyse minutieuse des tendances du marché, me permet de créer des stratégies SEO sur mesure, efficaces et durables.
Envoyer un message
Soumission gratuite

Plus de lecture

SEO Qu'est ce qu'un consultant SEO

Qu’est-ce qu’un consultant SEO ?

SEO

Externalisation SEO : pourquoi y recourir ?

SEO ||||Etude Google avantages seo|avantages seo

Quels sont les avantages du SEO ?

SEO |||||||||||externaliser marketing web

Rédaction Web : apprendre à rédiger

SEO

Position zéro : augmenter votre visibilité SEO

Conception sites web |||

Comment réussir une refonte de site Web?

array(5) {
  ["post_type"]=>
  string(4) "post"
  ["posts_per_page"]=>
  int(6)
  ["post__in"]=>
  array(6) {
    [0]=>
    int(15178)
    [1]=>
    int(15044)
    [2]=>
    int(6092)
    [3]=>
    int(9465)
    [4]=>
    int(6619)
    [5]=>
    int(8178)
  }
  ["post__not_in"]=>
  array(1) {
    [0]=>
    int(5757)
  }
  ["orderby"]=>
  string(8) "post__in"
}
Youpi!
Scroll top