SEO

Qu’est-ce que le contenu dupliqué et comment l’éviter ?

16 août 2023 Eugénie Delhaye
|éviter contenu dupliqué|exemple contenu dupliqué|e-commerce contenu dupliqué|contenu dupliqué e-commerce|trouver contenu dupliqué sur Google|contenu dupliqué seo|contenu dupliqué fournisseur|éviter contenu dupliqué sur réseaux sociaux|trouver contenu dupliqué avec nombre de résultats|utiliser la google search console pour trouver contenu dupliqué|outil paramètre url google search console contenu dupliqué|redirection 301 contenu dupliqué|contenu dupliqué sélecteur filtres|vérifier contenu dupliqué copyscape|balise canonique pour éviter contenu dupliqué|balise noindex contenu dupliqué

Le contenu dupliqué est un élément SEO très important car il est fortement pénalisé par Google. Or, se faire pénaliser par un engin de recherche engendre des conséquences plutôt désastreuses pour votre site Web et son référencement naturel et peut entrainer une perte de trafic considérable. Éviter le contenu dupliqué est donc très important pour votre stratégie SEO.

Sachant que certains propriétaires de sites Web copient-collent des articles entiers et pensent que cela ne pose aucun souci, les experts de l’agence SEO My Little Big Web vont éclaircir le mystère de la duplication dans cet article, et vous donner quelques conseils qui vous aideront à régler ce problème.

Sommaire

1. Qu’est-ce que le contenu dupliqué ?

Par définition, le contenu dupliqué, ou duplicate content en anglais, signifie d’avoir sur une ou plusieurs URLs, un contenu identique ou très similaire à celui d’une autre URL.

C’est-à-dire que le même texte se trouve sur deux pages Web ou plus, que cela soit sur le même site ou sur deux sites différents. Google qualifie le  contenu en double comme « des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ». Des statistiques SEO montrent que le contenu dupliqué peut être un réel frein au positionnement de vos pages.

Sachez qu'il existe deux types de contenu dupliqué : le contenu dupliqué interne et le contenu dupliqué externe.

exemple contenu dupliqué

1.1. Le contenu dupliqué interne - définition

Le contenu dupliqué interne fait référence à la présence de plusieurs pages identiques ou très similaires au sein d'un même site Web. C'est un cas très fréquent pour des sites e-commerce qui ont des produits extrêmement similaire. Imaginez un site e-commerce qui vend des tasses, il peut être compliqué de créer du contenu diffèrent pour chacune des tasses que le site Web vend.

1.2. Le contenu dupliqué externe

Le contenu dupliqué externe concerne la présence d'un contenu identique ou très similaire sur des sites Web différents.

Cela peut se produire lorsque des informations sont copiées et collées d'une source originale vers d'autres sites sans aucune modification.

Un exemple courant de contenu dupliqué externe est lorsqu'un article est reproduit intégralement sur plusieurs sites Web, sans indiquer la source ou sans apporter de valeur ajoutée.

Cela peut nuire au référencement et à la visibilité d'un site Web, car les moteurs de recherche pénalisent les sites qui recopient le contenu des uns et des autres, que ce soit volontaire ou non.

2. Les différentes causes d’un contenu dupliqué

2.1. Le contenu dupliqué présent sur votre site Web

Contre toute attente et à la surprise de beaucoup de propriétaires de site, votre contenu peut être dupliqué entre plusieurs pages de votre propre site Web.  Imaginez que vous ayez deux pages, présentant chacune un pantalon. L’une présentant un pantalon bleu et l’autre rouge.  Si vous utilisez le même texte descriptif pour ces deux pages, ce contenu sera considéré comme dupliqué.

Dans la mesure où certains gestionnaires de site n’ont pas le choix d’avoir du contenu similaire, il existe des solutions pour aider Google à comprendre votre contenu. Nous allons les aborder dans la suite de l’article . Voilà un exemple de contenu dupliqué avec ces deux pages Web pour des chaussures de course :

contenu dupliqué e-commerce

e-commerce contenu dupliqué

Un contenu dupliqué sur plusieurs pages d’un même site peut être le résultat d’une erreur humaine ; en effet un même contenu, comme une image, un texte ou un lien peut se retrouver sur deux URLS différentes du même site Web. Cela arrive fréquemment dans le cas d’utilisation de CMS. Dans le cas d'un site WordPress par exemple, les mêmes articles peuvent être disponibles à des URLs différentes du fait des tags ou catégories appliquées dépendamment des paramétrages choisis. Il faut donc prêter une grande attention au paramétrage des permaliens.

2.2. Le contenu dupliqué lié aux erreurs techniques de votre site Web

La duplication de contenu est également souvent le cas d’une erreur technique. Il est en effet fréquent d’avoir des milliers de pages dupliquées notamment sur les sites e-commerce.

L’erreur s’explique notamment du fait de la navigation à facettes c’est-à-dire les multiples filtres qui permettent d’accéder au même produit avec des URLs différentes. Le problème dans ce genre de cas est que les robots passent énormément de temps à crawler les milliers de pages générées par la navigation dynamique et cela affecte négativement votre référencement puisque les robots ont un temps de crawl limité. Ces derniers vont donc passer énormément de temps à parcourir des URLs identiques (et donc sans valeur ajoutée) au lieu de parcourir du nouveau contenu ou du contenu qualitatif.

contenu dupliqué sélecteur filtres

2.3. Contenu dupliqué car le fournisseur partage sont contenu à tous ses clients

Il arrive régulièrement que les propriétaires de sites Web utilisent du contenu fourni par le fournisseur. Après tout, pourquoi pas? C’est facile, c’est officiel et c’est rapide. Malheureusement, en utilisant du contenu « standard » qui peut être utilisé par plusieurs revendeurs, votre contenu n’a plus aucune valeur ajoutée auprès de Google.

Si vous êtes un revendeur de pneus par exemple et que vous avez exactement la même description sur votre site que sur le site de votre fournisseur Pirelli, qui pensez-vous que Google va favoriser? Il faut donc impérativement écrire un contenu original sur votre site Web. Nous savons qu’il est long et fastidieux de personnaliser le contenu quand on a des centaines de produits, mais cela peut réellement sauver votre positionnement sur les moteurs de recherche.

contenu dupliqué seo
contenu dupliqué fournisseur

2.4. Contenu délibérément copié d’un site Web à un autre

Dans certains cas, le contenu est délibérément dupliqué entre les domaines afin d’essayer de manipuler le classement du site sur les moteurs de recherche et augmenter le trafic. Naturellement, à long terme, le SEO se verra fortement pénalisé.

Un autre cas que nous avons vu à plusieurs reprises est le cas « Amazon ». Certains E-commerçants ayant déjà un site Web avec du contenu unique (c’est-à-dire non dupliqué), décident d’ouvrir une boutique Amazon. Au lieu de réecrire tout leur contenu, ils lient leur site Web à Amazon et offre tout leur contenu au géant du E-commerce.

2.5. Contenu dupliqué pour cause d’erreur de paramétrage

Il existe de nombreuses autres raisons d’avoir du contenu dupliqué : un site en http et https, un site avec et sans www, un site dupliqué car le site de développement est en ligne en même temps que le site officiel etc.

3. L’impact du contenu dupliqué sur votre SEO

3.1. Google pénalise le contenu dupliqué

Le SEO est négativement impacté par le contenu dupliqué. Dans un souci de présenter des résultats de recherche de qualité, Google ou tout autre moteur de recherche sanctionne lourdement le contenu dupliqué. Cela signifie qu’un site Web ayant trop de contenu dupliqué risque de se retrouver très loin dans les résultats de recherche, voire même complètement disparaître des moteurs.

3.2. Quelle est la mission de Google ?

Dans certains cas, le contenu est délibérément dupliqué entre les domaines afin d’essayer de manipuler le classement du site sur les moteurs de recherche afin d’augmenter le trafic. Naturellement, à long terme, le SEO se verra fortement pénalisé.

Un autre cas que nous avons vu à plusieurs reprises est le cas « Amazon ». Certains E-commerçants ayant déjà un site Web avec du contenu unique (c’est-à-dire non dupliqué), décident d’ouvrir une boutique Amazon. Au lieu de réecrire tout leur contenu, ils lient leur site Web à Amazon et offre tout leur contenu au géant du E-commerce.

3.3. Comment Google s’y prend pour identifier et gérer le contenu dupliqué?

Si vous copiez mot pour mot ou similairement du contenu Web provenant d’une autre page pour simplement produire du contenu, Google va savoir qu’il a été publié après l’original. N’oubliez pas que Google possède un index de plusieurs milliards de pages Web avec tout un tas d’informations s’y rattachant y compris la date de publication.

Lorsqu’il se retrouve avec des contenus dupliqués, il réagit souvent en assignant une place plus basse dans les résultats de recherche au contenu qui est le plus récent. Il regarde également de quelles pages est issu le contenu et positionne celle qui possède la plus grande autorité de domaine. Ainsi, si demain vous décidez de mettre les descriptions de vos produits sur Amazon, il y a de bonnes chances qu’Amazon se positionne avant votre site même si vous avez publié le contenu de votre site en premier.

C’est certes, un gain de temps dans la création de contenu, mais cela va à l’encontre d’une stratégie de contenu pertinente, puisque ça ne participe en rien à optimiser votre SEO. Copier le contenu d’autres pages est donc une perte de temps, car vous ne créez aucune valeur ajoutée et n’améliorez pas votre référencement naturel.

agence seo consultation


4. Comment détecter le contenu dupliqué sur mon site?

En vérifiant activement si votre site Web contient du contenu dupliqué et en réglant ce problème, vous améliorez le classement des pages de votre site Web et vous vous assurez que vos visiteurs soient dirigés vers des contenus nouveaux qui les inciteront à revisiter votre site Web pour en savoir plus.

4.1. Copyscape

Vous pouvez commencer par simplement entrer un extrait de votre contenu dans un logiciel antiplagiat comme Copyscape par exemple. Il vous montrera rapidement si votre contenu a été copié quelque part sur le Web et vous permettra d'éviter le duplicate content.

vérifier contenu dupliqué copyscape

4.2. Duplichecker

L'outil Duplichecker permet aux internautes de comparer deux documents ou de détecter le plagiat potentiel dans un document donné.

Cet outil est gratuit et facile à utiliser. Il permet de gagner du temps précieux dans la recherche de similitudes entre les textes.

Il vous suffit de copier et coller votre texte dans la zone de texte prévue à cet effet, de cliquer sur le bouton de vérification de la similarité et d'attendre les résultats.

Duplichecker analyse ensuite les mots et les phrases dans votre texte et vous renvoie un pourcentage de similitude avec d'autres sources en ligne.

Vous pourrez ainsi vous assurer que votre contenu est original et unique.

4.3. Siteliner

Siteliner est un autre outil de test de contenu dupliqué. Il analyse le contenu d'un site Web pour identifier les problèmes de duplication de contenu.

Il passe en revue chaque page du site et donne également des informations sur la structure du site, le nombre de liens internes et externes, et les pages comportant des erreurs HTTP.

4.4. Kill Duplicate

Kill Duplicate est un outil simple et efficace. Il a été conçu pour trouver et supprimer les doublons dans vos fichiers.

Que vous ayez des fichiers texte, des images, des vidéos ou même des fichiers audio, cet outil peut les analyser rapidement et en toute simplicité. Il utilise un algorithme avancé qui identifie les doublons en se basant sur leur contenu et leurs caractéristiques.

Une fois les doublons détectés, vous pouvez choisir de les supprimer définitivement ou de les déplacer vers un autre dossier. Cela vous permet de libérer de l'espace sur votre disque dur et d'organiser vos fichiers de manière plus efficace. En utilisant l'outil Kill Duplicate, vous pouvez facilement garder votre collection de fichiers propre et sans doublons.

4.5. Vérifiez le nombre de pages indexées

Une autre manière relativement simple de vérifier si vous avez des contenus dupliqués, c’est de voir combien de vos pages sont indexées sur Google. Vous pouvez le faire en recherchant sur Google de cette manière :          site:exemple.com

trouver contenu dupliqué sur Google

Vous obtiendrez alors le nombre de pages qui sont indexées dans Google.

trouver contenu dupliqué avec nombre de résultats

Si vous jugez ce nombre anormalement élevé, cela signifie sûrement que des pages ont été ajoutées à l’index et qu’elles sont possiblement des contenus dupliqués d’autres pages de votre site.

Vous pouvez également utiliser l’outil d’inspection URL de Google sur la Search Console qui vous donnera des informations précises sur la version de votre page indexée par le moteur de recherche ainsi que sur le nombre de pages indexées.

utiliser la google search console pour trouver contenu dupliqué

5. Comment éviter le contenu dupliqué ?

5.1. Écrivez du contenu unique

Ça tombe sous le sens, mais la meilleure façon d'éviter le contenu dupliqué est d'écrire du contenu unique. Vous devez donc vous assurer de produire des textes originaux et différents de ceux déjà existants sur internet.

Pour atteindre cet objectif, effectuez des recherches approfondies avant de rédiger un contenu. Remettez en cause le contenu qui vous est fourni par vos fournisseurs, assurez vous de promouvoir votre propre point de vue sur le sujet. Si vous avez besoin d'aide, n'hésitez pas à vous faire accompagner par une agence de rédaction Web ou consulter un guide de rédaction Web.

Si vous re-vendez des produits, ajouter votre touche personnelle aux descriptions de produits. Indiquez ce qui vous différencie. À ce sujet, n'hésitez pas à vous renseigner plus en détail sur les techniques pour rédiger une fiche produit pour le SEO.

En suivant ces étapes, vous pouvez garantir la création d'un contenu précieux et original pour vos lecteurs.

5.2. Utilisez les balises canoniques

Parfois, nous n'avons pas le choix d'avoir du contenu dupliqué sur notre site Web. Imaginez que vous présentez un portfolio de 600 réalisations de décoration intérieure. Il ne sera pas facile de trouver une manière de décrire 600 fois différentes le même type de projet.

Les balises canoniques sont particulièrement indiquées dans les cas de contenu similaires à faible valeur ajoutée.

6. Comment faire si j'ai du contenu dupliqué sur mon site Web?

Maintenant que vous savez si votre site Web propose du contenu dupliqué, il est temps de passer au plan d’action et de l’éliminer. Voilà les quelques astuces que vous pouvez suivre :

6.1. Utilisez une balise canonique

Nous l'avons déjà mentionné et c'est la première étape à suivre si vous avez deux contenus identiques et qu'ils ont de bonnes raisons d'être sur votre site Web. Ça peut être plus de deux pages similaires aussi.

Pour vous assurer que votre site ne soit accessible que par une URL, utilisez une balise canonique. Vous indiquez aux moteurs de recherche que cette URL spécifique est la copie originale. Si vous repostez un article qui est déjà publié ailleurs, vous pouvez utiliser cette balise pour indiquer aux moteurs de recherche où la version originale se trouve.

De plus, cela permet aux robots de Google de mieux explorer votre site Web. Ils passeront plus de temps à analyser vos nouvelles pages Web ou les mises à jour de vos pages plutôt que d’analyser les versions originales de celles-ci.

 

balise canonique pour éviter contenu dupliqué

De plus, cela permet aux robots de Google de mieux explorer votre site Web. Ils passeront plus de temps à analyser vos nouvelles pages Web ou les mises à jour de vos pages plutôt que d’analyser les versions originales de celles-ci.

6.2. L’outil paramètres d’URL de google

Vous pouvez encore une fois vous servir de l’outil d’inspection d’URLs de Google. Cet outil vous permettra de lui demander de ne pas parcourir certaines de vos pages grâce à des paramètres spécifiques. Au besoin, il vous permet de faire savoir à Google que votre contenu dupliqué est intentionnel et qu’il ne doit pas être pris en compte à des fins de référencement.

outil paramètre url google search console contenu dupliqué

6.3. La redirection 301

Enfin, la redirection 301 est idéale si deux pages (ou plusieurs) présentent le même contenu et que vous voulez faire un peu de ménage. Vous choisissez alors l’URL qui vous semble la plus pertinente et vous redirigez toutes les autres vers celle-ci à l’aide d’une redirection 301.  Cela vous permettra de transférer l’autorité des pages redirigées vers la page « maitresse ».

redirection 301 contenu dupliqué

6.4. Le contenu dupliqué sur les réseaux sociaux

Nombreux sont ceux qui dupliquent leur contenu pour le reposter sur d’autres médias, car cela fait partie de leur stratégie de marketing digital. Il s’agit de copier leurs articles de blogue pour les poster sur les réseaux sociaux dans le but promouvoir leur contenu et leur page Web. Si votre contenu est intéressant et attractif, cela créera de l’engagement, mais cela n’engendrera pas de conversion. Les lecteurs n’auront pas besoin de se rendre sur votre site Web puisqu’ils auront déjà les informations qui les intéressent. Or, augmenter votre taux de conversion, c’est sûrement votre objectif final.

Voici ce que vous pouvez faire pour partager votre contenu sur différentes plateformes. Ne publiez qu’une partie de votre contenu en guise d’aguichage et mettez un lien vers l’article original pour inciter à continuer la lecture sur votre blogue. Le but est de générer du trafic provenant des réseaux sociaux.

Soyez cependant rassuré sur le fait que publier un article sur Facebook avec du contenu similaire à votre site Web ne constitue pas du contenu dupliqué. Cela pourrait être amené à évoluer. Dans ce cas, publiez votre contenu sous forme d’images sur les réseaux sociaux et le tour est joué  . Google ne comprend pas bien les images, pour une fois, on profite de ses faiblesses.

éviter contenu dupliqué sur réseaux sociaux

6.5. Le contenu dupliqué sur Amazon

Les sites e-commerce se font souvent piéger par le géant du commerce en ligne. Quoi de plus simple, quand on crée une boutique sur Amazon, que de copier le contenu de votre propre site Web sur Amazon. Après tout, ce sont les mêmes produits n'est-ce pas?

Effectivement. Par contre, une fois que vous aurez gentiment offert sur un plateau d'argent votre contenu à Amazon, le contenu leur appartiendra. Et devinez qui d'Amazon ou de votre site Web aura la plus grosse autorité de domaine? Probablement pas vous. Alors si vous devez donner du contenu à Amazon rapidement, vous êtes mieux de lui donner un contenu différent de celui de votre site Web. Au besoin, vous pouvez toujours utiliser des outils d'intelligence artificielle.

 

 6.6. Le contenu dupliqué et l’indexation

Dans le cas où vous n’avez pas le choix d’afficher du contenu dupliqué et que vous ne pouvez pas non plus utiliser de balises canoniques, vous pourriez utiliser une balise « no index » qui permettra de bloquer l’indexation du contenu dupliqué sur Google.

Pour cela, veillez à bloquer le robot d’indexation de Google, en utilisant le meta tag « noindex » afin d’éviter de fragiliser votre site Web. Ainsi, vos pages de qualité continueront de se positionner correctement, à raison d’avoir une stratégie SEO pertinente bien sûr, sans que votre site soit affaibli par ce contenu dupliqué.

balise noindex contenu dupliqué

7. Le contenu dupliqué, votre pire ennemi ?

En conséquence, le contenu en double n’entraîne pas de conséquences trop négatives si la duplication n’est pas volontaire, car elle est modifiable. Cependant, Google se charge de repérer les sites utilisant des techniques trompeuses afin de les évincer définitivement des résultats de recherche, une sanction lourde pour un site de e-commerce !

Vous pouvez cependant demander à Google de réexaminer votre site web si celui-ci a été banni pour duplication. Rendez-vous dans Google Webmaster Tools pour ça. Vous avez aussi la possibilité de déposer une réclamation pour atteinte à vos droits d’auteur sur ce site.

N’hésitez pas à nous contacter au 514 572 7758 ou via notre formulaire de contact si vous souhaitez parler à un conseiller qui répondra à toutes vos questions.

Eugénie Delhaye
Cofondatrice et Spécialiste Marketing Internet et Référencement Naturel (SEO) Ma maîtrise des techniques de référencement, combinée à une analyse minutieuse des tendances du marché, me permet de créer des stratégies SEO sur mesure, efficaces et durables.
Envoyer un message
Soumission gratuite

Plus de lecture

SEO |éviter contenu dupliqué|exemple contenu dupliqué|e-commerce contenu dupliqué|contenu dupliqué e-commerce|trouver contenu dupliqué sur Google|contenu dupliqué seo|contenu dupliqué fournisseur|éviter contenu dupliqué sur réseaux sociaux|trouver contenu dupliqué avec nombre de résultats|utiliser la google search console pour trouver contenu dupliqué|outil paramètre url google search console contenu dupliqué|redirection 301 contenu dupliqué|contenu dupliqué sélecteur filtres|vérifier contenu dupliqué copyscape|balise canonique pour éviter contenu dupliqué|balise noindex contenu dupliqué

Qu’est-ce que le contenu dupliqué et comment l’éviter ?

SEO |

Comment améliorer son SEO ?

SEO maillage interne en SEO||catégories et sous catégories pour maillage interne|exemple menu et sous-menu maillage interne|maillage interne et autorité de page exemple|liens internes naturels article de blogue|pertinence des liens internes|exemple liens internes article SEO|texte d'ancre pour les liens internes|ancre maillage interne|balise nofollow maillage interne

Liens internes en SEO : tout comprendre sur le maillage interne

Agence SEO Meilleure agence seo Montréal

Quelle est la meilleure agence SEO à Montréal?

Définitions |||qu'est-ce que le SEO VS SEA?|exemple résultats SEO||pourquoi utiliser le SEO|les critères SEO internes et externes|comment optimiser son SEO interne|choix des mots clés en SEO|balises Hn optimisation SEO|Qu'est-ce que le SEO? Balises Alt|balise title et meta description agence SEO|qu'est-ce que le SEO? Liens internes et externes|structure site Web en SEO|exemple de contenu SEO||Qu'est-ce que le SEO - robots.txt|UX et SEO|netlinking pour optimiser son SEO

Qu’est-ce que le SEO ?

SEO Comment combiner le SEO et l'intelligence artificielle ?

Comment optimiser votre SEO grâce à l’intelligence artificielle ?

Youpi!
Scroll top