Qu’est-ce que le contenu dupliqué et comment l’éviter ?

Par

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué, ou duplicate content en anglais, signifie se retrouver avec le même contenu que son voisin (ou que soi-même !) sur son site web. C’est-à-dire que le même texte se trouve sur deux pages web ou plus, que cela soit sur le même site ou sur deux sites différents.

Vous souvenez vous de votre secondaire, quelques heures avant le rendu d’un devoir sur Maria Chapdelaine, cherchant frénétiquement sur Google de quoi remplumer votre travail ? Vous avez sûrement copié sans gêne un bloc entier provenant d’un site web ! Ceci est la définition du contenu dupliqué. Car dans le cas où l’on se retrouve avec le même texte qu’une autre page, c’est soit du vol/plagiat, soit du copier/coller de votre part !

Contenu dupliqué et SEO

Le SEO rentre en jeu à ce moment-là. Par souci de qualité des résultats naturels de recherche –c’est-à-dire du SEO (Search Engine Optimization)- Google ou tout autre moteur de recherche sanctionne lourdement le contenu dupliqué. Cela signifie qu’un site web ayant trop de contenu dupliqué risque de se retrouver très loin dans les résultats de recherche, voire même complètement disparaître des moteurs.

Un contenu dupliqué sur plusieurs page d’un même site peut être le résultat d’une erreur humaine ; en effet un même contenu, telle qu’une image, un texte ou un lien peut se retrouver sur deux URL différentes du même site web. Cela arrive fréquemment dans le cas d’utilisation de CMS. Dans le cas de WordPress par exemple, les mêmes articles peuvent être disponibles à des URLs différentes du fait des tags ou catégories appliquées. Il faut donc prêter une grande attention au paramétrage des permaliens.

La duplication de contenu est également souvent le cas d’une erreur technique. Il est en effet fréquent d’avoir des milliers de pages dupliquées dans le cas de site e-commerce. L’erreur s’explique notamment du fait de la navigation à facettes c’est-à-dire les multiples filtres qui permettent d’accéder au même produit avec des URLs différentes. Le problème de ce genre de cas est que les robots passent énormément de temps à crawler les milliers de pages générées par la navigation dynamique et cela affecte négativement votre référencement.

On retrouve néanmoins le plus souvent du contenu dupliqué sur des sites différents. Cela varie, allant d’un article trop semblable sur deux sites de e-commerce, à la reprise d’extraits d’un texte déjà vu sur un autre site. En effet, cela arrive souvent lorsque les sites web embauchent le même fournisseur de contenu ! Ce qui devient très vite handicapant, car cela empêche le site web de se retrouver haut dans les résultats de recherche. Nous savons qu’il est long et fastidieux de personnaliser le contenu quand on a des centaines de produits mais cela peut réellement sauver votre positionnement sur les moteurs de recherche. Si vous êtes un revendeur de pneus par exemple et que vous avez exactement la même description sur votre site que sur le site de Pirelli, qui pensez-vous que Google va favoriser ? Il faut donc impérativement valoriser un contenu original.

Il y a d’autre cas de figure possible. Des flux RSS peuvent être récupérés au format XML et sont exposés sur des sites à travers le web. Il est également possible que le plagiat soit volontaire ! En effet, dans certains cas, le contenu est délibérément dupliqué entre les domaines afin de manipuler le classement du site sur les moteurs de recherche et afin d’augmenter du trafic. Naturellement, le SEO se verra fortement pénalisé. De plus, le plagiat est sanctionné juridiquement lorsqu’on apporte une preuve de propriété intellectuelle.

Il existe de nombreuses autres raisons d’avoir du contenu dupliqué : un site en http et https, un site avec et sans www, un site dupliqué car le site de développement est en ligne etc.

Comment éviter le contenu dupliqué ?

  • Vérifiez régulièrement les URL et pages de votre site.
  • Si vous refaites votre site web, utilisez des redirections 301 « Redirect Permanent », ce qui redirige les internautes et Googlebot vers les nouvelles URL et non les anciennes !
  • Utilisez la « canonicalisation »; parfois plusieurs URL ont le même contenu, mais sont différentes. Il suffit d’adopter les URL canoniques qui précisent quelle URL est l’originale parmi plusieurs URL très proches. La balise est la suivante : <link rel=”canonical” href=”url”/>. Placez-là dans l’entête HTLM de votre page, entre <head/> et </head/>.
  • Vérifiez régulièrement sur Google qu’on ne vous ait pas volé une partie de votre contenu. Copiez quelques lignes d’un article de votre site web et collez les dans Google. Il se chargera de retrouver le fautif !
  • Avant d’acheter du contenu à un tiers, stipulez dans votre contrat que ce dernier ne doit écrire que du contenu original. Si cela n’est pas possible, réécrivez à votre propre sauce tout le contenu, en le modifiant sérieusement.
  • Limitez les contenus similaires. Imaginons que vous soyez une agence de voyage : si vous avez deux pages sur deux pays formulées de la même manière, songez à les regrouper en une seule page afin d’éviter du contenu dupliqué, ou tout simplement à les réécrire.
  • Utilisez Search Console pour indiquer à Google comment indexer votre site.
OBTENEZ UN COACHING GRATUIT DE 30 MINUTES EN REMPLISSANT LE FORMULAIRE !

 

Le contenu dupliqué, votre pire ennemi ?

En conséquence, le contenu en double n’entraîne pas de conséquences trop négatives si la duplication n’est pas volontaire, car elle est modifiable. Cependant, Google se charge de repérer les sites utilisant des techniques trompeuses afin de les évincer définitivement des résultats de recherche, une sanction lourde pour un site de e-commerce !

Vous pouvez cependant demander à Google de réexaminer votre site web si celui-ci a été banni pour duplication. Rendez-vous dans Google Webmaster Tools pour ça. Vous avez aussi la possibilité de déposer une réclamation pour atteinte à vos droits d’auteur sur ce site.

Suivez donc de façon assidue les conseils de My Little Big Web pour ne pas perdre votre place dans les résultats de recherche, et surtout, écrivez du contenu original. Maintenant que vous savez comment éviter le contenu dupliqué, apprenez comment tirer parti du référencement local !

N’hésitez pas à nous contacter au 514 437 4245 ou via notre formulaire de contact si vous souhaitez parler à un conseiller qui répondra à toutes vos questions.

L'importance de l'audit SEOerreurs-eviter-creation-site-e-commerce