Contenu dupliqué : les risques et les solutions pour votre SEO

contenu dupliqué
9 février 2021

Chaque jour et à tout moment, sur internet, les idées se partagent et s’échangent. Rédiger du contenu dupliqué peut ainsi se faire de manière involontaire. Mais attention, il s'agit d'une pratique très néfaste pour le référencement naturel et la visibilité. Car les moteurs de recherche déclassent rapidement les sites web s’ils détectent ce qu’ils considèrent être du « duplicate content ». Et les robots ne se limitent pas à chercher le contenu rédactionnel copié-collé à partir d’un autre site, de nombreux autres aspects sont pris en compte.

Dans cet article, nous allons voir quels sont les points à vérifier pour être sûr que votre site respecte toutes les règles en matière de plagiat.

Sommaire

Publier du contenu dupliqué un jeu très risqué

En dupliquant le texte d’une autre page web ou sur plusieurs pages d'un même site, le risque d’être pénalisé est double. Au regard des moteurs de recherche, la fiabilité d’un site s’en trouve mise à mal. Du côté de l’expérience utilisateur, c’est la crédibilité et l'expérience de navigation qui va être impactée. 

Des dizaines de millions de pages web sont indexées par Google et les autres moteurs de recherche chaque jour. Leurs robots d’indexation vont crawler le web jour et nuit. L’objectif est de classer les informations les plus pertinentes pour les internautes dans les res pages de résultats de recherche (SERP). C’est donc pour garantir la qualité de l’expérience utilisateur que la variété et la complémentarité sont privilégiées. 

Les contenus dupliqués vont être filtrés, puis ils seront relégués dans les pages profondes des répertoires. Dans les cas les plus extrêmes, un site peut disparaître complètement du web et sa suppression sera alors irréversible. 

De leur côté, les internautes attribuent une valeur qualitative à vos pages. S’ils tombent sur deux sites qui proposent exactement les mêmes contenus, leur confiance dans la qualité de ces informations va diminuer.

Le référencement d’un site est un travail de longue haleine. Découvrons les différents types de contenus dupliqués pour mieux protéger son site.

Les différents types de contenus dupliqués recensés par Google

Ce n’est pas uniquement le vol de contenu qui est incriminé dans la pratique du duplicate content. De nombreuses autres pratiques sont concernées.

Le contenu plagié par un site tiers

Vous venez de publier votre article sur lequel vous avez passé des heures de travail de rédaction. Quelques jours plus tard, vous le voyez avec stupéfaction apparaître mot pour mot sur un autre site. Ce n’est autre que du plagiat ! 

Si cela vous arrive, notre conseil est le suivant : contactez la personne et expliquez-lui qu’en plus de vous pénaliser, elle se pénalise elle-même. Cela nous est arrivé sur le blog d’un de nos clients, et la personne a retiré son contenu plagié. Bien souvent, les gens ne se rendent pas compte de ce qu’ils font et ne sont pas mal intentionnés.

Copie partielle ou intégrale, le logiciel détecteur du moteur de recherche dévoile les doublons, ainsi que les sites au contenu similaire. Impossible de passer inaperçu surtout si le score dépasse le seuil de tolérance accepté. 

Google reste indulgent pour des similitudes qui ne dépassent pas un pourcentage de 20 %. Toutefois, le mieux serait de rester au-dessous de 10 %. Ce taux peut représenter les mots-clés et expressions employés dans la production de contenus optimisés SEO. Et gardez en tête que le simple fait de partager une citation peut aussi faire l’objet d’un contenu dupliqué

Vous l’aurez compris, copier-coller le contenu d’un autre site internet n’est pas acceptable pour les moteurs de recherche. Mais que se passe-t-il si vous dupliquez du contenu de vos propres pages web ? Cette deuxième variante est très courante dans la duplication de contenu en interne.

Un contenu dupliqué sur plusieurs pages de son site

Votre site peut présenter plusieurs pages dupliquées contenant des textes identiques. Par exemple, c’est souvent le cas des sites e-commerce tentés de reproduire les fiches produits quand les articles sont similaires. 

La rédaction de textes est une activité qui prend du temps. Bien qu’il puisse être tentant d’essayer de trouver des techniques pour être plus efficace, il est nécessaire que le contenu d'un site soit toujours inédit

Sans cela, le référencement SEO (search engine optimization) de votre site sera pénalisé et au final, essayer de gagner du temps sera contre-productif. Aussitôt que l’algorithme de Google met au jour ce type de pratiques, les sites perdent des places dans le classement, leur popularité baisse. 

À l’inverse, avoir un contenu bien référencé aidera votre site à gagner des positions. L’idéal est donc de toujours produire des textes 100 % originaux, de proposer à vos lecteurs des contenus d’actualité et de qualité

Si malgré tout vous souhaitez réutiliser un texte que vous avez déjà publié quelque part, il faut se conformer à la règle des 30 %. Vous devez en effet modifier au moins 30 % de votre texte pour qu’il se différencie. 

Pour cela, usez et abusez des synonymes ! Développez un champ sémantique riche pour garder la même idée, tout en utilisant des mots différents. 

Maintenant, nous allons nous pencher sur des détails un peu plus techniques avec les balises méta et les URL. 

Des balises meta identiques

Google va plus loin encore en analysant la balise meta titre et la meta description de chacune de vos pages. Là aussi, toute ressemblance sera considérée comme un duplicate content

Or, ces similitudes auront une incidence directe sur l’affichage de vos pages. Étant incapable de différencier ces pages, Google aura vite fait de les assigner très loin dans son répertoire. 

Des URLs semblables pour deux pages web distinctes

Parfois, il faut aller jusque dans les URL pour comprendre pourquoi les moteurs de recherche ont déclassé un ou plusieurs de vos contenus. 

Pour faire simple, chaque page web possède une adresse web qui n’est autre que l’URL. Quand vous faites des requêtes sur internet, 2 choix s’offrent à vous :

  • soit vous tapez une requête clé ou un mot-clé dans la barre de recherche ; 
  • soit vous indiquez l’URL complet de la page dans la barre d’adresse.

À moins de connaître la page que l’on souhaite trouver, le plus souvent on utilise la recherche par mots-clés.

Il arrive toutefois qu’une même page soit accidentellement associée à deux URL différentes. Google l’interprète autrement, il considère qu’un même contenu est publié sur deux pages distinctes du site. 

Parmi les bonnes pratiques SEO, il est recommandé de vérifier de temps en temps avec la Google Search Console l’ensemble des URL d'un site. 

Et dans le cas où vous referiez votre site, il est important d’être vigilant lors de la mise en ligne de la nouvelle version du site en développement. Si l’ancien et le nouveau site sont accessibles en même temps aux robots de Google, ils risquent fort de considérer que c'est du plagiat

Désormais, vous connaissez les différentes formes de contenu dupliqué, il sera donc plus facile de les éviter. Maintenant, faisons le tour des meilleures pratiques pour y remédier.

Comment s’affranchir définitivement du contenu dupliqué ?

En appliquant les bonnes pratiques, vous pourrez définitivement venir à bout du contenu dupliqué. D’ailleurs, des outils gratuits et payants peuvent vous aider dans la veille de vos contenus. 

Passer au détecteur de plagiat avant de publier

Un seul article dupliqué nuira à votre référencement éditorial et sera dommageable pour l’expérience utilisateur. Mieux vaut donc prévenir que guérir. 

Grâce à des logiciels spécialisés, vous pouvez scanner vos articles avant leur publication et détecter s’il existe des contenus similaires

Ces outils détecteurs existent en versions gratuites et payantes : 

  1. Copyscape est sans doute le logiciel le plus ancien et le plus vulgarisé. Sa version gratuite est accessible sans inscription. Néanmoins, il faudra vous abonner pour affiner votre recherche et renforcer la fiabilité du résultat. 
  2. Accessible uniquement par abonnement, Plagscan vous propose un rapport détaillé du résultat de votre scan. Son plus grand avantage est de pouvoir analyser un texte volumineux en un seul passage.
  3. Toutefois, aucun ne saurait égaler Quetext, le détecteur le plus élaboré proposant des renseignements fournis à chaque scan. Il mettra en lumière tous les éléments dupliqués et classera les doublons selon leur degré d’importance. Vous pourrez facilement rectifier le tir et voir le changement de votre score au gré des modifications.

Les étapes à suivre pour corriger les pages en doublons

Vous ne pourrez pas empêcher Google d’analyser vos pages. Par contre, vous pouvez lui indiquer laquelle indexer ou non si vous avez des pages similaires, des doublons sur votre site

La 1ère étape consiste à attribuer une forme canonique à l’URL que vous souhaitez pointer comme étant l’originale, pour la différencier de celle dupliquée. Pour cela, il faudra placer une balise de reconnaissance qui facilitera son indexation dans l’en-tête HTML de la page. Autrement dit, dans la balise <head> de la page.

On ajoute la forme canonique de l’URL en insérant la balise rel = canonical suivie de l’URL : <link rel="canonical" href="https://www.nomdusiteweb.com/page/" />. Votre webmaster pourra s’en occuper.

La 2ème étape est applicable quand vous créez une nouvelle version de vos pages. Il faudra alors appliquer une redirection 301 pour indiquer aux robots la page source et les pages à rediriger. 

Ainsi ils sauront qu’il existe deux niveaux de pertinence des pages, mais que toutes doivent rester néanmoins accessibles. Et cela vous permettra de conserver l’historique SEO de vos pages, ce qui est bon pour le référencement !

Proposer un contenu rédactionnel de qualité

La qualité des articles et textes présents sur votre site détermine le niveau de satisfaction et d’engagement des lecteurs. Élaborer des contenus de qualité et à forte valeur ajoutée améliore l’expérience de l’utilisateur et le taux de conversion. Au lieu de vous contenter d’une simple réécriture de textes, proposez un contenu engageant, actuel avec une bonne optimisation SEO

Rédigez une charte éditoriale qui servira de repère pour vos rédacteurs web lors de la création de contenu. Si vous faites appel à un prestataire externe en conception-rédaction, précisez que le contenu doit être original et sans plagiat dans le contrat. 

Faire une vérification globale de son site régulièrement et tracker le contenu dupliqué

Nous en avions parlé plus tôt dans l’article, pensez à revoir l’intégralité de votre site au moyen de l'analyse du contenu de chaque page. Vous pouvez utiliser la Google Search Console qui vous proposera un rapport détaillé des erreurs où sont listées toutes les balises dupliquées. 

Il suffit ensuite de télécharger le document afin de retravailler la description de vos balises. Reformulez également le descriptif des images et vérifiez qu’elles ne présentent pas de doublons. Ces audits complets devraient se faire périodiquement et se renforcer au fur et à mesure que votre site, votre blog ou votre e-commerce s’agrandit.

Ce qu'il faut retenir sur le duplicate content

Si vous tenez à votre positionnement, misez sur un contenu unique, engageant et zéro plagiat ! Dupliquer du contenu de votre propre site ou de celui de tiers est à proscrire, sans quoi vous risquez d’être pénalisé. Des textes d’actualité et inédits auront toujours plus de valeur aux yeux de vos lecteurs et des moteurs de recherche. 

Investir d’abord sur la qualité avant la quantité est une stratégie gagnante pour améliorer la puissance du SEO éditorial de votre site. Ajoutez à cela une vérification et un nettoyage périodique de vos contenus et le duplicate content ne freinera plus jamais l’amélioration de vos positions. 

Et le partage de contenu sur d'autres plateformes ou les réseaux sociaux ?

À partir du moment où un contenu se trouve sur internet, vous devez considérer qu'il existe un risque de contenu dupliqué. Par exemple, vous avez écrit un article de blog et souhaitez le partager sur vos plateformes sociales ? Le premier réflexe, pour gagner du temps, sera de reprendre votre introduction par exemple, et de la copier-coller sur Facebook ou Linkedin. Pourquoi faire un simple copier-coller qui risquerait d'aller à contresens de vos intentions ? À la place, réécrivez votre texte de présentation, avec des termes différents, de nouvelles phrases, un ordre différent. Il est clair que cela prendra quelques minutes de plus, mais elles les valent si votre texte remonte dans les résultats des moteurs de recherche. Car là se trouvait bien votre finalité, non ? Améliorer votre classement, être lu, visible et trouvé... davantage et de plus en plus. 

Enfin, nos 5 astuces anti contenu dupliqué !

Vous avez un texte de base et vous souhaitez le partager ailleurs, le publier sur une autre plateforme que votre site internet ou sur un réseau social ?
Voici les 5 étapes que nous pratiquons, chez Sémantisseo afin de respecter la règle des 30%

  1. Modifiez la construction de votre phrase : le complément de phrase au début, ou au centre ou encore à la fin de votre phrase.
  2. Usez de synonymes : remplacez un mot par un autre, à chaque fois que c'est possible et que le sens ne s'en trouvera pas modifié.
  3. Changer l'ordre de vos paragraphes : la fin au début, le début à la fin, une réorganisation de votre paragraphe permet de ne pas être dans une copie conforme.
  4. Élargissez votre champ lexical : de nouveaux termes, toujours dans la même famille de mots bien sûr, mais qui n'ont pas encore été employés dans la version première.
  5. Ajoutez du contenu : une phrase, une introduction nouvelle, un paragraphe inédit. L'idée était d'ajouter des éléments nouveaux, de complètes parties de texte qui n'apparaissent nulle part ailleurs. Vous pouvez d'ailleurs faire de même dans l'autre sens. Supprimer de petites phrases ou parties de votre texte pour lui donner nouvelle allure.

De votre côté, prenez-vous toujours la peine de réécrire et modifier vos textes ? Si c'est le cas, bravo, vous êtes le maître des bonnes pratiques. Si ce n'est pas encore le cas, nous espérons que ces quelques informations et conseils pourront vous aider. 

Merci de votre lecture 

Au plaisir de vous retrouver dans nos prochains articles. 

L’équipe Sémantisseo 

 

Si cet article vous a plu, pourquoi ne pas rester en contact ?

Si les thématiques du référencement éditorial et du SEO vous intéressent, voici quelques suggestions :

  • pour commencer, pourquoi ne pas vous abonner à notre newsletter de conseils, dans laquelle on décortique notre métier au quotidien
  • puis, retrouvez-nous sur notre page LinkedIn qui traite notamment des bonnes pratiques en champ sémantique
  • suivez-nous également sur Pinterest où vous trouverez une sélection des meilleurs conseils en référencement éditorial et en marketing digital
  • rejoignez-nous ensuite sur Instagram et Facebook pour connaître toutes les actualités de notre activité et les coulisses de l’entreprise
  • et surtout : si vous avez besoin d’aide pour démarrer votre référencement éditorial, contactez-nous ! Nous serons heureux et ravis de vous aider. Car nous adorons notre métier et aimons beaucoup le partager plus loin ☺️

📌 Epinglez cet article sur Pinterest pour le relire plus tard.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bonjour !
Nous adorons transmettre nos connaissances et vous proposerons ici toujours plus de contenu.
Vous pourriez aussi être intéressés par :
Les fautes d’orthographe pénalisent-elles le référencement ?Les métaphores : comment Google les comprend-il et leur impact sur le SEO ?Écriture inclusive : son impact sur le référencement SEO
Gagnez en visibilité sur le web grâce au référencement éditorial
Mail : equipe@semantisseo.com
Les Ateliers de La Côte, Rte de Pallatex, 5
1163 Etoy
closechevron-upfacebook-squarelinkedin-squarefacebookpinterestpinterest-squarelinkedininstagrampinterest-pchevron-downmenu-circle