Chaque jour et à tout moment, sur internet, les idées se partagent et s’échangent. Rédiger du contenu dupliqué peut ainsi se faire de manière involontaire. Mais attention, il s’agit d’une pratique très néfaste pour le référencement naturel et la visibilité. Car les moteurs de recherche déclassent rapidement les sites web s’ils détectent ce qu’ils considèrent être du « duplicate content ». Et les robots ne se limitent pas à chercher le contenu rédactionnel copié-collé à partir d’un autre site, de nombreux autres aspects sont pris en compte.
Dans cet article, nous allons voir quels sont les points à vérifier pour être sûr que votre site respecte toutes les règles en matière de plagiat.
Sommaire
En dupliquant le texte d’une autre page web ou sur plusieurs pages d’un même site, le risque d’être pénalisé est double. Au regard des moteurs de recherche, la fiabilité d’un site s’en trouve mise à mal. Du côté de l’expérience utilisateur, c’est la crédibilité et l’expérience de navigation qui va être impactée.
Des dizaines de millions de pages web sont indexées par Google et les autres moteurs de recherche chaque jour. Leurs robots d’indexation vont crawler le web jour et nuit. L’objectif est de classer les informations les plus pertinentes pour les internautes dans les 1ères pages de résultats de recherche (SERP). C’est donc pour garantir la qualité de l’expérience utilisateur que la variété et la complémentarité sont privilégiées.
Les contenus dupliqués vont être filtrés, puis ils seront relégués dans les pages profondes des répertoires. Dans les cas les plus extrêmes, un site peut disparaître complètement du web et sa suppression sera alors irréversible.
De leur côté, les internautes attribuent une valeur qualitative à vos pages. S’ils tombent sur deux sites qui proposent exactement les mêmes contenus, leur confiance dans la qualité de ces informations va diminuer.
Le référencement d’un site est un travail de longue haleine. Découvrons les différents types de contenus dupliqués pour mieux protéger son site.
Ce n’est pas uniquement le vol de contenu qui est incriminé dans la pratique du duplicate content. De nombreuses autres pratiques sont concernées.
Vous venez de publier votre article sur lequel vous avez passé des heures de travail de rédaction. Quelques jours plus tard, vous le voyez avec stupéfaction apparaître mot pour mot sur un autre site. Ce n’est autre que du plagiat !
Si cela vous arrive, notre conseil est le suivant : contactez la personne et expliquez-lui qu’en plus de vous pénaliser, elle se pénalise elle-même. Cela nous est arrivé sur le blog d’un de nos clients, et la personne a retiré son contenu plagié. Bien souvent, les gens ne se rendent pas compte de ce qu’ils font et ne sont pas mal intentionnés.
Copie partielle ou intégrale, le logiciel détecteur du moteur de recherche dévoile les doublons, ainsi que les sites au contenu similaire. Impossible de passer inaperçu surtout si le score dépasse le seuil de tolérance accepté.
Google reste indulgent pour des similitudes qui ne dépassent pas un pourcentage de 20 %. Toutefois, le mieux serait de rester au-dessous de 10 %. Ce taux peut représenter les mots-clés et expressions employés dans la production de contenus optimisés SEO. Et gardez en tête que le simple fait de partager une citation peut aussi faire l’objet d’un contenu dupliqué.
Vous l’aurez compris, copier-coller le contenu d’un autre site internet n’est pas acceptable pour les moteurs de recherche. Mais que se passe-t-il si vous dupliquez du contenu de vos propres pages web ? Cette deuxième variante est très courante dans la duplication de contenu en interne.
Votre site peut présenter plusieurs pages dupliquées contenant des textes identiques. Par exemple, c’est souvent le cas des sites e-commerce tentés de reproduire les fiches produits quand les articles sont similaires.
La rédaction de textes est une activité qui prend du temps. Bien qu’il puisse être tentant d’essayer de trouver des techniques pour être plus efficace, il est nécessaire que le contenu d’un site soit toujours inédit.
Sans cela, le référencement SEO (search engine optimization) de votre site sera pénalisé et au final, essayer de gagner du temps sera contre-productif. Aussitôt que l’algorithme de Google met au jour ce type de pratiques, les sites perdent des places dans le classement, leur popularité baisse.
À l’inverse, avoir un contenu bien référencé aidera votre site à gagner des positions. L’idéal est donc de toujours produire des textes 100 % originaux, de proposer à vos lecteurs des contenus d’actualité et de qualité.
Si malgré tout vous souhaitez réutiliser un texte que vous avez déjà publié quelque part, il faut se conformer à la règle des 30 %. Vous devez en effet modifier au moins 30 % de votre texte pour qu’il se différencie.
Pour cela, usez et abusez des synonymes ! Développez un champ sémantique riche pour garder la même idée, tout en utilisant des mots différents.
Maintenant, nous allons nous pencher sur des détails un peu plus techniques avec les balises méta et les URL.
Google va plus loin encore en analysant la balise meta titre et la meta description de chacune de vos pages. Là aussi, toute ressemblance sera considérée comme un duplicate content.
Or, ces similitudes auront une incidence directe sur l’affichage de vos pages. Étant incapable de différencier ces pages, Google aura vite fait de les assigner très loin dans son répertoire.
Parfois, il faut aller jusque dans les URL pour comprendre pourquoi les moteurs de recherche ont déclassé un ou plusieurs de vos contenus.
Pour faire simple, chaque page web possède une adresse web qui n’est autre que l’URL. Quand vous faites des requêtes sur internet, 2 choix s’offrent à vous :
À moins de connaître la page que l’on souhaite trouver, le plus souvent on utilise la recherche par mots-clés.
Il arrive toutefois qu’une même page soit accidentellement associée à deux URL différentes. Google l’interprète autrement, il considère qu’un même contenu est publié sur deux pages distinctes du site.
Parmi les bonnes pratiques SEO, il est recommandé de vérifier de temps en temps avec la Google Search Console l’ensemble des URL d’un site.
Et dans le cas où vous referiez votre site, il est important d’être vigilant lors de la mise en ligne de la nouvelle version du site en développement. Si l’ancien et le nouveau site sont accessibles en même temps aux robots de Google, ils risquent fort de considérer que c’est du plagiat.
Désormais, vous connaissez les différentes formes de contenu dupliqué, il sera donc plus facile de les éviter. Maintenant, faisons le tour des meilleures pratiques pour y remédier.
En appliquant les bonnes pratiques, vous pourrez définitivement venir à bout du contenu dupliqué. D’ailleurs, des outils gratuits et payants peuvent vous aider dans la veille de vos contenus.
Un seul article dupliqué nuira à votre référencement éditorial et sera dommageable pour l’expérience utilisateur. Mieux vaut donc prévenir que guérir.
Grâce à des logiciels spécialisés, vous pouvez scanner vos articles avant leur publication et détecter s’il existe des contenus similaires.
Ces outils détecteurs existent en versions gratuites et payantes :
Vous ne pourrez pas empêcher Google d’analyser vos pages. Par contre, vous pouvez lui indiquer laquelle indexer ou non si vous avez des pages similaires, des doublons sur votre site.
La 1ère étape consiste à attribuer une forme canonique à l’URL que vous souhaitez pointer comme étant l’originale, pour la différencier de celle dupliquée. Pour cela, il faudra placer une balise de reconnaissance qui facilitera son indexation dans l’en-tête HTML de la page. Autrement dit, dans la balise <head> de la page.
On ajoute la forme canonique de l’URL en insérant la balise rel = canonical suivie de l’URL : <link rel=”canonical” href=”https://www.nomdusiteweb.com/page/” />. Votre webmaster pourra s’en occuper.
La 2ème étape est applicable quand vous créez une nouvelle version de vos pages. Il faudra alors appliquer une redirection 301 pour indiquer aux robots la page source et les pages à rediriger.
Ainsi ils sauront qu’il existe deux niveaux de pertinence des pages, mais que toutes doivent rester néanmoins accessibles. Et cela vous permettra de conserver l’historique SEO de vos pages, ce qui est bon pour le référencement !
La qualité des articles et textes présents sur votre site détermine le niveau de satisfaction et d’engagement des lecteurs. Élaborer des contenus de qualité et à forte valeur ajoutée améliore l’expérience de l’utilisateur et le taux de conversion. Au lieu de vous contenter d’une simple réécriture de textes, proposez un contenu engageant, actuel avec une bonne optimisation SEO.
Rédigez une charte éditoriale qui servira de repère pour vos rédacteurs web lors de la création de contenu. Si vous faites appel à un prestataire externe en conception-rédaction, précisez que le contenu doit être original et sans plagiat dans le contrat.
Nous en avions parlé plus tôt dans l’article, pensez à revoir l’intégralité de votre site au moyen de l’analyse du contenu de chaque page. Vous pouvez utiliser la Google Search Console qui vous proposera un rapport détaillé des erreurs où sont listées toutes les balises dupliquées.
Il suffit ensuite de télécharger le document afin de retravailler la description de vos balises. Reformulez également le descriptif des images et vérifiez qu’elles ne présentent pas de doublons. Ces audits complets devraient se faire périodiquement et se renforcer au fur et à mesure que votre site, votre blog ou votre e-commerce s’agrandit.
Si vous tenez à votre positionnement, misez sur un contenu unique, engageant et zéro plagiat ! Dupliquer du contenu de votre propre site ou de celui de tiers est à proscrire, sans quoi vous risquez d’être pénalisé. Des textes d’actualité et inédits auront toujours plus de valeur aux yeux de vos lecteurs et des moteurs de recherche.
Investir d’abord sur la qualité avant la quantité est une stratégie gagnante pour améliorer la puissance du SEO éditorial de votre site. Ajoutez à cela une vérification et un nettoyage périodique de vos contenus et le duplicate content ne freinera plus jamais l’amélioration de vos positions.
À partir du moment où un contenu se trouve sur internet, vous devez considérer qu’il existe un risque de contenu dupliqué. Par exemple, vous avez écrit un article de blog et souhaitez le partager sur vos plateformes sociales ? Le premier réflexe, pour gagner du temps, sera de reprendre votre introduction par exemple, et de la copier-coller sur Facebook ou Linkedin. Pourquoi faire un simple copier-coller qui risquerait d’aller à contresens de vos intentions ? À la place, réécrivez votre texte de présentation, avec des termes différents, de nouvelles phrases, un ordre différent. Il est clair que cela prendra quelques minutes de plus, mais elles les valent si votre texte remonte dans les résultats des moteurs de recherche. Car là se trouvait bien votre finalité, non ? Améliorer votre classement, être lu, visible et trouvé… davantage et de plus en plus.
Vous avez un texte de base et vous souhaitez le partager ailleurs, le publier sur une autre plateforme que votre site internet ou sur un réseau social ?
Voici les 5 étapes que nous pratiquons, chez Sémantisseo afin de respecter la règle des 30%.
De votre côté, prenez-vous toujours la peine de réécrire et modifier vos textes ? Si c’est le cas, bravo, vous êtes le maître des bonnes pratiques. Si ce n’est pas encore le cas, nous espérons que ces quelques informations et conseils pourront vous aider.
Sacheen est une experte en marketing, marketing digital et référencement éditorial. Avec 20 ans de métier, elle a développé au fil du temps une méthode imparable pour créer du contenu rédactionnel unique qui permet de propulser les entreprises et leurs articles tout en haut des résultats des moteurs de recherche de la SERP.
L’écriture est pour elle une passion. Elle a suivi des dizaines d’ateliers d’écriture, a rédigé plusieurs romans, et a écrit plusieurs centaines d’articles qui se trouvent régulièrement en position zéro ou tout en haut des résultats de Google. L’association de l’algorithmie et du plaisir de l’écriture lui permettent aujourd’hui de jongler avec les mots et éviter à tout moment le contenu dupliqué.
Pour moi, l’écriture est un plaisir. Je peux écrire des dizaines de fois sur des sujets similaires, je prendrai toujours un immense plaisir à créer un contenu nouveau, différent. Je trouve un angle nouveau, différent, et nous sommes partis pour une nouvelle histoire. Copier, prendre le contenu d’une autre, c’est pour moi inimaginable. Je trouve à la fois dommage, car on a toujours quelque chose de nouveau à dire et écrire sur un sujet. Sans parler de la légalité. Car piquer le contenu d’une autre, c’est du plagiat, du vol. Et je pense aussi au lecteur. Personne n’a envie de lire deux fois le même contenu, le même article. Donc en effet, je suis contre le contenu dupliqué. Sous quelque forme que ce soit.
Oui, malheureusement. Il y a quelques années, avec Géraldine, nous avons développé pour une entreprise un blog gigantesque, avec plusieurs centaines d’articles. Il s’agissait d’une industrie où la publicité était interdite. Donc l’unique manière de travailler et développer notre notoriété et notre visibilité était par le contenu organique. Ce blog, c’était du contenu unique. Nous avions pris beaucoup de temps à interviewer nos consommateurs cibles. Nous avions développé des catégories répondant aux attentes de nos lecteurs, identifié les sujets clés, créé un calendrier éditorial.
Puis chaque semaine, un nouvel article était publié en ligne. Un contenu 100% original, créé par nous, avec notre cœur, nos petits doigts, les témoignages de nos consommateurs. Je peux dire que c’était du travail de grande qualité qui nous apportait l’essentiel du trafic sur le site, avec près de 1000 visiteurs par jour qui arrivaient par notre blog et nos articles.
Un jour, en effectuant un audit SEO du site, avec l’outil Screaming Frog, j’ai identifié un taux de contenu dupliqué anormalement élevé. Chaque article, chaque texte était unique, nouveau, original. C’était donc impossible d’avoir du contenu dupliqué. Et c’est ainsi que nous avons identifié qu’un blog, situé dans le sud de la France, avait repris l’ensemble de nos articles, la totalité du blog pour créer son propre blog.
Je vous passe les détails de l’énervement, la colère, l’incompréhension et la déception. Bref, crise de nerfs au sein de l’équipe 😂 . Je me sentais spoilée, volée, violée. J’avais écrit avec mon cœur, avec amour, pour une entreprise que j’adorais, et un inconnu me piquait mes textes.
Nous l’avons contacté. Pour lui expliquer que non seulement ce vol et ce plagiat n’étaient ni sympathiques, ni respectueux, ni légaux. Mais surtout lui apprendre qu’il se pénalisait lui-même, et nous pénalisait par la même occasion. Je pense qu’il ne le savait pas, qu’il n’avait pas conscience de cet aspect. Beaucoup de personnes ignorent que le contenu dupliqué est néfaste pour le référencement naturel SEO. Il a simplement voulu s’offrir un super blog, parfaitement optimisé pour le SEO, avec les meilleurs mots-clés du marché. Sans comprendre ni connaître les tenants et les aboutissants.
L’histoire s’est bien terminée. Après deux relances, la personne a supprimé son blog, s’est excusée, elle ignorait ces règles du web et du duplicate. Et nos métriques SEO sont remontées, puisque tout le contenu dupliqué avait été supprimé.
Ce fut une grande leçon. J’ai sans doute un côté très naïf, mais à mon sens, on ne vole pas le contenu d’autrui. C’est criminel, c’est illégal. Il ne me viendrait pas à l’esprit d’aller faire du copié-collé chez quelqu’un. Évidemment, puisque j’aime écrire, j’aime rédiger, j’ai du plaisir à créer du contenu autour d’un sujet, je n’ai pas besoin de plagier d’autres sites internet.
Mais nous ne sommes pas tous pareils. Pour certains, écrire est compliqué, n’est pas un plaisir. Donc ils ont deux choix : soit faire appel à un rédacteur web professionnel, et donc investir un budget pour pouvoir le payer. Soit ne pas avoir de blog. Ce qui est dommage pour leur SEO, leur référencement et leur visibilité.
Ma grande leçon est donc de faire tourner mon outil de vérification de duplicate content régulièrement, au minimum trois à six fois par année. Afin de pouvoir identifier très rapidement si un site nous a piqué du contenu, répliqué nos articles, et éviter ainsi d’être pénalisé.
Il y a de nombreuses théories qui circulent sur le sujet. Certains disent que ce n’est pas pris en compte. Certains hésitent. J’ai pour ma part une théorie très conservatrice sur le sujet. Tant que nous n’en sommes pas certains, mieux vaut jouer la carte de la sécurité. Cela signifie de modifier son contenu. Le copié-collé, chez moi, c’est une pratique interdite et bannie. Partager sur ses réseaux sociaux, c’est bien. C’est une pratique utile, qui aide le trafic et augmente les visites sur un site ou un blog. Mais, on ne reprend pas son introduction pour la copier telle quelle sur notre réseau social.
Oh oui, absolument. En fait, sans le savoir, les gens reprennent leurs contenus et le publient tel quel sur leurs plateformes sociales. Récemment, j’ai audité un gros site, et toutes les meta-descriptions étaient identiques. Donc là encore, un contenu dupliqué interne. Ce qui est tout aussi néfaste.
Dans les deux cas, ce sont des pratiques à proscrire et éviter.
Au fil de mes années d’écriture, des exercices et des ateliers, j’ai élargi ma sémantique. Les synonymes, c’est une seconde nature chez moi 😂.
Lorsque je dois reprendre un texte, je commence par prendre la base. Le texte initial. Je le copie dans mon document, celui que je vais réécrire et transformer.
Puis, je commence ma transcription en jouant avec les mots et voici les petits secrets :
Ce dont il faut se rappeler, c’est appliquer la règle des 30%. Cela signifie que dans un texte, il faut que 30% du contenu soit différent du reste. Entre nous, 30% c’est vraiment peu, et très rapide et facile à changer.
Lorsque je m’attelle à une transformation de texte pour éviter le duplicata, ça ne me prend jamais plus de 15 minutes. Dans notre formation en ligne, La visibilité par les mots, j’effectue une transformation en direct dans une vidéo. Elle dure très exactement 7 minutes pour un texte d’un paragraphe plutôt long, avec toutes les explications. La preuve qu’il s’agit d’un exercice de réécriture rapide.
Si cela vous semble effrayant ou compliqué, rassurez-vous. C’est facile de l’éviter, le contenu dupliqué !
On vous le concède, ce n’est pas toujours évident de ne pas se répéter lorsque l’on veut partager son article de blog sur ses réseaux sociaux. Surtout si on a beaucoup de plateformes sociales différentes ! Voici quelques conseils que nous utilisons dans l’équipe et qui pourront peut-être vous aider :
Vous venez de mettre un point final à votre article, de le publier sur votre CMS en n’oubliant pas d’optimiser les balises et les photos. Et là, vous n’avez qu’une hâte : le partager au monde entier !
Et pourtant, le plus simple est parfois de laisser passer un petit moment avant sa publication sur les réseaux sociaux. Cela vous permet en effet de vous rafraîchir les idées et de faciliter la réécriture. En effet, quand vous avez encore la tête remplie de ce que vous venez de rédiger, que vous avez relu 3x votre texte pour ne laisser aucune chance aux fautes d’orthographe, il est souvent difficile de vous détacher de vos mots et de vos tournures de phrases.
Alors que si vous y revenez quelques heures ou quelques jours plus tard, vous saurez encore exactement ce que vous avez envie de dire. Mais il y a fort à parier que vous allez vous exprimer différemment, utiliser d’autres mots, varier votre style rédactionnel.
La règle indique qu’il faut un minimum de 30% de modification dans un contenu afin qu’il ne soit pas considéré comme duplicata ou plagiat. La démarche est simple : vous prenez votre texte original, vous prenez le temps de le transformer, en modifiant l’ordre des phrases, en remplaçant des mots spécifiques par leurs synonymes. Cela ne vous prendra pas beaucoup de temps, mais reste indispensable pour que votre contenu reste originel.
Si vous avez la chance de travailler en équipe, il peut parfois être utile de demander à l’un de vos collègues de rédiger pour vous le petit texte qui introduira votre article sur les médias sociaux. Cette personne pourra en effet utiliser son propre style rédactionnel et ses propres mots pour dire la même chose.
Chez Sémantisseo, chaque membre de l’équipe s’occupe d’une plateforme social. Nous pouvons vous garantir que chacun a sa vision bien personnelle de chaque sujet et qu’aucune publication ne se ressemble !
Nous entendons de plus en plus parler d’intelligence artificielle en rédaction web. Ces robots ultra-puissants utilisent des algorithmes qui scannent le web pour vous offrir des textes inédits à partir de ce qu’ils ont lu.
Certains d’entre eux sont notamment spécialisés dans la réécriture. Vous leur donnez votre texte d’origine, et ils en écrivent un nouveau qui a le même sens, mais en utilisant des synonymes pour ne pas créer du contenu dupliqué.
Chez Sémantisseo nous avons eu l’occasion de tester ces outils. Dont Smodin ou Jasper, qui semblent faire l’affaire. Nous ne sommes pas pour. Car entre nous, rien ne vaut de réécrire soi-même, en jouant avec des termes élargis issus du champ lexical. C’est plus amusant, plus valorisant, ça ne prend que quelques minutes. Donc nous ne sommes pas pour. Mais nous voulions quand même vous les mentionner…
Dites-nous en commentaire si vous aimeriez que nous vous fassions un retour d’expérience plus abouti sur l’utilisation de ces outils ! Affaire à suivre…
Merci de votre lecture sur le contenu dupliqué !
Au plaisir de vous retrouver dans nos prochains articles.
L’équipe Sémantisseo
Si les thématiques du référencement éditorial et du contenu dupliqué vous intéressent, voici quelques suggestions :