La contrefaçon de contenus web

Sep 05, 2012

Lorsque l'on fait écrire des textes par une agence éditoriale ou par un rédacteur Web, il n'y a rien de plus désagréable que de retrouver son propre contenu rédactionnel sur le site d'un concurrent.

On s'est habitué à ce que, sur Internet, la propriété des images soit dotée de contours un peu flous : gâce à Google Image, il suffit que le titre de vos illustrations soit suffisamment explicite pour qu'elles se retrouvent un peu partout ; à moins d'interdire aux robots des moteurs de recherche d'indexer les images de votre site par le biais d'un fichier appelé "robots.txt" (consultez votre webmaster pour en savoir plus).

En revanche l'appropriation par autrui d'un contenu rédactionnel constitue une violation plus flagrante de la propriété intellectuelle, et peut nuire au référencement de votre site. Il n'est donc pas inutile de vérifier que les textes dont vous disposez n'ont pas été copiés par des concurrents peu scrupuleux.

Détecter les plagiaires

Les outils ci-dessous présentent un second intérêt : ils permettent de s'assurer qu'un texte qui vous a été fourni par un rédacteur Web n'est pas une simple adaptation d'un article de Wikipédia ou du site d'un de vos concurrents. C'était là ce rose relativement fréquente dans le monde de la rédaction de contenu pour Internet. Pour éviter tout problème n'hésitez pas à passer les textes fournis dans l'une des moulinettes suivantes :

Plagium.com permet des analyses dans plusieurs langues, à partir d'un texte ou d'une adresse web (URL); il est gratuit pour quelques requêtes.

Copyscape.com, probablement le plus connu en France, permet de retrouver directement des copies d'un site web à partir de son adresse.

Plagiarism-detect.com effectue des analyses assez simples à partir d'un texte copié-collé et permet également de télécharger un document au format Word, OpenOffice ou texte simple (txt). Il autorise aussi l'analyse d'une page web par son adresse.

L'image ci-dessous montre qu'un texte réalisé par nos soins et publié sur le site d'un de nos cliens, a été repris sur pas moins de 5 sites web. La raison est simple : ce client est en première position de Google sur une série de mots-clef assez concurrentiel relatifs au déménagement. Quoi de plus naturel que de copier le premier quand on n'a pas d'idées ?

plagiarisme.jpg

 

Cependant, attention aux excès. Ce post que vous êtes en train de lire a été entièrement écrit pour ce site, et n'a fait appel à aucune source externe. Pourtant, le texte qui le constitue est considéré comme une copie d'autres sources à 65% par un outil comme Plagtracker.com !  Dans la capture ci-dessous, le texte considéré comme plagiaire apparaît surligné en rose ou en vert. Ce résultat fantaisiste montre qu'il ne faut pas se précipiter sur le téléphone pour appeler un huissier lorsque vous détectez un plagiaire. Vérifiez d'abord à l'aide de plusieurs outils, et assurez-vous que le texte copié est d'une longueur importante. Dans l'exemple du présent article, Plagtracker cite 89 sources différentes. Le plagiat c'est évidemment lorsque l'on copie deux ou trois sources maximum. Trouver une correspondance sur plus de 15 ou 20 sources pour un texte de cette longueur, montre que l'algorithme utilisé par ce site n'est pas très sérieux, d'autant que certains liens envoient vers une page qui se contente de compter la fréquence de certains mots dans la langue française. 

plagiat02.png

Vous avez été copié ?

Que faire lorsque vous avez détecté un plagiaire ? Le plus simple est d'envoyer une gentille lettre; comme l'email ci-dessous :


Bonjour,

Votre site XYZ comporte des phrases tirées du site de notre client, www.nomdusite.com, par exemple la phrase "Insérer le texte copié ici"

Comme vous le savez, la loi n° 57-298 du 11 mars 1957 sur la propriété littéraire et artistique prévoit que la copie de contenu littéraire constitue une contrefaçon qui ouvre droit à une demande de dommages et intérêts de la part du propriétaire des textes. Nous tenons par ailleurs à protéger les droits de nos clients et la qualité de leur référencement dans Google.

Nous aimerions vous demander de faire le nécessaire pour supprimer les textes copiés, cependant ce genre de demande n'ayant généralement pas de résultats, nous allons plutôt faire un signalement à Google, d'ici quelques jours, pour leur indiquer que votre site copie du texte en provenance d'autres sites. C'est une chose qu'ils n'apprécient pas beaucoup.

Bien entendu si vous preniez l'initiative de vous conformer à la loi et de retirer les textes plagiés; nous n'effectuerons pas cette triste démarche.

Salutations.

L'Agence Rédaction Web

Curieusement ce genre de mail fonctionne plutôt bien.

La loi est dure mais c'est la loi

Lorsque des cas plus épineux se présentent, il n'est pas inutile de faire appel à un bon avocat en propriété intellectuelle. Précisons toutefois que les éléments de protection de la propriété intellectuelle sur le web ont été abordé par l'article L336-2 du Code de la Propriété Intellectuelle, qui précise que le TGI saisi en référé peut faire ordonner la cessation du trouble : 

En présence d'une atteinte à un droit d'auteur ou à un droit voisin occasionnée par le contenu d'un service de communication au public en ligne, le tribunal de grande instance, statuant le cas échéant en la forme des référés, peut ordonner à la demande des titulaires de droits sur les œuvres et objets protégés, de leurs ayants droit, des sociétés de perception et de répartition des droits visées à l'article L. 321-1 ou des organismes de défense professionnelle visés à l'article L. 331-1, toutes mesures propres à prévenir ou à faire cesser une telle atteinte à un droit d'auteur ou un droit voisin, à l'encontre de toute personne susceptible de contribuer à y remédier.

Pour plus de détail sur la propriété des oeuvres artistiques et littéraires sur le net, consultez la fiche établie par le ministère de la culture.

Ce que disent les moteurs de recherche

Lorsqu'un site copie le contenu d'un autre, cela ne laisse pas Google indifférent. Le géant des moteurs de recherche sait pertinemment quelle est la première page qui a présenté le texte en question. Les petits malins qui tentent de récupérer de la notoriété à peu de frais se voient donc appliquer une pénalité, appelée "Duplicate Content Penalty" ou pénalité de contenu dupliqué. Les dernières mises à jour de Google mettent d'ailleurs l'accent sur cette pratique.

Les logiciels de réécriture font du tort à ceux qui les utilisent

Bien entendu il n'est pas toujours possible de se mettre à l'abri des copieurs, particulièrement lorsqu'ils utilisent un logiciel capable de réécrire le texte en faisant appel à des synonymes et des bouts de phrases qui lui donnent un semblant d'unicité. Cela étend, le texte recraché par ces logiciels n'est jamais de très bonne qualité, à moins d'avoir fait appel au départ à de bien mauvais rédacteurs. En effet, ce qui fait la qualité d'un texte, c'est la variété du vocabulaire, la façon dont il est agencé, les structures grammaticales utilisées, le rythme des phrases, et l'articulation des idées. Les logiciels capables de remanier ces éléments en conservant le sens et la lisibilité n'existent pas.

La meilleur des solutions : rester devant les autres

S'il est impossible de se mettre totalement à l'abri des plagiaires et des copieurs, il n'est pas interdit de rester vigilant et de protéger sa marque et son investissement en surveillant la concurrence. Mais puisque la meilleure des défenses c'est l'attaque, c'est-à-dire l'action, la technique la plus efficace du point de vue du référencement c'est celle qui consiste à écrire plus de contenu de qualité plus souvent, de façon à faire évoluer vos pages et votre site de façon positive dans l'index de Google, tout en laissant les copieurs loin derrière.




Gilles Lancrey

user_avatar

Entrepreneur, consultant, architecte d'information, chef de projet logiciel, designer, journaliste et logisticien, multi culturel par nature et aficionado de la sémantique autant que de l'intelligence artificielle, féru du web depuis la première heure.