Le plagiat est un problème mondial qui touche tous les secteurs produisant du contenu écrit. Selon une étude publiée par le Centre international pour l'intégrité académique (ICAI), environ 68 % des étudiants de premier cycle ont admis avoir eu recours à une forme de tricherie écrite, notamment au plagiat, au cours de leurs études. Ce chiffre est resté remarquablement stable au fil des différentes vagues d'enquêtes menées pendant plus de vingt ans par Donald McCabe et ses collègues.
Une méta-analyse à grande échelle publiée dans PLOS ONE (Pupovac &Fanelli, 2015) a examiné les taux de plagiat autodéclarés dans 54 études et a constaté une prévalence globale d'environ 30 % d'étudiants admettant avoir commis au moins un cas de plagiat. L'étude a mis en évidence des variations importantes selon les régions, certains pays affichant des taux supérieurs à 50 % et d'autres inférieurs à 10 %, reflétant des différences dans les attitudes culturelles, l'application des règles par les établissements et la connaissance des normes en matière de plagiat.
Le problème dépasse le cadre universitaire. Un rapport de 2019 d'iThenticate (une filiale de Turnitin) mené auprès de rédacteurs et de chercheurs a révélé qu'un manuscrit sur six soumis à des revues académiques contenait des similitudes textuelles importantes avec des documents déjà publiés. Dans le journalisme et l'édition, les scandales de plagiat continuent d'éclater régulièrement, et des cas retentissants ont été signalés ces dernières années au sein de grands médias.
Les recherches sur la fraude académique révèlent systématiquement que le plagiat est un phénomène répandu à tous les niveaux d'enseignement. Le McCabe Center for Academic Integrity (anciennement International Center for Academic Integrity) a recueilli des données auprès de plus de 71 000 étudiants de premier cycle et 17 000 étudiants de cycles supérieurs en Amérique du Nord. Ses conclusions indiquent que 39 % des étudiants de premier cycle ont admis avoir paraphrasé ou copié quelques phrases d'une source Internet sans la citer, et que 62 % d'entre eux ont reconnu avoir commis au moins une fraude grave dans leurs travaux écrits.
Une enquête menée en 2023 par Turnitin a révélé que, parmi les travaux soumis via leur système, environ 11 % des copies d'étudiants présentaient un chevauchement textuel important (plus de 25 % de similarité) avec des sources non attribuées. Une autre étude, réalisée par Bretag et al. (2019) et publiée dans Studies in Higher Education, a interrogé 14 086 étudiants de huit universités australiennes et a constaté que 6,5 % d'entre eux avaient admis avoir acheté ou sous-traité des travaux (fraude par contrat), une forme particulièrement grave de fraude académique.
Le plagiat au niveau des études supérieures est moins étudié, mais non moins fréquent. Aux États-Unis, l'Office of Research Integrity (ORI) a enquêté sur des centaines de cas de fraude scientifique depuis sa création, le plagiat et la falsification de données étant les principales catégories. Une étude de Heitman et Litewka (2011), publiée dans Developing World Bioethics, a révélé que le plagiat dans les publications scientifiques était plus répandu dans les pays en développement, notamment en raison des barrières linguistiques et des différences de normes académiques.
Le lancement de ChatGPT en novembre 2022 a marqué un tournant dans l'intégrité académique. Une enquête menée par le groupe de recherche sur l'intelligence artificielle centrée sur l'humain de l'université de Stanford a révélé qu'environ 17 % des étudiants interrogés ont déclaré avoir utilisé des outils d'IA pour leurs travaux universitaires durant l'année 2022-2023. Des enquêtes ultérieures suggèrent que ce chiffre a considérablement augmenté.
En 2024, Turnitin a indiqué que son système de détection par IA avait signalé entre 6 % et 11 % des travaux d'étudiants remis comme contenant une quantité importante de contenu généré par l'IA (défini comme un texte composé à 80 % ou plus de texte rédigé par l'IA). Une enquête menée par BestColleges (2023) a révélé que 56 % des étudiants avaient utilisé des outils d'IA pour leurs travaux universitaires, et qu'environ la moitié d'entre eux reconnaissaient que leur établissement considérait cet usage comme une forme de tricherie ou de plagiat.
Le défi posé par les contenus générés par l'IA dépasse le cadre de l'éducation. Une analyse réalisée en 2024 par Originality.AI estimait qu'un pourcentage important et croissant des contenus web récemment publiés présentait des traces de génération par l'IA. Ceci engendre de nouveaux défis pour les outils de détection de plagiat, qui doivent désormais distinguer les textes originaux rédigés par des humains, les textes plagiés rédigés par des humains et les textes générés par l'IA – trois catégories distinctes nécessitant des approches de détection différentes.
Le plagiat dans les publications scientifiques a des conséquences qui dépassent largement le cadre des carrières individuelles. Une étude de Fang, Steen et Casadevall (2012), publiée dans les Actes de l'Académie nationale des sciences, a analysé 2 047 articles biomédicaux rétractés et a constaté que 9,8 % des rétractations étaient dues au plagiat, tandis que la fraude et la publication en double représentaient la majorité. Cette étude a établi que le taux de rétractation dans la littérature scientifique avait décuplé depuis 1975.
En journalisme, l'Institut Poynter et d'autres organismes de déontologie des médias ont constaté une recrudescence des cas de plagiat dans les grands organes de presse. Des journalistes du New York Times, du Washington Post, de CNN et de Der Spiegel, entre autres, ont été impliqués. Une étude menée en 2014 par Honeycut et Freberg a révélé que ces affaires de plagiat contribuaient à accroître la méfiance du public envers les médias concernés et, plus généralement, envers les médias.
L'édition numérique a rendu le plagiat à la fois plus facile à commettre et plus facile à détecter. Les outils d'extraction de contenu peuvent dupliquer des articles sur des milliers de sites web quelques heures seulement après leur publication. Parallèlement, les outils de détection de plagiat permettent aux éditeurs de vérifier facilement le contenu entrant par rapport à des milliards de pages web indexées et de repérer les problèmes potentiels avant publication.
Les conséquences financières du plagiat touchent les individus, les institutions et les secteurs d'activité. Dans le milieu universitaire, les étudiants pris en flagrant délit de plagiat peuvent perdre leurs bourses, devoir supporter des frais de scolarité supplémentaires liés à leurs échecs, ou encore engager des poursuites judiciaires. Une étude menée en 2020 par la Quality Assurance Agency for Higher Education (QAA) au Royaume-Uni estimait que le marché mondial de la fraude à la tâche – où les étudiants rémunèrent des tiers pour la rédaction de leurs travaux – représentait plus d'un milliard de dollars par an.
Pour les éditeurs et les entreprises, le plagiat peut entraîner une responsabilité financière directe. Aux États-Unis, les poursuites pour violation de droits d'auteur aboutissent généralement à des dommages et intérêts légaux allant de 750 $ à 30 000 $ par œuvre contrefaite, les sanctions pour contrefaçon intentionnelle pouvant atteindre 150 000 $ par œuvre en vertu de la loi sur le droit d'auteur. La Guilde des auteurs et d'autres organisations similaires indiquent que le vol de contenu coûte chaque année aux auteurs et aux éditeurs des centaines de millions de dollars de pertes de revenus.
Les établissements supportent également des coûts. Les universités investissent des ressources considérables dans l'infrastructure d'intégrité académique : licences de logiciels de détection du plagiat, responsables de l'intégrité, procédures d'enquête et programmes de formation. D'après les budgets publiés par les établissements, les grandes universités peuvent dépenser entre 50 000 et 300 000 dollars, voire plus, par an pour les seuls services de détection du plagiat, notamment celles qui utilisent un modèle d'abonnement par étudiant.
Téléchargez une démo gratuite ou achetez une licence pour commencer à vérifier le plagiat et le contenu généré par l'IA.
La détection du plagiat est devenue une pratique courante dans l'enseignement et l'édition. Selon une enquête menée en 2022 par Educause, plus de 90 % des établissements d'enseignement supérieur aux États-Unis et au Royaume-Uni utilisent désormais un logiciel de détection du plagiat. Son adoption progresse rapidement en Asie, au Moyen-Orient et en Amérique latine, parallèlement à la sensibilisation croissante à l'intégrité académique à l'échelle mondiale.
L'intégration de la détection de contenu généré par IA dans les processus de vérification du plagiat représente la plus récente évolution en matière de technologies de prévention. Les établissements d'enseignement et les éditeurs recherchent de plus en plus des outils combinant la détection traditionnelle du plagiat et l'analyse par IA sur une plateforme unique. Les outils de bureau offrent un avantage supplémentaire aux organisations soucieuses de la confidentialité, car ils permettent de vérifier les documents sans les télécharger sur des serveurs cloud externes.
L'éducation demeure la stratégie de prévention à long terme la plus efficace. Les recherches de McCabe, Butterfield et Trevino (publiées dans leur ouvrage Cheating in College, Johns Hopkins University Press, 2012) ont démontré que les établissements dotés d'un code d'honneur et de programmes actifs d'éducation à l'intégrité enregistraient des taux de tricherie inférieurs de 25 à 50 % à ceux qui s'appuyaient uniquement sur la détection et la sanction. L'approche la plus efficace combine des politiques claires, des actions de sensibilisation et des technologies de détection fiables.