Плагіат — це всесвітня проблема, яка впливає на кожен сектор, що створює письмовий контент. Згідно з дослідженням, опублікованим Міжнародним центром академічної доброчесності (ICAI), приблизно 68% студентів бакалаврату зізналися, що вдавалися до тієї чи іншої форми письмового шахрайства, включаючи плагіат, під час своєї академічної кар'єри. Цей показник залишається разюче стабільним протягом кількох хвиль опитувань, що охоплюють понад два десятиліття досліджень Дональда Маккейба та його колег.
Масштабний метааналіз, опублікований у PLOS ONE (Pupovac &Fanelli, 2015), дослідив рівень самостійно повідомленого плагіату у 54 дослідженнях і виявив сукупну поширеність приблизно 30% студентів, які визнали принаймні один випадок плагіату. У дослідженні відзначено значні відмінності за регіонами, причому деякі країни повідомляють про рівень вище 50%, а інші — нижче 10%, що відображає відмінності в культурних установках, інституційному забезпеченні дотримання законодавства та обізнаності про норми плагіату.
Проблема виходить за межі академічних кіл. Звіт iThenticate (компанії Turnitin) за 2019 рік, в якому було проведено опитування редакторів та дослідників, показав, що кожен шостий поданий до академічних журналів рукопис містить значний перетин тексту з раніше опублікованим матеріалом. У журналістиці та видавничій справі скандали з плагіатом продовжують регулярно виникати, і в останні роки гучні випадки були зареєстровані у великих новинних організаціях.
Дослідження академічної нечесності постійно показують, що плагіат поширений на всіх рівнях освіти. Центр академічної доброчесності Маккейба (раніше Міжнародний центр академічної доброчесності) зібрав дані понад 71 000 студентів бакалаврату та 17 000 аспірантів по всій Північній Америці. Їхні результати показують, що 39% студентів бакалаврату зізналися у перефразуванні або копіюванні кількох речень з інтернет-джерела без посилання на нього, а 62% студентів бакалаврату зізналися принаймні у одному серйозному шахрайстві під час письмових завдань.
Згідно з опитуванням Turnitin, проведеним у 2023 році, серед робіт, оброблених через їхню систему, приблизно 11% студентських робіт містили значне перекриття тексту (понад 25% подібності) з невказаних джерел. В окремому дослідженні Бретага та ін. (2019), опублікованому в «Дослідженнях у вищій освіті», опитано 14 086 студентів з восьми австралійських університетів і виявлено, що 6,5% зізналися у закупівлі або аутсорсингу завдань (обман у контрактах), що є особливо серйозною формою академічного шахрайства.
Плагіат на рівні аспірантури вивчений менш, але не є рідкістю. Управління дослідницької доброчесності (ORI) у Сполучених Штатах розслідувало сотні випадків неправомірних дій у дослідницькій діяльності з моменту свого створення, де плагіат та фальсифікація даних були основними категоріями. Дослідження Хейтмана та Літевки (2011), опубліковане в журналі «Біоетика країн, що розвиваються», показало, що плагіат у наукових публікаціях був більш поширеним у країнах, що розвиваються, частково через мовні бар'єри та різні академічні норми.
Випуск ChatGPT у листопаді 2022 року ознаменував поворотний момент в академічній доброчесності. Опитування, проведене дослідницькою групою Stanford University's Human-Centered Artificial Intelligence показало, що приблизно 17% опитаних студентів коледжів повідомили про використання інструментів штучного інтелекту для виконання завдань у 2022-2023 навчальному році. Подальші опитування показують, що ця цифра значно зросла.
У 2024 році Turnitin повідомив, що їхня система ШІ-виявлення позначила від 6% до 11% поданих студентських робіт як такі, що містять значну частину ШІ-контенту (визначеного як 80% або більше ШІ-згенерованого тексту). Опитування BestColleges (2023) показало, що 56% студентів коледжів використовували ШІ-інструменти для курсової роботи, причому близько половини з них визнали, що їхні навчальні заклади вважають таке використання формою шахрайства або плагіату.
Проблема ШІ-контенту виходить за рамки освіти. Аналіз Originality.AI, проведений у 2024 році, показав, що значний і зростаючий відсоток нещодавно опублікованого веб-контенту має ознаки ШІ-генерування. Це створює нові виклики для інструментів виявлення плагіату, які тепер повинні розрізняти оригінальний текст, написаний людиною, плагіатований текст, написаний людиною, та ШІ-згенерований текст — три різні категорії, що потребують різних підходів до виявлення.
Плагіат у професійних публікаціях має наслідки, які виходять далеко за рамки індивідуальної кар'єри. У дослідженні Фанга, Стіна та Касадеваля (2012), опублікованому в Proceedings of the National Academy of Sciences, було проаналізовано 2047 відкликаних біомедичних статей і виявлено, що 9,8% відкликань були пов'язані з плагіатом, тоді як шахрайство та дублікати публікацій становили більшість. Дослідження встановило, що показники відкликань у науковій літературі зросли вдесятеро з 1975 року.
У журналістиці Інститут Пойнтера та інші організації з медіа-етики задокументували тенденцію до гучних випадків плагіату у великих новинних організаціях. Справи стосувалися, серед інших, репортерів The New York Times, The Washington Post, CNN та Der Spiegel . Дослідження Honeycut та Freberg 2014 року показало, що випадки плагіату журналістів посилили недовіру громадськості до постраждалих новинних організацій та медіа загалом.
Цифрове видавництво спростило як вчинення, так і виявлення плагіату. Інструменти для парсингу контенту можуть копіювати статті на тисячах веб-сайтів протягом кількох годин після публікації. Водночас інструменти виявлення плагіату спрощують для видавців перевірку вхідного контенту на мільярдах проіндексованих веб-сторінок та позначання потенційних проблем перед публікацією.
Фінансові наслідки плагіату впливають на окремих осіб, установи та галузі промисловості. В академічних колах студенти, яких викриють на плагіаті, можуть втратити стипендії, зіткнутися з витратами на навчання через невдалі курси або понести витрати, пов’язані з судовими процесами. Дослідження, проведене Агентством із забезпечення якості вищої освіти (QAA) у Великій Британії у 2020 році, оцінило світовий ринок шахрайства з контрактами, де студенти платять третім сторонам за написання їхніх завдань, вартістю понад 1 мільярд доларів на рік.
Для видавців та підприємств плагіат може призвести до прямої фінансової відповідальності. Позови про порушення авторських прав у Сполучених Штатах зазвичай призводять до законодавчо встановлених збитків у розмірі від 750 до 30 000 доларів США за кожен порушений твір, а штрафи за навмисне порушення авторських прав сягають 150 000 доларів США за кожен твір згідно із Законом про авторське право. Гільдія авторів та подібні організації повідомляють, що крадіжка контенту щорічно коштує авторам та видавцям сотень мільйонів доларів у вигляді втраченого доходу.
Установи також несуть витрати. Університети інвестують значні ресурси в інфраструктуру академічної доброчесності — ліцензії на програмне забезпечення для виявлення плагіату, співробітників з питань доброчесності, процеси розслідування та освітні програми. Згідно з розкриттям інформації про бюджет установ, великі університети можуть витрачати від 50 000 до 300 000 доларів США або більше щорічно лише на послуги з виявлення плагіату, особливо ті, що використовують моделі ціноутворення на основі підписки на одного студента.
Завантажте безкоштовну демо-версію або придбайте ліцензію, щоб розпочати перевірку на плагіат та контент, створений штучним інтелектом.
Технологія виявлення плагіату стала стандартною практикою в освіті та видавничій справі. Згідно з опитуванням Educause 2022 року, понад 90% вищих навчальних закладів у Сполучених Штатах та Великій Британії зараз використовують певну форму програмного забезпечення для виявлення плагіату. Темпи впровадження швидко зростають в Азії, на Близькому Сході та в Латинській Америці, оскільки обізнаність про академічну доброчесність зростає в усьому світі.
Інтеграція виявлення ШІ-контенту в робочі процеси перевірки на плагіат являє собою новітній етап розвитку технологій запобігання. Установи та видавці все частіше шукають інструменти, які поєднують традиційне виявлення плагіату з ШІ-аналізом в одній платформі. Десктопні інструменти пропонують додаткову перевагу для організацій, що дбають про конфіденційність, оскільки вони дозволяють перевіряти документи без їх завантаження на зовнішні хмарні сервери.
Освіта залишається найефективнішою довгостроковою стратегією запобігання. Дослідження Маккейба, Баттерфілда та Тревіно (опубліковане в їхній книзі «Шахрайство в коледжі», видавництво Університету Джонса Гопкінса, 2012) показало, що в установах з кодексами честі та активними програмами навчання доброчесності рівень шахрайства був на 25-50% нижчим, ніж у тих, хто покладається виключно на виявлення та покарання. Найефективніший підхід поєднує чітку політику, освітню діяльність та надійні технології виявлення.