Плагиат — мировая проблема, затрагивающая каждый сектор, производящий письменный контент. Согласно исследованию, опубликованному Международным центром академической честности (ICAI), около 68% студентов бакалавриата признали участие в той или иной форме письменного мошенничества, включая плагиат, за годы учёбы. Этот показатель остаётся удивительно стабильным в нескольких волнах опросов, охватывающих более двух десятилетий исследований Дональда Маккейба и его коллег.
Масштабный мета-анализ, опубликованный в PLOS ONE (Pupovac & Fanelli, 2015), изучил самоотчёты о плагиате в 54 исследованиях и обнаружил объединённую распространённость примерно 30% студентов, признавших хотя бы один случай плагиата. Исследование отметило значительные региональные различия: в некоторых странах отмечаются показатели выше 50%, в других — ниже 10%, что отражает различия в культурных установках, институциональных мерах и осведомлённости о нормах в отношении плагиата.
Проблема выходит за рамки академической среды. Отчёт 2019 года компании iThenticate (дочерней компании Turnitin), проведшей опрос редакторов и исследователей, установил, что каждая 6-я представленная рукопись в академических журналах содержала значительное текстовое перекрытие с ранее опубликованными материалами. В журналистике и издательском деле скандалы с плагиатом регулярно всплывают: в последние годы громкие случаи фиксировались в крупных новостных организациях.
Исследования академической нечестности неизменно показывают, что плагиат широко распространён на всех уровнях образования. Центр академической честности Маккейба (бывший Международный центр академической честности) собрал данные от более чем 71 000 студентов бакалавриата и 17 000 аспирантов по всей Северной Америке. Их результаты показывают, что 39% студентов бакалавриата признались в пересказе или копировании нескольких предложений из интернет-источника без цитирования, а 62% студентов бакалавриата признали хотя бы одно серьёзное нарушение в письменных заданиях.
Опрос Turnitin 2023 года показал, что среди работ, обрабатываемых через их систему, около 11% студенческих работ содержали значительное текстовое перекрытие (выше 25% сходства) из неатрибутированных источников. Отдельное исследование Bretag et al. (2019), опубликованное в Studies in Higher Education, опросило 14 086 студентов из восьми австралийских университетов и установило, что 6,5% признались в покупке или аутсорсинге заданий (контрактное мошенничество) — особенно тяжкая форма академического мошенничества.
Плагиат на уровне аспирантуры изучен меньше, но не является редкостью. Управление по исследовательской честности (ORI) в США с момента создания расследовало сотни случаев научного проступка, при этом плагиат и фабрикация данных являются ведущими категориями. Исследование Хайтмана и Литевки (2011), опубликованное в Developing World Bioethics, показало, что плагиат в научных публикациях был более распространён в развивающихся странах — частично из-за языкового барьера и различных академических норм.
Выпуск ChatGPT в ноябре 2022 года ознаменовал поворотный момент в академической честности. Опрос, проведённый исследовательской группой Human-Centered Artificial Intelligence Стэнфордского университета, показал, что примерно 17% опрошенных студентов колледжей использовали ИИ-инструменты для выполнения заданий в 2022–2023 учебном году. Последующие опросы свидетельствуют о том, что этот показатель существенно вырос.
Turnitin сообщил в 2024 году, что их система обнаружения ИИ отметила от 6% до 11% представленных студенческих работ как содержащих значительный контент, созданный ИИ (определяемый как 80% или более текста, написанного ИИ). Опрос BestColleges (2023) показал, что 56% студентов колледжей использовали ИИ-инструменты для учебных заданий, при этом около половины из них признали, что их учреждения считали подобное использование формой мошенничества или плагиата.
Проблема контента, созданного ИИ, выходит за рамки образования. Анализ 2024 года компании Originality.AI показал, что значительная и растущая доля вновь публикуемого веб-контента демонстрирует признаки ИИ-генерации. Это создаёт новые проблемы для инструментов обнаружения плагиата, которые теперь должны различать оригинальный человеческий текст, плагиатный человеческий текст и текст, созданный ИИ, — три принципиально разные категории, требующие различных подходов к обнаружению.
Плагиат в профессиональном издательстве влечёт последствия, далеко выходящие за рамки индивидуальных карьер. Исследование Fang, Steen и Casadevall (2012), опубликованное в Proceedings of the National Academy of Sciences, проанализировало 2 047 отозванных биомедицинских работ и установило, что 9,8% отзывов были обусловлены плагиатом, тогда как мошенничество и дублированные публикации составляли большинство. Исследование установило, что число отзывов в научной литературе увеличилось в десять раз с 1975 года.
В журналистике Институт Пойнтера и другие организации по медиаэтике задокументировали паттерн громких случаев плагиата в крупных новостных организациях. Случаи затронули репортёров The New York Times, The Washington Post, CNN и Der Spiegel, среди других. Исследование Хонникатта и Фреберга 2014 года показало, что случаи журналистского плагиата усилили недоверие общества к пострадавшим новостным организациям и к СМИ в целом.
Цифровое издательство сделало плагиат одновременно и более лёгким, и более лёгким для обнаружения. Инструменты скрейпинга контента могут копировать статьи на тысячи веб-сайтов в течение нескольких часов после публикации. В то же время инструменты обнаружения плагиата упрощают для издателей проверку поступающего контента по миллиардам проиндексированных веб-страниц и выявление потенциальных проблем до публикации.
Финансовые последствия плагиата затрагивают физических лиц, учреждения и отрасли. В академической среде студенты, уличённые в плагиате, могут лишиться стипендий, столкнуться с расходами, связанными с непрохождением курсов, или понести расходы по судебным разбирательствам. Исследование 2020 года Агентства по обеспечению качества высшего образования (QAA) в Великобритании оценило, что глобальный рынок контрактного мошенничества — где студенты платят третьим лицам за написание заданий — составлял более 1 миллиарда долларов в год.
Для издателей и предприятий плагиат может повлечь прямую финансовую ответственность. Судебные иски о нарушении авторских прав в США регулярно приводят к установленным законом убыткам в размере от 750 до 30 000 долларов за каждое нарушенное произведение, при этом за умышленное нарушение санкции достигают 150 000 долларов за произведение согласно Закону об авторском праве. Гильдия авторов и аналогичные организации сообщают, что кража контента ежегодно обходится авторам и издателям в сотни миллионов долларов упущенного дохода.
Учреждения также несут расходы. Университеты вкладывают значительные ресурсы в инфраструктуру академической честности — лицензии на программы обнаружения плагиата, сотрудников по вопросам честности, следственные процессы и образовательные программы. Согласно институциональным раскрытиям бюджета, крупные университеты могут тратить 50 000–300 000 долларов и более ежегодно только на сервисы обнаружения плагиата — особенно использующие модели ценообразования по подписке на студента.
Скачайте бесплатную демо-версию или приобретите лицензию, чтобы начать проверку на плагиат и контент, сгенерированный ИИ.
Технология обнаружения плагиата стала стандартной практикой в образовании и издательском деле. Согласно опросу Educause 2022 года, более 90% учреждений высшего образования в США и Великобритании теперь используют ту или иную форму программного обеспечения для обнаружения плагиата. Темпы внедрения быстро растут в Азии, на Ближнем Востоке и в Латинской Америке по мере глобального роста осведомлённости об академической честности.
Интеграция обнаружения контента ИИ в процессы проверки на плагиат представляет собой новейшую эволюцию в технологии предотвращения. Учреждения и издатели всё активнее ищут инструменты, объединяющие традиционное обнаружение плагиата с анализом ИИ на единой платформе. Настольные инструменты предоставляют дополнительное преимущество для организаций, дорожащих конфиденциальностью, поскольку позволяют проверять документы без их загрузки на внешние облачные серверы.
Образование остаётся наиболее эффективной долгосрочной стратегией предотвращения. Исследование Маккейба, Баттерфилда и Тревино (опубликованное в их книге Cheating in College, издательство Johns Hopkins University Press, 2012) показало, что учреждения с кодексами чести и активными образовательными программами по вопросам честности демонстрировали уровни мошенничества на 25–50% ниже, чем те, которые полагались исключительно на обнаружение и наказание. Наиболее эффективный подход сочетает чёткие политики, образовательно-просветительскую работу и надёжную технологию обнаружения.