Научный рекорд

Независимо верифицируемый бенчмарк, 2009 – 2026

Детектор плагиата — не чёрный ящик. Его поисковый движок участвовал в главном научном бенчмарке в этой области — соревновании PAN — и оценивался независимыми академическими организаторами в ходе девяти международных оценок. Полная история результатов приведена ниже; каждый результат ссылается на официальный источник.

Ведущий разработчик и исследователь: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · Профиль в DBLP

Кратко В период с 2009 по 2014 год движок участвовал во всех шести ежегодных международных соревнованиях PAN по обнаружению плагиата и в двух межъязыковых задачах PAN@FIRE в Индии — и победил в задаче CL!NSS (английский–хинди) в 2012 году. В 2026 году эта же разработка вышла на задачу PAN Voight-Kampff по обнаружению текстов генеративного ИИ и показала наивысший ROC-AUC (0.996) среди всех систем в оценке, заняв 3-е место из 34 команд. Продукт непрерывно поставляется с 2007 года.

Полная история соревнований

Девять оценок, каждый результат подтверждён источником

Год	Соревнование	Площадка	Задача	Место	Оценка	Источник
2009	1-е Международное соревнование по обнаружению плагиата	PAN @ SEPLN · San Sebastián	Внешнее обнаружение	4 / 10	0.3045	обзор
2010	2-е Международное соревнование по обнаружению плагиата	PAN @ CLEF · Padua	Внешнее обнаружение	8 / 18	0.5093	обзор · статья
2011	3-е Международное соревнование по обнаружению плагиата	PAN @ CLEF · Amsterdam	Внешнее (эксперимент с WordNet)	7 / 9	0.19	обзор · статья
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	Повторное использование текстов хинди↔английский	4 (лучший прогон)	F 0.603	таблица лидеров · обзор
2012	4-е Международное соревнование по обнаружению плагиата	PAN @ CLEF · Rome	Выравнивание текстов	6 / 10	0.538	обзор · статья
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	Журналистское повторное использование (en→hi)	1 / 3	NDCG@10 0.34	обзор · статья
2013	5-е Международное соревнование по обнаружению плагиата	PAN @ CLEF · Valencia	Выравнивание текстов	6 / 9	0.61523	обзор · статья
2014	6-е Международное соревнование по обнаружению плагиата 1ST*	PAN @ CLEF · Sheffield	Выравнивание текстов	1 std · 3/10	0.868	обзор · статья
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	Человек vs. ИИ-текст	3 / 34	ROC-AUC 0.996	таблица лидеров

plagdet = общий балл PAN по обнаружению плагиата (точность, полнота и гранулярность в совокупности). NDCG@10 = качество ранжирования. ROC-AUC = качество классификации, независимое от порога. *2014: 1-е место на стандартном тестовом корпусе, 3-е из 10 на официальном ранжирующем корпусе. 2026: 3-е из 34 команд; наивысший ROC-AUC среди всех команд и базовых систем.

От лаборатории к продукту

Методы, которым вы доверяете

Каждое соревнование документировало технику, которая лежит в основе работающего движка. Исследования и программное обеспечение — единая линия преемственности, а не маркетинговые заявления, а опубликованные, прошедшие рецензирование методы.

N-gram-дактилоскопия

Быстрое обнаружение кандидатов для повторно использованных фрагментов (PAN 2010, 2014).

Выравнивание текстов

Точное сопоставление исходных ↔ подозрительных фрагментов с высокой точностью (PAN 2012–2014).

Семантическое и межъязыковое сходство

WordNet и TF-IDF / методы перевода для перефразирования и межъязыкового повторного использования (PAN 2011; FIRE 2011–2012).

Обнаружение текстов, созданных ИИ

Разграничение авторства человека и машины — наивысший ROC-AUC на PAN 2026.

Рецензируемые публикации

Библиография

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

Об авторе

Yurii Palkovskii

Исследователь и ведущий разработчик · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор семи рецензируемых статей об обнаружении плагиата и текстов, сгенерированных ИИ, опубликованных в материалах CLEF/CEUR-WS и FIRE, с результатами, независимо оценёнными организационным комитетом PAN (Potthast, Stein, Rosso, Hagen и др.).

Профиль в DBLP ↗

Попробуйте ИИ и детектор плагиата →

Каждое место и каждый балл на этой странице взяты из официального обзорного доклада соревнования или таблицы лидеров, на которую дана ссылка рядом, — и могут быть проверены независимо от этого сайта. Продукт активно разрабатывается с 2007 года; текущая сборка #2965.