Наукові досягнення

Незалежно верифікований рекорд бенчмарку, 2009 – 2026

Детектор плагіату — не чорна скринька. Його рушій виявлення брав участь у головному науковому бенчмарку галузі — змаганні PAN — і оцінювався незалежними академічними організаторами в дев'яти міжнародних оцінюваннях. Повний рекорд наведено нижче; кожен результат посилається на офіційне джерело.

Провідний розробник та дослідник: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · Профіль DBLP

Коротко З 2009 по 2014 рік рушій брав участь у всіх шести щорічних міжнародних змаганнях PAN з виявлення плагіату та у двох міжмовних завданнях PAN@FIRE в Індії — перемігши у завданні англійська–гінді CL!NSS у 2012 році. У 2026 році та сама лінія взяла участь у завданні PAN Voight-Kampff Generative AI Detection і показала найвищий ROC-AUC (0.996) серед усіх систем в оцінюванні, посівши 3-тє місце серед 34 команд. Продукт безперервно постачається з 2007 року.

Повний рекорд змагань

Дев'ять оцінювань, кожен результат із джерелом

Рік	Змагання	Майданчик	Завдання	Місце	Результат	Джерело
2009	1-е Міжнародне змагання з виявлення плагіату	PAN @ SEPLN · San Sebastián	Зовнішнє виявлення	4 / 10	0.3045	огляд
2010	2-е Міжнародне змагання з виявлення плагіату	PAN @ CLEF · Padua	Зовнішнє виявлення	8 / 18	0.5093	огляд · стаття
2011	3-є Міжнародне змагання з виявлення плагіату	PAN @ CLEF · Amsterdam	Зовнішнє (експеримент з WordNet)	7 / 9	0.19	огляд · стаття
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	Повторне використання гінді↔англійська	4 (найкращий запуск)	F 0.603	таблиця лідерів · огляд
2012	4-е Міжнародне змагання з виявлення плагіату	PAN @ CLEF · Rome	Вирівнювання тексту	6 / 10	0.538	огляд · стаття
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	Журналістське повторне використання (en→hi)	1 / 3	NDCG@10 0.34	огляд · стаття
2013	5-е Міжнародне змагання з виявлення плагіату	PAN @ CLEF · Valencia	Вирівнювання тексту	6 / 9	0.61523	огляд · стаття
2014	6-е Міжнародне змагання з виявлення плагіату 1ST*	PAN @ CLEF · Sheffield	Вирівнювання тексту	1 std · 3/10	0.868	огляд · стаття
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	Текст людина проти ШІ	3 / 34	ROC-AUC 0.996	таблиця лідерів

plagdet = загальний бал PAN з виявлення плагіату (точність, повнота та гранулярність разом). NDCG@10 = якість ранжування. ROC-AUC = якість класифікації незалежно від порогу. *2014: 1-ше місце на стандартному тестовому корпусі, 3-тє з 10 на офіційному корпусі ранжування. 2026: 3-тє з 34 команд; найвищий ROC-AUC серед будь-якої команди або базової лінії.

Від лабораторії до продукту

Методи, яким ви довіряєте

Кожне змагання задокументувало техніку, яка лежить в основі робочого рушія. Дослідження та програмне забезпечення — це одна лінія наступництва, а не маркетингові твердження, а опубліковані рецензовані методи.

N-gram фінгерпринтинг

Швидке виявлення кандидатів у повторно використаних уривках (PAN 2010, 2014).

Вирівнювання тексту

Точне зіставлення вихідних ↔ підозрілих уривків із високою точністю (PAN 2012–2014).

Семантична та міжмовна схожість

WordNet і TF-IDF / методи перекладу для парафразу та міжмовного повторного використання (PAN 2011; FIRE 2011–2012).

Виявлення тексту, згенерованого ШІ

Розрізнення авторства людини та машини — найвищий ROC-AUC на PAN 2026.

Рецензовані публікації

Бібліографія

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

Про автора

Yurii Palkovskii

Дослідник і провідний розробник · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор семи рецензованих статей з виявлення плагіату та тексту, згенерованого ШІ, у матеріалах CLEF/CEUR-WS і FIRE, результати яких незалежно оцінювались організаційним комітетом PAN (Potthast, Stein, Rosso, Hagen та ін.).

Профіль DBLP ↗

Спробувати перевірку ШІ та плагіату →

Кожне місце та кожен результат на цій сторінці взяті з офіційного оглядового документа змагання або таблиці лідерів, посилання на яку наведено поруч — незалежно верифіковано без прив'язки до цього сайту. Продукт активно розробляється з 2007 року; поточна збірка #2965.