Научен архив

Независимо проверим рекорд в бенчмаркове, 2009 – 2026

Детектор за плагиатство не е черна кутия. Неговият двигател за засичане е участвал в основния научен бенчмарк в областта — състезанието PAN — и е бил оценяван от независими академични организатори в девет международни оценявания. Пълният архив е представен по-долу; всеки резултат е свързан с официалния си източник.

Водещ разработчик и изследовател: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · DBLP профил

Накратко В периода между 2009 и 2014 г. двигателят се е конкурирал във всичките шест годишни Международни състезания PAN за разпознаване на плагиатство и в две задачи за кръстосани езици PAN@FIRE в Индия — спечелвайки задачата CL!NSS на английски–хинди през 2012 г. През 2026 г. същата линия влезе в задачата Voight-Kampff за разпознаване на AI-генерирани текстове на PAN и отбеляза най-висок ROC-AUC (0.996) сред всички системи в оценяването, заемайки 3-то място от 34 отбора. Продуктът се предлага непрекъснато от 2007 г.

Пълен архив от състезания

Девет оценявания, всеки резултат с посочен източник

Година	Състезание	Място на провеждане	Задача	Класиране	Резултат	Източник
2009	1-во Международно състезание за разпознаване на плагиатство	PAN @ SEPLN · San Sebastián	Външно разпознаване	4 / 10	0.3045	преглед
2010	2-ро Международно състезание за разпознаване на плагиатство	PAN @ CLEF · Padua	Външно разпознаване	8 / 18	0.5093	преглед · статия
2011	3-то Международно състезание за разпознаване на плагиатство	PAN @ CLEF · Amsterdam	Външно (WordNet експеримент)	7 / 9	0.19	преглед · статия
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	Hindi↔English повторна употреба	4 (най-добро изпълнение)	F 0.603	класация · преглед
2012	4-то Международно състезание за разпознаване на плагиатство	PAN @ CLEF · Rome	Текстово изравняване	6 / 10	0.538	преглед · статия
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	Журналистическа повторна употреба (en→hi)	1 / 3	NDCG@10 0.34	преглед · статия
2013	5-то Международно състезание за разпознаване на плагиатство	PAN @ CLEF · Valencia	Текстово изравняване	6 / 9	0.61523	преглед · статия
2014	6-то Международно състезание за разпознаване на плагиатство 1ST*	PAN @ CLEF · Sheffield	Текстово изравняване	1 std · 3/10	0.868	преглед · статия
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	Разграничаване на човек от AI	3 / 34	ROC-AUC 0.996	класация

plagdet = общият резултат на PAN за разпознаване на плагиатство (комбинация от прецизност, пълнота и гранулярност). NDCG@10 = качество на класиране. ROC-AUC = качество на класификация, независимо от прага. *2014: 1-во място на стандартния тестови корпус, 3-то от 10 в официалния класиращ корпус. 2026: 3-то от 34 отбора; най-висок ROC-AUC сред всички отбори и базови линии.

От лабораторията до продукта

Методите, на които се доверявате

Всяко състезание е документирало техника, която е залегнала в основата на работещия двигател. Изследванията и софтуерът са от една линия — не маркетингови твърдения, а публикувани, рецензирани методи.

N-gram пръстови отпечатъци

Бързо разпознаване на кандидати за повторно използвани пасажи (PAN 2010, 2014).

Текстово изравняване

Прецизно съпоставяне на изходни ↔ подозрителни пасажи с висока точност (PAN 2012–2014).

Семантично и кръстоезиково сходство

WordNet и TF-IDF / методи за превод при парафразиране и кръстоезикова повторна употреба (PAN 2011; FIRE 2011–2012).

Разпознаване на AI-генерирани текстове

Разграничаване на човешко от машинно авторство — най-висок ROC-AUC на PAN 2026.

Рецензирани публикации

Библиография

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

За автора

Yurii Palkovskii

Изследовател и водещ разработчик · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор на седем рецензирани статии за разпознаване на плагиатство и AI-генерирани текстове в сборниците на CLEF/CEUR-WS и FIRE, с резултати, оценявани независимо от организационния комитет на PAN (Potthast, Stein, Rosso, Hagen и др.).

DBLP профил ↗

Изпробвайте AI и проверката за плагиатство →

Всяко класиране и резултат на тази страница са взети от официалния преглед на състезанието или от свързаната до него класация — независимо проверими от уебсайта. Продуктът е в активна разработка от 2007 г.; текуща версия #2965.