Отидете до върха
Научен архив

Независимо проверим рекорд в бенчмаркове, 2009 – 2026

Детектор за плагиатство не е черна кутия. Неговият двигател за засичане е участвал в основния научен бенчмарк в областта — състезанието PAN — и е бил оценяван от независими академични организатори в девет международни оценявания. Пълният архив е представен по-долу; всеки резултат е свързан с официалния си източник.

Накратко В периода между 2009 и 2014 г. двигателят се е конкурирал във всичките шест годишни Международни състезания PAN за разпознаване на плагиатство и в две задачи за кръстосани езици PAN@FIRE в Индия — спечелвайки задачата CL!NSS на английски–хинди през 2012 г. През 2026 г. същата линия влезе в задачата Voight-Kampff за разпознаване на AI-генерирани текстове на PAN и отбеляза най-висок ROC-AUC (0.996) сред всички системи в оценяването, заемайки 3-то място от 34 отбора. Продуктът се предлага непрекъснато от 2007 г.
Пълен архив от състезания

Девет оценявания, всеки резултат с посочен източник

ГодинаСъстезаниеМясто на провежданеЗадачаКласиранеРезултатИзточник
20091-во Международно състезание за разпознаване на плагиатствоPAN @ SEPLN · San SebastiánВъншно разпознаване4 / 100.3045преглед
20102-ро Международно състезание за разпознаване на плагиатствоPAN @ CLEF · PaduaВъншно разпознаване8 / 180.5093преглед · статия
20113-то Международно състезание за разпознаване на плагиатствоPAN @ CLEF · AmsterdamВъншно (WordNet експеримент)7 / 90.19преглед · статия
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiHindi↔English повторна употреба4 (най-добро изпълнение)F 0.603класация · преглед
20124-то Международно състезание за разпознаване на плагиатствоPAN @ CLEF · RomeТекстово изравняване6 / 100.538преглед · статия
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI KolkataЖурналистическа повторна употреба (en→hi)1 / 3NDCG@10 0.34преглед · статия
20135-то Международно състезание за разпознаване на плагиатствоPAN @ CLEF · ValenciaТекстово изравняване6 / 90.61523преглед · статия
20146-то Международно състезание за разпознаване на плагиатство 1ST*PAN @ CLEF · SheffieldТекстово изравняване1 std · 3/100.868преглед · статия
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · JenaРазграничаване на човек от AI3 / 34ROC-AUC 0.996класация

plagdet = общият резултат на PAN за разпознаване на плагиатство (комбинация от прецизност, пълнота и гранулярност). NDCG@10 = качество на класиране. ROC-AUC = качество на класификация, независимо от прага. *2014: 1-во място на стандартния тестови корпус, 3-то от 10 в официалния класиращ корпус. 2026: 3-то от 34 отбора; най-висок ROC-AUC сред всички отбори и базови линии.

От лабораторията до продукта

Методите, на които се доверявате

Всяко състезание е документирало техника, която е залегнала в основата на работещия двигател. Изследванията и софтуерът са от една линия — не маркетингови твърдения, а публикувани, рецензирани методи.

N-gram пръстови отпечатъци

Бързо разпознаване на кандидати за повторно използвани пасажи (PAN 2010, 2014).

Текстово изравняване

Прецизно съпоставяне на изходни ↔ подозрителни пасажи с висока точност (PAN 2012–2014).

Семантично и кръстоезиково сходство

WordNet и TF-IDF / методи за превод при парафразиране и кръстоезикова повторна употреба (PAN 2011; FIRE 2011–2012).

Разпознаване на AI-генерирани текстове

Разграничаване на човешко от машинно авторство — най-висок ROC-AUC на PAN 2026.

Рецензирани публикации

Библиография

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
За автора
YP

Yurii Palkovskii

Изследовател и водещ разработчик · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор на седем рецензирани статии за разпознаване на плагиатство и AI-генерирани текстове в сборниците на CLEF/CEUR-WS и FIRE, с резултати, оценявани независимо от организационния комитет на PAN (Potthast, Stein, Rosso, Hagen и др.).

Всяко класиране и резултат на тази страница са взети от официалния преглед на състезанието или от свързаната до него класация — независимо проверими от уебсайта. Продуктът е в активна разработка от 2007 г.; текуща версия #2965.