Перейти наверх
Научный рекорд

Независимо верифицируемый бенчмарк, 2009 – 2026

Детектор плагиата — не чёрный ящик. Его поисковый движок участвовал в главном научном бенчмарке в этой области — соревновании PAN — и оценивался независимыми академическими организаторами в ходе девяти международных оценок. Полная история результатов приведена ниже; каждый результат ссылается на официальный источник.

Кратко В период с 2009 по 2014 год движок участвовал во всех шести ежегодных международных соревнованиях PAN по обнаружению плагиата и в двух межъязыковых задачах PAN@FIRE в Индии — и победил в задаче CL!NSS (английский–хинди) в 2012 году. В 2026 году эта же разработка вышла на задачу PAN Voight-Kampff по обнаружению текстов генеративного ИИ и показала наивысший ROC-AUC (0.996) среди всех систем в оценке, заняв 3-е место из 34 команд. Продукт непрерывно поставляется с 2007 года.
Полная история соревнований

Девять оценок, каждый результат подтверждён источником

ГодСоревнованиеПлощадкаЗадачаМестоОценкаИсточник
20091-е Международное соревнование по обнаружению плагиатаPAN @ SEPLN · San SebastiánВнешнее обнаружение4 / 100.3045обзор
20102-е Международное соревнование по обнаружению плагиатаPAN @ CLEF · PaduaВнешнее обнаружение8 / 180.5093обзор · статья
20113-е Международное соревнование по обнаружению плагиатаPAN @ CLEF · AmsterdamВнешнее (эксперимент с WordNet)7 / 90.19обзор · статья
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiПовторное использование текстов хинди↔английский4 (лучший прогон)F 0.603таблица лидеров · обзор
20124-е Международное соревнование по обнаружению плагиатаPAN @ CLEF · RomeВыравнивание текстов6 / 100.538обзор · статья
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI KolkataЖурналистское повторное использование (en→hi)1 / 3NDCG@10 0.34обзор · статья
20135-е Международное соревнование по обнаружению плагиатаPAN @ CLEF · ValenciaВыравнивание текстов6 / 90.61523обзор · статья
20146-е Международное соревнование по обнаружению плагиата 1ST*PAN @ CLEF · SheffieldВыравнивание текстов1 std · 3/100.868обзор · статья
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · JenaЧеловек vs. ИИ-текст3 / 34ROC-AUC 0.996таблица лидеров

plagdet = общий балл PAN по обнаружению плагиата (точность, полнота и гранулярность в совокупности). NDCG@10 = качество ранжирования. ROC-AUC = качество классификации, независимое от порога. *2014: 1-е место на стандартном тестовом корпусе, 3-е из 10 на официальном ранжирующем корпусе. 2026: 3-е из 34 команд; наивысший ROC-AUC среди всех команд и базовых систем.

От лаборатории к продукту

Методы, которым вы доверяете

Каждое соревнование документировало технику, которая лежит в основе работающего движка. Исследования и программное обеспечение — единая линия преемственности, а не маркетинговые заявления, а опубликованные, прошедшие рецензирование методы.

N-gram-дактилоскопия

Быстрое обнаружение кандидатов для повторно использованных фрагментов (PAN 2010, 2014).

Выравнивание текстов

Точное сопоставление исходных ↔ подозрительных фрагментов с высокой точностью (PAN 2012–2014).

Семантическое и межъязыковое сходство

WordNet и TF-IDF / методы перевода для перефразирования и межъязыкового повторного использования (PAN 2011; FIRE 2011–2012).

Обнаружение текстов, созданных ИИ

Разграничение авторства человека и машины — наивысший ROC-AUC на PAN 2026.

Рецензируемые публикации

Библиография

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
Об авторе
YP

Yurii Palkovskii

Исследователь и ведущий разработчик · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор семи рецензируемых статей об обнаружении плагиата и текстов, сгенерированных ИИ, опубликованных в материалах CLEF/CEUR-WS и FIRE, с результатами, независимо оценёнными организационным комитетом PAN (Potthast, Stein, Rosso, Hagen и др.).

Каждое место и каждый балл на этой странице взяты из официального обзорного доклада соревнования или таблицы лидеров, на которую дана ссылка рядом, — и могут быть проверены независимо от этого сайта. Продукт активно разрабатывается с 2007 года; текущая сборка #2965.