Przejdź do góry
Dorobek naukowy

Niezależnie weryfikowalny rekord wyników, 2009 – 2026

Wykrywacz plagiatów nie jest czarną skrzynką. Jego silnik wykrywania brał udział w głównym naukowym benchmarku tej dziedziny — konkursie PAN — i był oceniany przez niezależnych akademickich organizatorów w dziewięciu międzynarodowych ewaluacjach. Pełen rekord przedstawiono poniżej; każdy wynik zawiera odnośnik do oficjalnego źródła.

W skrócie W latach 2009–2014 silnik brał udział we wszystkich sześciu dorocznych Międzynarodowych Konkursach PAN na Wykrywanie Plagiatów oraz w dwóch zadaniach wielojęzycznych PAN@FIRE w Indiach — zwyciężając w zadaniu CL!NSS angielsko-hindi w 2012 roku. W 2026 roku ta sama linia badawcza wzięła udział w zadaniu PAN Voight-Kampff Generative AI Detection i osiągnęła najwyższy wynik ROC-AUC (0.996) spośród wszystkich systemów w ewaluacji, zajmując 3. miejsce wśród 34 zespołów. Produkt jest dostępny nieprzerwanie od 2007 roku.
Pełny rekord konkursowy

Dziewięć ewaluacji, każdy wynik z podanym źródłem

RokKonkursMiejsceZadanieMiejsceWynikŹródło
20091. Międzynarodowy Konkurs na Wykrywanie PlagiatówPAN @ SEPLN · San SebastiánZewnętrzne wykrywanie4 / 100.3045przegląd
20102. Międzynarodowy Konkurs na Wykrywanie PlagiatówPAN @ CLEF · PaduaZewnętrzne wykrywanie8 / 180.5093przegląd · artykuł
20113. Międzynarodowy Konkurs na Wykrywanie PlagiatówPAN @ CLEF · AmsterdamZewnętrzne (eksperyment WordNet)7 / 90.19przegląd · artykuł
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiPonowne użycie tekstu hindi↔angielski4 (najlepszy wynik)F 0.603tabela wyników · przegląd
20124. Międzynarodowy Konkurs na Wykrywanie PlagiatówPAN @ CLEF · RomeWyrównanie tekstu6 / 100.538przegląd · artykuł
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI KolkataPonowne użycie dziennikarskie (en→hi)1 / 3NDCG@10 0.34przegląd · artykuł
20135. Międzynarodowy Konkurs na Wykrywanie PlagiatówPAN @ CLEF · ValenciaWyrównanie tekstu6 / 90.61523przegląd · artykuł
20146. Międzynarodowy Konkurs na Wykrywanie Plagiatów 1ST*PAN @ CLEF · SheffieldWyrównanie tekstu1 std · 3/100.868przegląd · artykuł
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · JenaTekst człowieka kontra AI3 / 34ROC-AUC 0.996tabela wyników

plagdet = ogólny wynik PAN dla wykrywania plagiatów (precyzja, czułość i granularność łącznie). NDCG@10 = jakość rankingu. ROC-AUC = jakość klasyfikacji niezależna od progu. *2014: 1. miejsce na standardowym korpusie testowym, 3. miejsce wśród 10 na oficjalnym korpusie rankingowym. 2026: 3. miejsce wśród 34 zespołów; najwyższy ROC-AUC spośród wszystkich zespołów i wartości bazowych.

Od laboratorium do produktu

Metody, którym możesz zaufać

Każdy konkurs udokumentował technikę, która wpływa na działający silnik produktu. Badania i oprogramowanie stanowią jedną linię — nie są to twierdzenia marketingowe, lecz opublikowane, recenzowane przez specjalistów metody.

Odcisk palca N-gram

Szybkie wykrywanie kandydatów na ponownie użyte fragmenty tekstu (PAN 2010, 2014).

Wyrównanie tekstu

Precyzyjne dopasowanie fragmentów źródłowych ↔ podejrzanych z wysoką precyzją (PAN 2012–2014).

Podobieństwo semantyczne i wielojęzyczne

Metody WordNet i TF-IDF / tłumaczenia do wykrywania parafraz i ponownego użycia między językami (PAN 2011; FIRE 2011–2012).

Wykrywanie tekstów generowanych przez AI

Rozróżnianie autorstwa ludzkiego od maszynowego — najwyższy ROC-AUC na PAN 2026.

Publikacje recenzowane przez specjalistów

Bibliografia

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
O autorze
YP

Yurii Palkovskii

Badacz i główny programista · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Autor siedmiu recenzowanych artykułów naukowych na temat wykrywania plagiatów i tekstów generowanych przez AI w materiałach CLEF/CEUR-WS i FIRE, z wynikami niezależnie ocenianymi przez komitet organizacyjny PAN (Potthast, Stein, Rosso, Hagen i in.).

Każdy wynik i pozycja rankingowa na tej stronie pochodzi z oficjalnego artykułu przeglądowego lub tabeli wyników danego konkursu, podanych obok — weryfikowalnych niezależnie od tej witryny. Produkt w aktywnym rozwoju od 2007 roku; bieżące wydanie #2965.