Wykrywacz plagiatów nie jest czarną skrzynką. Jego silnik wykrywania brał udział w głównym naukowym benchmarku tej dziedziny — konkursie PAN — i był oceniany przez niezależnych akademickich organizatorów w dziewięciu międzynarodowych ewaluacjach. Pełen rekord przedstawiono poniżej; każdy wynik zawiera odnośnik do oficjalnego źródła.
| Rok | Konkurs | Miejsce | Zadanie | Miejsce | Wynik | Źródło |
|---|---|---|---|---|---|---|
| 2009 | 1. Międzynarodowy Konkurs na Wykrywanie Plagiatów | PAN @ SEPLN · San Sebastián | Zewnętrzne wykrywanie | 4 / 10 | 0.3045 | przegląd |
| 2010 | 2. Międzynarodowy Konkurs na Wykrywanie Plagiatów | PAN @ CLEF · Padua | Zewnętrzne wykrywanie | 8 / 18 | 0.5093 | przegląd · artykuł |
| 2011 | 3. Międzynarodowy Konkurs na Wykrywanie Plagiatów | PAN @ CLEF · Amsterdam | Zewnętrzne (eksperyment WordNet) | 7 / 9 | 0.19 | przegląd · artykuł |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Ponowne użycie tekstu hindi↔angielski | 4 (najlepszy wynik) | F 0.603 | tabela wyników · przegląd |
| 2012 | 4. Międzynarodowy Konkurs na Wykrywanie Plagiatów | PAN @ CLEF · Rome | Wyrównanie tekstu | 6 / 10 | 0.538 | przegląd · artykuł |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Ponowne użycie dziennikarskie (en→hi) | 1 / 3 | NDCG@10 0.34 | przegląd · artykuł |
| 2013 | 5. Międzynarodowy Konkurs na Wykrywanie Plagiatów | PAN @ CLEF · Valencia | Wyrównanie tekstu | 6 / 9 | 0.61523 | przegląd · artykuł |
| 2014 | 6. Międzynarodowy Konkurs na Wykrywanie Plagiatów 1ST* | PAN @ CLEF · Sheffield | Wyrównanie tekstu | 1 std · 3/10 | 0.868 | przegląd · artykuł |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Tekst człowieka kontra AI | 3 / 34 | ROC-AUC 0.996 | tabela wyników |
plagdet = ogólny wynik PAN dla wykrywania plagiatów (precyzja, czułość i granularność łącznie). NDCG@10 = jakość rankingu. ROC-AUC = jakość klasyfikacji niezależna od progu. *2014: 1. miejsce na standardowym korpusie testowym, 3. miejsce wśród 10 na oficjalnym korpusie rankingowym. 2026: 3. miejsce wśród 34 zespołów; najwyższy ROC-AUC spośród wszystkich zespołów i wartości bazowych.
Każdy konkurs udokumentował technikę, która wpływa na działający silnik produktu. Badania i oprogramowanie stanowią jedną linię — nie są to twierdzenia marketingowe, lecz opublikowane, recenzowane przez specjalistów metody.
Szybkie wykrywanie kandydatów na ponownie użyte fragmenty tekstu (PAN 2010, 2014).
Precyzyjne dopasowanie fragmentów źródłowych ↔ podejrzanych z wysoką precyzją (PAN 2012–2014).
Metody WordNet i TF-IDF / tłumaczenia do wykrywania parafraz i ponownego użycia między językami (PAN 2011; FIRE 2011–2012).
Rozróżnianie autorstwa ludzkiego od maszynowego — najwyższy ROC-AUC na PAN 2026.