Il Rilevatore di Plagio non è una scatola nera. Il suo motore di rilevamento ha partecipato al principale benchmark scientifico del settore — la competizione PAN — ed è stato valutato da organizzatori accademici indipendenti nel corso di nove valutazioni internazionali. Il record completo è riportato di seguito; ogni risultato rimanda alla fonte ufficiale.
| Anno | Competizione | Sede | Task | Posizione | Punteggio | Fonte |
|---|---|---|---|---|---|---|
| 2009 | 1ª Competizione Internazionale sul Rilevamento del Plagio | PAN @ SEPLN · San Sebastián | Rilevamento esterno | 4 / 10 | 0.3045 | panoramica |
| 2010 | 2ª Competizione Internazionale sul Rilevamento del Plagio | PAN @ CLEF · Padua | Rilevamento esterno | 8 / 18 | 0.5093 | panoramica · articolo |
| 2011 | 3ª Competizione Internazionale sul Rilevamento del Plagio | PAN @ CLEF · Amsterdam | Esterno (esperimento WordNet) | 7 / 9 | 0.19 | panoramica · articolo |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Riuso Hindi↔English | 4 (miglior esecuzione) | F 0.603 | classifica · panoramica |
| 2012 | 4ª Competizione Internazionale sul Rilevamento del Plagio | PAN @ CLEF · Rome | Allineamento del testo | 6 / 10 | 0.538 | panoramica · articolo |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Riuso giornalistico (en→hi) | 1 / 3 | NDCG@10 0.34 | panoramica · articolo |
| 2013 | 5ª Competizione Internazionale sul Rilevamento del Plagio | PAN @ CLEF · Valencia | Allineamento del testo | 6 / 9 | 0.61523 | panoramica · articolo |
| 2014 | 6ª Competizione Internazionale sul Rilevamento del Plagio 1ST* | PAN @ CLEF · Sheffield | Allineamento del testo | 1 std · 3/10 | 0.868 | panoramica · articolo |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Testo umano vs. IA | 3 / 34 | ROC-AUC 0.996 | classifica |
plagdet = punteggio complessivo PAN per il rilevamento del plagio (precisione, recall e granularità combinati). NDCG@10 = qualità del ranking. ROC-AUC = qualità della classificazione indipendente dalla soglia. *2014: 1º sul corpus di test standard, 3° di 10 sul corpus di ranking ufficiale. 2026: 3° di 34 team; ROC-AUC più alto tra tutti i team e le baseline.
Ogni competizione ha documentato una tecnica che informa il motore in produzione. La ricerca e il software sono una linea evolutiva unica — non affermazioni di marketing, ma metodi pubblicati e sottoposti a revisione paritaria.
Rilevamento rapido dei candidati per i passaggi riutilizzati (PAN 2010, 2014).
Corrispondenza precisa dei passaggi sorgente ↔ sospetti con alta precisione (PAN 2012–2014).
Metodi WordNet e TF-IDF / di traduzione per parafrasi e riuso cross-linguistico (PAN 2011; FIRE 2011–2012).
Distinguere la paternità umana da quella automatica — ROC-AUC più alto a PAN 2026.