Detector de Plagio no es una caja negra. Su motor de detección ha participado en el principal benchmark científico del campo — la competición PAN — y ha sido evaluado por organizadores académicos independientes en nueve evaluaciones internacionales. El historial completo se muestra a continuación; cada resultado enlaza con su fuente oficial.
| Año | Competición | Sede | Tarea | Clasificación | Puntuación | Fuente |
|---|---|---|---|---|---|---|
| 2009 | 1.ª Competición Internacional de Detección de Plagios | PAN @ SEPLN · San Sebastián | Detección externa | 4 / 10 | 0.3045 | resumen general |
| 2010 | 2.ª Competición Internacional de Detección de Plagios | PAN @ CLEF · Padua | Detección externa | 8 / 18 | 0.5093 | resumen general · artículo |
| 2011 | 3.ª Competición Internacional de Detección de Plagios | PAN @ CLEF · Amsterdam | Externo (experimento con WordNet) | 7 / 9 | 0.19 | resumen general · artículo |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Reutilización hindi↔inglés | 4 (mejor ejecución) | F 0.603 | clasificación · resumen general |
| 2012 | 4.ª Competición Internacional de Detección de Plagios | PAN @ CLEF · Rome | Alineación de textos | 6 / 10 | 0.538 | resumen general · artículo |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Reutilización periodística (en→hi) | 1 / 3 | NDCG@10 0.34 | resumen general · artículo |
| 2013 | 5.ª Competición Internacional de Detección de Plagios | PAN @ CLEF · Valencia | Alineación de textos | 6 / 9 | 0.61523 | resumen general · artículo |
| 2014 | 6.ª Competición Internacional de Detección de Plagios 1ST* | PAN @ CLEF · Sheffield | Alineación de textos | 1 std · 3/10 | 0.868 | resumen general · artículo |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Texto humano vs. IA | 3 / 34 | ROC-AUC 0.996 | clasificación |
plagdet = la puntuación global de detección de plagios PAN (precisión, recall y granularidad combinados). NDCG@10 = calidad del ranking. ROC-AUC = calidad de clasificación independiente del umbral. *2014: 1.º en el corpus de prueba estándar, 3.º de 10 en el corpus de clasificación oficial. 2026: 3.º de 34 equipos; ROC-AUC más alto de cualquier equipo o línea base.
Cada competición documentó una técnica que informa al motor en producción. La investigación y el software son un mismo linaje — no afirmaciones de marketing, sino métodos publicados y revisados por pares.
Detección rápida de candidatos con pasajes reutilizados (PAN 2010, 2014).
Alineación precisa de pasajes fuente ↔ sospechosos con alta precisión (PAN 2012–2014).
Métodos con WordNet y TF-IDF / traducción para paráfrasis y reutilización multilingüe (PAN 2011; FIRE 2011–2012).
Distinción entre autoría humana y de máquina — ROC-AUC más alto en PAN 2026.