Plagiatsdetektor ist keine Black Box. Seine Erkennungsengine wurde im wichtigsten wissenschaftlichen Benchmark des Fachgebiets — dem PAN-Wettbewerb — eingesetzt und von unabhängigen akademischen Organisatoren in neun internationalen Evaluierungen bewertet. Der vollständige Nachweis ist nachfolgend aufgeführt; jedes Ergebnis verweist auf seine offizielle Quelle.
| Jahr | Wettbewerb | Veranstaltungsort | Aufgabe | Rang | Ergebnis | Quelle |
|---|---|---|---|---|---|---|
| 2009 | 1. International Competition on Plagiarism Detection | PAN @ SEPLN · San Sebastián | Externe Erkennung | 4 / 10 | 0.3045 | Übersicht |
| 2010 | 2. International Competition on Plagiarism Detection | PAN @ CLEF · Padua | Externe Erkennung | 8 / 18 | 0.5093 | Übersicht · Artikel |
| 2011 | 3. International Competition on Plagiarism Detection | PAN @ CLEF · Amsterdam | Extern (WordNet-Experiment) | 7 / 9 | 0.19 | Übersicht · Artikel |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Hindi↔English reuse | 4 (bester Durchlauf) | F 0.603 | Rangliste · Übersicht |
| 2012 | 4. International Competition on Plagiarism Detection | PAN @ CLEF · Rome | Textausrichtung | 6 / 10 | 0.538 | Übersicht · Artikel |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Journalistische Weiterverwendung (en→hi) | 1 / 3 | NDCG@10 0.34 | Übersicht · Artikel |
| 2013 | 5. International Competition on Plagiarism Detection | PAN @ CLEF · Valencia | Textausrichtung | 6 / 9 | 0.61523 | Übersicht · Artikel |
| 2014 | 6. International Competition on Plagiarism Detection 1ST* | PAN @ CLEF · Sheffield | Textausrichtung | 1 std · 3/10 | 0.868 | Übersicht · Artikel |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Mensch-vs.-KI-Text | 3 / 34 | ROC-AUC 0.996 | Rangliste |
plagdet = der PAN-Gesamtwert für Plagiatserkennung (Präzision, Recall und Granularität kombiniert). NDCG@10 = Ranking-Qualität. ROC-AUC = schwellenwertunabhängige Klassifikationsqualität. *2014: 1. Platz im Standard-Testkorpus, 3. von 10 im offiziellen Ranking-Korpus. 2026: 3. von 34 Teams; höchster ROC-AUC aller Teams und Baselines.
Jeder Wettbewerb dokumentierte eine Technik, die in die ausgelieferte Engine eingeflossen ist. Forschung und Software entstammen derselben Entwicklungslinie — keine Marketingversprechen, sondern veröffentlichte, begutachtete Methoden.
Schnelle Kandidatenerkennung von wiederverwendeten Textpassagen (PAN 2010, 2014).
Präziser Abgleich von Quell- ↔ Verdachtspassagen mit hoher Genauigkeit (PAN 2012–2014).
WordNet- und TF-IDF- / Übersetzungsmethoden für Paraphrasierung und sprachübergreifende Wiederverwendung (PAN 2011; FIRE 2011–2012).
Unterscheidung menschlicher von maschineller Urheberschaft — höchster ROC-AUC bei PAN 2026.