Détecteur de plagiat n'est pas une boîte noire. Son moteur de détection a été engagé dans le principal benchmark scientifique du domaine — la compétition PAN — et évalué par des organisateurs académiques indépendants lors de neuf évaluations internationales. Le bilan complet figure ci-dessous ; chaque résultat renvoie à sa source officielle.
| Année | Compétition | Lieu | Tâche | Rang | Score | Source |
|---|---|---|---|---|---|---|
| 2009 | 1re Compétition internationale sur la détection de plagiat | PAN @ SEPLN · San Sebastián | Détection externe | 4 / 10 | 0.3045 | vue d'ensemble |
| 2010 | 2e Compétition internationale sur la détection de plagiat | PAN @ CLEF · Padua | Détection externe | 8 / 18 | 0.5093 | vue d'ensemble · article |
| 2011 | 3e Compétition internationale sur la détection de plagiat | PAN @ CLEF · Amsterdam | Détection externe (expérience WordNet) | 7 / 9 | 0.19 | vue d'ensemble · article |
| 2011 | CL!TR — Réutilisation de texte indien multilingue | PAN@FIRE · IIT Bombay, Mumbai | Réutilisation hindi↔anglais | 4 (meilleure exécution) | F 0.603 | classement · vue d'ensemble |
| 2012 | 4e Compétition internationale sur la détection de plagiat | PAN @ CLEF · Rome | Alignement de texte | 6 / 10 | 0.538 | vue d'ensemble · article |
| 2012 | CL!NSS — Recherche d'articles de presse indiens multilingue 1ST | PAN@FIRE · ISI Kolkata | Réutilisation journalistique (en→hi) | 1 / 3 | NDCG@10 0.34 | vue d'ensemble · article |
| 2013 | 5e Compétition internationale sur la détection de plagiat | PAN @ CLEF · Valencia | Alignement de texte | 6 / 9 | 0.61523 | vue d'ensemble · article |
| 2014 | 6e Compétition internationale sur la détection de plagiat 1ST* | PAN @ CLEF · Sheffield | Alignement de texte | 1 std · 3/10 | 0.868 | vue d'ensemble · article |
| 2026 | Voight-Kampff — Détection de texte IA génératif TOP AUC | PAN @ CLEF · Jena | Texte humain ou IA | 3 / 34 | ROC-AUC 0.996 | classement |
plagdet = le score global de détection de plagiat PAN (précision, rappel et granularité combinés). NDCG@10 = qualité du classement. ROC-AUC = qualité de classification indépendante du seuil. *2014 : 1er sur le corpus de test standard, 3e sur 10 dans le corpus de classement officiel. 2026 : 3e sur 34 équipes ; ROC-AUC le plus élevé de toutes les équipes ou bases de référence.
Chaque compétition a documenté une technique qui nourrit le moteur en production. La recherche et le logiciel forment une seule et même lignée — non pas des arguments marketing, mais des méthodes publiées et évaluées par les pairs.
Détection rapide de candidats dans les passages réutilisés (PAN 2010, 2014).
Correspondance précise des passages source ↔ suspects avec une haute précision (PAN 2012–2014).
Méthodes WordNet et TF-IDF / traduction pour la paraphrase et la réutilisation multilingue (PAN 2011 ; FIRE 2011–2012).
Distinguer la paternité humaine de celle d'une machine — ROC-AUC le plus élevé à PAN 2026.