盗用検出ツールはブラックボックスではありません。その検出エンジンはこの分野の主要な科学的ベンチマークである PAN コンペティションに出場し、9つの国際評価において独立した学術組織の審査員による評価を受けました。以下に完全な記録を示します。すべての結果は公式情報源にリンクしています。
| 年 | 競技 | 開催地 | タスク | 順位 | スコア | 出典 |
|---|---|---|---|---|---|---|
| 2009 | 剽窃検出に関する第1回国際競技会 | PAN @ SEPLN · San Sebastián | 外部検出 | 4 / 10 | 0.3045 | 概要 |
| 2010 | 剽窃検出に関する第2回国際競技会 | PAN @ CLEF · Padua | 外部検出 | 8 / 18 | 0.5093 | 概要 · 論文 |
| 2011 | 剽窃検出に関する第3回国際競技会 | PAN @ CLEF · Amsterdam | 外部(WordNet 実験) | 7 / 9 | 0.19 | 概要 · 論文 |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | ヒンディー語↔英語の再利用 | 4 (最良ラン) | F 0.603 | リーダーボード · 概要 |
| 2012 | 剽窃検出に関する第4回国際競技会 | PAN @ CLEF · Rome | テキストアライメント | 6 / 10 | 0.538 | 概要 · 論文 |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | ジャーナリズム的再利用(en→hi) | 1 / 3 | NDCG@10 0.34 | 概要 · 論文 |
| 2013 | 剽窃検出に関する第5回国際競技会 | PAN @ CLEF · Valencia | テキストアライメント | 6 / 9 | 0.61523 | 概要 · 論文 |
| 2014 | 剽窃検出に関する第6回国際競技会 1ST* | PAN @ CLEF · Sheffield | テキストアライメント | 1 std · 3/10 | 0.868 | 概要 · 論文 |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | 人間 vs AI テキスト | 3 / 34 | ROC-AUC 0.996 | リーダーボード |
plagdet = PAN の剽窃検出総合スコア(適合率・再現率・粒度を統合)。NDCG@10 = ランキング品質。ROC-AUC = 閾値非依存の分類品質。*2014年:標準テストコーパスで1位、公式ランキングコーパスでは10チーム中3位。2026年:34チーム中3位、全チーム・ベースライン中最高の ROC-AUC。
各競技では、実運用エンジンに取り入れられた技術が文書化されました。研究とソフトウェアは一つの系譜であり、マーケティング上の主張ではなく、査読済みの発表手法に基づいています。
再利用された文章の高速候補検出(PAN 2010、2014)。
高精度による原文↔疑義文の精密マッチング(PAN 2012〜2014)。
言い換えおよびクロスリンガル再利用のための WordNet と TF-IDF /翻訳手法(PAN 2011;FIRE 2011〜2012)。
人間と機械の著者性を識別 — PAN 2026 で最高 ROC-AUC を記録。