표절 감지기는 블랙박스가 아닙니다. 탐지 엔진은 해당 분야의 주요 과학적 벤치마크인 PAN 경진대회에 출전하였으며, 아홉 차례의 국제 평가에서 독립적인 학술 운영진이 심사했습니다. 전체 기록은 아래에 있으며, 모든 결과는 공식 출처로 연결됩니다.
| 연도 | 경진대회 | 행사장 | 과제 | 순위 | 점수 | 출처 |
|---|---|---|---|---|---|---|
| 2009 | 제1회 국제 표절 탐지 경진대회 | PAN @ SEPLN · San Sebastián | 외부 탐지 | 4 / 10 | 0.3045 | 개요 |
| 2010 | 제2회 국제 표절 탐지 경진대회 | PAN @ CLEF · Padua | 외부 탐지 | 8 / 18 | 0.5093 | 개요 · 논문 |
| 2011 | 제3회 국제 표절 탐지 경진대회 | PAN @ CLEF · Amsterdam | 외부 탐지 (WordNet 실험) | 7 / 9 | 0.19 | 개요 · 논문 |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | 힌디어↔영어 재사용 | 4 (최고 실행 결과) | F 0.603 | 리더보드 · 개요 |
| 2012 | 제4회 국제 표절 탐지 경진대회 | PAN @ CLEF · Rome | 텍스트 정렬 | 6 / 10 | 0.538 | 개요 · 논문 |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | 저널리즘 재사용 (en→hi) | 1 / 3 | NDCG@10 0.34 | 개요 · 논문 |
| 2013 | 제5회 국제 표절 탐지 경진대회 | PAN @ CLEF · Valencia | 텍스트 정렬 | 6 / 9 | 0.61523 | 개요 · 논문 |
| 2014 | 제6회 국제 표절 탐지 경진대회 1ST* | PAN @ CLEF · Sheffield | 텍스트 정렬 | 1 std · 3/10 | 0.868 | 개요 · 논문 |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | 인간 대 AI 텍스트 | 3 / 34 | ROC-AUC 0.996 | 리더보드 |
plagdet = PAN 전체 표절 탐지 점수(정밀도, 재현율 및 세분성 종합). NDCG@10 = 순위 품질. ROC-AUC = 임계값 독립적 분류 품질. *2014: 표준 테스트 코퍼스에서 1위, 공식 순위 코퍼스에서 10팀 중 3위. 2026: 34팀 중 3위; 모든 팀 및 기준선 중 최고 ROC-AUC.
각 경진대회는 실제 출시 엔진에 반영된 기법을 문서화했습니다. 연구와 소프트웨어는 동일한 계보를 이루며 — 마케팅 주장이 아닌 동료 심사를 거친 출판된 방법론입니다.
재사용된 구절의 빠른 후보 탐지 (PAN 2010, 2014).
높은 정밀도로 출처 ↔ 의심 구절을 정밀 매칭 (PAN 2012–2014).
패러프레이즈 및 교차 언어 재사용을 위한 WordNet 및 TF-IDF / 번역 방법 (PAN 2011; FIRE 2011–2012).
인간과 기계 저작을 구별 — PAN 2026에서 최고 ROC-AUC 기록.