Trình phát hiện đạo văn không phải là một hộp đen. Động cơ phát hiện của nó đã được đưa vào benchmark khoa học hàng đầu của lĩnh vực — cuộc thi PAN — và được đánh giá bởi các tổ chức học thuật độc lập qua chín kỳ đánh giá quốc tế. Hồ sơ đầy đủ được trình bày bên dưới; mỗi kết quả đều liên kết đến nguồn chính thức.
| Năm | Cuộc thi | Địa điểm | Nhiệm vụ | Xếp hạng | Điểm số | Nguồn |
|---|---|---|---|---|---|---|
| 2009 | Cuộc thi Quốc tế lần thứ nhất về Phát hiện Đạo văn | PAN @ SEPLN · San Sebastián | Phát hiện bên ngoài | 4 / 10 | 0.3045 | tổng quan |
| 2010 | Cuộc thi Quốc tế lần thứ hai về Phát hiện Đạo văn | PAN @ CLEF · Padua | Phát hiện bên ngoài | 8 / 18 | 0.5093 | tổng quan · bài báo |
| 2011 | Cuộc thi Quốc tế lần thứ ba về Phát hiện Đạo văn | PAN @ CLEF · Amsterdam | Bên ngoài (thí nghiệm WordNet) | 7 / 9 | 0.19 | tổng quan · bài báo |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Tái sử dụng Hindi↔English | 4 (lần chạy tốt nhất) | F 0.603 | bảng xếp hạng · tổng quan |
| 2012 | Cuộc thi Quốc tế lần thứ tư về Phát hiện Đạo văn | PAN @ CLEF · Rome | Căn chỉnh văn bản | 6 / 10 | 0.538 | tổng quan · bài báo |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Tái sử dụng báo chí (en→hi) | 1 / 3 | NDCG@10 0.34 | tổng quan · bài báo |
| 2013 | Cuộc thi Quốc tế lần thứ năm về Phát hiện Đạo văn | PAN @ CLEF · Valencia | Căn chỉnh văn bản | 6 / 9 | 0.61523 | tổng quan · bài báo |
| 2014 | Cuộc thi Quốc tế lần thứ sáu về Phát hiện Đạo văn 1ST* | PAN @ CLEF · Sheffield | Căn chỉnh văn bản | 1 std · 3/10 | 0.868 | tổng quan · bài báo |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Văn bản người — AI | 3 / 34 | ROC-AUC 0.996 | bảng xếp hạng |
plagdet = điểm phát hiện đạo văn tổng thể của PAN (kết hợp độ chính xác, độ hồi tưởng và độ chi tiết). NDCG@10 = chất lượng xếp hạng. ROC-AUC = chất lượng phân loại không phụ thuộc ngưỡng. *2014: Hạng 1 trên corpus thử nghiệm tiêu chuẩn, hạng 3 trong số 10 trên corpus xếp hạng chính thức. 2026: hạng 3 trong số 34 đội; ROC-AUC cao nhất trong số tất cả các đội và baseline.
Mỗi cuộc thi ghi lại một kỹ thuật được tích hợp vào động cơ phát hành. Nghiên cứu và phần mềm thuộc cùng một dòng — không phải tuyên bố marketing, mà là các phương pháp đã được công bố và được phản biện đồng nghiệp.
Phát hiện nhanh các đoạn văn bản được tái sử dụng (PAN 2010, 2014).
Khớp chính xác các đoạn nguồn ↔ đoạn đáng ngờ với độ chính xác cao (PAN 2012–2014).
Các phương pháp WordNet và TF-IDF / dịch thuật cho diễn giải lại và tái sử dụng đa ngôn ngữ (PAN 2011; FIRE 2011–2012).
Phân biệt tác giả là người hay máy — ROC-AUC hàng đầu tại PAN 2026.