導航至頂部
科學紀錄

可獨立驗證的基準測試紀錄,2009 – 2026

抄襲檢測器並非黑盒。其檢測引擎已參加該領域最主要的科學基準競賽——PAN 競賽——並由獨立學術組織者在九次國際評測中進行評審。完整紀錄如下,每項結果均連結至其官方來源。

簡介 2009 至 2014 年間,該引擎參加了全部六屆 PAN 國際抄襲檢測競賽,以及在印度舉辦的兩次 PAN@FIRE 跨語言任務——並於 2012 年贏得英語–印地語 CL!NSS 任務冠軍。2026 年,同一技術傳承參加了 PAN 的 Voight-Kampff 生成式 AI 檢測任務,取得評測中所有系統最高的 ROC-AUC(0.996),在 34 支隊伍中排名第 3。本產品自 2007 年起持續發布。
完整競賽紀錄

九次評測,每項結果均有來源

年份競賽會議地點任務排名分數來源
2009第一屆國際抄襲檢測競賽PAN @ SEPLN · San Sebastián外部文件檢測4 / 100.3045概覽
2010第二屆國際抄襲檢測競賽PAN @ CLEF · Padua外部文件檢測8 / 180.5093概覽 · 論文
2011第三屆國際抄襲檢測競賽PAN @ CLEF · Amsterdam外部檢測(WordNet 實驗)7 / 90.19概覽 · 論文
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiHindi↔English 文字重用4 (最佳結果)F 0.603排行榜 · 概覽
2012第四屆國際抄襲檢測競賽PAN @ CLEF · Rome文字對齊6 / 100.538概覽 · 論文
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI Kolkata新聞重用(en→hi)1 / 3NDCG@10 0.34概覽 · 論文
2013第五屆國際抄襲檢測競賽PAN @ CLEF · Valencia文字對齊6 / 90.61523概覽 · 論文
2014第六屆國際抄襲檢測競賽 1ST*PAN @ CLEF · Sheffield文字對齊1 std · 3/100.868概覽 · 論文
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · Jena人類與 AI 文字辨別3 / 34ROC-AUC 0.996排行榜

plagdet = PAN 抄襲檢測綜合分數(精確率、召回率與細粒度之綜合)。NDCG@10 = 排名品質。ROC-AUC = 不依賴閾值的分類品質。*2014:標準測試語料庫排名第 1,官方排名語料庫 10 隊中排名第 3。2026:34 隊中排名第 3;所有隊伍及基準線中 ROC-AUC 最高。

從實驗室到產品

您所信賴的方法

每次競賽均記錄了一項對正式發布引擎有所貢獻的技術。研究成果與軟體系出同源——不是行銷話術,而是已發表且經同儕審查的方法。

N-gram 指紋識別

快速偵測重用段落的候選項(PAN 2010、2014)。

文字對齊

以高精確率精確比對原始 ↔ 可疑段落(PAN 2012–2014)。

語義與跨語言相似度

WordNet 與 TF-IDF/翻譯方法,用於改寫及跨語言重用檢測(PAN 2011;FIRE 2011–2012)。

AI 生成文字檢測

辨別人類與機器撰寫的文字——PAN 2026 最高 ROC-AUC。

同儕審查出版品

參考書目

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
關於作者
YP

Yurii Palkovskii

研究員及首席開發者 · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

於 CLEF/CEUR-WS 及 FIRE 論文集上發表七篇關於抄襲及 AI 生成文字檢測的同儕審查論文,研究結果由 PAN 組織委員會(Potthast、Stein、Rosso、Hagen 等人)獨立評估。

本頁所有排名及分數均取自官方競賽概覽論文或其旁附之排行榜連結——可不依賴本網站獨立驗證。產品自 2007 年起持續開發;目前版本 #2965。