导航至顶部
科学记录

可独立核实的基准测试记录,2009 – 2026

抄袭检测器并非黑箱。其检测引擎已参加该领域最权威的科学基准测试——PAN 竞赛——并由独立的学术组织委员会在九次国际评测中进行评判。完整记录如下,每项结果均链接至官方来源。

简述 2009 年至 2014 年间,该引擎参加了全部六届 PAN 国际抄袭检测竞赛,以及在印度举办的两次 PAN@FIRE 跨语言任务——并在 2012 年赢得英语–印地语 CL!NSS 任务冠军。2026 年,同一技术谱系参加了 PAN 的 Voight-Kampff 生成式 AI 检测任务,取得了评测中所有系统最高的 ROC-AUC(0.996),在 34 支参赛队伍中位列第 3。该产品自 2007 年起持续发布。
完整竞赛记录

九次评测,每项结果均有来源

年份竞赛举办地任务排名得分来源
2009第一届国际抄袭检测竞赛PAN @ SEPLN · San Sebastián外部检测4 / 100.3045概览
2010第二届国际抄袭检测竞赛PAN @ CLEF · Padua外部检测8 / 180.5093概览 · 论文
2011第三届国际抄袭检测竞赛PAN @ CLEF · Amsterdam外部检测(WordNet 实验)7 / 90.19概览 · 论文
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, Mumbai印地语↔英语复用4 (最佳运行)F 0.603排行榜 · 概览
2012第四届国际抄袭检测竞赛PAN @ CLEF · Rome文本对齐6 / 100.538概览 · 论文
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI Kolkata新闻复用(en→hi)1 / 3NDCG@10 0.34概览 · 论文
2013第五届国际抄袭检测竞赛PAN @ CLEF · Valencia文本对齐6 / 90.61523概览 · 论文
2014第六届国际抄袭检测竞赛 1ST*PAN @ CLEF · Sheffield文本对齐1 std · 3/100.868概览 · 论文
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · Jena人类与 AI 文本识别3 / 34ROC-AUC 0.996排行榜

plagdet = PAN 抄袭检测综合得分(精确率、召回率与粒度综合计算)。NDCG@10 = 排名质量。ROC-AUC = 与阈值无关的分类质量。*2014 年:在标准测试语料库上排名第 1,在官方排名语料库上 10 支队伍中排名第 3。2026 年:34 支队伍中排名第 3;所有队伍及基线中 ROC-AUC 最高。

从实验室到产品

您所信赖的方法

每届竞赛都记录了一项技术,这些技术共同构成了正式发布引擎的基础。研究与软件同出一脉——不是营销噱头,而是经过同行评审的已发表方法。

N-gram 指纹识别

快速检测复用段落的候选项(PAN 2010、2014)。

文本对齐

对原始文本与可疑段落进行高精度精确匹配(PAN 2012–2014)。

语义与跨语言相似度

面向释义与跨语言复用的 WordNet 和 TF-IDF / 翻译方法(PAN 2011;FIRE 2011–2012)。

AI 生成文本检测

区分人类与机器写作——在 PAN 2026 上取得最高 ROC-AUC。

同行评审论文

参考文献

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
关于作者
YP

Yurii Palkovskii

研究员与首席开发者 · Zhytomyr State University,外国语言学学院 · SkyLine LLC

在 CLEF/CEUR-WS 和 FIRE 论文集上发表了七篇关于抄袭与 AI 生成文本检测的同行评审论文,研究成果由 PAN 组织委员会(Potthast、Stein、Rosso、Hagen 等)独立评审。

本页面上的每项排名和得分均来自官方竞赛概述论文或旁边链接的排行榜,可独立于本网站进行核实。产品自 2007 年起持续开发;当前版本 #2965。