Hồ sơ khoa học

Một hồ sơ benchmark có thể xác minh độc lập, 2009 – 2026

Trình phát hiện đạo văn không phải là một hộp đen. Động cơ phát hiện của nó đã được đưa vào benchmark khoa học hàng đầu của lĩnh vực — cuộc thi PAN — và được đánh giá bởi các tổ chức học thuật độc lập qua chín kỳ đánh giá quốc tế. Hồ sơ đầy đủ được trình bày bên dưới; mỗi kết quả đều liên kết đến nguồn chính thức.

Trưởng nhóm phát triển và nhà nghiên cứu: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · Hồ sơ DBLP

Tóm tắt Từ năm 2009 đến 2014, động cơ đã tham gia cả sáu kỳ Cuộc thi PAN Quốc tế hàng năm về Phát hiện Đạo văn và hai nhiệm vụ đa ngôn ngữ PAN@FIRE ở Ấn Độ — giành chiến thắng nhiệm vụ CL!NSS tiếng Anh–Hindi năm 2012. Năm 2026, cùng dòng hệ thống đó đã tham gia nhiệm vụ Voight-Kampff Generative AI Detection của PAN và ghi nhận ROC-AUC cao nhất (0.996) trong số tất cả các hệ thống tham gia đánh giá, xếp hạng 3 trong số 34 đội. Sản phẩm đã được phát hành liên tục từ năm 2007.

Hồ sơ thi đấu đầy đủ

Chín kỳ đánh giá, mọi kết quả đều có nguồn dẫn chứng

Năm	Cuộc thi	Địa điểm	Nhiệm vụ	Xếp hạng	Điểm số	Nguồn
2009	Cuộc thi Quốc tế lần thứ nhất về Phát hiện Đạo văn	PAN @ SEPLN · San Sebastián	Phát hiện bên ngoài	4 / 10	0.3045	tổng quan
2010	Cuộc thi Quốc tế lần thứ hai về Phát hiện Đạo văn	PAN @ CLEF · Padua	Phát hiện bên ngoài	8 / 18	0.5093	tổng quan · bài báo
2011	Cuộc thi Quốc tế lần thứ ba về Phát hiện Đạo văn	PAN @ CLEF · Amsterdam	Bên ngoài (thí nghiệm WordNet)	7 / 9	0.19	tổng quan · bài báo
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	Tái sử dụng Hindi↔English	4 (lần chạy tốt nhất)	F 0.603	bảng xếp hạng · tổng quan
2012	Cuộc thi Quốc tế lần thứ tư về Phát hiện Đạo văn	PAN @ CLEF · Rome	Căn chỉnh văn bản	6 / 10	0.538	tổng quan · bài báo
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	Tái sử dụng báo chí (en→hi)	1 / 3	NDCG@10 0.34	tổng quan · bài báo
2013	Cuộc thi Quốc tế lần thứ năm về Phát hiện Đạo văn	PAN @ CLEF · Valencia	Căn chỉnh văn bản	6 / 9	0.61523	tổng quan · bài báo
2014	Cuộc thi Quốc tế lần thứ sáu về Phát hiện Đạo văn 1ST*	PAN @ CLEF · Sheffield	Căn chỉnh văn bản	1 std · 3/10	0.868	tổng quan · bài báo
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	Văn bản người — AI	3 / 34	ROC-AUC 0.996	bảng xếp hạng

plagdet = điểm phát hiện đạo văn tổng thể của PAN (kết hợp độ chính xác, độ hồi tưởng và độ chi tiết). NDCG@10 = chất lượng xếp hạng. ROC-AUC = chất lượng phân loại không phụ thuộc ngưỡng. *2014: Hạng 1 trên corpus thử nghiệm tiêu chuẩn, hạng 3 trong số 10 trên corpus xếp hạng chính thức. 2026: hạng 3 trong số 34 đội; ROC-AUC cao nhất trong số tất cả các đội và baseline.

Từ phòng thí nghiệm đến sản phẩm

Các phương pháp bạn đang tin dùng

Mỗi cuộc thi ghi lại một kỹ thuật được tích hợp vào động cơ phát hành. Nghiên cứu và phần mềm thuộc cùng một dòng — không phải tuyên bố marketing, mà là các phương pháp đã được công bố và được phản biện đồng nghiệp.

Nhận dấu vân tay N-gram

Phát hiện nhanh các đoạn văn bản được tái sử dụng (PAN 2010, 2014).

Căn chỉnh văn bản

Khớp chính xác các đoạn nguồn ↔ đoạn đáng ngờ với độ chính xác cao (PAN 2012–2014).

Tương đồng ngữ nghĩa và đa ngôn ngữ

Các phương pháp WordNet và TF-IDF / dịch thuật cho diễn giải lại và tái sử dụng đa ngôn ngữ (PAN 2011; FIRE 2011–2012).

Phát hiện văn bản do AI tạo ra

Phân biệt tác giả là người hay máy — ROC-AUC hàng đầu tại PAN 2026.

Các công bố được phản biện đồng nghiệp

Thư mục tài liệu tham khảo

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

Về tác giả

Yurii Palkovskii

Nhà nghiên cứu và Trưởng nhóm Phát triển · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Tác giả của bảy bài báo được phản biện đồng nghiệp về phát hiện đạo văn và phát hiện văn bản do AI tạo ra trong kỷ yếu CLEF/CEUR-WS và FIRE, với kết quả được đánh giá độc lập bởi ban tổ chức PAN (Potthast, Stein, Rosso, Hagen và cộng sự).

Hồ sơ DBLP ↗

Dùng thử Trình kiểm tra AI và Đạo văn →

Mọi hạng và điểm số trên trang này đều được lấy từ bài báo tổng quan cuộc thi chính thức hoặc bảng xếp hạng được liên kết kế bên — có thể xác minh độc lập với trang web này. Sản phẩm đang được phát triển tích cực từ năm 2007; phiên bản hiện tại #2965.