Điều hướng lên trên cùng
Hồ sơ khoa học

Một hồ sơ benchmark có thể xác minh độc lập, 2009 – 2026

Trình phát hiện đạo văn không phải là một hộp đen. Động cơ phát hiện của nó đã được đưa vào benchmark khoa học hàng đầu của lĩnh vực — cuộc thi PAN — và được đánh giá bởi các tổ chức học thuật độc lập qua chín kỳ đánh giá quốc tế. Hồ sơ đầy đủ được trình bày bên dưới; mỗi kết quả đều liên kết đến nguồn chính thức.

Tóm tắt Từ năm 2009 đến 2014, động cơ đã tham gia cả sáu kỳ Cuộc thi PAN Quốc tế hàng năm về Phát hiện Đạo văn và hai nhiệm vụ đa ngôn ngữ PAN@FIRE ở Ấn Độ — giành chiến thắng nhiệm vụ CL!NSS tiếng Anh–Hindi năm 2012. Năm 2026, cùng dòng hệ thống đó đã tham gia nhiệm vụ Voight-Kampff Generative AI Detection của PAN và ghi nhận ROC-AUC cao nhất (0.996) trong số tất cả các hệ thống tham gia đánh giá, xếp hạng 3 trong số 34 đội. Sản phẩm đã được phát hành liên tục từ năm 2007.
Hồ sơ thi đấu đầy đủ

Chín kỳ đánh giá, mọi kết quả đều có nguồn dẫn chứng

NămCuộc thiĐịa điểmNhiệm vụXếp hạngĐiểm sốNguồn
2009Cuộc thi Quốc tế lần thứ nhất về Phát hiện Đạo vănPAN @ SEPLN · San SebastiánPhát hiện bên ngoài4 / 100.3045tổng quan
2010Cuộc thi Quốc tế lần thứ hai về Phát hiện Đạo vănPAN @ CLEF · PaduaPhát hiện bên ngoài8 / 180.5093tổng quan · bài báo
2011Cuộc thi Quốc tế lần thứ ba về Phát hiện Đạo vănPAN @ CLEF · AmsterdamBên ngoài (thí nghiệm WordNet)7 / 90.19tổng quan · bài báo
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiTái sử dụng Hindi↔English4 (lần chạy tốt nhất)F 0.603bảng xếp hạng · tổng quan
2012Cuộc thi Quốc tế lần thứ tư về Phát hiện Đạo vănPAN @ CLEF · RomeCăn chỉnh văn bản6 / 100.538tổng quan · bài báo
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI KolkataTái sử dụng báo chí (en→hi)1 / 3NDCG@10 0.34tổng quan · bài báo
2013Cuộc thi Quốc tế lần thứ năm về Phát hiện Đạo vănPAN @ CLEF · ValenciaCăn chỉnh văn bản6 / 90.61523tổng quan · bài báo
2014Cuộc thi Quốc tế lần thứ sáu về Phát hiện Đạo văn 1ST*PAN @ CLEF · SheffieldCăn chỉnh văn bản1 std · 3/100.868tổng quan · bài báo
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · JenaVăn bản người — AI3 / 34ROC-AUC 0.996bảng xếp hạng

plagdet = điểm phát hiện đạo văn tổng thể của PAN (kết hợp độ chính xác, độ hồi tưởng và độ chi tiết). NDCG@10 = chất lượng xếp hạng. ROC-AUC = chất lượng phân loại không phụ thuộc ngưỡng. *2014: Hạng 1 trên corpus thử nghiệm tiêu chuẩn, hạng 3 trong số 10 trên corpus xếp hạng chính thức. 2026: hạng 3 trong số 34 đội; ROC-AUC cao nhất trong số tất cả các đội và baseline.

Từ phòng thí nghiệm đến sản phẩm

Các phương pháp bạn đang tin dùng

Mỗi cuộc thi ghi lại một kỹ thuật được tích hợp vào động cơ phát hành. Nghiên cứu và phần mềm thuộc cùng một dòng — không phải tuyên bố marketing, mà là các phương pháp đã được công bố và được phản biện đồng nghiệp.

Nhận dấu vân tay N-gram

Phát hiện nhanh các đoạn văn bản được tái sử dụng (PAN 2010, 2014).

Căn chỉnh văn bản

Khớp chính xác các đoạn nguồn ↔ đoạn đáng ngờ với độ chính xác cao (PAN 2012–2014).

Tương đồng ngữ nghĩa và đa ngôn ngữ

Các phương pháp WordNet và TF-IDF / dịch thuật cho diễn giải lại và tái sử dụng đa ngôn ngữ (PAN 2011; FIRE 2011–2012).

Phát hiện văn bản do AI tạo ra

Phân biệt tác giả là người hay máy — ROC-AUC hàng đầu tại PAN 2026.

Các công bố được phản biện đồng nghiệp

Thư mục tài liệu tham khảo

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
Về tác giả
YP

Yurii Palkovskii

Nhà nghiên cứu và Trưởng nhóm Phát triển · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Tác giả của bảy bài báo được phản biện đồng nghiệp về phát hiện đạo văn và phát hiện văn bản do AI tạo ra trong kỷ yếu CLEF/CEUR-WS và FIRE, với kết quả được đánh giá độc lập bởi ban tổ chức PAN (Potthast, Stein, Rosso, Hagen và cộng sự).

Mọi hạng và điểm số trên trang này đều được lấy từ bài báo tổng quan cuộc thi chính thức hoặc bảng xếp hạng được liên kết kế bên — có thể xác minh độc lập với trang web này. Sản phẩm đang được phát triển tích cực từ năm 2007; phiên bản hiện tại #2965.