과학적 실적

독립적으로 검증 가능한 벤치마크 기록, 2009 – 2026

표절 감지기는 블랙박스가 아닙니다. 탐지 엔진은 해당 분야의 주요 과학적 벤치마크인 PAN 경진대회에 출전하였으며, 아홉 차례의 국제 평가에서 독립적인 학술 운영진이 심사했습니다. 전체 기록은 아래에 있으며, 모든 결과는 공식 출처로 연결됩니다.

수석 개발자 및 연구자: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · DBLP 프로필

요약 2009년부터 2014년까지 엔진은 PAN 국제 표절 탐지 경진대회 전 6회에 출전했으며, 인도에서 열린 두 차례의 PAN@FIRE 교차 언어 과제에도 참가하여 2012년 영어–힌디어 CL!NSS 과제에서 우승했습니다. 2026년에는 동일한 계보의 엔진이 PAN의 Voight-Kampff 생성 AI 탐지 과제에 참가하여 평가 전체 시스템 중 가장 높은 ROC-AUC(0.996)를 기록했으며, 34개 팀 중 3위를 차지했습니다. 이 제품은 2007년부터 지속적으로 출시되어 왔습니다.

전체 경진대회 기록

아홉 차례 평가, 모든 결과에 출처 명시

연도	경진대회	행사장	과제	순위	점수	출처
2009	제1회 국제 표절 탐지 경진대회	PAN @ SEPLN · San Sebastián	외부 탐지	4 / 10	0.3045	개요
2010	제2회 국제 표절 탐지 경진대회	PAN @ CLEF · Padua	외부 탐지	8 / 18	0.5093	개요 · 논문
2011	제3회 국제 표절 탐지 경진대회	PAN @ CLEF · Amsterdam	외부 탐지 (WordNet 실험)	7 / 9	0.19	개요 · 논문
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	힌디어↔영어 재사용	4 (최고 실행 결과)	F 0.603	리더보드 · 개요
2012	제4회 국제 표절 탐지 경진대회	PAN @ CLEF · Rome	텍스트 정렬	6 / 10	0.538	개요 · 논문
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	저널리즘 재사용 (en→hi)	1 / 3	NDCG@10 0.34	개요 · 논문
2013	제5회 국제 표절 탐지 경진대회	PAN @ CLEF · Valencia	텍스트 정렬	6 / 9	0.61523	개요 · 논문
2014	제6회 국제 표절 탐지 경진대회 1ST*	PAN @ CLEF · Sheffield	텍스트 정렬	1 std · 3/10	0.868	개요 · 논문
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	인간 대 AI 텍스트	3 / 34	ROC-AUC 0.996	리더보드

plagdet = PAN 전체 표절 탐지 점수(정밀도, 재현율 및 세분성 종합). NDCG@10 = 순위 품질. ROC-AUC = 임계값 독립적 분류 품질. *2014: 표준 테스트 코퍼스에서 1위, 공식 순위 코퍼스에서 10팀 중 3위. 2026: 34팀 중 3위; 모든 팀 및 기준선 중 최고 ROC-AUC.

연구실에서 제품으로

신뢰할 수 있는 방법론

각 경진대회는 실제 출시 엔진에 반영된 기법을 문서화했습니다. 연구와 소프트웨어는 동일한 계보를 이루며 — 마케팅 주장이 아닌 동료 심사를 거친 출판된 방법론입니다.

N-gram 지문 추출

재사용된 구절의 빠른 후보 탐지 (PAN 2010, 2014).

텍스트 정렬

높은 정밀도로 출처 ↔ 의심 구절을 정밀 매칭 (PAN 2012–2014).

의미적 및 교차 언어 유사성

패러프레이즈 및 교차 언어 재사용을 위한 WordNet 및 TF-IDF / 번역 방법 (PAN 2011; FIRE 2011–2012).

AI 생성 텍스트 탐지

인간과 기계 저작을 구별 — PAN 2026에서 최고 ROC-AUC 기록.

동료 심사 논문

참고 문헌

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

저자 소개

Yurii Palkovskii

연구원 및 수석 개발자 · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

표절 및 AI 생성 텍스트 탐지에 관한 7편의 동료 심사 논문 저자로, CLEF/CEUR-WS 및 FIRE 논문집에 게재되었으며, PAN 조직위원회(Potthast, Stein, Rosso, Hagen 외)에 의해 독립적으로 평가되었습니다.

DBLP 프로필 ↗

AI 및 표절 검사기 사용해 보기 →

이 페이지의 모든 순위와 점수는 옆에 링크된 공식 경진대회 개요 논문 또는 리더보드에서 가져온 것으로 — 이 웹사이트와 독립적으로 검증 가능합니다. 제품은 2007년부터 활발히 개발 중이며, 현재 빌드 #2965.