상단으로 이동
과학적 실적

독립적으로 검증 가능한 벤치마크 기록, 2009 – 2026

표절 감지기는 블랙박스가 아닙니다. 탐지 엔진은 해당 분야의 주요 과학적 벤치마크인 PAN 경진대회에 출전하였으며, 아홉 차례의 국제 평가에서 독립적인 학술 운영진이 심사했습니다. 전체 기록은 아래에 있으며, 모든 결과는 공식 출처로 연결됩니다.

요약 2009년부터 2014년까지 엔진은 PAN 국제 표절 탐지 경진대회 전 6회에 출전했으며, 인도에서 열린 두 차례의 PAN@FIRE 교차 언어 과제에도 참가하여 2012년 영어–힌디어 CL!NSS 과제에서 우승했습니다. 2026년에는 동일한 계보의 엔진이 PAN의 Voight-Kampff 생성 AI 탐지 과제에 참가하여 평가 전체 시스템 중 가장 높은 ROC-AUC(0.996)를 기록했으며, 34개 팀 중 3위를 차지했습니다. 이 제품은 2007년부터 지속적으로 출시되어 왔습니다.
전체 경진대회 기록

아홉 차례 평가, 모든 결과에 출처 명시

연도경진대회행사장과제순위점수출처
2009제1회 국제 표절 탐지 경진대회PAN @ SEPLN · San Sebastián외부 탐지4 / 100.3045개요
2010제2회 국제 표절 탐지 경진대회PAN @ CLEF · Padua외부 탐지8 / 180.5093개요 · 논문
2011제3회 국제 표절 탐지 경진대회PAN @ CLEF · Amsterdam외부 탐지 (WordNet 실험)7 / 90.19개요 · 논문
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, Mumbai힌디어↔영어 재사용4 (최고 실행 결과)F 0.603리더보드 · 개요
2012제4회 국제 표절 탐지 경진대회PAN @ CLEF · Rome텍스트 정렬6 / 100.538개요 · 논문
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI Kolkata저널리즘 재사용 (en→hi)1 / 3NDCG@10 0.34개요 · 논문
2013제5회 국제 표절 탐지 경진대회PAN @ CLEF · Valencia텍스트 정렬6 / 90.61523개요 · 논문
2014제6회 국제 표절 탐지 경진대회 1ST*PAN @ CLEF · Sheffield텍스트 정렬1 std · 3/100.868개요 · 논문
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · Jena인간 대 AI 텍스트3 / 34ROC-AUC 0.996리더보드

plagdet = PAN 전체 표절 탐지 점수(정밀도, 재현율 및 세분성 종합). NDCG@10 = 순위 품질. ROC-AUC = 임계값 독립적 분류 품질. *2014: 표준 테스트 코퍼스에서 1위, 공식 순위 코퍼스에서 10팀 중 3위. 2026: 34팀 중 3위; 모든 팀 및 기준선 중 최고 ROC-AUC.

연구실에서 제품으로

신뢰할 수 있는 방법론

각 경진대회는 실제 출시 엔진에 반영된 기법을 문서화했습니다. 연구와 소프트웨어는 동일한 계보를 이루며 — 마케팅 주장이 아닌 동료 심사를 거친 출판된 방법론입니다.

N-gram 지문 추출

재사용된 구절의 빠른 후보 탐지 (PAN 2010, 2014).

텍스트 정렬

높은 정밀도로 출처 ↔ 의심 구절을 정밀 매칭 (PAN 2012–2014).

의미적 및 교차 언어 유사성

패러프레이즈 및 교차 언어 재사용을 위한 WordNet 및 TF-IDF / 번역 방법 (PAN 2011; FIRE 2011–2012).

AI 생성 텍스트 탐지

인간과 기계 저작을 구별 — PAN 2026에서 최고 ROC-AUC 기록.

동료 심사 논문

참고 문헌

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
저자 소개
YP

Yurii Palkovskii

연구원 및 수석 개발자 · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

표절 및 AI 생성 텍스트 탐지에 관한 7편의 동료 심사 논문 저자로, CLEF/CEUR-WS 및 FIRE 논문집에 게재되었으며, PAN 조직위원회(Potthast, Stein, Rosso, Hagen 외)에 의해 독립적으로 평가되었습니다.

이 페이지의 모든 순위와 점수는 옆에 링크된 공식 경진대회 개요 논문 또는 리더보드에서 가져온 것으로 — 이 웹사이트와 독립적으로 검증 가능합니다. 제품은 2007년부터 활발히 개발 중이며, 현재 빌드 #2965.