Dorobek naukowy

Niezależnie weryfikowalny rekord wyników, 2009 – 2026

Wykrywacz plagiatów nie jest czarną skrzynką. Jego silnik wykrywania brał udział w głównym naukowym benchmarku tej dziedziny — konkursie PAN — i był oceniany przez niezależnych akademickich organizatorów w dziewięciu międzynarodowych ewaluacjach. Pełen rekord przedstawiono poniżej; każdy wynik zawiera odnośnik do oficjalnego źródła.

Główny programista i badacz: Yurii Palkovskii · Zhytomyr State University · SkyLine LLC · Profil DBLP

W skrócie W latach 2009–2014 silnik brał udział we wszystkich sześciu dorocznych Międzynarodowych Konkursach PAN na Wykrywanie Plagiatów oraz w dwóch zadaniach wielojęzycznych PAN@FIRE w Indiach — zwyciężając w zadaniu CL!NSS angielsko-hindi w 2012 roku. W 2026 roku ta sama linia badawcza wzięła udział w zadaniu PAN Voight-Kampff Generative AI Detection i osiągnęła najwyższy wynik ROC-AUC (0.996) spośród wszystkich systemów w ewaluacji, zajmując 3. miejsce wśród 34 zespołów. Produkt jest dostępny nieprzerwanie od 2007 roku.

Pełny rekord konkursowy

Dziewięć ewaluacji, każdy wynik z podanym źródłem

Rok	Konkurs	Miejsce	Zadanie	Miejsce	Wynik	Źródło
2009	1. Międzynarodowy Konkurs na Wykrywanie Plagiatów	PAN @ SEPLN · San Sebastián	Zewnętrzne wykrywanie	4 / 10	0.3045	przegląd
2010	2. Międzynarodowy Konkurs na Wykrywanie Plagiatów	PAN @ CLEF · Padua	Zewnętrzne wykrywanie	8 / 18	0.5093	przegląd · artykuł
2011	3. Międzynarodowy Konkurs na Wykrywanie Plagiatów	PAN @ CLEF · Amsterdam	Zewnętrzne (eksperyment WordNet)	7 / 9	0.19	przegląd · artykuł
2011	CL!TR — Cross-Language Indian Text Re-Use	PAN@FIRE · IIT Bombay, Mumbai	Ponowne użycie tekstu hindi↔angielski	4 (najlepszy wynik)	F 0.603	tabela wyników · przegląd
2012	4. Międzynarodowy Konkurs na Wykrywanie Plagiatów	PAN @ CLEF · Rome	Wyrównanie tekstu	6 / 10	0.538	przegląd · artykuł
2012	CL!NSS — Cross-Language Indian News Story Search 1ST	PAN@FIRE · ISI Kolkata	Ponowne użycie dziennikarskie (en→hi)	1 / 3	NDCG@10 0.34	przegląd · artykuł
2013	5. Międzynarodowy Konkurs na Wykrywanie Plagiatów	PAN @ CLEF · Valencia	Wyrównanie tekstu	6 / 9	0.61523	przegląd · artykuł
2014	6. Międzynarodowy Konkurs na Wykrywanie Plagiatów 1ST*	PAN @ CLEF · Sheffield	Wyrównanie tekstu	1 std · 3/10	0.868	przegląd · artykuł
2026	Voight-Kampff Generative AI Detection TOP AUC	PAN @ CLEF · Jena	Tekst człowieka kontra AI	3 / 34	ROC-AUC 0.996	tabela wyników

plagdet = ogólny wynik PAN dla wykrywania plagiatów (precyzja, czułość i granularność łącznie). NDCG@10 = jakość rankingu. ROC-AUC = jakość klasyfikacji niezależna od progu. *2014: 1. miejsce na standardowym korpusie testowym, 3. miejsce wśród 10 na oficjalnym korpusie rankingowym. 2026: 3. miejsce wśród 34 zespołów; najwyższy ROC-AUC spośród wszystkich zespołów i wartości bazowych.

Od laboratorium do produktu

Metody, którym możesz zaufać

Każdy konkurs udokumentował technikę, która wpływa na działający silnik produktu. Badania i oprogramowanie stanowią jedną linię — nie są to twierdzenia marketingowe, lecz opublikowane, recenzowane przez specjalistów metody.

Odcisk palca N-gram

Szybkie wykrywanie kandydatów na ponownie użyte fragmenty tekstu (PAN 2010, 2014).

Wyrównanie tekstu

Precyzyjne dopasowanie fragmentów źródłowych ↔ podejrzanych z wysoką precyzją (PAN 2012–2014).

Podobieństwo semantyczne i wielojęzyczne

Metody WordNet i TF-IDF / tłumaczenia do wykrywania parafraz i ponownego użycia między językami (PAN 2011; FIRE 2011–2012).

Wykrywanie tekstów generowanych przez AI

Rozróżnianie autorstwa ludzkiego od maszynowego — najwyższy ROC-AUC na PAN 2026.

Publikacje recenzowane przez specjalistów

Bibliografia

Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
"Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗

O autorze

Yurii Palkovskii

Badacz i główny programista · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Autor siedmiu recenzowanych artykułów naukowych na temat wykrywania plagiatów i tekstów generowanych przez AI w materiałach CLEF/CEUR-WS i FIRE, z wynikami niezależnie ocenianymi przez komitet organizacyjny PAN (Potthast, Stein, Rosso, Hagen i in.).

Profil DBLP ↗

Wypróbuj narzędzie do wykrywania AI i plagiatów →

Każdy wynik i pozycja rankingowa na tej stronie pochodzi z oficjalnego artykułu przeglądowego lub tabeli wyników danego konkursu, podanych obok — weryfikowalnych niezależnie od tej witryny. Produkt w aktywnym rozwoju od 2007 roku; bieżące wydanie #2965.