शीर्ष पर जाएँ
वैज्ञानिक अभिलेख

स्वतंत्र रूप से सत्यापन योग्य बेंचमार्क रिकॉर्ड, 2009 – 2026

साहित्यिक चोरी डिटेक्टर एक ब्लैक बॉक्स नहीं है। इसके डिटेक्शन इंजन को इस क्षेत्र की प्राथमिक वैज्ञानिक बेंचमार्क — PAN प्रतियोगिता — में प्रविष्ट किया गया है और नौ अंतरराष्ट्रीय मूल्यांकनों में स्वतंत्र शैक्षणिक आयोजकों द्वारा परखा गया है। पूर्ण रिकॉर्ड नीचे दिया गया है; प्रत्येक परिणाम अपने आधिकारिक स्रोत से लिंक है।

संक्षेप में 2009 से 2014 के बीच इंजन ने साहित्यिक चोरी पहचान पर सभी छह वार्षिक PAN अंतरराष्ट्रीय प्रतियोगिताओं और भारत में दो PAN@FIRE क्रॉस-लैंग्वेज टास्क में भाग लिया — 2012 में English–Hindi CL!NSS टास्क जीता। 2026 में उसी परंपरा ने PAN के Voight-Kampff Generative AI Detection टास्क में भाग लिया और मूल्यांकन में किसी भी प्रणाली की तुलना में सर्वोच्च ROC-AUC (0.996) दर्ज किया, जो 34 टीमों में तीसरे स्थान पर रहा। यह उत्पाद 2007 से निरंतर उपलब्ध है।
पूर्ण प्रतियोगिता रिकॉर्ड

नौ मूल्यांकन, प्रत्येक परिणाम का स्रोत सहित

वर्षप्रतियोगितास्थानटास्करैंकस्कोरस्रोत
2009साहित्यिक चोरी पहचान पर पहली अंतरराष्ट्रीय प्रतियोगिताPAN @ SEPLN · San Sebastiánबाहरी पहचान4 / 100.3045अवलोकन
2010साहित्यिक चोरी पहचान पर दूसरी अंतरराष्ट्रीय प्रतियोगिताPAN @ CLEF · Paduaबाहरी पहचान8 / 180.5093अवलोकन · पेपर
2011साहित्यिक चोरी पहचान पर तीसरी अंतरराष्ट्रीय प्रतियोगिताPAN @ CLEF · Amsterdamबाहरी (WordNet प्रयोग)7 / 90.19अवलोकन · पेपर
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiHindi↔English पुनः उपयोग4 (सर्वश्रेष्ठ रन)F 0.603लीडरबोर्ड · अवलोकन
2012साहित्यिक चोरी पहचान पर चौथी अंतरराष्ट्रीय प्रतियोगिताPAN @ CLEF · Romeटेक्स्ट संरेखण6 / 100.538अवलोकन · पेपर
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI Kolkataपत्रकारिता पुनः उपयोग (en→hi)1 / 3NDCG@10 0.34अवलोकन · पेपर
2013साहित्यिक चोरी पहचान पर पाँचवीं अंतरराष्ट्रीय प्रतियोगिताPAN @ CLEF · Valenciaटेक्स्ट संरेखण6 / 90.61523अवलोकन · पेपर
2014साहित्यिक चोरी पहचान पर छठी अंतरराष्ट्रीय प्रतियोगिता 1ST*PAN @ CLEF · Sheffieldटेक्स्ट संरेखण1 std · 3/100.868अवलोकन · पेपर
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · Jenaमानव-बनाम-AI टेक्स्ट3 / 34ROC-AUC 0.996लीडरबोर्ड

plagdet = PAN का समग्र साहित्यिक चोरी पहचान स्कोर (सटीकता, रिकॉल और ग्रैन्यूलैरिटी का संयोजन)। NDCG@10 = रैंकिंग गुणवत्ता। ROC-AUC = थ्रेशोल्ड-स्वतंत्र वर्गीकरण गुणवत्ता। *2014: मानक परीक्षण कॉर्पस पर प्रथम स्थान, आधिकारिक रैंकिंग कॉर्पस पर 10 में से तीसरा। 2026: 34 टीमों में तीसरा; किसी भी टीम या बेसलाइन से अधिक ROC-AUC।

प्रयोगशाला से उत्पाद तक

वे विधियाँ जिन पर आप भरोसा कर रहे हैं

प्रत्येक प्रतियोगिता ने एक ऐसी तकनीक को प्रलेखित किया जो शिपिंग इंजन को सूचित करती है। शोध और सॉफ़्टवेयर एक ही परंपरा हैं — विपणन दावे नहीं, बल्कि प्रकाशित, सहकर्मी-समीक्षित विधियाँ।

N-gram फिंगरप्रिंटिंग

पुनः उपयोग किए गए अंशों की तेज़ उम्मीदवार पहचान (PAN 2010, 2014)।

टेक्स्ट संरेखण

उच्च सटीकता के साथ स्रोत ↔ संदिग्ध अंशों का सटीक मिलान (PAN 2012–2014)।

सिमेंटिक और क्रॉस-लैंग्वेज समानता

पैराफ्रेज़ और क्रॉस-लिंगुअल पुनः उपयोग के लिए WordNet और TF-IDF / अनुवाद विधियाँ (PAN 2011; FIRE 2011–2012)।

AI-जनित टेक्स्ट पहचान

मानव बनाम मशीन लेखकत्व में भेद — PAN 2026 में शीर्ष ROC-AUC।

सहकर्मी-समीक्षित प्रकाशन

ग्रंथसूची

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
लेखक के बारे में
YP

Yurii Palkovskii

शोधकर्ता और प्रमुख डेवलपर · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

साहित्यिक चोरी और AI-जनित टेक्स्ट पहचान पर CLEF/CEUR-WS और FIRE कार्यवाही में सात सहकर्मी-समीक्षित पेपर के लेखक, जिनके परिणाम PAN आयोजन समिति (Potthast, Stein, Rosso, Hagen et al.) द्वारा स्वतंत्र रूप से मूल्यांकित किए गए हैं।

इस पृष्ठ पर प्रत्येक रैंक और स्कोर आधिकारिक प्रतियोगिता अवलोकन पेपर या लीडरबोर्ड से लिया गया है जो उसके साथ लिंक है — इस वेबसाइट से स्वतंत्र रूप से सत्यापन योग्य। उत्पाद 2007 से सक्रिय विकास में है; वर्तमान बिल्ड #2965।