سرقتِ ادب کا جاسوس کوئی بند ڈبہ نہیں ہے۔ اس کے شناسی انجن کو اس شعبے کے بنیادی سائنسی معیار — PAN مقابلے — میں شامل کیا گیا ہے، اور نو بین الاقوامی جائزوں میں آزاد علمی منتظمین نے اسے پرکھا ہے۔ مکمل ریکارڈ ذیل میں ہے؛ ہر نتیجہ اپنے سرکاری ماخذ سے منسلک ہے۔
| سال | مقابلہ | مقام | مہم | درجہ | اسکور | ماخذ |
|---|---|---|---|---|---|---|
| 2009 | سرقہ شناسی کا پہلا بین الاقوامی مقابلہ | PAN @ SEPLN · San Sebastián | بیرونی شناسی | 4 / 10 | 0.3045 | جائزہ |
| 2010 | سرقہ شناسی کا دوسرا بین الاقوامی مقابلہ | PAN @ CLEF · Padua | بیرونی شناسی | 8 / 18 | 0.5093 | جائزہ · مقالہ |
| 2011 | سرقہ شناسی کا تیسرا بین الاقوامی مقابلہ | PAN @ CLEF · Amsterdam | بیرونی (WordNet تجربہ) | 7 / 9 | 0.19 | جائزہ · مقالہ |
| 2011 | CL!TR — کراس لینگویج ہندوستانی متن کا دوبارہ استعمال | PAN@FIRE · IIT Bombay, Mumbai | Hindi↔English دوبارہ استعمال | 4 (بہترین رن) | F 0.603 | لیڈر بورڈ · جائزہ |
| 2012 | سرقہ شناسی کا چوتھا بین الاقوامی مقابلہ | PAN @ CLEF · Rome | متن کی صف بندی | 6 / 10 | 0.538 | جائزہ · مقالہ |
| 2012 | CL!NSS — کراس لینگویج ہندوستانی خبری کہانی کی تلاش 1ST | PAN@FIRE · ISI Kolkata | صحافتی دوبارہ استعمال (en→hi) | 1 / 3 | NDCG@10 0.34 | جائزہ · مقالہ |
| 2013 | سرقہ شناسی کا پانچواں بین الاقوامی مقابلہ | PAN @ CLEF · Valencia | متن کی صف بندی | 6 / 9 | 0.61523 | جائزہ · مقالہ |
| 2014 | سرقہ شناسی کا چھٹا بین الاقوامی مقابلہ 1ST* | PAN @ CLEF · Sheffield | متن کی صف بندی | 1 std · 3/10 | 0.868 | جائزہ · مقالہ |
| 2026 | Voight-Kampff AI سے تیار کردہ متن کی شناسی TOP AUC | PAN @ CLEF · Jena | انسانی بمقابلہ AI متن | 3 / 34 | ROC-AUC 0.996 | لیڈر بورڈ |
plagdet = PAN کا مجموعی سرقہ شناسی اسکور (درستی، یادآوری اور دانہ بندی کا مجموعہ)۔ NDCG@10 = درجہ بندی کا معیار۔ ROC-AUC = حد سے آزاد درجہ بندی کا معیار۔ *2014: معیاری آزمائشی کارپس پر پہلا مقام، سرکاری درجہ بندی کارپس پر 10 میں سے تیسرا۔ 2026: 34 ٹیموں میں تیسرا؛ کسی بھی ٹیم یا بیس لائن سے زیادہ ROC-AUC۔
ہر مقابلے نے ایک ایسی تکنیک کو دستاویز کیا جو موجودہ انجن میں کام آتی ہے۔ تحقیق اور سافٹ ویئر ایک ہی سلسلے کی کڑیاں ہیں — یہ مارکیٹنگ کے دعوے نہیں بلکہ شائع شدہ، ہم مرتبہ جائزہ شدہ طریقے ہیں۔
دوبارہ استعمال شدہ اقتباسات کی تیز امیدوار شناسی (PAN 2010, 2014)۔
ماخذ ↔ مشکوک اقتباسات کی اعلی درستی کے ساتھ درست ملاپ (PAN 2012–2014)۔
WordNet اور TF-IDF / ترجمے کے طریقے مفہومی اور کراس لسانی دوبارہ استعمال کے لیے (PAN 2011؛ FIRE 2011–2012)۔
انسانی اور مشینی تصنیف میں فرق کرنا — PAN 2026 میں سب سے زیادہ ROC-AUC۔