به بالا بروید
سابقه علمی

یک سابقه معیار قابل تأیید مستقل، ۲۰۰۹ – ۲۰۲۶

آشکارساز سرقت ادبی یک جعبه سیاه نیست. موتور تشخیص آن در اصلی‌ترین معیار علمی این حوزه — رقابت PAN — شرکت کرده و توسط مجریان دانشگاهی مستقل در نه ارزیابی بین‌المللی داوری شده است. سابقه کامل در زیر آمده؛ هر نتیجه به منبع رسمی خود پیوند دارد.

به‌طور خلاصه بین ۲۰۰۹ و ۲۰۱۴، این موتور در هر شش رقابت سالانه PAN International در زمینه تشخیص سرقت ادبی و در دو تکلیف چندزبانه PAN@FIRE در هند شرکت کرد — و در ۲۰۱۲ در تکلیف انگلیسی–هندی CL!NSS برنده شد. در ۲۰۲۶، همین نسل در تکلیف Voight-Kampff Generative AI Detection رقابت PAN شرکت کرد و بالاترین ROC-AUC (0.996) را در میان تمامی سیستم‌های ارزیابی ثبت نمود و در جایگاه سوم از ۳۴ تیم قرار گرفت. این محصول از ۲۰۰۷ به‌طور پیوسته عرضه شده است.
سابقه کامل رقابت‌ها

نه ارزیابی، همه نتایج با منابع مستند

سالرقابتمکان برگزاریتکلیفرتبهامتیازمنبع
2009اولین رقابت بین‌المللی تشخیص سرقت ادبیPAN @ SEPLN · San Sebastiánتشخیص خارجی4 / 100.3045مرور کلی
2010دومین رقابت بین‌المللی تشخیص سرقت ادبیPAN @ CLEF · Paduaتشخیص خارجی8 / 180.5093مرور کلی · مقاله
2011سومین رقابت بین‌المللی تشخیص سرقت ادبیPAN @ CLEF · Amsterdamخارجی (آزمایش WordNet)7 / 90.19مرور کلی · مقاله
2011CL!TR — بازاستفاده چندزبانه از متون هندیPAN@FIRE · IIT Bombay, Mumbaiبازاستفاده هندی↔انگلیسی4 (بهترین اجرا)F 0.603جدول رتبه‌بندی · مرور کلی
2012چهارمین رقابت بین‌المللی تشخیص سرقت ادبیPAN @ CLEF · Romeتراز متن6 / 100.538مرور کلی · مقاله
2012CL!NSS — جستجوی چندزبانه اخبار هندی 1STPAN@FIRE · ISI Kolkataبازاستفاده روزنامه‌نگاری (en→hi)1 / 3NDCG@10 0.34مرور کلی · مقاله
2013پنجمین رقابت بین‌المللی تشخیص سرقت ادبیPAN @ CLEF · Valenciaتراز متن6 / 90.61523مرور کلی · مقاله
2014ششمین رقابت بین‌المللی تشخیص سرقت ادبی 1ST*PAN @ CLEF · Sheffieldتراز متن1 std · 3/100.868مرور کلی · مقاله
2026Voight-Kampff تشخیص متن تولیدشده توسط هوش مصنوعی TOP AUCPAN @ CLEF · Jenaمتن انسانی در برابر هوش مصنوعی3 / 34ROC-AUC 0.996جدول رتبه‌بندی

plagdet = امتیاز کلی PAN برای تشخیص سرقت ادبی (ترکیبی از دقت، بازیابی و دانه‌بندی). NDCG@10 = کیفیت رتبه‌بندی. ROC-AUC = کیفیت طبقه‌بندی مستقل از آستانه. *۲۰۱۴: رتبه اول در مجموعه آزمایشی استاندارد، سوم از ۱۰ در مجموعه رتبه‌بندی رسمی. ۲۰۲۶: سوم از ۳۴ تیم؛ بالاترین ROC-AUC در میان همه تیم‌ها و خطوط پایه.

از آزمایشگاه تا محصول

روش‌هایی که به آن‌ها اعتماد می‌کنید

هر رقابت، تکنیکی را مستند کرده که در موتور ارسال‌شده به‌کار گرفته شده است. پژوهش و نرم‌افزار یک نسل واحد هستند — نه ادعاهای بازاریابی، بلکه روش‌های منتشرشده و داوری‌شده توسط همتایان.

اثرانگشت N-gram

تشخیص سریع متقاضیان از گذرگاه‌های بازاستفاده‌شده (PAN 2010، ۲۰۱۴).

تراز متن

تطابق دقیق گذرگاه‌های منبع ↔ مشکوک با دقت بالا (PAN 2012–2014).

شباهت معنایی و چندزبانه

روش‌های WordNet و TF-IDF / ترجمه برای بازاستفاده پارافرازی و چندزبانه (PAN 2011؛ FIRE 2011–2012).

تشخیص متن تولیدشده توسط هوش مصنوعی

تمایز میان نویسندگی انسانی و ماشینی — بالاترین ROC-AUC در PAN 2026.

انتشارات داوری‌شده توسط همتایان

کتابنامه

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
درباره نویسنده
YP

Yurii Palkovskii

پژوهشگر و توسعه‌دهنده اصلی · Zhytomyr State University، دانشکده زبان‌شناسی بیگانه · SkyLine LLC

نویسنده هفت مقاله داوری‌شده توسط همتایان در زمینه سرقت ادبی و تشخیص متن تولیدشده توسط هوش مصنوعی در مجموعه مقالات CLEF/CEUR-WS و FIRE، با نتایج ارزیابی‌شده به‌طور مستقل توسط کمیته سازمان‌دهنده PAN (Potthast، Stein، Rosso، Hagen و همکاران).

هر رتبه و امتیاز در این صفحه از مقاله مرور کلی رسمی رقابت یا جدول رتبه‌بندی پیوند داده‌شده در کنار آن گرفته شده — و به‌طور مستقل از این وب‌سایت قابل تأیید است. محصول از ۲۰۰۷ در حال توسعه فعال است؛ نسخه فعلی #2965.