נווט למעלה
רקורד מדעי

רקורד בנצ'מרק הניתן לאימות עצמאי, 2009 – 2026

גלאי הפלגיאריזם אינו קופסה שחורה. מנוע הזיהוי שלו השתתף בבנצ'מרק המדעי המרכזי בתחום — תחרות PAN — ונשפט על ידי ארגונים אקדמיים עצמאיים בתשע הערכות בינלאומיות. הרקורד המלא מוצג להלן; כל תוצאה מקושרת למקורה הרשמי.

בקצרה בין 2009 ל-2014 המנוע התחרה בכל שש תחרויות PAN הבינלאומיות השנתיות לזיהוי פלגיאריזם ובשתי משימות בין-לשוניות של PAN@FIRE בהודו — וזכה במשימת CL!NSS אנגלית–הינדי ב-2012. ב-2026 אותה שושלת השתתפה במשימת Voight-Kampff לזיהוי טקסט AI גנרטיבי של PAN ורשמה את ה-ROC-AUC הגבוה ביותר (0.996) מבין כל המערכות בהערכה, ודורגה במקום השלישי מבין 34 קבוצות. המוצר נשלח ללא הפסקה מאז 2007.
רקורד תחרויות מלא

תשע הערכות, כל תוצאה עם מקור

שנהתחרותמקום קיוםמשימהדירוגציוןמקור
2009תחרות PAN הראשונה הבינלאומית לזיהוי פלגיאריזםPAN @ SEPLN · San Sebastiánזיהוי חיצוני4 / 100.3045סקירה כללית
2010תחרות PAN השנייה הבינלאומית לזיהוי פלגיאריזםPAN @ CLEF · Paduaזיהוי חיצוני8 / 180.5093סקירה כללית · מאמר
2011תחרות PAN השלישית הבינלאומית לזיהוי פלגיאריזםPAN @ CLEF · Amsterdamחיצוני (ניסוי WordNet)7 / 90.19סקירה כללית · מאמר
2011CL!TR — שימוש חוזר בטקסט הודי בין-לשוניPAN@FIRE · IIT Bombay, Mumbaiשימוש חוזר הינדי↔אנגלי4 (הרצה הטובה ביותר)F 0.603לוח תוצאות · סקירה כללית
2012תחרות PAN הרביעית הבינלאומית לזיהוי פלגיאריזםPAN @ CLEF · Romeיישור טקסט6 / 100.538סקירה כללית · מאמר
2012CL!NSS — חיפוש סיפורי חדשות הודיים בין-לשוני 1STPAN@FIRE · ISI Kolkataשימוש חוזר עיתונאי (en→hi)1 / 3NDCG@10 0.34סקירה כללית · מאמר
2013תחרות PAN החמישית הבינלאומית לזיהוי פלגיאריזםPAN @ CLEF · Valenciaיישור טקסט6 / 90.61523סקירה כללית · מאמר
2014תחרות PAN השישית הבינלאומית לזיהוי פלגיאריזם 1ST*PAN @ CLEF · Sheffieldיישור טקסט1 std · 3/100.868סקירה כללית · מאמר
2026Voight-Kampff — זיהוי טקסט AI גנרטיבי TOP AUCPAN @ CLEF · Jenaטקסט אנושי מול AI3 / 34ROC-AUC 0.996לוח תוצאות

plagdet = ציון זיהוי הפלגיאריזם הכולל של PAN (שילוב דיוק, היזכרות ופירוט). NDCG@10 = איכות דירוג. ROC-AUC = איכות סיווג בלתי תלויה בסף. *2014: מקום ראשון על קורפוס הבדיקה הסטנדרטי, שלישי מתוך 10 על קורפוס הדירוג הרשמי. 2026: שלישי מתוך 34 קבוצות; ה-ROC-AUC הגבוה ביותר מבין כל הקבוצות וקווי הבסיס.

מהמעבדה למוצר

השיטות שאתם סומכים עליהן

כל תחרות תיעדה טכניקה המיישמת את מנוע הייצור. המחקר והתוכנה הם שושלת אחת — לא טענות שיווקיות, אלא שיטות שפורסמו ועברו סקירת עמיתים.

טביעות אצבע N-gram

זיהוי מהיר של מועמדים לקטעים שנעשה בהם שימוש חוזר (PAN 2010, 2014).

יישור טקסט

התאמה מדויקת של קטעים מקוריים ↔ חשודים ברמת דיוק גבוהה (PAN 2012–2014).

דמיון סמנטי ובין-לשוני

שיטות WordNet ו-TF-IDF / תרגום לשימוש חוזר פרפרזי ובין-לשוני (PAN 2011; FIRE 2011–2012).

זיהוי טקסט שנוצר על ידי AI

הבחנה בין כתיבה אנושית לכתיבת מכונה — ROC-AUC מוביל ב-PAN 2026.

פרסומים שעברו סקירת עמיתים

ביבליוגרפיה

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
אודות המחבר
YP

Yurii Palkovskii

חוקר ומפתח ראשי · Zhytomyr State University, המכון לפילולוגיה זרה · SkyLine LLC

מחבר שבעה מאמרים שעברו סקירת עמיתים בנושא פלגיאריזם וזיהוי טקסט שנוצר על ידי AI בכנסי CLEF/CEUR-WS ו-FIRE, עם תוצאות שנבחנו באופן עצמאי על ידי ועדת הארגון של PAN (Potthast, Stein, Rosso, Hagen ועוד).

כל דירוג וציון בדף זה לקוחים ממאמר הסקירה הרשמי של התחרות או מלוח התוצאות המקושר לצידם — ניתנים לאימות עצמאי מאתר זה. המוצר בפיתוח פעיל מאז 2007; גרסת בנייה נוכחית #2965.