دانشجویان مجموعهای از تکنیکها برای فریب دادن نرمافزار تشخیص سرقت ادبی توسعه دادهاند. این روشها از ترفندهای قالببندی ساده تا رویکردهای پیشرفته با کمک فناوری متغیر هستند. در حالی که برخی تکنیکها ممکن است بررسیکنندگان آنلاین رایگان و ابتداییتر را دور بزنند، ابزارهای پیشرفته تشخیص سرقت ادبی برای کشف همه آنها طراحی شدهاند.
درک این روشهای تقلب برای هر دو مربیان و دانشجویان مهم است. برای مربیان، دانستن اینکه چه چیزی را باید بدنبال گشت کمک میکند حتی قبل از اجرای یک بررسی رسمی، ارسالیهای مشکوک را شناسایی کنند. برای دانشجویان، درک اینکه این ترفندها در برابر فناوری تشخیص مدرن کار نمیکنند یک بازدارنده قدرتمند است؛ خطر کشف شدن بسیار بیشتر از هر میانبر ادراکشدهای است.
یکی از فریبندهترین ترفندها جایگزینی کاراکتر یونیکد است؛ جایگزینی حروف لاتین استاندارد با کاراکترهای بصری یکسان از اسکریپتهای یونیکد دیگر. مثلاً دانشجویی ممکن است حرف لاتین «a» (U+0061) را با حرف سیریلیک «а» (U+0430) جایگزین کند، یا لاتین «o» را با یونانی «ο» (U+03BF). برای چشم انسان، متن یکسان به نظر میرسد. برای یک الگوریتم مقایسه متن پایه، کلمات کاملاً متفاوت به نظر میرسند.
این تکنیک آسان است (کپی-پیست از یک نقشه کاراکتر یا استفاده از ابزار جایگزینی) و برای مربیانی که سند را بصری بررسی میکنند نامرئی است. با این حال، UACE (موتور ضد تقلب یونیکد) ردیاب سرقت ادبی بهطور خاص برای غلبه بر این ترفند ساخته شده است. UACE قبل از مقایسه همه کاراکترهای یونیکد را نرمال میکند و کاراکترهای شبیه به هم از سیریلیک، یونانی، ارمنی و سایر اسکریپتها را به معادلهای لاتینشان تبدیل میکند. نتیجه: جایگزینی کاراکتر هیچ محافظتی در برابر تشخیص ایجاد نمیکند.
برخی دانشجویان بلوکهایی از متن اصیل نامربوط را با رنگ فونت سفید (نامرئی روی پسزمینه سفید) درج میکنند تا امتیاز تشابه را رقیق کنند. دیگران کاراکترهای نامرئی، فضاهای عرضصفر یا متن با اندازه ریز بین کلمات اضافه میکنند تا رشتههای تطابقی را بشکنند. تنوعهای پیچیدهتر شامل پنهان کردن متن پشت تصاویر، استفاده از جعبههای متن لایهبندیشده روی محتوا یا دستکاری فاصله پاراگراف برای درج محتوای پنهان هستند.
این ترفندهای قالببندی توسط بررسیکنندگان مدرن سرقت ادبی بهراحتی شکست میخورند. ردیاب سرقت ادبی متن خام را از اسناد در طول مرحله تجزیه استخراج میکند و تمام قالببندی، رنگهای فونت، کاراکترهای پنهان و عناصر نامرئی را برمیدارد. موتور مقایسه روی متن ساده استخراجشده کار میکند نه ارائه بصری. متن سفید، کاراکترهای عرضصفر و دستکاریهای قالببندی پنهان مطلقاً هیچ تأثیری بر دقت تشخیص ندارند.
ابزارهای بازنویسی خودکار (که به آنها «چرخندههای مقاله» یا «بازنویس» نیز گفته میشود) یک متن منبع را میگیرند و نسخه تغییریافتهای با کلمات تغییرشده و جملات بازساختاریافته تولید میکنند. دانشجویان از این ابزارها برای تبدیل محتوای سرقتشده به متنی که بهطور سطحی متفاوت از اصل به نظر میرسد استفاده میکنند. ابزارهای بازنویسی رایگان بهطور گستردهای آنلاین در دسترس هستند و نتایج با کیفیتهای متفاوت تولید میکنند.
در حالی که بررسیکنندگان پایه سرقت ادبی که صرفاً بر تطابق دقیق رشته تکیه میکنند ممکن است محتوای چرخیدهشده را از دست بدهند، فناوری تشخیص بازنویسی متن بازنویسیشده را با تحلیل شباهت معنایی شناسایی میکند. ردیاب سرقت ادبی معنای زیربنایی متون را مقایسه میکند نه فقط کلمات سطحی را. متنی که از طریق یک ابزار بازنویسی اجرا شده همان ایدهها، استدلالها و ساختار منطقی را حفظ میکند؛ و تشخیص بازنویسی آن را کشف میکند. کیفیت خروجی ابزارهای چرخش اغلب بهقدری ضعیف است که به تنهایی شک ایجاد میکند.
جدیدترین و سریعالرشدترین روش تقلب استفاده از ابزارهای هوش مصنوعی مثل ChatGPT، Gemini یا HuggingChat برای تولید مقالات کامل از صفر است. چون هوش مصنوعی متن آماری جدید تولید میکند نه کپی از منابع خاص، بررسیکنندگان سنتی سرقت ادبی که فقط محتوای تطابق آنلاین را جستجو میکنند آن را علامتگذاری نمیکنند. دانشجویان این را یک روش ضدگلوله میپندارند؛ متن از نظر فنی «اصیل» است به این معنی که هیچ متن یکسانی در جای دیگری وجود ندارد.
با این حال، فناوری تشخیص محتوای هوش مصنوعی الگوهای آماری متن را تجزیهوتحلیل میکند تا تعیین کند آیا توسط یک مدل زبانی تولید شده است. ردیاب سرقت ادبی شامل تشخیص هوش مصنوعی یکپارچه با حساسیت ۰.۹۸ است و در ۹۸٪ موارد متن تولیدشده توسط هوش مصنوعی را بهدرستی شناسایی میکند. نرمافزار گیجی پایین مشخصه و انفجاری یکنواخت متن تولیدشده توسط ماشین را تشخیص میدهد، صرفنظر از اینکه کدام ابزار هوش مصنوعی آن را تولید کرده. استفاده از هوش مصنوعی برای نوشتن تکالیف یک حفره قانونی نیست؛ یک جرم قابل تشخیص و مجازات است.
یک نسخه آزمایشی رایگان دانلود کنید یا مجوز خریداری کنید تا بررسی سرقت ادبی و محتوای تولید شده توسط هوش مصنوعی را شروع کنید.
دلیل اینکه ابزارهای پیشرفته تشخیص سرقت ادبی تمام این تکنیکهای تقلب را شکست میدهند رویکرد چندلایه آنهاست. به جای اتکا به یک روش تشخیص واحد، ابزارهایی مثل ردیاب سرقت ادبی چندین فناوری را ترکیب میکنند که هر کدام راهبردهای فرار متفاوتی را برطرف میکنند. UACE جایگزینی کاراکتر را خنثی میکند. استخراج متن ترفندهای قالببندی را حذف میکند. تشخیص بازنویسی محتوای بازنویسیشده را کشف میکند. تشخیص محتوای هوش مصنوعی متن تولیدشده توسط ماشین را شناسایی میکند.
این لایهها در یک اسکن واحد با هم کار میکنند. وقتی یک سند پردازش میکنید، تمام فناوریهای تشخیص بهطور همزمان اجرا میشوند و یک گزارش اصالت جامع تولید میکنند که تطابقهای دقیق، شباهتهای معنایی، تلاشهای دستکاری کاراکتر و محتوای تولیدشده توسط هوش مصنوعی را پوشش میدهد. جستجو در ۴+ میلیارد منبع اینترنتی از طریق Google، Bing، Yahoo و DuckDuckGo انجام میشود. هیچ ترفند واحدی وجود ندارد که بتواند همه لایهها را بهیکباره دور بزند و این دلیلی است که تلاش برای تقلب یک راهبرد بازنده است.
پیامدهای کشف تقلب شدید و ماندگار است. در محیطهای آکادمیک، مجازاتها معمولاً با صفر در تکلیف شروع میشوند و میتوانند به مردود شدن در درس، تعلیق یا اخراج تشدید شوند. بسیاری از موسسات یادداشتهای دائمی در کارنامههای آکادمیک قرار میدهند که میتوانند برای سالها بر درخواستهای دانشکده تحصیلات تکمیلی، صدور مجوزهای حرفهای و چشمانداز استخدامی تأثیر بگذارند.
فراتر از مجازاتهای رسمی، کشف تقلب به شهرت شما در میان استادان و همتایان آسیب میزند. مربیان اطلاعات درباره نقض صداقت را به اشتراک میگذارند و یک حادثه واحد میتواند در سراسر حرفه آکادمیک شما دنبالتان باشد. طنز این است که زمان و تلاش صرفشده برای دور زدن تشخیص سرقت ادبی میتوانست برای واقعاً تکمیل تکلیف سرمایهگذاری شود؛ که منجر به یادگیری واقعی و سوابق تمیز میشد.
ابزارهای تشخیص مدرن کشف شدن را تبدیل به مسئله «وقتی»، نه «اگر» میکنند. به جای قمار کردن با حرفه آکادمیک خود روی تکنیکهایی که کار نمیکنند، روی توسعه مهارتهای نوشتاری خودتان سرمایهگذاری کنید. از بررسیکنندگان سرقت ادبی بهصورت فعالانه برای تأیید اصالت کارتان قبل از ارسال استفاده کنید. این ابزارها برای کمک به نویسندگان صادق وجود دارند نه فقط برای کشف نویسندگان ناصادق.