سرقت ادبی مستقیم آشکارترین و عمدیترین شکل است؛ کپی کلمهبهکلمه متن دیگری و ارائه آن به عنوان متعلق به خود بدون علامتگذاری نقلقول یا استناد. این شامل کپی کردن پاراگرافهای کامل از کتابها، مقالات، وبسایتها یا مقالات دیگر دانشجویان است. در محیط آکادمیک، سرقت ادبی مستقیم یک عمل متقلبانه جدی تلقی میشود و معمولاً سختترین مجازاتها را به دنبال دارد، از جمله نمره ردی برای درس یا اخراج.
سرقت ادبی مستقیم آسانترین نوع برای شناسایی است. الگوریتمهای تطابق متن اسناد ارائهشده را با میلیاردها صفحه وب ایندکسشده، پایگاههای داده آکادمیک و آثار منتشرشده مقایسه میکنند. وقتی رشتههای متنی یکسانی در هر دو کار ارائهشده و یک منبع موجود یافت میشود، تطابق فوراً علامتگذاری میشود. حتی تلاشها برای پنهان کردن متن کپیشده، مانند جایگزینی کاراکترهای یونیکد که بصری با حروف لاتین یکسان هستند، میتوانند توسط ابزارهای تخصصی مانند موتور ضد تقلب یونیکد (UACE) شناسایی شوند.
خودسرقتی، که به آن بازیافت یا انتشار مضاعف نیز گفته میشود، زمانی رخ میدهد که نویسندهای کارهای قبلاً ارائهشده یا منتشرشده خود را بدون افشاسازی مجدداً استفاده کند. این شامل ارائه یک مقاله به چندین درس، بازانتشار بخشهایی از یک مقاله قبلی در انتشار جدید، یا استفاده مجدد از بخشهای قابل توجه پایاننامه در یک ارسال به مجله است. در حالی که ممکن است بیضرر به نظر برسد، خودسرقتی انتظار اینکه هر ارسال کار اصیل باشد را نقض میکند.
در محیط آکادمیک، خودسرقتی بهویژه مشکلساز است زیرا تکالیف برای نشان دادن یادگیری جدید و تفکر اصیل طراحی شدهاند. در نشر، خودسرقتی رکورد علمی را تحریف میکند و ممکن است قراردادهای حق مؤلف با ناشرانی که حقوق کارهای قبلاً منتشرشده را دارند را نقض کند. بسیاری از مجلات اکنون صریحاً در مرحله داوری همتا خودسرقتی را بررسی میکنند. پایگاههای داده اسناد سازمانی مانند PDAS (سرور انباشت ردیاب سرقت ادبی) به سازمانها کمک میکند آرشیوهایی از کارهای ارائهشده قبلی نگهداری کنند.
سرقت ادبی موزاییکی، که گاهی وصلهدوزی نامیده میشود، یکی از فریبندهترین اشکال است. این شامل گرفتن عبارات، جملات یا ایدهها از چندین منبع و بافتن آنها با هم، اغلب با تغییرات جزئی کلمات، برای ایجاد چیزی است که به نظر میرسد یک نوشته اصیل است. سارق ادبی ممکن است یک کلمه را اینجا تغییر دهد یا جملهای را آنجا بازسازی کند، اما ایدهها، ساختار و اغلب عبارتبندی بدون استناد مناسب وام گرفته شده باقی میماند.
این نوع دشوارتر از سرقت ادبی مستقیم شناسایی میشود زیرا هیچ پاراگراف واحدی دقیقاً با یک منبع مطابقت ندارد. در عوض، متن پارچهای از قطعات اصلاحشده جزئی از منابع مختلف است. تشخیص سرقت ادبی موزاییکی به الگوریتمهای پیچیدهای نیاز دارد که میتوانند تطابقهای جزئی و الگوهای تشابه را در چندین منبع بهطور همزمان شناسایی کنند. ابزارهای شناسایی موثر در ۴+ میلیارد منبع اینترنتی جستجو میکنند و از چندین موتور جستجو استفاده میکنند.
سرقت ادبی تصادفی زمانی رخ میدهد که یک نویسنده بهطور ناخواسته منابع را به درستی استناد ندهد، اطلاعات را نادرست نسبت دهد، یا ناخودآگاه از عبارتبندیهایی که بسیار به اصل نزدیک است استفاده کند. این معمولاً زمانی اتفاق میافتد که دانشجویان در حین تحقیق یادداشتهای ضعیفی میگیرند، یا زمانی که با قراردادهای استناد مورد نیاز در رشته خود آشنا نیستند.
علیرغم غیرعمدی بودن، سرقت ادبی تصادفی همچنان توسط اکثر موسسات به عنوان سرقت ادبی در نظر گرفته میشود. قصد، عدم استناد به منابع را توجیه نمیکند. بهترین دفاع در برابر سرقت ادبی تصادفی، یادداشتبرداری دقیق، آگاهی کامل از استانداردهای استناد و انجام یک بررسی سرقت ادبی نهایی قبل از ارسال است.
سرقت ادبی بازنویسی زمانی رخ میدهد که کسی ایدههای دیگری را با کلمات متفاوت بازنویسی کند اما استناد مناسب ارائه ندهد. برخلاف سرقت ادبی مستقیم، عبارتبندی تغییر میکند، اما ایدههای اساسی، استدلالها یا ساختار بدون اعتباردهی از منبع گرفته شدهاند. بسیاری از دانشجویان اشتباهاً معتقدند که تغییر کلمات کافی است، اما رویه آکادمیک صحیح مستلزم استناد به منبع ایده صرفنظر از نحوه بیان آن است.
تشخیص سرقت ادبی بازنویسی یکی از چالشبرانگیزترین وظایف در تشخیص سرقت ادبی است زیرا متن کلمهبهکلمه با اصل مطابقت ندارد. تطابق متن استاندارد به تنهایی کافی نیست. فناوری پیشرفته تشخیص بازنویسی تشابه معنایی را تجزیهوتحلیل میکند تا محتوایی را که بدون استناد بازنویسی شده شناسایی کند. این قابلیت برای هر گردش کار جدی تشخیص سرقت ادبی ضروری است.
سرقت ادبی با هوش مصنوعی جدیدترین و سریعترین شکل در حال رشد است. این شامل ارائه محتوای تولیدشده توسط مدلهای زبانی بزرگ مانند ChatGPT، Gemini یا HuggingChat به عنوان کار اصیل خود است. از آنجایی که متن تولیدشده توسط هوش مصنوعی از هیچ منبع خاصی کپی نشده، بهطور کامل از تشخیص سنتی مبتنی بر تطابق متن فرار میکند. خروجی از نظر آماری منحصربهفرد است، اما محصول تفکر، تحقیق یا یادگیری خود ارائهدهنده نیست.
تشخیص محتوای تولیدشده توسط هوش مصنوعی رویکرد اساساً متفاوتی نیاز دارد. الگوریتمهای تشخیص هوش مصنوعی الگوهای آماری متن را تجزیهوتحلیل میکنند تا مشخص کنند آیا محتوا احتمالاً توسط ماشین و نه انسان تولید شده است. ردیاب سرقت ادبی شامل تشخیص محتوای هوش مصنوعی با حساسیت ۰.۹۸ است که قادر به شناسایی خروجی ChatGPT، Gemini، HuggingChat و سایر مدلهای زبانی است.
یک نسخه آزمایشی رایگان دانلود کنید یا مجوز خریداری کنید تا بررسی سرقت ادبی و محتوای تولید شده توسط هوش مصنوعی را شروع کنید.
انواع مختلف سرقت ادبی به استراتژیهای تشخیص متفاوتی نیاز دارند. سرقت ادبی مستقیم با مقایسه تطابق دقیق متن با پایگاههای داده بزرگ محتوای منتشرشده شناسایی میشود. سرقت ادبی موزاییکی به الگوریتمهای تطابق جزئی نیاز دارد که میتوانند قطعات وامگرفتهشده را حتی در متن دیگری اصیل شناسایی کنند. سرقت ادبی بازنویسی به تشخیص بازنویسیای نیاز دارد که معنا را نه عبارتبندی سطح-سطحی تجزیهوتحلیل کند.
یک ابزار جامع تشخیص سرقت ادبی همه این انواع را در یک گردش کار واحد پوشش میدهد. ردیاب سرقت ادبی در ۴+ میلیارد منبع اینترنتی با استفاده همزمان از Google، Bing، Yahoo و DuckDuckGo جستجو میکند، تشخیص بازنویسی و فناوری ضد تقلب UACE را ترکیب میکند، و تشخیص محتوای هوش مصنوعی را در یک برنامه دسکتاپ ادغام میکند که اسناد شما را خصوصی نگه میدارد.