سرقت ادبی یک مشکل جهانی است که هر بخش تولیدکننده محتوای نوشتاری را تحت تأثیر قرار میدهد. طبق تحقیقات منتشرشده توسط مرکز بینالمللی صداقت آکادمیک (ICAI)، تقریباً ۶۸٪ از دانشجویان دوره کارشناسی اذعان کردند که در طول دوران تحصیلی خود در نوعی از تقلب نوشتاری از جمله سرقت ادبی شرکت داشتهاند. این رقم در طول چندین موج نظرسنجی که بیش از دو دهه تحقیق توسط دونالد مککیب و همکارانش را دربرمیگیرد بهطور قابل توجهی ثابت مانده است.
یک فراتحلیل بزرگمقیاس منتشرشده در PLOS ONE (Pupovac و Fanelli، ۲۰۱۵) نرخهای سرقت ادبی خودگزارششده در ۵۴ مطالعه را بررسی کرد و شیوع ترکیبی تقریباً ۳۰٪ از دانشجویانی که به حداقل یک نمونه سرقت ادبی اذعان کردند را یافت. مطالعه تنوع قابل توجهی را بر اساس منطقه مشاهده کرد و برخی کشورها نرخهای بالای ۵۰٪ و برخی دیگر زیر ۱۰٪ را گزارش دادند که تفاوتها در نگرشهای فرهنگی، اجرای سازمانی و آگاهی از هنجارهای سرقت ادبی را منعکس میکند.
مشکل فراتر از حوزه آکادمیک گسترش دارد. یک گزارش ۲۰۱۹ توسط iThenticate (یک شرکت Turnitin) که ویراستاران و محققان را مورد بررسی قرار داد نشان داد که ۱ از هر ۶ نسخه خطی ارسالی به مجلات آکادمیک حاوی همپوشانی متنی قابل توجه با مواد قبلاً منتشرشده بود. در صنایع روزنامهنگاری و نشر، رسواییهای سرقت ادبی بهطور منظم برملا میشوند و موارد پرمخاطب در سازمانهای خبری بزرگ در سالهای اخیر گزارش شده است.
تحقیقات بیصداقتی آکادمیک بهطور مداوم نشان میدهند که سرقت ادبی در همه سطوح آموزش فراگیر است. مرکز مککیب برای صداقت آکادمیک (پیشتر مرکز بینالمللی صداقت آکادمیک) دادههایی از بیش از ۷۱,۰۰۰ دانشجوی کارشناسی و ۱۷,۰۰۰ دانشجوی تحصیلات تکمیلی در سراسر آمریکای شمالی جمعآوری کرده است. یافتههای آنها نشان میدهد که ۳۹٪ از کارشناسیها اذعان کردهاند چند جمله از منبع اینترنتی را بدون استناد بازنویسی یا کپی کردهاند، و ۶۲٪ از کارشناسیها به حداقل یک رفتار تقلب جدی در تکالیف نوشتاری اذعان کردهاند.
یک نظرسنجی ۲۰۲۳ توسط Turnitin گزارش داد که در میان ارسالیهای پردازششده از طریق سیستمشان، تقریباً ۱۱٪ از مقالات دانشجویی حاوی همپوشانی متنی قابل توجه (بالای ۲۵٪ تشابه) از منابع بدون استناد بود. مطالعه جداگانهای توسط Bretag و همکاران (۲۰۱۹) منتشرشده در Studies in Higher Education ۱۴,۰۸۶ دانشجو را در هشت دانشگاه استرالیایی بررسی کرد و دریافت که ۶.۵٪ اذعان کردند به خرید یا برونسپاری تکالیف (تقلب قراردادی)، که یک شکل بهویژه شدید از تقلب آکادمیک است.
سرقت ادبی در سطح تحصیلات تکمیلی کمتر مطالعه شده اما غیرمعمول نیست. دفتر صداقت تحقیقاتی (ORI) در ایالات متحده صدها مورد سوء رفتار تحقیقاتی را از زمان تأسیسش بررسی کرده که سرقت ادبی و جعل داده به عنوان دستههای اصلی هستند. مطالعهای توسط Heitman و Litewka (۲۰۱۱) منتشرشده در Developing World Bioethics دریافت که سرقت ادبی در انتشارات علمی در کشورهای در حال توسعه رایجتر بود، که بخشی به موانع زبانی و هنجارهای آکادمیک متفاوت مربوط میشود.
انتشار ChatGPT در نوامبر ۲۰۲۲ یک نقطه عطف در صداقت آکادمیک بود. یک نظرسنجی انجامشده توسط گروه تحقیقاتی هوش مصنوعی انسانمحور دانشگاه Stanford دریافت که تقریباً ۱۷٪ از دانشجویان دانشگاه مورد بررسی گزارش دادند در سال تحصیلی ۲۰۲۲-۲۰۲۳ از ابزارهای هوش مصنوعی برای تکالیف استفاده کردهاند. نظرسنجیهای بعدی نشان میدهند این رقم بهطور قابل توجهی افزایش یافته است.
Turnitin در ۲۰۲۴ گزارش داد که سیستم تشخیص هوش مصنوعی آنها بین ۶٪ تا ۱۱٪ از مقالات ارسالشده دانشجویان را به عنوان حاوی محتوای هوش مصنوعی قابل توجه (تعریفشده به عنوان ۸۰٪ یا بیشتر متن نوشتهشده توسط هوش مصنوعی) علامتگذاری کرد. یک نظرسنجی توسط BestColleges (۲۰۲۳) دریافت که ۵۶٪ از دانشجویان دانشگاه از ابزارهای هوش مصنوعی برای کارهای درسی استفاده کرده بودند و حدود نیمی از آنها اذعان کردند که موسسههایشان چنین استفادهای را نوعی تقلب یا سرقت ادبی میداند.
چالش محتوای تولیدشده توسط هوش مصنوعی فراتر از آموزش گسترش دارد. یک تحلیل ۲۰۲۴ توسط Originality.AI تخمین زد که درصد قابل توجه و رو به رشدی از محتوای وب تازه منتشرشده نشانههایی از تولید توسط هوش مصنوعی نشان میدهد. این چالشهای جدیدی برای ابزارهای تشخیص سرقت ادبی ایجاد میکند که اکنون باید بین متن اصیل نوشتهشده توسط انسان، متن سرقتشده توسط انسان و متن تولیدشده توسط هوش مصنوعی تشخیص دهند؛ سه دسته متمایز که به رویکردهای تشخیص متفاوتی نیاز دارند.
سرقت ادبی در نشر حرفهای پیامدهایی دارد که فراتر از حرفههای فردی گسترش مییابد. مطالعهای توسط Fang، Steen و Casadevall (۲۰۱۲) منتشرشده در Proceedings of the National Academy of Sciences ۲,۰۴۷ مقاله زیستپزشکی پسگرفتهشده را تحلیل کرد و دریافت که ۹.۸٪ از عقبنشینیها به سرقت ادبی نسبت داده شده، در حالی که تقلب و انتشار مضاعف عمده را تشکیل میدادند. این مطالعه تثبیت کرد که نرخ عقبنشینی در ادبیات علمی از سال ۱۹۷۵ ده برابر شده است.
در روزنامهنگاری، موسسه Poynter و سایر سازمانهای اخلاق رسانهای الگویی از موارد پرمخاطب سرقت ادبی در سازمانهای خبری بزرگ را مستند کردهاند. موارد شامل گزارشگرانی در نیویورک تایمز، واشنگتن پست، CNN و Der Spiegel و دیگران بوده است. مطالعهای در ۲۰۱۴ توسط Honeycut و Freberg دریافت که موارد سرقت ادبی روزنامهنگاران بیاعتمادی عمومی را افزایش داد به سازمانهای خبری تأثیرگذار و به رسانه بهطور کلی.
انتشار دیجیتال سرقت ادبی را هم آسانتر کرده هم آسانتر قابل تشخیص. ابزارهای کپی محتوا میتوانند مقالات را در طول چند ساعت از انتشار در هزاران وبسایت تکثیر کنند. در عین حال، ابزارهای تشخیص سرقت ادبی بررسی محتوای ورودی در برابر میلیاردها صفحه وب ایندکسشده و علامتگذاری مسائل بالقوه قبل از انتشار را برای ناشران ساده میکنند.
پیامدهای مالی سرقت ادبی بر افراد، موسسات و صنایع تأثیر میگذارد. در محیطهای آکادمیک، دانشجویانی که سرقت ادبی میکنند ممکن است بورس تحصیلی از دست بدهند، با هزینههای مرتبط با شهریه از شکستهای درسی روبرو شوند یا هزینههایی مرتبط با رسیدگیهای قانونی متحمل شوند. مطالعهای در ۲۰۲۰ توسط آژانس تضمین کیفیت آموزش عالی (QAA) در بریتانیا تخمین زد که بازار جهانی تقلب قراردادی؛ که در آن دانشجویان به اشخاص ثالث پول میدهند تا تکالیفشان را بنویسند؛ ارزش بیش از یک میلیارد دلار سالانه داشت.
برای ناشران و کسبوکارها، سرقت ادبی میتواند منجر به مسئولیت مالی مستقیم شود. دعاوی نقض حق مؤلف در ایالات متحده معمولاً منجر به خسارات قانونی ۷۵۰ تا ۳۰,۰۰۰ دلار به ازای هر اثر نقضشده میشوند با جریمههای نقض عمدی که تا ۱۵۰,۰۰۰ دلار به ازای هر اثر تحت قانون حق مؤلف میرسد. انجمن نویسندگان و سازمانهای مشابه گزارش میدهند که سرقت محتوا سالانه صدها میلیون دلار درآمد از دست رفته به نویسندگان و ناشران وارد میکند.
موسسات نیز هزینهها را تحمل میکنند. دانشگاهها منابع قابل توجهی در زیرساخت صداقت آکادمیک سرمایهگذاری میکنند؛ مجوزهای نرمافزار تشخیص سرقت ادبی، مسئولان صداقت، فرآیندهای تحقیق و برنامههای آموزشی. طبق افشائیات بودجه سازمانی، دانشگاههای بزرگ ممکن است ۵۰,۰۰۰ تا ۳۰۰,۰۰۰ دلار یا بیشتر سالانه فقط برای سرویسهای تشخیص سرقت ادبی هزینه کنند، بهویژه آنهایی که از مدلهای قیمتگذاری اشتراکی بر اساس دانشجو استفاده میکنند.
یک نسخه آزمایشی رایگان دانلود کنید یا مجوز خریداری کنید تا بررسی سرقت ادبی و محتوای تولید شده توسط هوش مصنوعی را شروع کنید.
فناوری تشخیص سرقت ادبی به یک شیوه استاندارد در آموزش و نشر تبدیل شده است. طبق یک نظرسنجی ۲۰۲۲ توسط Educause، بیش از ۹۰٪ از موسسات آموزش عالی در ایالات متحده و بریتانیا اکنون از نوعی نرمافزار تشخیص سرقت ادبی استفاده میکنند. نرخ پذیرش بهسرعت در آسیا، خاورمیانه و آمریکای لاتین با افزایش آگاهی از صداقت آکادمیک بهصورت جهانی در حال رشد است.
ادغام تشخیص محتوای هوش مصنوعی در گردش کارهای بررسی سرقت ادبی جدیدترین تکامل در فناوری پیشگیری را نشان میدهد. موسسات و ناشران بهطور فزایندهای ابزارهایی را که تشخیص سرقت ادبی سنتی را با تحلیل هوش مصنوعی در یک پلتفرم واحد ترکیب میکنند جستجو میکنند. ابزارهای مبتنی بر دسکتاپ مزیت اضافی برای سازمانهای آگاه از حریم خصوصی ارائه میدهند زیرا امکان بررسی اسناد را بدون آپلود به سرورهای ابری خارجی فراهم میکنند.
آموزش مؤثرترین راهبرد پیشگیری بلندمدت باقی میماند. تحقیقات توسط مککیب، باترفیلد و ترویینو (منتشرشده در کتابشان Cheating in College، انتشارات Johns Hopkins University، ۲۰۱۲) دریافت که موسساتی با قوانین شرافت و برنامههای آموزشی فعال صداقت نرخهای تقلب ۲۵ تا ۵۰٪ پایینتر از آنهایی که صرفاً به تشخیص و مجازات تکیه میکنند داشتند. مؤثرترین رویکرد سیاستهای روشن، ارتباط آموزشی و فناوری تشخیص قابل اعتماد را ترکیب میکند.