به بالا بروید
صفحه اصلی آمار سرقت ادبی ۲۰۲۵: حقایق، روندها و داده‌های تحقیقاتی

آمار سرقت ادبی ۲۰۲۵: حقایق، روندها و داده‌های تحقیقاتی

2025-02-15 · Plagiarism Detector Team

آمار جهانی سرقت ادبی

سرقت ادبی یک مشکل جهانی است که هر بخش تولیدکننده محتوای نوشتاری را تحت تأثیر قرار می‌دهد. طبق تحقیقات منتشرشده توسط مرکز بین‌المللی صداقت آکادمیک (ICAI)، تقریباً ۶۸٪ از دانشجویان دوره کارشناسی اذعان کردند که در طول دوران تحصیلی خود در نوعی از تقلب نوشتاری از جمله سرقت ادبی شرکت داشته‌اند. این رقم در طول چندین موج نظرسنجی که بیش از دو دهه تحقیق توسط دونالد مک‌کیب و همکارانش را دربرمی‌گیرد به‌طور قابل توجهی ثابت مانده است.

یک فراتحلیل بزرگ‌مقیاس منتشرشده در PLOS ONE (Pupovac و Fanelli، ۲۰۱۵) نرخ‌های سرقت ادبی خودگزارش‌شده در ۵۴ مطالعه را بررسی کرد و شیوع ترکیبی تقریباً ۳۰٪ از دانشجویانی که به حداقل یک نمونه سرقت ادبی اذعان کردند را یافت. مطالعه تنوع قابل توجهی را بر اساس منطقه مشاهده کرد و برخی کشورها نرخ‌های بالای ۵۰٪ و برخی دیگر زیر ۱۰٪ را گزارش دادند که تفاوت‌ها در نگرش‌های فرهنگی، اجرای سازمانی و آگاهی از هنجارهای سرقت ادبی را منعکس می‌کند.

مشکل فراتر از حوزه آکادمیک گسترش دارد. یک گزارش ۲۰۱۹ توسط iThenticate (یک شرکت Turnitin) که ویراستاران و محققان را مورد بررسی قرار داد نشان داد که ۱ از هر ۶ نسخه خطی ارسالی به مجلات آکادمیک حاوی همپوشانی متنی قابل توجه با مواد قبلاً منتشرشده بود. در صنایع روزنامه‌نگاری و نشر، رسوایی‌های سرقت ادبی به‌طور منظم برملا می‌شوند و موارد پرمخاطب در سازمان‌های خبری بزرگ در سال‌های اخیر گزارش شده است.

آمار جهانی سرقت ادبی

نرخ‌های سرقت ادبی آکادمیک

تحقیقات بی‌صداقتی آکادمیک به‌طور مداوم نشان می‌دهند که سرقت ادبی در همه سطوح آموزش فراگیر است. مرکز مک‌کیب برای صداقت آکادمیک (پیش‌تر مرکز بین‌المللی صداقت آکادمیک) داده‌هایی از بیش از ۷۱,۰۰۰ دانشجوی کارشناسی و ۱۷,۰۰۰ دانشجوی تحصیلات تکمیلی در سراسر آمریکای شمالی جمع‌آوری کرده است. یافته‌های آن‌ها نشان می‌دهد که ۳۹٪ از کارشناسی‌ها اذعان کرده‌اند چند جمله از منبع اینترنتی را بدون استناد بازنویسی یا کپی کرده‌اند، و ۶۲٪ از کارشناسی‌ها به حداقل یک رفتار تقلب جدی در تکالیف نوشتاری اذعان کرده‌اند.

یک نظرسنجی ۲۰۲۳ توسط Turnitin گزارش داد که در میان ارسالی‌های پردازش‌شده از طریق سیستمشان، تقریباً ۱۱٪ از مقالات دانشجویی حاوی همپوشانی متنی قابل توجه (بالای ۲۵٪ تشابه) از منابع بدون استناد بود. مطالعه جداگانه‌ای توسط Bretag و همکاران (۲۰۱۹) منتشرشده در Studies in Higher Education ۱۴,۰۸۶ دانشجو را در هشت دانشگاه استرالیایی بررسی کرد و دریافت که ۶.۵٪ اذعان کردند به خرید یا برون‌سپاری تکالیف (تقلب قراردادی)، که یک شکل به‌ویژه شدید از تقلب آکادمیک است.

سرقت ادبی در سطح تحصیلات تکمیلی کمتر مطالعه شده اما غیرمعمول نیست. دفتر صداقت تحقیقاتی (ORI) در ایالات متحده صدها مورد سوء رفتار تحقیقاتی را از زمان تأسیسش بررسی کرده که سرقت ادبی و جعل داده به عنوان دسته‌های اصلی هستند. مطالعه‌ای توسط Heitman و Litewka (۲۰۱۱) منتشرشده در Developing World Bioethics دریافت که سرقت ادبی در انتشارات علمی در کشورهای در حال توسعه رایج‌تر بود، که بخشی به موانع زبانی و هنجارهای آکادمیک متفاوت مربوط می‌شود.

انتشار ChatGPT در نوامبر ۲۰۲۲ یک نقطه عطف در صداقت آکادمیک بود. یک نظرسنجی انجام‌شده توسط گروه تحقیقاتی هوش مصنوعی انسان‌محور دانشگاه Stanford دریافت که تقریباً ۱۷٪ از دانشجویان دانشگاه مورد بررسی گزارش دادند در سال تحصیلی ۲۰۲۲-۲۰۲۳ از ابزارهای هوش مصنوعی برای تکالیف استفاده کرده‌اند. نظرسنجی‌های بعدی نشان می‌دهند این رقم به‌طور قابل توجهی افزایش یافته است.

Turnitin در ۲۰۲۴ گزارش داد که سیستم تشخیص هوش مصنوعی آن‌ها بین ۶٪ تا ۱۱٪ از مقالات ارسال‌شده دانشجویان را به عنوان حاوی محتوای هوش مصنوعی قابل توجه (تعریف‌شده به عنوان ۸۰٪ یا بیشتر متن نوشته‌شده توسط هوش مصنوعی) علامت‌گذاری کرد. یک نظرسنجی توسط BestColleges (۲۰۲۳) دریافت که ۵۶٪ از دانشجویان دانشگاه از ابزارهای هوش مصنوعی برای کارهای درسی استفاده کرده بودند و حدود نیمی از آن‌ها اذعان کردند که موسسه‌هایشان چنین استفاده‌ای را نوعی تقلب یا سرقت ادبی می‌داند.

چالش محتوای تولیدشده توسط هوش مصنوعی فراتر از آموزش گسترش دارد. یک تحلیل ۲۰۲۴ توسط Originality.AI تخمین زد که درصد قابل توجه و رو به رشدی از محتوای وب تازه منتشرشده نشانه‌هایی از تولید توسط هوش مصنوعی نشان می‌دهد. این چالش‌های جدیدی برای ابزارهای تشخیص سرقت ادبی ایجاد می‌کند که اکنون باید بین متن اصیل نوشته‌شده توسط انسان، متن سرقت‌شده توسط انسان و متن تولیدشده توسط هوش مصنوعی تشخیص دهند؛ سه دسته متمایز که به رویکردهای تشخیص متفاوتی نیاز دارند.

سرقت ادبی در نشر و روزنامه‌نگاری

سرقت ادبی در نشر حرفه‌ای پیامدهایی دارد که فراتر از حرفه‌های فردی گسترش می‌یابد. مطالعه‌ای توسط Fang، Steen و Casadevall (۲۰۱۲) منتشرشده در Proceedings of the National Academy of Sciences ۲,۰۴۷ مقاله زیست‌پزشکی پس‌گرفته‌شده را تحلیل کرد و دریافت که ۹.۸٪ از عقب‌نشینی‌ها به سرقت ادبی نسبت داده شده، در حالی که تقلب و انتشار مضاعف عمده را تشکیل می‌دادند. این مطالعه تثبیت کرد که نرخ عقب‌نشینی در ادبیات علمی از سال ۱۹۷۵ ده برابر شده است.

در روزنامه‌نگاری، موسسه Poynter و سایر سازمان‌های اخلاق رسانه‌ای الگویی از موارد پرمخاطب سرقت ادبی در سازمان‌های خبری بزرگ را مستند کرده‌اند. موارد شامل گزارشگرانی در نیویورک تایمز، واشنگتن پست، CNN و Der Spiegel و دیگران بوده است. مطالعه‌ای در ۲۰۱۴ توسط Honeycut و Freberg دریافت که موارد سرقت ادبی روزنامه‌نگاران بی‌اعتمادی عمومی را افزایش داد به سازمان‌های خبری تأثیرگذار و به رسانه به‌طور کلی.

انتشار دیجیتال سرقت ادبی را هم آسان‌تر کرده هم آسان‌تر قابل تشخیص. ابزارهای کپی محتوا می‌توانند مقالات را در طول چند ساعت از انتشار در هزاران وب‌سایت تکثیر کنند. در عین حال، ابزارهای تشخیص سرقت ادبی بررسی محتوای ورودی در برابر میلیاردها صفحه وب ایندکس‌شده و علامت‌گذاری مسائل بالقوه قبل از انتشار را برای ناشران ساده می‌کنند.

تأثیر مالی سرقت ادبی

پیامدهای مالی سرقت ادبی بر افراد، موسسات و صنایع تأثیر می‌گذارد. در محیط‌های آکادمیک، دانشجویانی که سرقت ادبی می‌کنند ممکن است بورس تحصیلی از دست بدهند، با هزینه‌های مرتبط با شهریه از شکست‌های درسی روبرو شوند یا هزینه‌هایی مرتبط با رسیدگی‌های قانونی متحمل شوند. مطالعه‌ای در ۲۰۲۰ توسط آژانس تضمین کیفیت آموزش عالی (QAA) در بریتانیا تخمین زد که بازار جهانی تقلب قراردادی؛ که در آن دانشجویان به اشخاص ثالث پول می‌دهند تا تکالیفشان را بنویسند؛ ارزش بیش از یک میلیارد دلار سالانه داشت.

برای ناشران و کسب‌وکارها، سرقت ادبی می‌تواند منجر به مسئولیت مالی مستقیم شود. دعاوی نقض حق مؤلف در ایالات متحده معمولاً منجر به خسارات قانونی ۷۵۰ تا ۳۰,۰۰۰ دلار به ازای هر اثر نقض‌شده می‌شوند با جریمه‌های نقض عمدی که تا ۱۵۰,۰۰۰ دلار به ازای هر اثر تحت قانون حق مؤلف می‌رسد. انجمن نویسندگان و سازمان‌های مشابه گزارش می‌دهند که سرقت محتوا سالانه صدها میلیون دلار درآمد از دست رفته به نویسندگان و ناشران وارد می‌کند.

موسسات نیز هزینه‌ها را تحمل می‌کنند. دانشگاه‌ها منابع قابل توجهی در زیرساخت صداقت آکادمیک سرمایه‌گذاری می‌کنند؛ مجوزهای نرم‌افزار تشخیص سرقت ادبی، مسئولان صداقت، فرآیندهای تحقیق و برنامه‌های آموزشی. طبق افشائیات بودجه سازمانی، دانشگاه‌های بزرگ ممکن است ۵۰,۰۰۰ تا ۳۰۰,۰۰۰ دلار یا بیشتر سالانه فقط برای سرویس‌های تشخیص سرقت ادبی هزینه کنند، به‌ویژه آن‌هایی که از مدل‌های قیمت‌گذاری اشتراکی بر اساس دانشجو استفاده می‌کنند.

متن خود را با دزدی ادبی بررسی کنید

یک نسخه آزمایشی رایگان دانلود کنید یا مجوز خریداری کنید تا بررسی سرقت ادبی و محتوای تولید شده توسط هوش مصنوعی را شروع کنید.

پیشگیری و پذیرش تشخیص

فناوری تشخیص سرقت ادبی به یک شیوه استاندارد در آموزش و نشر تبدیل شده است. طبق یک نظرسنجی ۲۰۲۲ توسط Educause، بیش از ۹۰٪ از موسسات آموزش عالی در ایالات متحده و بریتانیا اکنون از نوعی نرم‌افزار تشخیص سرقت ادبی استفاده می‌کنند. نرخ پذیرش به‌سرعت در آسیا، خاورمیانه و آمریکای لاتین با افزایش آگاهی از صداقت آکادمیک به‌صورت جهانی در حال رشد است.

ادغام تشخیص محتوای هوش مصنوعی در گردش کارهای بررسی سرقت ادبی جدیدترین تکامل در فناوری پیشگیری را نشان می‌دهد. موسسات و ناشران به‌طور فزاینده‌ای ابزارهایی را که تشخیص سرقت ادبی سنتی را با تحلیل هوش مصنوعی در یک پلتفرم واحد ترکیب می‌کنند جستجو می‌کنند. ابزارهای مبتنی بر دسکتاپ مزیت اضافی برای سازمان‌های آگاه از حریم خصوصی ارائه می‌دهند زیرا امکان بررسی اسناد را بدون آپلود به سرورهای ابری خارجی فراهم می‌کنند.

آموزش مؤثرترین راهبرد پیشگیری بلندمدت باقی می‌ماند. تحقیقات توسط مک‌کیب، باترفیلد و ترویینو (منتشرشده در کتابشان Cheating in College، انتشارات Johns Hopkins University، ۲۰۱۲) دریافت که موسساتی با قوانین شرافت و برنامه‌های آموزشی فعال صداقت نرخ‌های تقلب ۲۵ تا ۵۰٪ پایین‌تر از آن‌هایی که صرفاً به تشخیص و مجازات تکیه می‌کنند داشتند. مؤثرترین رویکرد سیاست‌های روشن، ارتباط آموزشی و فناوری تشخیص قابل اعتماد را ترکیب می‌کند.

سؤالات متداول

سرقت ادبی در دانشگاه‌ها چقدر رایج است؟
پژوهش مرکز بین‌المللی صداقت علمی نشان می‌دهد که تقریباً ۶۸ درصد دانشجویان کارشناسی به نوعی از تقلب نوشتاری اعتراف می‌کنند، در حالی که ۳۹ درصد به کپی کردن یا بازنویسی منابع اینترنتی بدون ارجاع اعتراف می‌کنند. نرخ‌های واقعی سرقت ادبی ممکن است بیشتر از ارقام خودگزارش‌شده باشند، چون خودگزارشی تمایل دارد رفتار نادرست را دست کم بگیرد.
چه درصدی از مقالات دانش‌آموزان حاوی سرقت ادبی هستند؟
داده‌های Turnitin نشان می‌دهد که تقریباً ۱۱ درصد از ارائه‌های دانش‌آموزان حاوی همپوشانی متن قابل توجه (بالای ۲۵ درصد شباهت) از منابع بدون ارجاع هستند. با این حال، سطحی از تطابق متن در کار علمی ارجاع‌داده‌شده صحیح، عادی و مورد انتظار است. تمایز بین سرقت ادبی و ارجاع مشروع هنگام تفسیر امتیازهای شباهت حیاتی است.
چه مقدار محتوای تولیدشده توسط هوش مصنوعی در مدارس ارائه می‌شود؟
تخمین‌ها متفاوت است، اما Turnitin در ۲۰۲۴ گزارش داد که ۶ تا ۱۱ درصد از ارائه‌های دانش‌آموزان حاوی محتوای قابل توجه تولیدشده توسط هوش مصنوعی بودند. یک نظرسنجی BestColleges نشان داد که ۵۶ درصد دانشجویان از ابزارهای هوش مصنوعی برای کارهای دانشگاهی استفاده کرده‌اند، هرچند همه استفاده‌ها بی‌صداقتی علمی محسوب نمی‌شوند — برخی مؤسسات کمک هوش مصنوعی برای وظایف خاص را مجاز می‌دانند.
سرقت ادبی چقدر برای ناشران و نویسندگان هزینه دارد؟
نقض حق مؤلف می‌تواند منجر به خسارات قانونی ۷۵۰ تا ۱۵۰۰۰۰ دلار به ازای هر اثر نقض‌شده در ایالات متحده شود. بازار جهانی تقلب در قراردادها به تنهایی سالانه بیش از ۱ میلیارد دلار است. موارد فردی سرقت ادبی در ناشران منجر به تسویه دعوا، فراخوان کتاب و آسیب اعتباری شغل‌خراب‌کننده برای نویسندگان شده است.
آیا ابزارهای تشخیص سرقت ادبی واقعاً تقلب را کاهش می‌دهند؟
بله. پژوهش نشان می‌دهد مؤسساتی که از ابزارهای تشخیص سرقت ادبی استفاده می‌کنند نرخ‌های سرقت ادبی پایین‌تری تجربه می‌کنند، به خصوص وقتی تشخیص با آموزش و سیاست‌های صداقت واضح ترکیب می‌شود. اثر بازدارندگی به خوبی مستند شده است: دانش‌آموزانی که می‌دانند کارشان بررسی می‌شود به طور قابل توجهی کمتر سرقت ادبی می‌کنند. پژوهش McCabe نشان داد که ترکیب آیین‌نامه‌های شرافت با فناوری تشخیص، تقلب را ۲۵ تا ۵۰ درصد کاهش می‌دهد.