抄襲是一個影響所有生產書面內容的行業的全球性問題。根據國際學術誠信中心(ICAI)發表的研究,約有68%的大學本科生承認在其學術生涯中從事過某種形式的書面作弊,包括抄襲。這一數字在Donald McCabe及其同事超過二十年的多輪調查中保持了驚人的一致性。
發表在PLOS ONE(Pupovac和Fanelli,2015年)上的大型元分析,審查了54項研究中的自我報告抄襲率,發現約有30%的學生至少承認過一次抄襲行為的匯總患病率。該研究指出了各地區的顯著差異,一些國家的比率超過50%,另一些則低於10%,反映了文化態度、機構執法和抄襲規範意識方面的差異。
問題延伸到學術界之外。iThenticate(Turnitin公司)2019年的一份報告,對編輯和研究人員進行了調查,發現向學術期刊提交的手稿中,六分之一與之前發表的材料存在顯著的文字重疊。在新聞和出版業,抄襲醜聞持續浮現,近年來在主要新聞機構報告了高知名度案例。
學術不誠信研究一致揭示,抄襲在各個教育層級普遍存在。麥凱布學術誠信中心(前身為國際學術誠信中心)從北美超過71,000名本科生和17,000名研究生收集了數據。其研究發現,39%的本科生承認在未引用的情況下改述或複製了網路來源的幾個句子,而62%的本科生承認在書面作業上至少有一次嚴重的作弊行為。
Turnitin2023年的調查報告稱,在其系統處理的提交作業中,約有11%的學生論文包含來自未歸因來源的顯著文字重疊(超過25%的相似度)。Bretag等人(2019年)在《高等教育研究》中發表的一項單獨研究,對澳大利亞八所大學的14,086名學生進行了調查,發現6.5%承認購買或外包作業(合約作弊),這是一種特別嚴重的學術詐欺形式。
研究生層面的抄襲研究較少,但並不罕見。美國研究誠信辦公室(ORI)自成立以來已調查了數百起研究不當行為案例,抄襲和資料捏造是主要類別。Heitman和Litewka(2011年)在《發展中世界生物倫理》中發表的研究發現,科學出版物中的抄襲在開發中國家更為普遍,部分原因是語言障礙和不同的學術規範。
ChatGPT於2022年11月的發布,標誌著學術誠信的轉折點。史丹福大學以人為中心的人工智能研究組進行的一項調查發現,2022-2023學年中,約有17%的受訪大學生報告在作業中使用了AI工具。後續調查表明,這一數字已大幅增加。
Turnitin在2024年報告稱,其AI偵測系統將6%至11%的提交學生論文標記為包含大量AI生成內容(定義為80%或以上的AI撰寫文字)。BestColleges(2023年)的一項調查發現,56%的大學生在課程作業中使用過AI工具,其中約有一半承認其所在機構認為此類使用是一種作弊或抄襲形式。
AI生成內容的挑戰超出了教育範疇。Originality.AI2024年的分析估計,新發表的網路內容中,有顯著且不斷增長的比例顯示出AI生成的標誌。這為抄襲偵測工具帶來了新挑戰,它們現在必須區分人類撰寫的原創文字、被抄襲的人類撰寫文字和AI生成的文字——這三個不同的類別需要不同的偵測方法。
專業出版業的抄襲帶來的後果遠超個人職業生涯。Fang、Steen和Casadevall(2012年)發表在《美國國家科學院院刊》上的研究,分析了2,047篇被撤稿的生物醫學論文,發現9.8%的撤稿歸因於抄襲,而欺詐和重複發表佔了大多數。該研究確認,自1975年以來,科學文獻的撤稿率增加了十倍。
在新聞業,波因特學院和其他媒體倫理組織記錄了主要新聞機構高知名度抄襲案例的模式。這些案例涉及《紐約時報》、《華盛頓郵報》、CNN和《明鏡周刊》等媒體的記者。Honeycut和Freberg(2014年)的一項研究發現,記者抄襲案例增加了公眾對受影響新聞機構和媒體整體的不信任。
數位出版使抄襲既更容易實施,也更容易偵測。內容抓取工具可以在發表後幾小時內將文章複製到數千個網站。與此同時,抄襲偵測工具使出版商能夠方便地針對數十億個已索引的網頁檢查收到的內容,並在發表前標記潛在問題。
抄襲的財務後果影響個人、機構和行業。在學術環境中,被抓到抄襲的學生可能失去獎學金、面臨因課程不及格帶來的學費相關成本,或承擔與法律程序相關的費用。英國高等教育品質保證機構(QAA)2020年的研究估計,全球合約作弊市場——學生付費讓第三方撰寫其作業——每年價值超過10億美元。
對於出版商和企業,抄襲可能導致直接的財務責任。美國的版權侵犯訴訟通常導致每件被侵犯作品750至30,000美元的法定損害賠償,根據《版權法》,故意侵犯的處罰每件作品最高可達150,000美元。美國作家協會和類似組織報告稱,內容盜竊每年使作者和出版商損失數億美元的收入。
機構也承擔費用。大學在學術誠信基礎設施上投入大量資源——抄襲偵測軟體授權、誠信官員、調查流程和教育計劃。根據機構預算披露,大型大學每年可能在抄襲偵測服務上花費50,000至300,000美元或更多,特別是那些使用基於訂閱的按生計費模式的服務。
下載免費試用版或購買授權,立即開始檢查抄襲與AI生成內容。
抄襲偵測技術已成為教育和出版業的標準實踐。根據Educause 2022年的調查,美國和英國超過90%的高等教育機構現在使用某種形式的抄襲偵測軟體。採用率在亞洲、中東和拉丁美洲正在快速增長,隨著全球學術誠信意識的提高。
將AI內容偵測整合到抄襲檢查工作流程中,代表了預防技術的最新演進。機構和出版商越來越多地尋求在單一平台上結合傳統抄襲偵測和AI分析的工具。桌面版工具為注重隱私的組織提供了額外優勢,因為它們允許在不將文件上傳到外部雲端伺服器的情況下進行檢查。
教育仍然是最有效的長期預防策略。McCabe、Butterfield和Trevino(發表在其書《大學作弊》,約翰斯·霍普金斯大學出版社,2012年)的研究發現,具有榮譽守則和積極誠信教育計劃的機構,其作弊率比只依賴偵測和懲罰的機構低25-50%。最有效的方法結合了明確的政策、教育推廣和可靠的偵測技術。