ChatGPT 已進入每個課堂。這是一份針對教師的實用、以研究為基礎的工作流程——如何偵測 AI 生成作業、如何與學生討論,以及如何建立在沒有錯誤指控風險的情況下有效運作的政策。
到 2025 年,大多數學生已在其學術寫作的某些部分使用過大型語言模型。對大學生的調查持續顯示,根據學科和國家的不同,這個數字在 60% 到 90% 之間。問題不再是學生是否使用 AI,而是使用了多少、用於哪些任務,以及有何後果。
學術誠信問題分為兩個子問題。某份提交作業是否為 AI 生成?——一個偵測問題。使用 AI 是否違反作業規定?——一個政策問題。教師需要兩者的答案,而且順序很重要:政策優先,偵測負責確認。
在沒有明確政策的情況下進行偵測會產生錯誤指控風險。在沒有偵測的情況下執行政策會造成榮譽體系下的作弊行為。實際答案是兩個層次相互支撐的聯合工作流程。
良好的 AI 政策在四個維度上是明確的。允許什麼:頭腦風暴、提綱、語法檢查、尋找參考文獻——即使在嚴格政策下也通常被允許。禁止什麼:以學生自己作品名義提交的整句或整段生成內容。必須披露什麼:任何 AI 輔助任務,在提交時的披露聲明中記錄。後果是什麼:學術誠信委員會、成績懲罰、重新提交或升級處理——請提前說明。
在對提交作品進行任何 AI 偵測掃描之前先發布政策。在提交後被告知「我們會偵測 AI」的學生有合理的申訴;在學期開始時被告知「這是政策,這是我們的驗證方式」的學生則不能。將偵測視為對已發布政策的執法,而非驚喜。
與你所在機構保持一致。如果你的大學有模範政策,請採用它。如果沒有,請借鑒 MLA、IEEE 或你的國家監管機構的標準。同一機構的教師之間的不一致會造成學生申訴和法律風險——在推出偵測之前先與教師隊伍保持一致。
AI 偵測分數是信號,而非判定。提交作品中 92% 的 AI 概率是進一步調查的強烈理由——它不是證明。我們的準確率基準對此是誠實的:在 50% 閾值下,我們的目標是在驗證集上零誤報,但你的學生寫作不是我們的驗證集。
在做出任何決定之前,將分數與其他三個信號結合。寫作歷史:這是否與學生之前的提交作品相符?課堂信號:課堂作文、口頭討論、簡答測驗——與提交作品的水平相符嗎?技術背景:提交時間戳、編輯歷史(如果平台有公開的話)、任何不尋常的元資料。
分數加上至少一個佐證信號構成值得調查的案例。分數單獨只是一個標記,而非調查結果。這條規則——最初在 AI 出現之前很久就在學術誠信文獻中記錄——保護學生和教師,是對抗錯誤指控爭議最有效的單一槓桿。
如果一份提交作品被評為可能為 AI 生成,請與學生面談。不要以指控開頭,以作品本身開頭。請學生引導你了解他們的過程:他們研究了什麼、草稿是什麼樣子的、他們改動了什麼。寫了作業的學生能流暢地回答這些問題。使用了 AI 的學生往往不能——不是因為他們不誠實,而是因為他們沒有深入研究材料。
這次對話的目的是收集證據,而非設陷阱。記錄學生說的話。如果對話解除了標記——他們的過程是連貫的,草稿歷史相符——則撤銷標記。如果對話揭示了不一致之處,你現在有了繼續正式程序的佐證。
避免這些常見錯誤。不要以偵測分數開頭——學生會感到被突襲。不要將分數視為值得認罪——某些學生在壓力下即使無辜也會承認。請記錄每次對話——你機構的正當程序要求書面記錄。
AI 偵測發現生成的文本。抄襲偵測發現複製的文本。學生提交的是兩者的混合——一些大型語言模型起草的段落、一些從其他來源複製貼上的內容、一些真正原創的寫作。只掃描 AI 的工作流程會遺漏複製貼上;只掃描抄襲的工作流程會遺漏完全生成的內容。
我們的桌面抄襲偵測器在單次掃描中同時運行兩者:一次針對 40 億索引網頁、學術資料庫和機構 PDAS 語料庫的匹配,加上為我們線上工具提供支援的相同 AI 偵測引擎。一分鐘內完成每份文件的綜合判定。
對於偏好瀏覽器工作流程的機構,我們的免費線上工具涵蓋 AI 偵測,免費示範桌面下載則增加了完整的來源匹配功能。大多數大學根據教師工作流程混合使用兩者。
貼上樣本提交作品,查看逐句判定。適合課堂使用。無需註冊,無雲端儲存。
披露優先:任何 AI 使用都需要在提交時附上簡短聲明——「我使用 GPT-4 為第 2 節列提綱,並對第 3 節進行語法編輯。」披露後無偵測懲罰;未披露的 AI 被偵測到則全額懲罰。對學生而言摩擦低,問責高。
無 AI 作業:明確標記必須完全不使用 AI 撰寫的提交作品。課堂、口頭或監考形式。用於期末考試、診斷性寫作以及任何 AI 無助於學習目標的任務。
允許 AI 的作業:明確允許 AI 作為研究或編輯工具;無論生產方式如何,根據品質對學生的最終作品評分。學生學會使用工具;教師對結果評分。這種方法的教師採用率最高,偵測工作量最低。
你會漏掉一些 AI 生成的提交作品。人工化工具、短作業和混合人機寫作在當前生成器水平下都能擊敗文本偵測。接受這樣一個事實:目標不是 100% 偵測,而是有意義的威懾和對被標記案例的公平處理。
你會將一些人工提交作品標記為 AI。非英語母語者的寫作、大量編輯的學術散文,以及某些真正不尋常的學生風格都會獲得高於預期的分數。我們基準測試中零誤報的數字是在驗證集上的;你的學生不是那個驗證集。在採取任何行動之前結合佐證信號。
可持續運作的工作流程:發布政策、在提交時進行偵測、標記高分以供調查、與學生共同調查、記錄一切、僅在有佐證時升級處理。遵循此序列的教師報告,在一個學期內 AI 使用量和錯誤指控爭議都有所減少。
本文為教育指導,而非法律建議。學術誠信政策和自動偵測的合法性因司法管轄區和機構而異。在部署任何偵測工作流程之前,請諮詢你機構的資料保護官。