六年前,生成式文本还是一种新奇事物。如今,它以与人类写作难以区分的质量,撰写学生论文、新闻文章、营销文案和社交媒体内容。这是我们如何走到今天的简短历史——以及为何检测从学术研究演变为日常实践。
GPT-3 之前,生成式文本大多是研究领域的新奇产物。马尔可夫链、循环神经网络以及最早的基于 Transformer 的模型,能生成连贯的句子,但在段落层面就会崩溃。一个短样本或许能欺骗粗心的读者;一份完整文档从来无法做到。
AI 检测研究存在,但属于小众领域。Zellers 等人的 Grover(2019 年)等论文为 GPT-2 时代的虚假新闻构建了检测器,但实际需求较低——流通中的机器生成文本数量极少。检测是一种在寻找问题的解决方案。
2020-2021 年,三件事同时发生:模型规模突破了十亿参数门槛(GPT-3 拥有 1750 亿参数),训练数据突破了万亿词元门槛,OpenAI 开放了具有简单易读提示界面的 API 访问权限。文本生成从研究实验室走向了任何拥有信用卡的人。
ChatGPT 于 2022 年 11 月基于 GPT-3.5 发布,两个月内获得 1 亿用户——这是消费类产品史上增长最快的案例。六个月内,学生提交的作业、营销文案和客服脚本已明显向 LLM 生成内容转移。
教育工作者最先察觉。2023 年春,每所主要大学都召开了紧急 AI 政策会议,许多大学暂时强制要求无 AI 评估形式(课堂考试、口头答辩)。检测工具市场爆炸式增长——Originality.ai、GPTZero、Copyleaks AI 及其他十余家,均在 ChatGPT 发布后 12 个月内相继推出。
这一模式在出版业重演。AI 生成文章淹没了内容农场,被排名算法检测到;谷歌推出了「有用内容」更新,专门降低低质量 AI 输出的权重;新闻出版商发布了作者披露政策;学术期刊在作者声明中要求披露 AI 使用情况。
首批 AI 检测工具在 GPT-3.5 输出上实现了中等精准度。供应商在标准基准测试上发布的 AUC 数字在 0.85–0.95 区间。六个月内,人工化工具明确针对这些检测器出现——Undetectable AI(2023 年 10 月)、StealthWriter、Humanbeing——提供按每千词计价的改写服务。
检测供应商通过在人工化样本上再训练予以回应。人工化供应商又针对新检测器进行训练予以反击。军备竞赛的周期从数月缩短到数周。到 2024 年中,没有任何公开部署的检测器能诚实地声称在不针对人工化输出持续再训练的情况下保持稳定精准度。
与此同时,生成器的复杂度加速提升。GPT-4(2023 年 3 月)、Claude 3(2024 年 3 月)、Gemini 1.5(2024 年 2 月)、Llama 2/3(2023 年 7 月 / 2024 年 4 月)、Mistral 系列——每一代都比上一代更难检测。检测变成了一个移动基线问题。
截至 2026-04,检测格局已进入大致稳态。生产检测器——包括我们的——在分布内学术文本上的 AUC 达到 0.95–0.99,在前沿模型(GPT-5、Claude 4.5、Gemini 2.5)上降至 0.85–0.92,直到再训练追上。当前逐模型数字请参见我们的精准度基准测试。
在 2023-2024 年淘汰赛中存活下来的工具,是那些从第一天起就将检测视为持续再训练问题的工具。发布一次性模型就宣告完工的供应商,已悄然淡出市场。市场已整合到少数几家持续研究投入的供应商——我们、少数专业供应商,以及嵌入主流抄袭检测平台的检测功能。
用户格局也已趋于稳定。教育工作者已发布政策;出版商有披露要求;搜索引擎降低了低质量 AI 内容的权重;社交平台对 AI 生成内容进行标注。检测现已成为常规而非例外——嵌入工作流程,而非临时运行。
在任意文本上试用我们的 AI & 抄袭检测器。真实数据,真实逐句判决,无需注册。
两种趋势主导 2026-2027 年的展望。多模态证据:纯文本检测将与打字动态分析、编辑历史核实以及与已知写作语料库的作者一致性检查相结合。纯文本分数将成为更丰富决策体系中的一票。
生成时水印:OpenAI 已在部分 GPT 界面中部署了实验性文本水印。如果水印在各主要供应商中成为标准,检测将从概率推断转变为密码学验证。这是一次根本性的架构变革,将降低统计检测对于有水印模型的价值——同时使开放权重模型完全处于统计检测的领域之内。
两种变化都不会消除对文本统计检测的需求。开放权重模型将继续生成无水印文本。多模态证据需要许多工作流程无法捕获的数据。文本统计检测将在可预见的未来继续作为第一道防线——我们承诺让这道防线保持诚实和时效性。
这是一篇旨在阐明当前 AI 检测实践背景的历史性综述。具体日期和产品参考反映了 2026-04 的领域现状。请咨询各工具和生成模型供应商以获取权威的时间线数据。