Enam tahun lalu teks generatif adalah satu kebaruan. Hari ini ia menulis esei pelajar, artikel berita, salinan pemasaran, dan urutan media sosial dengan kualiti yang tidak dapat dibezakan daripada manusia. Ini adalah sejarah ringkas tentang bagaimana kita sampai ke sini — dan mengapa pengesanan beralih dari penyelidikan akademik ke amalan harian.
Teks generatif pra-GPT-3 kebanyakannya adalah keingintahuan penyelidikan. Rantai Markov, rangkaian neural berulang, dan model berasaskan transformer terawal boleh menghasilkan ayat yang koheren tetapi berpecah pada panjang perenggan. Sampel pendek boleh memperdayakan pembaca yang tidak berhati-hati; dokumen penuh tidak pernah melakukannya.
Penyelidikan pengesanan AI wujud tetapi bersifat niche. Kertas kerja seperti Grover Zellers et al. (2019) membina pengesan untuk berita palsu era GPT-2 tetapi permintaan praktikal adalah rendah — jumlah teks yang dijana oleh mesin dalam peredaran adalah minimal. Pengesanan adalah penyelesaian yang mencari masalah.
Tiga perkara berubah serentak pada 2020–2021: skala model melepasi ambang bilion parameter (GPT-3 pada 175B), data latihan melepasi ambang trilion token, dan OpenAI membuka akses API dengan antara muka arahan yang mudah, boleh dibaca oleh manusia. Penjanaan teks bergerak dari makmal penyelidikan kepada sesiapa sahaja yang mempunyai kad kredit.
ChatGPT dilancarkan pada November 2022 di atas GPT-3.5 dan memperoleh 100 juta pengguna dalam masa dua bulan — pengambilan-pakai produk pengguna yang paling pantas dalam sejarah. Dalam masa enam bulan, penghantaran pelajar, salinan pemasaran, dan skrip perkhidmatan pelanggan telah bergerak secara terukur ke arah kandungan yang dijana oleh LLM.
Para pendidik menyedari dahulu. Menjelang musim bunga 2023, setiap universiti utama mengadakan mesyuarat dasar AI kecemasan dan banyak yang mengarahkan format penilaian sementara bebas-AI (peperiksaan dalam kelas, pertahanan lisan). Pasaran alat pengesanan meledak — Originality.ai, GPTZero, Copyleaks AI, dan selusin yang lain dilancarkan dalam masa 12 bulan selepas keluaran ChatGPT.
Pola berulang dalam penerbitan. Artikel yang dijana oleh AI membanjiri ladang kandungan dan dikesan oleh algoritma pemeringkatan; Google melancarkan kemas kini kandungan-membantu khusus untuk mengutamakan-rendah output AI berkualiti rendah; penerbit berita mengeluarkan dasar pendedahan penulis; jurnal akademik memerlukan pendedahan penggunaan AI dalam pernyataan pengarang.
Alat pengesanan AI pertama mencapai ketepatan sederhana pada output GPT-3.5. Vendor menerbitkan nombor AUC dalam julat 0.85–0.95 pada penanda aras standard. Dalam masa enam bulan, alat pemanusiaan muncul yang secara eksplisit menyasarkan pengesan ini — Undetectable AI (Okt 2023), StealthWriter, Humanbeing — menawarkan perkhidmatan parafrasa dengan harga setiap 1000 patah perkataan.
Vendor pengesanan bertindak balas dengan melatih semula pada sampel yang dimanusiakan. Vendor alat pemanusiaan bertindak balas dengan melatih terhadap pengesan baharu. Kitaran perlumbaan senjata diperketatkan dari bulan ke minggu. Menjelang pertengahan 2024, tiada pengesan yang digunakan secara awam boleh mendakwa dengan jujur ketepatan yang stabil tanpa latihan semula berterusan terhadap output alat pemanusiaan.
Sementara itu, kecanggihan penjana dipercepatkan. GPT-4 (Mac 2023), Claude 3 (Mac 2024), Gemini 1.5 (Feb 2024), Llama 2/3 (Julai 2023 / April 2024), keluaran Mistral — setiap generasi secara terukur lebih sukar untuk dikesan daripada yang sebelumnya. Pengesanan menjadi masalah garis-asas-bergerak.
Pada 2026-04, landskap pengesanan telah mencapai keadaan stabil yang kasar. Pengesan pengeluaran — termasuk kami — mencapai AUC dalam julat 0.95–0.99 pada teks akademik dalam-taburan, jatuh ke 0.85–0.92 pada model hadapan (GPT-5, Claude 4.5, Gemini 2.5) sehingga latihan semula mengejar. Lihat penanda aras ketepatan kami untuk nombor setiap penjana semasa.
Alat yang bertahan daripada pengurangan 2023–2024 adalah yang menganggap pengesanan sebagai masalah latihan-semula-berterusan dari hari pertama. Vendor yang menghantar model sekali sahaja dan menyebutnya selesai telah senyap-senyap pudar. Pasaran telah tertumpu di sekitar beberapa pembekal dengan pelaburan penyelidikan berterusan — kami, sebilangan kecil vendor khusus, dan ciri pengesanan yang tertanam dalam platform pengesanan-plagiarisme utama.
Landskap pengguna juga telah stabil. Para pendidik telah menerbitkan dasar; penerbit mempunyai keperluan pendedahan; enjin carian mengutamakan-rendah AI berkualiti rendah; platform sosial melabel kandungan yang dijana oleh AI. Pengesanan kini rutin, bukan luar biasa — tertanam dalam aliran kerja dan bukannya dijalankan secara ad-hoc.
Cuba Penyemak AI & Plagiarisme kami pada mana-mana teks. Nombor sebenar, keputusan setiap ayat sebenar, tanpa pendaftaran.
Dua trend mendominasi pandangan 2026–2027. Bukti berbilang-modal: pengesanan teks sahaja akan disertai oleh analisis dinamik menaip, pengesahan sejarah suntingan, dan semakan konsistensi pengarangan terhadap korpus penulisan yang diketahui. Skor teks tulen menjadi ahli pengundi dalam keputusan yang lebih kaya.
Penanda air pada masa penjanaan: OpenAI telah menggunakan penanda air teks eksperimental dalam beberapa antara muka GPT. Jika penanda air menjadi standard merentas pembekal utama, pengesanan beralih daripada inferens probabilistik kepada pengesahan kriptografi. Ini adalah perubahan seni bina yang asasi dan akan mengurangkan nilai pengesanan statistik untuk model yang diberi penanda air — sementara meninggalkan model sumber-terbuka sepenuhnya dalam wilayah statistik.
Tiada perubahan menghapuskan keperluan untuk pengesanan statistik berasaskan teks. Model sumber-terbuka akan terus menjana teks tanpa penanda air. Bukti berbilang-modal memerlukan data yang tidak ditangkap oleh banyak aliran kerja. Pengesanan teks statistik akan kekal sebagai pertahanan barisan pertama pada masa hadapan yang dapat diramalkan — komitmen kami adalah untuk memastikan barisan itu jujur dan terkini.
Ini adalah gambaran keseluruhan sejarah yang bertujuan untuk meletakkan amalan pengesanan AI semasa. Tarikh tertentu dan rujukan produk mencerminkan keadaan medan pada 2026-04. Rujuk alat individu dan vendor penjana untuk data garis masa yang berwibawa.