Prije šest godina generativni tekst bio je novitet. Danas piše studentske eseje, novinske članke, marketinški sadržaj i objave na društvenim mrežama na kvaliteti nerazlučivoj od one čovjeka. Ovo je kratka povijest kako smo do ovdje došli — i zašto je detekcija prešla iz akademskog istraživanja u svakodnevnu praksu.
Pre-GPT-3 generativni tekst bio je uglavnom istraživačka znatiželja. Markovljevi lanci, rekurentne neuronske mreže i rani modeli temeljeni na transformatorima mogli su producirati koherentne rečenice, ali su se raspadali na razini paragrafa. Kratak uzorak mogao bi zavarati nepažljivog čitatelja; potpuni dokument nikad nije.
Istraživanje otkrivanja AI-a postojalo je ali je bilo nišno. Radovi poput Grover (2019) Zellersa i sur. izgradili su detektore za lažne vijesti u eri GPT-2, ali praktična potražnja bila je niska — volumen strojno generiranog teksta u optjecaju bio je minimalan. Detekcija je bila rješenje koje je tražilo problem.
Tri stvari su se istovremeno promijenile 2020.–2021.: skala modela prešla je prag od milijardu parametara (GPT-3 sa 175B), podaci za treniranje prešli su prag od bilijun tokena, i OpenAI je otvorio pristup API-ju s jednostavnim, čovjeku čitljivim sučeljem za prompte. Generacija teksta premještena je iz istraživačkih laboratorija na svakoga s kreditnom karticom.
ChatGPT je lansiran u studenom 2022. na temelju GPT-3.5 i stekao 100 milijuna korisnika u roku od dva mjeseca — najbrže usvajanje potrošačkog proizvoda u povijesti. U roku od šest mjeseci, predaje studenata, marketinški tekstovi i skripte korisničkih servisa mjerljivo su se pomakli prema LLM generiranom sadržaju.
Pedagozi su to prvi primijetili. Do proljeća 2023. svako veće sveučilište imalo je hitni sastanak o politici AI-a i mnogi su privremeno uveli formate ocjenjivanja bez AI-a (ispiti u učionici, usmene obrane). Tržište alata za detekciju eksplodiralo je — Originality.ai, GPTZero, Copyleaks AI i desetak drugih lansiralo se u roku od 12 mjeseci od lansiranja ChatGPT-a.
Obrazac se ponovio u nakladništvu. AI generirani članci poplavili su sadržajne farme i bili otkriveni algoritmima za rangiranje; Google je uveo ažuriranje korisnog sadržaja specifično da depriorizira nisku kvalitetu AI izlaza; nakladnici vijesti izdali su politike o razotkrivanju autora; akademski časopisi zatražili su razotkrivanja upotrebe AI-a u izjavama autora.
Prvi alati za otkrivanje AI-a postigli su umjerenu točnost na GPT-3.5 izlazu. Vendori su objavili AUC brojeve u rasponu 0,85–0,95 na standardnim benchmarkima. U roku od šest mjeseci, alati za humanizaciju pojavili su se eksplicitno ciljajući te detektore — Undetectable AI (listopad 2023.), StealthWriter, Humanbeing — nudeći usluge parafraziranja po cijeni po 1000 riječi.
Vendori detekcije odgovorili su pretreniranjem na humaniziranim uzorcima. Vendori humanizatora odgovorili su treniranjem na novim detektorima. Ciklus utrke u naoružanju suzio se s mjeseci na tjedne. Do sredine 2024. nijedan javno raspoređeni detektor nije mogao pošteno tvrditi stabilnu točnost bez kontinuiranog pretreniranja na humanizator izlazima.
U međuvremenu, sofisticiranost generatora ubrzala se. GPT-4 (ožujak 2023.), Claude 3 (ožujak 2024.), Gemini 1.5 (veljača 2024.), Llama 2/3 (srpanj 2023. / travanj 2024.), Mistral izdanja — svaka generacija bila je mjerljivo teže otkriti od prethodne. Detekcija je postala problem pomičnih osnova.
Od travnja 2026., krajolik detekcije dostigao je grubu stabilnost. Produkcijski detektori — uključujući naš — postižu AUC u rasponu 0,95–0,99 na akademskom tekstu unutar distribucije, padajući na 0,85–0,92 na frontier modelima (GPT-5, Claude 4.5, Gemini 2.5) dok se pretreniranje ne nadoknadi. Pogledajte naš benchmark točnosti za trenutne brojeve po generatoru.
Alati koji su preživjeli stresiranje 2023.–2024. su oni koji su od prvog dana tretirali detekciju kao problem kontinuiranog pretreniranja. Vendori koji su isporučili jednokratni model i smatrali posao završenim tiho su nestali. Tržište se konsolidiralo oko šačice pružatelja s tekućim istraživačkim ulaganjem — nas, malog broja specijaliziranih vendora i značajki detekcije ugrađenih u veće platforme za otkrivanje plagijata.
Krajolik korisnika se također stabilizirao. Pedagozi su objavili politike; nakladnici imaju zahtjeve za razotkrivanjem; tražilice deprioriziraju nisku kvalitetu AI; platforme društvenih mreža označavaju AI generirani sadržaj. Detekcija je sada rutinska, ne iznimna — ugrađena u radne tokove, a ne pokretana ad-hoc.
Isprobajte naš AI & Detektor plagijata na bilo kojem tekstu. Stvarni brojevi, stvarni zaključak po rečenici, bez registracije.
Dva trenda dominiraju prognozom za 2026.–2027. Multimodalni dokazi: detekcija samo teksta bit će nadopunjena analizom dinamike tipkanja, provjerom povijesti uređivanja i provjerama konzistentnosti autorstva u usporedbi s poznatim pisanim korpusom. Čisti tekstualni rezultat postaje glasujući član u bogatijoj odluci.
Vodeni žig u trenutku generacije: OpenAI je implementirao eksperimentalno vodeno žigosanje teksta u nekim GPT sučeljima. Ako vodeni žig postane standard kod velikih pružatelja, detekcija se pomiče od probabilistički zaključka do kriptografski verifikacije. Ovo je temeljita arhitekturalna promjena i smanjila bi vrijednost statističke detekcije za vodenim žigom označene modele — ostavljajući modele otvorenih težina u potpunosti na statističkom području.
Nijedna promjena ne eliminirava potrebu za statističkom detekcijom teksta. Modeli otvorenih težina nastavit će generirati tekst bez vodenih žigova. Multimodalni dokazi zahtijevaju podatke koje mnogi radni tokovi ne prikupljaju. Statistička detekcija teksta ostat će prva linija obrane u doglednoj budućnosti — naša je obveza da tu liniju čuvamo poštenom i aktualnom.
Ovo je povijesni pregled namijenjen smještanju trenutne prakse otkrivanja AI teksta u kontekst. Specifični datumi i reference na proizvode odražavaju stanje polja od travnja 2026. Konzultirajte pojedinačne vendore alata i generatora za autoritativne podatke o vremenskoj liniji.