2022 m. lapkritį paleidus ChatGPT, fenomenalus AI pokalbių robotas tapo vienu patikimiausių rašymo įrankių internete. Tai paprasta naudoti; apibūdinkite, ką turite parašyti, o „ChatGPT“ per kelias sekundes išspausdins tai ekrane.
Tačiau epochoje, kai dirbtinio intelekto sukurtas tekstas perduodamas kaip žmogaus parašytas ir naudojamas siekiant nesąžiningo pranašumo, AI turinio nustatymas yra labai svarbus. Tačiau „ChatGPT“ negali tiksliai nustatyti AI turinio, net ir savo darbo, bet kodėl?
Ar yra skirtumas tarp AI teksto ir žmogaus rašymo?
Išankstinė sąlyga, kad „ChatGPT“ pastebėtų savo raštą ar bet kokį dirbtinio intelekto sukurtą tekstą, yra ta, kad jis turi skirtis nuo žmogaus parašyto teksto. Taigi, ar yra koks nors reikšmingas skirtumas tarp žmogaus parašyto teksto ir AI sukurto turinio? Jei tikrai yra įrankis, pvz., „ChatGPT“, turėtų sugebėti tai atpažinti.
Parašėme trumpą istoriją be jokio AI įrankio įvesties ir tada paklausėme „ChatGPT“, ar istorija yra AI parašytas turinys. ChatGPT užtikrintai pažymėjo jį kaip AI sukurtą tekstą.
Tada paprašėme „ChatGPT“ sugeneruoti istoriją, o toje pačioje pokalbių gijoje nukopijavome ir įklijavome sugeneruotą tekstą ir paklausėme „ChatGPT“, ar tekstas sukurtas dirbtinio intelekto. ChatGPT atsakymas? Pasitikintis „ne“.
Abiem atvejais „ChatGPT“ nepavyko identifikuoti žmogaus parašyto arba dirbtinio intelekto sukurto teksto. Taigi kodėl „ChatGPT“ negali aptikti savo teksto? Ar tai reiškia, kad nėra skirtumo tarp AI ir žmogaus teksto?
Na, yra. Galėtume parašyti visą knygą apie skirtumą tarp šių dviejų, bet tai neturi didelės reikšmės. Taigi, jei yra skirtumas, kodėl „ChatGPT“ ar bet kuris kitas AI įrankis negali nustatyti šių skirtumų ir tiksliai nurodyti AI sukurto teksto iš žmogaus parašyto? Atsakymas slypi kaip veikia ChatGPT ir kaip generuoja tekstą.
Kaip ChatGPT generuoja tekstą
Kai prašote „ChatGPT“ sugeneruoti tekstą, jis bando imituoti žmogaus rašymo procesą. Pirma, „ChatGPT“ modelis – generuojamasis iš anksto apmokytas transformatorius (GPT) – buvo parengtas naudojant didelį žmogaus teksto korpusą. Viskas – nuo el. laiškų, sveikatos straipsnių, straipsnių apie technologijas, vidurinės mokyklos esė ir beveik bet kokio teksto, kurį galite rasti internete, modeliui buvo pateikta treniruočių metu. Taigi „ChatGPT“ supranta, kaip turėtų būti parašytas kiekvienas iš šių tipų tekstų.
Jei paprašysite „ChatGPT“ parašyti el. laišką jūsų viršininkui, jis žino, kaip turėtų atrodyti tokio pobūdžio el. laiškas, nes buvo išmokyti naudoti panašius el. laiškus – tikriausiai tūkstančius. Panašiai, jei paprašysite parašyti vidurinės mokyklos rašinį, jis taip pat žino, kaip turėtų skambėti vidurinės mokyklos rašinys. „ChatGPT“ stengsis parašyti viską, ką norite, taip, kaip rašytų žmogus.
Bet yra laimikis. Skirtingai nuo to, kaip rašo žmonės, ChatGPT iš tikrųjų nesupranta, ką rašo taip, kaip tai suprastų žmogus. Vietoj to, pokalbių robotas bando nuspėti, koks kitas sakinio žodis būtų labiausiai tikėtinas, kol baigs rašyti.
Kaip ChatGPT rašo pagal numatymą
Tarkime, paprašote ChatGPT parašyti istoriją apie išgalvotą miestą, pavadintą Volkra. Didelė tikimybė, kad pokalbių robotas pasakojimą pradės žodžiais „Kartą“. Taip yra todėl, kad pokalbių robotas negalvoja pati, bet bando nuspėti, ką žmogus parašys, remdamasis tuo, ką sužinojo iš tūkstančių istorijų, kuriomis buvo maitinamas mokymas.
Taigi, manydamas, kad žmogus pasakojimą pradės žodžiais „Kartą“, „ChatGPT“ tada bandys nuspėti kitą loginį žodį, kuris būti „a“, po kurio eina „laikas“. Taigi jūs turėtumėte „Kartą...“, po kurio seka loginis žodis ir kitas, kol istorija bus baigta. ChatGPT iš esmės rašo numatydamas, koks žodis natūraliai (ar bent jau turi didžiausią tikimybę) ateis kitas sakinyje ir jį įterpdamas.
Taigi, kai AI įrankis bando nustatyti, ar tekstas yra sukurtas dirbtinio intelekto, vienas iš kriterijų, kurį jis bando pasverti, yra teksto nuspėjamumas, nes AI įrankiai rašo numatydami. Šis nuspėjamumo matas AI kalba vadinamas sumišimu. Dabar, kai pateikiamas tekstas, be kitų kriterijų, AI įrankis, pvz., „ChatGPT“, bando analizuoti tekstą, kad įvertintų, kaip nuspėjama teksto žodžių ar sakinių seka. Didesnis nuspėjamumas arba mažas sumišimas paprastai reiškia, kad tekstas gali būti sukurtas dirbtinio intelekto. Mažesnis nuspėjamumas arba didesnis sumišimas paprastai reiškia, kad tekstą parašė žmonės.
Deja, šių kriterijų kartu su kitais veiksniais, tokiais kaip teksto kūrybiškumo lygis, nepakanka, kad būtų galima tiksliai nustatyti, ar tekstas parašytas AI įrankiu, ar ne. Taip yra todėl, kad žmonės gali rašyti skirtingai, kaip pavyzdiniame tekste, kurį naudojome demonstruodami šio straipsnio pradžioje.
AI pokalbių robotai, tokie kaip ChatGPT, yra sukurti taip, kad kuo labiau imituotų natūralią žmogaus kalbą. Taigi, nors AI tekstas gali turėti pastebimų raštų, tie modeliai nėra tokie akivaizdūs net tokiam galingam įrankiui kaip „ChatGPT“. Štai kodėl „ChatGPT“ negali pastebėti savo rašymo, taip pat kodėl AI teksto detektoriaus įrankiai neveikia.
Ar „ChatGPT“ atpažins savo rašymą ateityje?
Šiuo metu tokie įrankiai kaip „ChatGPT“ negali nustatyti, ar tekstas buvo parašytas pats, ar bet koks kitas AI įrankis, nes AI sukurtame turinyje nėra aiškaus, pastebimo modelio. Tačiau yra didelė tikimybė, kad tai greitai pasikeis. Tokioms įmonėms kaip „ChatGPT“ stengiantis į „ChatGPT“ sukurtą turinį įtraukti skaitmeninius vandens ženklus, pokalbių roboto sugeneruotas tekstas bus labiau pastebimas.