Daugiau nei prieš 70 metų, kai buvo sukurtas dirbtinis intelektas, Alanas Turingas paskelbė straipsnį, kuriame aprašoma, kaip jį atpažinti. Vėliau jis buvo žinomas kaip Turingo testas ir buvo naudojamas dešimtmečius atskirti žmogų nuo AI.

Tačiau įdiegus pažangius AI pokalbių robotus, tokius kaip „ChatGPT“ ir „Google Bard“, darosi vis sunkiau atskirti, ar kalbate su AI. Tai kelia klausimą; ar Turingo testas pasenęs? Ir jei taip, kokios yra alternatyvos?

Ar Turingo testas pasenęs?

Vaizdo kreditas: Jesus Sanz/Shutterstock

Norėdami nustatyti, ar Tiuringo testas yra pasenęs, pirmiausia turite suprasti, kaip tai veikia. Kad dirbtinis intelektas išlaikytų Tiuringo testą, jis turi įtikinti žmogaus tardytoją, kad tai žmogus. Tačiau yra klaida – dirbtinis intelektas vertinamas kartu su žmogumi ir turi reaguoti naudodamas tekstą.

Pagalvokite apie tai taip; Jei esate tardytojas ir užduodate klausimus dviem dalyviams internete naudodami tekstą, tačiau vienas iš jų yra AI modelis – ar atskirtumėte juos po penkių minučių? Atminkite, kad Turingo testo tikslas yra ne nustatyti AI modelį remiantis teisingais atsakymais, bet įvertinti, ar AI gali mąstyti ar elgtis kaip žmogus.

instagram viewer

Problema, susijusi su Tiuringo testo metodu, nustatančiu tik į žmones panašius atsakymus, yra ta, kad jame neatsižvelgiama į kitus veiksnius. Pavyzdžiui, AI modelio intelektas arba tardytojo žinios. Be to, Turingo testas apsiriboja tik tekstu, todėl darosi vis sunkiau atpažinti dirbtinį intelektą, generuojantį žmogaus balsą arba giliai padirbti vaizdo įrašai, imituojantys žmogaus elgesį.

Tačiau dabartiniai AI modeliai, tokie kaip „ChatGPT-4“ ir „Google Bard“, dar nepasiekė tiek, kad galėtų nuolat išlaikyti Turingo testą. Tiesą sakant, jei esate susipažinę su AI, galite vietoje AI sukurto teksto.

5 geriausios Tiuringo testo alternatyvos

Gali būti, kad būsimi AI modeliai, tokie kaip „ChatGPT-5“. galėtų išlaikyti Tiuringo testą. Jei taip atsitiks, mums reikės skirtingų testų kartu su Tiuringo testu, kad nustatytume, ar kalbame su AI, ar su žmogumi. Čia yra geriausios Turingo testo alternatyvos:

1. Markuso testas

Gary Marcus, žinomas kognityvinis mokslininkas ir AI tyrinėtojas, pasiūlė alternatyvą Turingo testui, kuris buvo paskelbtas niujorkietis nustatyti AI pažintinius gebėjimus. Testas paprastas – AI modelį vertinate pagal jo gebėjimą žiūrėti ir suprasti „YouTube“ vaizdo įrašus ir TV laidas be subtitrų ar teksto. Kad dirbtinis intelektas išlaikytų Markuso testą, žiūrėdamas vaizdo įrašus jis turėtų suprasti sarkazmą, humorą, ironiją ir siužetą bei paaiškinti tai kaip žmogus.

Šiuo metu, GPT-4 gali apibūdinti vaizdus, tačiau kol kas nėra AI modelio, kuris galėtų suprasti vaizdo įrašus kaip žmogus. Savarankiškos transporto priemonės priartėti, tačiau jie nėra visiškai savarankiški ir jiems reikalingi jutikliai, nes jie negali suprasti visko supančioje aplinkoje.

2. Vizualus Turingo testas

Remiantis moksliniu darbu, paskelbtu PNAS, vizualinis Turingo testas gali būti naudojamas norint nustatyti, ar kalbate su žmogumi, ar su dirbtiniu intelektu, naudojant vaizdo klausimus. Jis veikia kaip Tiuringo testas, tačiau užuot atsakius į klausimus naudodami tekstus, dalyviams rodomi vaizdai ir tikimasi, kad jie atsakys į paprastus klausimus mąstydami kaip žmogus. Tačiau, vizualinis Turingo testas skiriasi nuo CAPTCHA kadangi visi atsakymai yra teisingi, tačiau norint išlaikyti testą, AI turi apdoroti vaizdus panašiai kaip žmogus.

Be to, jei dirbtinis intelektas ir žmogus būtų rodomi keli vaizdai greta ir paprašytų atpažinti tikroviškus vaizdus, ​​žmogus turėtų pažinimo gebėjimą išlaikyti testą. Taip yra todėl, kad dirbtinio intelekto modeliams sunku atskirti vaizdus, ​​​​kurie neatrodo padaryti realiame pasaulyje. Tiesą sakant, tai yra priežastis, kodėl galite nustatyti AI sukurtus vaizdus naudojant anomalijas, kurios neturi prasmės.

3. Lovelace 2.0 testas

Teoriją, kad kompiuteris negali sukurti originalių idėjų, nei buvo užprogramuotas, pirmą kartą konceptualizavo Ada Lovelace prieš Turingo testą. Tačiau Alanas Turingas prieštaravo šiai teorijai teigdamas, kad AI vis tiek gali nustebinti žmones. Tik 2001 m. buvo sukurtos Lovelace testo gairės, skirtos atskirti dirbtinį intelektą nuo žmogaus ir, kaip teigiama kurzweillibrary taisyklės vėliau buvo patikslintos 2014 m.

Kad dirbtinis intelektas išlaikytų Lovelace testą, jis turi parodyti, kad gali generuoti originalias idėjas, kurios pranoksta jo mokymą. Dabartiniai AI modeliai, tokie kaip GPT-4, negali sugalvoti naujų išradimų, viršijančių mūsų turimas žinias. Tačiau dirbtinis bendras intelektas gali pasiekti tą gebėjimą ir išlaikyti Lovelace testą.

4. Atvirkštinis Turingo testas

Kaip apie Tiuringo testą, bet atliktas atvirkščiai? Užuot bandę išsiaiškinti, ar kalbate su žmogumi, tikslas atvirkštinis Turingo testas yra priversti dirbtinį intelektą patikėti, kad esate DI. Tačiau jums taip pat reikia kito AI modelio, kad galėtumėte atsakyti į tuos pačius klausimus naudodami tekstą.

Pavyzdžiui, jei „ChatGPT-4“ yra tardytojas, galite įtraukti „Google Bard“ ir kitą žmogų kaip dalyvius. Jei AI modelis pagal atsakymus gali teisingai identifikuoti dalyvį žmogų, jis išlaikė testą.

Atvirkštinio Turingo testo minusas yra tas, kad jis nepatikimas, ypač atsižvelgiant į tai kartais AI negali atskirti AI sukurto ir žmogaus parašytas turinys.

5. AI klasifikavimo sistema

Pagal AI klasifikavimo sistemą, kurią sukūrė Krisas Saadas, Turingo testas yra tik vienas vertinimo metodas, leidžiantis sužinoti, ar kalbate su AI. Trumpiau tariant, dirbtinio intelekto klasifikavimo sistema yra pagrįsta daugialypio intelekto teorija, kuri reikalauja, kad žmogaus intelektas atitiktų bent aštuonis skirtingus kriterijus. apima: muzikinį ritmą, loginį-matematinį intelektą, vizualinį identifikavimą, emocinį intelektą, savirefleksinį intelektą, egzistencinio mąstymo gebėjimus ir kūną. judėjimas.

Kadangi dirbtinis intelektas vertinamas pagal aštuonis skirtingus parametrus, mažai tikėtina, kad jis bus tinkamas žmogui, net jei tam tikruose etalonuose jis veikia geriau nei vidutinis. Pavyzdžiui, „ChatGPT“ gali išspręsti matematikos uždavinius, apibūdinti vaizdus ir kalbėtis natūralia kalba, kaip žmogus, tačiau tai nepakenktų kitoms AI klasifikavimo sistemoje apibrėžtoms kategorijoms.

Turingo testas nėra galutinis

Turingo testas turėjo būti labiau minties eksperimentas, o ne įtikinamas testas, skirtas atskirti žmones nuo AI. Kai jis iš pradžių buvo pasiūlytas, tai buvo pagrindinis mašinos intelekto matavimo etalonas.

Tačiau pastaruoju metu plėtojant dirbtinio intelekto modelius su kalbos, vaizdo ir klausos interaktyviomis galimybėmis, Turingo testas nepavyksta, nes jis apsiriboja tekstiniu pokalbiu. Veiksmingiausias sprendimas būtų įdiegti Turingo testo alternatyvas, kurios dar labiau atskirtų AI modelius nuo žmonių.