AI nėra pasirengęs mūsų sunaikinti... dar.

Dirbtinis intelektas buvo diskusijų tema nuo pat jo atsiradimo. Nors baimės, kad „Skynet“ tipo dirbtinis intelektas atgys ir užvaldys žmoniją, yra neracionalios, švelniai tariant, kai kurie eksperimentai davė abejonių.

Vienas iš tokių eksperimentų yra sąvaržėlių maksimizavimo problema – minties eksperimentas, parodantis, kad labai protingas dirbtinis intelektas, net jei sukurtas visiškai be piktavališkumo, galiausiai gali sunaikinti žmoniją.

Paaiškinta sąvaržėlių maksimizavimo problema

Šis minties eksperimentas, kad net visiškai nekenksmingas dirbtinis intelektas ilgainiui gali sunaikinti žmoniją, pirmą kartą buvo pavadintas sąvaržėlių maksimalizatoriumi vien todėl, kad buvo pasirinktos sąvaržėlės. ką dirbtinis intelektas galėtų padaryti, nes jie nekelia akivaizdaus pavojaus ir nesukels emocinio streso, palyginti su kitomis sritimis, kurioms ši problema taikoma, pavyzdžiui, vėžio išgydymu ar laimėjimu karai.

Pirmasis eksperimentas pasirodė švedų filosofo Nicko Bostromo 2003 m.

instagram viewer
Pažangaus dirbtinio intelekto etikos problemos, kuriame buvo sąvaržėlės maksimizavimo priemonė, skirta parodyti egzistencinę riziką, kurią galėtų naudoti pakankamai pažangus AI.

Problema buvo AI, kurio vienintelis tikslas buvo padaryti kuo daugiau sąvaržėlių. Pakankamai protingas AI anksčiau ar vėliau suprastų, kad žmonės kelia iššūkį jo tikslui trimis skirtingais aspektais.

  • Žmonės gali išjungti AI.
  • Žmonės gali pakeisti savo tikslus.
  • Žmonės yra sudaryti iš atomų, kuriuos galima paversti sąvaržėlėmis.

Visuose trijuose pavyzdžiuose visatoje būtų mažiau sąvaržėlių. Todėl pakankamai protingas AI, kurio vienintelis tikslas yra padaryti kuo daugiau sąvaržėlių perimtų visą ranka pasiekiamą materiją ir energiją ir neleistų išsijungti arba pasikeitė. Kaip tikriausiai galite atspėti, tai daug pavojingiau nei nusikaltėliai, naudojantys ChatGPT, kad įsilaužtų į jūsų banko sąskaitą ar kompiuterį.

AI nėra priešiškas žmonėms; tai tiesiog abejinga. AI, kuriam rūpi tik maksimalus sąvaržėlių skaičius, sunaikintų žmoniją ir iš esmės paverstų jas sąvaržėlėmis, kad pasiektų savo tikslą.

Kaip sąvaržėlių maksimizavimo problema taikoma AI?

Moksliniuose tyrimuose ir eksperimentuose minima sąvaržėlių maksimizavimo problema čia kaip veikianti šalis mini hipotetinį itin galingą optimizatorių arba labai protingą agentą. Vis dėlto problema taikoma AI tiek, kiek ji puikiai tinka vaidmeniui.

Galų gale, sąvaržėlių maksimizatoriaus idėja buvo sukurta siekiant parodyti kai kuriuos pažangaus AI pavojus. Apskritai tai kelia dvi problemas.

  • Ortogonalumo tezė: Ortogonalumo tezė yra požiūris, kad intelektas ir motyvacija nėra tarpusavyje susiję. Tai reiškia, kad dirbtinis intelektas, turintis aukštą bendrojo intelekto lygį, gali nepasiekti tų pačių moralinių išvadų kaip žmonės.
  • Instrumentinis konvergencija: Instrumentinė konvergencija apibrėžiama kaip daugumos pakankamai protingų būtybių tendencija (abiejų žmonių ir nežmogiškų) siekti panašių smulkesnių tikslų, net jei jų galutinis tikslas gali būti visiškai skirtinga. Jei kyla sąvaržėlių maksimizavimo problemos, tai reiškia, kad AI galiausiai perims kiekvieną gamtos išteklius ir išnaikinti žmoniją vien tam, kad pasiektų savo tikslą sukurti vis daugiau savaržėlės.

Didesnė problema, kurią pabrėžia sąvaržėlės maksimizatorius, yra instrumentinė konvergencija. Ją taip pat galima paryškinti naudojant Riemann hipotezę – tokiu atveju AI, sukurtas išspręsti hipotezę, gali labai gerai nuspręsti perimti visas Žemės masę ir paversti ją kompiuteriu (efektyviausiais įmanomais kompiuterių procesoriais), kad būtų sukurti superkompiuteriai, kurie išspręstų problemą ir pasiektų ją. įvartis.

Pats Bostromas pabrėžė, kad netiki, kad sąvaržėlių maksimizavimo problema kada nors taps tikra problema, tačiau jo ketinimas buvo iliustruoti pavojus, kylančius kuriant superprotingas mašinas, nežinant, kaip jas valdyti ar užprogramuoti, kad jos nebūtų egzistenciškai pavojingos žmogui. būtybės. Šiuolaikinės AI sistemos, tokios kaip „ChatGPT“, taip pat turi problemų, tačiau jie toli gražu ne itin intelektualios dirbtinio intelekto sistemos, apie kurias kalbama sąvaržėlės padidinimo problema, todėl kol kas nėra jokios priežasties panikuoti.

Pažangioms AI sistemoms reikalingas geresnis valdymas

Sąvaržėlių maksimizavimo problema visada daro tą pačią išvadą ir išryškina labai protingos ir galingos sistemos, kuriai trūksta žmogiškųjų vertybių, valdymo problemas.

Nors sąvaržėlių naudojimas gali būti populiariausias problemos iliustravimo būdas, jis taikomas bet kokiam skaičiui užduočių gali duoti dirbtiniam intelektui, nesvarbu, ar tai būtų vėžio pašalinimas, karų pergalė, medžių pasodinimas ar bet kokia kita užduotis, kad ir kaip atrodytų kvailas.