GPT-4 yra čia, ir tai yra naujos funkcijos, kurias turėtumėte patikrinti.
„OpenAI“ pagaliau pristatė savo ilgai lauktą GPT atnaujinimą GPT-4. Didelės kalbos modelis (LLM) turi keletą galingų naujų funkcijų ir galimybių, kurios jau šokiravo vartotojus visame pasaulyje.
Be to, kad GPT-4 yra žymiai geresnis už GPT-3.5, esamas LLM, valdantis OpenAI virusinį pokalbių robotą ChatGPT, GPT-4 gali supranta sudėtingesnes įvestis, turi daug didesnį simbolių įvesties apribojimą, turi daugiarūšio ryšio galimybes ir, kaip pranešama, yra saugesnis naudoti.
1. GPT-4 gali suprasti sudėtingesnius įvestis
Viena didžiausių naujų GPT-4 funkcijų yra jos gebėjimas suprasti sudėtingesnius ir niuansesnius raginimus. Pagal OpenAI, GPT-4 „parodo žmogaus lygio našumą įvairiais profesiniais ir akademiniais etalonais“.
Tai buvo įrodyta atliekant GPT-4 kelis žmogaus lygio egzaminus ir standartizuotus testus, tokius kaip SAT, BAR ir GRE, be specialaus mokymo. GTP-4 ne tik suprato ir išsprendė šiuos testus gana aukštu balu, bet ir kiekvieną kartą aplenkė savo pirmtaką GPT-3.5.
Galimybę suprasti niuansuotus įvesties raginimus taip pat padeda tai, kad GPT-4 turi daug didesnį žodžių limitą. Naujasis modelis gali apdoroti iki 25 000 žodžių įvesties raginimus (kontekstei GPT-3.5 buvo apribotas iki 8 000 žodžių). Tai tiesiogiai paveiks detales, kurias vartotojai gali įtraukti į savo raginimus, todėl modeliui bus suteikta daug daugiau informacijos, su kuria galima dirbti, ir gauti ilgesnius rezultatus.
GPT-4 taip pat palaiko daugiau nei 26 kalbas, įskaitant mažai išteklių reikalaujančias kalbas, tokias kaip latvių, valų ir suahilių. Vertinant trijų kadrų tikslumą pagal MMLU etaloną, GPT-4 pranoko GPT-3.5 ir kitas pirmaujančias LLM, tokias kaip PaLM ir Chinchilla, pagal našumą anglų kalba 24 kalbomis.
2. Multimodalinės galimybės
Ankstesnė versija ChatGPT apsiribojo tik tekstiniais raginimais. Priešingai, viena iš naujausių GPT-4 savybių yra multimodalinės galimybės. Modelis gali priimti ir tekstinius, ir vaizdo raginimus.
Tai reiškia, kad AI gali priimti vaizdą kaip įvestį ir interpretuoti bei suprasti jį kaip tekstinį raginimą. Ši galimybė apima visų dydžių ir tipų vaizdus ir tekstą, įskaitant dokumentus, kurie sujungia abu, ranka pieštus eskizus ir net ekrano kopijas.
Tačiau GPT-4 vaizdų skaitymo galimybės neapsiriboja jų aiškinimu. OpenAI tai pademonstravo savo kūrėjų sraute (aukščiau), kur GPT-4 pateikė ranka nupieštą pokštų svetainės maketą. Modeliui buvo pavesta parašyti HTML ir „JavaScript“ kodus, kad maketą paverstų svetaine, o juokelius pakeistų tikrais.
GPT-4 parašė kodą naudodamas makete nurodytą išdėstymą. Išbandžius kodas sukūrė veikiančią svetainę su, kaip galite atspėti, tikrais juokeliais. Ar tai reiškia AI pažanga reikš programavimo pabaigą? Ne visai, bet tai vis tiek yra funkcija, kuri bus naudinga programišiams.
Kad ir kaip daug žadanti ši funkcija atrodytų, ji vis dar peržiūrima ir nėra viešai prieinama. Be to, modeliui reikia daug laiko apdoroti vizualines įvestis, o pati „OpenAI“ teigia, kad gali prireikti darbo ir laiko, kad jis būtų greitesnis.
3. Didesnis vairavimas
OpenAI taip pat teigia, kad GPT-4 pasižymi dideliu valdomumu. Tai taip pat apsunkino AI sulaužyti personažą, o tai reiškia, kad mažesnė tikimybė, kad ji nepavyks, kai įdiegta programoje, kad vaidintų tam tikrą personažą.
Kūrėjai gali nurodyti savo AI stilių ir užduotį, apibūdindami kryptį „sistemos“ pranešime. Šie pranešimai leidžia API vartotojams labai pritaikyti vartotojo patirtį tam tikrose ribose. Kadangi šie pranešimai taip pat yra lengviausias būdas „palaužti“ modelį, jie taip pat stengiasi padaryti juos saugesnius. GPT-4 demonstracinė versija šiuo metu privertė vartotoją neleisti GPT-4 tapti Socratic mokytoju ir atsakyti į jų užklausą. Tačiau modelis atsisakė palaužti charakterį.
4. Saugumas
„OpenAI“ praleido šešis mėnesius kurdamas GPT-4 saugesnis ir labiau suderintas. Bendrovė teigia, kad 82 % mažesnė tikimybė atsakyti į užklausas dėl netinkamo ar kitaip neleidžiamo turinio, o 29 % didesnė tikimybė, kad reaguoti į jautrias užklausas pagal OpenAI politiką ir 40 % didesnė tikimybė pateikti faktinius atsakymus, palyginti su GPT-3.5.
Jis nėra tobulas, ir jūs vis tiek galite tikėtis, kad jis retkarčiais „haliucinuos“ ir gali klysti savo prognozėse. Žinoma, GPT-4 geriau suvokia ir nuspėja, bet vis tiek neturėtumėte aklai pasitikėti AI.
5. Našumo patobulinimai
Be modelio našumo įvertinimo atliekant žmogaus egzaminus, OpenAI taip pat įvertino robotą pagal tradicinius etalonus, skirtus mašininio mokymosi modeliams.
Teigiama, kad GPT-4 „gerokai lenkia“ esamus LLM ir „pažangiausius modelius“. Šie etalonai apima pirmiau minėti MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval ir Drop, kurie visi tikrina individualias galimybes.
Panašius rezultatus rasite lygindami akademinės vizijos etalonų rezultatus. Vykdomi bandymai apima VQAv2, TextVQA, ChartQA, AI2 diagramą (AI2D), DocVQA, Infographic VQA, TVQA ir LSMDC, kurie visi yra geriausi GPT-4. Tačiau „OpenAI“ pareiškė, kad GPT-4 šių testų rezultatai „ne visiškai atspindi jos galimybių mastą“, nes mokslininkai nuolat randa naujų ir sudėtingesnių dalykų, kuriuos šis modelis gali išspręsti.
Mažas žingsnis GPT-4, milžiniškas šuolis dirbtiniam intelektui
Dėl didesnio tikslumo, naudojimo saugumo ir pažangesnių galimybių GPT-4 buvo išleistas visuomenei per ChatGPT+ mėnesio prenumeratos planą, kuris kainuoja 20 per mėnesį. Be to, „OpenAI“ bendradarbiauja su įvairiomis organizacijomis, kad pradėtų kurti vartotojams skirtus produktus su GPT-4. „Microsoft Bing“, „Duolingo“, „Stripe“, „Be My Eyes“ ir „Khan Academy“, be kita ko, savo produktuose jau įdiegė GPT-4.
GPT-4 gali būti laipsniškas atnaujinimas, palyginti su GPT-3.5, tačiau apskritai tai didžiulis AI laimėjimas. Kadangi modelis tampa labiau prieinamas tiek paprastam vartotojui, tiek kūrėjams per jo API, atrodo, kad jis bus tinkamas LLM diegimui įvairiose srityse.