Tikriausiai girdėjote apie OpenAI GPT, tačiau jie nėra vieninteliai LLM šiame bloke.
Key Takeaways
- OpenAI GPT-4 yra pažangiausias ir plačiausiai naudojamas didelės kalbos modelis, turintis 1,76 trilijono parametrų ir daugiarūšių galimybių.
- Anthropic's Claude 2 konkuruoja su GPT-4 kūrybinio rašymo užduotyse ir išlaiko savo pozicijas, nors turi mažiau išteklių.
- „Google“ „PaLM 2“, nors ir nėra GPT-4 žudikas, yra galingas kalbos modelis, turintis stiprių daugiakalbių ir kūrybinių gebėjimų. „Falcon-180B“ yra atvirojo kodo modelis, kuris konkuruoja su komerciniais milžinais ir gali atsispirti GPT-3.5.
Artėja dirbtinio intelekto sezonas, o technologijų įmonės gamina didelius kalbų modelius, pavyzdžiui, duoną iš kepyklos. Nauji modeliai išleidžiami greitai, todėl juos sekti tampa per sunku.
Tačiau tarp naujų leidimų gausos tik keli modeliai pakilo į viršų ir pasirodė esą tikri varžovai didelėje kalbinių modelių erdvėje. Artėjant 2023 m. pabaigai, surinkome šešis įspūdingiausius didelių kalbų modelius, kuriuos turėtumėte išbandyti.
1. OpenAI GPT-4
GPT-4 yra iki šiol pažangiausias viešai prieinamas didelės kalbos modelis. Sukurta OpenAI ir išleista 2023 m. kovo mėn. GPT-4 yra naujausia „Generative Pre- Train Transformer“ serijos iteracija kuris prasidėjo 2018 m. Su savo didžiulėmis galimybėmis GPT-4 tapo vienu iš plačiausiai naudojamų ir populiariausių didelių kalbų modelių pasaulyje.
Nors oficialiai nepatvirtinta, šaltiniai apskaičiavo, kad GPT-4 gali turėti stulbinančius 1,76 trilijono parametrų, maždaug dešimt kartų daugiau nei jo pirmtakas GPT-3.5 ir penkis kartus didesnis nei Google flagmanas PaLM 2. Šis didžiulis mastas įgalina GPT-4 daugiarūšius gebėjimus, leidžiančius apdoroti tekstą ir vaizdus kaip įvestį. Dėl to GPT-4 gali interpretuoti ir aprašyti ne tik tekstą, bet ir vaizdinę informaciją, pvz., diagramas ir ekrano kopijas. Jo daugiarūšis pobūdis suteikia labiau žmogišką realaus pasaulio duomenų supratimą.
Pagal mokslinius etalonus, atliekant įvairius bandymus, GPT-4 gerokai lenkia kitus šiuolaikinius modelius. Nors vien etaloniniai rodikliai nevisiškai parodo modelio privalumus, realūs naudojimo atvejai parodė, kad GPT-4 yra ypač įgudęs intuityviai spręsti praktines problemas. GPT-4 šiuo metu mokama 20 USD per mėnesį ir pasiekiama naudojant „ChatGPT Plus“ planą.
2. Antropinis Klodas 2
Nors ir nėra toks populiarus kaip GPT-4, Anthropic AI sukurtas Claude 2 gali atitikti GPT -4 techninius etalonus ir realų našumą keliose srityse. Kai kuriuose standartizuotuose testuose, įskaitant tam tikrus egzaminus, Claude 2 lenkia GPT-4. AI kalbos modelis taip pat turi daug geresnį konteksto langą – apie 100 000 žetonų, palyginti su GPT -4 8k ir 32k žetonų modeliais. Nors didesnis konteksto ilgis ne visada reiškia geresnį našumą, išplėstas Claude 2 pajėgumas suteikia aiškių pranašumų, pavyzdžiui, ištisų 75 000 žodžių knygų analizei.
Pagal bendrą našumą GPT-4 išlieka pranašesnis, tačiau mūsų vidaus bandymai rodo, kad Claude 2 jį viršija keliose kūrybinio rašymo užduotyse. Claude 2 taip pat atsilieka nuo GPT-4 programavimo ir matematikos įgūdžių, pagrįstų mūsų vertinimais, bet puikiai pateikia žmogiškus, kūrybiškus atsakymus. Kai šešis kartus iš dešimties paraginome visus šiame sąraše esančius modelius parašyti arba perrašyti kūrybinį kūrinį, pasirinkome Claude 2 rezultatą dėl natūraliai skambančių žmogaus rezultatus. Šiuo metu, „Claude 2“ yra nemokama per „Claude AI“ pokalbių robotą. Taip pat yra 20 USD mokamas prieigos prie papildomų funkcijų planas.
Nepaisant mažesnės finansinės paramos nei tokie milžinai kaip „OpenAI“ ir „Microsoft“, „Anthropic“ „Claude 2 AI“ modelis turi savo pranašumą prieš populiarius GPT modelius ir „Google“ PaLM seriją. Jei dirbtinis intelektas turi mažiau išteklių, Claude 2 yra įspūdingai konkurencingas. Jei priverstas lažintis dėl to, kuris esamas modelis artimiausioje ateityje turi didžiausią galimybę konkuruoti su GPT, „Claude 2“ atrodo saugiausias statymas. Nors „Claude 2“ pažengęs į finansavimą, pažangios galimybės rodo, kad jis gali pasiekti net gerai finansuojami behemotai (nors verta paminėti, kad „Google“ daug prisidėjo prie Antropinis). Modelis pranoksta savo svorio kategoriją ir yra perspektyvus varžovas.
3. OpenAI GPT-3.5
Nors GPT-3.5 ir jo 175 milijardų parametrų nustelbė GPT-4 išleidimas, nereikėtų nuvertinti. Dėl pakartotinio koregavimo ir atnaujinimų, orientuotų į našumą, tikslumą ir saugą, GPT-3.5 gerokai nuėjo nuo originalaus GPT-3 modelio. Nors jai trūksta GPT -4 daugiarūšių galimybių ir jis atsilieka konteksto ilgiu ir parametrų skaičiumi, GPT-3.5 išlieka labai galingas, o GPT-4 yra vienintelis modelis, galintis pranokti savo universalumą ryžtingai.
Nepaisant to, kad GPT-3.5 yra antrosios pakopos GPT šeimos modelis, jis gali išsilaikyti ir netgi pranokti „Google“ ir „Meta“ pavyzdinius modelius pagal kelis etalonus. Atliekant gretutinį matematinių ir programavimo įgūdžių testą su Google PaLM 2, skirtumai nebuvo ryškūs, o GPT-3.5 kai kuriais atvejais netgi turėjo nedidelį pranašumą. Kūrybiškesnės užduotys, tokios kaip humoras ir pasakojimų rašymas, leido GPT-3.5 ryžtingai pasistūmėti į priekį.
Taigi, nors GPT-4 žymi naują etapą dirbtinio intelekto srityje, GPT-3.5 išlieka įspūdingai galingu modeliu, galinčiu konkuruoti ir kartais pranokti net pažangiausias alternatyvas. Jo nuolatinis tobulinimas užtikrina, kad jis išlieka aktualus net kartu su ryškesniais naujos kartos modeliais.
4. Google PaLM 2
Vertinant AI modelio galimybes, įrodyta formulė yra perskaityti techninę ataskaitą ir patikrinkite etaloninius balus, bet įvertinkite viską, ką išmokote, ir išbandykite modelį save. Kad ir kaip atrodytų priešingai, kai kurių dirbtinio intelekto modelių etaloniniai rezultatai ne visada sutampa su realaus pasaulio našumu. Popieriuje „Google“ PaLM 2 turėjo būti GPT-4 žudikas, o oficialūs bandymų rezultatai rodo, kad pagal kai kuriuos etalonus jis atitinka GPT-4. Tačiau naudojant kasdien, susidaro kitoks vaizdas.
Loginio mąstymo, matematikos ir kūrybiškumo srityse PaLM 2 nusileidžia GPT-4. Ji taip pat atsilieka nuo Anthropic's Claude pagal daugybę kūrybinio rašymo užduočių. Tačiau, nors jis ir nepateisina savo, kaip GPT-4 žudiko, reikalavimų, „Google“ „PaLM 2“ išlieka galingu kalbos modeliu savaime, su didžiulėmis galimybėmis. Didelė dalis neigiamų nuotaikų kyla dėl palyginimų su modeliais, tokiais kaip GPT-4, o ne dėl tiesioginio prasto veikimo.
Su 340 milijardų parametrų PaLM 2 yra vienas didžiausių pasaulio modelių. Jis ypač puikiai atlieka daugiakalbes užduotis ir turi stiprių matematikos bei programavimo gebėjimų. Nors PaLM 2 nėra pats geriausias, jis taip pat gana efektyviai atlieka kūrybines užduotis, tokias kaip rašymas. Taigi, nors etaloniniai rodikliai nupiešė optimistinį vaizdą, kuris visiškai nepasitvirtino, PaLM 2 vis tiek demonstruoja įspūdingus AI įgūdžius, net jei ir nepralenkia visų konkurentų.
5. TII Falcon-180B
Tikriausiai niekada nesusidūrėte su Falcon-180B, nebent neatsilikote nuo spartaus AI kalbos modelių išleidimo tempo. JAE technologijų inovacijų instituto sukurtas 180 milijardų parametras Falcon-180 yra vienas galingiausių. atvirojo kodo kalbų modeliai, net jei jiems trūksta GPT modelių vardų atpažinimo ar plačiai paplitusio Meta Lama 2. Tačiau nesuklyskite – Falcon-180B gali atsispirti geriausiais klasėje.
Palyginimo rezultatai rodo, kad Falcon-180B pranoksta daugumą atvirojo kodo modelių ir konkuruoja su komerciniais žmogeliukais, tokiais kaip PaLM 2 ir GPT-3.5. Bandydamas matematikos, kodavimo, samprotavimo ir kūrybinio rašymo užduotis, jis netgi pralenkė GPT-3.5 ir PaLM 2. laikai. Jei reitinguojame GPT-4, GPT-3.5 ir Falcon-180B, keliais naudojimo atvejais Falcon-180B statytume tiesiai tarp GPT-4 ir GPT-3.5, atsižvelgiant į jo pranašumus.
Nors negalime užtikrintai teigti, kad jis yra geresnis už GPT-3.5 bendru našumu, tačiau jis pats savaime suprantamas. Nors ir neaiškus, šis modelis nusipelno dėmesio, nes atitinka arba viršija geriau žinomų alternatyvų galimybes. Galite išbandyti Falcon-180B modelį Apkabinantis Veidas (atvirojo kodo LLM platforma).
„Llama 2“, „Meta AI“ 70 milijardų parametrų didelės kalbos modelis, sukurtas remiantis jo pirmtaku „Llama 1“. Nors „Llama 2“ yra mažesnis už pirmaujančius modelius, jis gerokai lenkia daugumą viešai prieinamų atvirojo kodo LLM pagal etalonus ir naudojimą realiame pasaulyje. Išimtis būtų Falcon-180B.
Išbandėme „Llama 2“ su GPT-4, GPT-3.5, Claude 2 ir PaLM 2, kad įvertintume jos galimybes. Nenuostabu, kad GPT-4 pranoko Llama 2 pagal beveik visus parametrus. Tačiau keliuose vertinimuose Llama 2 atsilaikė prieš GPT-3.5 ir PaLM 2. Nors būtų netikslu teigti, kad „Llama 2“ yra pranašesnė už „PaLM 2“, „Llama 2“ išsprendė daug problemų, kurios pribloškė PaLM 2, įskaitant kodavimo užduotis. Claude 2 ir GPT-3.5 kai kuriose srityse pralenkė Llama 2, tačiau buvo ryžtingai geresni atliekant ribotą skaičių užduočių.
Taigi, neviršydami didžiausių patentuotų modelių galimybių, atvirojo kodo Llama 2 smūgiai viršija savo svorio kategoriją. Atvirai prieinamam modeliui jis demonstruoja įspūdingą našumą ir konkuruoja su dirbtinio intelekto milžinais, tokiais kaip PaLM 2, pasirinktuose vertinimuose. „Llama 2“ suteikia žvilgsnį į atvirojo kodo kalbų modelių ateities potencialą.
Veikimo skirtumas tarp AI modelių mažėja
Nors dirbtinio intelekto aplinka vystosi sparčiai, OpenAI GPT-4 išlieka paketo lyderiu. Tačiau, nors GPT-4 išlieka neprilygstamas mastu ir našumu, tokie modeliai kaip Claude 2 rodo, kad turėdami pakankamai įgūdžių, mažesni modeliai gali konkuruoti tam tikrose srityse. Nepaisant didelių lūkesčių, „Google PaLM 2“ vis dar turi didelių galimybių. Ir Falcon-180B įrodo, kad atvirojo kodo iniciatyvos gali stovėti petys į petį su pramonės titanais, turinčiais pakankamai išteklių.