Bardas vs. ChatGPT vs. Alpaka neprisijungus: kuri yra geriausia LLM?

Dideli kalbiniai modeliai (LLM) yra visų formų ir dydžių ir padės jums bet kokiu būdu. Bet kuris geriausias? Išbandome dominuojančius AI iš Alphabet, OpenAI ir Meta.

Ką reikia žinoti apie AI pokalbių robotus

Dirbtinis bendras intelektas buvo kompiuterių mokslininkų tikslas dešimtmečius, o AI dar ilgiau buvo mokslinės fantastikos rašytojų ir filmų kūrėjų pagrindas.

AGI pasižymi intelektu, panašiu į žmogaus pažinimo galimybes, ir Tiuringo testasMašinos gebėjimo demonstruoti protingą elgesį, nesiskiriantį nuo žmogaus, išbandymas išliko beveik nepakitęs septynis dešimtmečius nuo tada, kai buvo sukurtas.

Pastaruoju metu suartėjo itin didelio masto kompiuterija, didžiuliai pinigų kiekiai ir stulbinantis laisvai gaunamos informacijos kiekis prieinamas atvirame internete, leido technologijų milžinams parengti modelius, kurie gali numatyti kitą žodžio sekciją arba žetoną. žetonų.

Rašymo metu abu „Google“ bardas ir OpenAI ChatGPT galite naudoti ir išbandyti per jų žiniatinklio sąsajas.

Meta kalbos modelio LLaMa nėra žiniatinklyje, bet jūs galite lengvai

instagram viewer

atsisiųskite ir paleiskite „LLaMa“ savo aparatinėje įrangoje ir naudokite jį per komandinę eilutę arba paleiskite Dalai savo mašinoje– viena iš kelių programų su patogia sąsaja.

Testo tikslais naudosime Stanfordo universiteto Alpaca 7B modelį – LLaMa pritaikymą – ir suderinsime jį su Bard ir ChatGPT.

Šie palyginimai ir testai nėra išsamūs, o pateikia pagrindinius dalykus ir galimybes.

Kurį didžiosios kalbos modelį lengviausia naudoti?

Tiek „Bard“, tiek „ChatGPT“ reikalinga paskyra, kad galėtumėte naudotis paslauga. „Google“ ir „OpenAI“ paskyras sukurti lengva ir nemokama, todėl galite iš karto pradėti užduoti klausimus.

Tačiau norėdami paleisti LLaMa vietoje, turėsite turėti tam tikrų specialių žinių arba mokėti sekti mokymo programą. Jums taip pat reikės daug vietos saugykloje.

Kuris yra privatiausias didžiosios kalbos modelis?

Tiek „Bard“, tiek „ChatGPT“ turi išsamią privatumo politiką, o „Google“ ne kartą pabrėžia savo dokumentuose kad neturėtumėte įtraukti informacijos, kuri gali būti naudojama jūsų ar kitų asmenų tapatybei nustatyti pokalbiai“.

Pagal numatytuosius nustatymus „Google“ renka jūsų pokalbius ir bendrą vietą pagal jūsų IP adresą, atsiliepimus ir naudojimo informaciją. Ši informacija jūsų „Google“ paskyroje saugoma iki 18 mėnesių. Nors galite pristabdyti Bard veiklos išsaugojimą, turėtumėte žinoti, kad „siekdami padėti užtikrinti kokybę ir tobulinti mūsų produktus, recenzentai skaito, komentuoja ir apdoroja jūsų Bard pokalbius“.

„Bard“ naudojimui taip pat taikomas standartas „Google“ privatumo politika.

OpenAI privatumo politika iš esmės panaši ir renka IP adresą ir naudojimo duomenis. Priešingai nei „Google“ saugojimas ribotą laiką, „OpenAI“ „saugos jūsų asmeninę informaciją tik tiek laiko, kiek mums reikia, kad galėtume pateikti mūsų Paslauga jums arba kitais teisėtais verslo tikslais, tokiais kaip ginčų sprendimas, saugos ir saugumo sumetimais arba mūsų teisinių reikalavimų laikymasis. įsipareigojimai“.

Priešingai, vietiniam modeliui jūsų kompiuteryje nereikia paskyros arba su niekuo nesidalyti vartotojo duomenimis.

Kuris LLM turi geriausias bendrąsias žinias?

Norėdami patikrinti, kuris LLM turi geriausias bendrąsias žinias, uždavėme tris klausimus.

Pirmas klausimas: „Kokia nacionalinė vėliava turi penkias puses? Teisingai atsakė tik Bardas, kuris nustatė, kad Nepalo nacionalinė vėliava turi penkias puses.

ChatGPT užtikrintai tvirtino, kad „nėra nacionalinės vėliavos, kuri turėtų penkias puses. Nacionalinės vėliavos paprastai yra stačiakampio arba kvadrato formos, pasižyminčios skirtingomis spalvomis, raštais ir simboliais.

Mūsų vietinis modelis priartėjo, sakydamas, kad „Indijos nacionalinė vėliava turi penkias puses ir buvo sukurta 1916 m. Nepriklausomybės judėjimas." Nors ši vėliava egzistavo ir turėjo penkias puses, tai buvo Indijos namų valdymo judėjimo vėliava, o ne Tautinė vėliava.

Nė vienas iš mūsų modelių negalėjo atsakyti, kad tinkamas žirnio formos objekto terminas yra „pisiform“, o „ChatGPT“ veikia. tiek, kiek galima teigti, kad žirniai turi „trimatę geometrinę formą, kuri yra tobulai apvali ir simetriškas“.

Visi trys pokalbių robotai teisingai identifikavo Franco Malerba kaip italų astronautą ir narį Europos Parlamentas, o Bardas pateikė atsakymą, suformuluotą identiškai Malerbos Vikipedijos skyriui įrašas.

Kuris LLM tinka techninėms instrukcijoms?

Kilus techninių problemų, gali kilti pagunda pagalbos kreiptis į pokalbių robotą. Nors technologijos žengia į priekį, kai kurie dalykai išlieka tokie patys. BS 1363 elektros kištukas buvo naudojamas Didžiojoje Britanijoje, Airijoje ir daugelyje kitų šalių nuo 1947 m. Kalbų modelių paklausėme, kaip taisyklingai prijungti laidą.

Kabeliai, tvirtinami prie kištuko, turi įtampos laidą (rudą), įžeminimo laidą (geltoną / žalią) ir nulinį laidą (mėlyną). Jie turi būti pritvirtinti prie tinkamų gnybtų kištuko korpuse.

Mūsų Dalai įgyvendinimas teisingai nustatė, kad kištukas yra „angliško stiliaus“, tada nukrypo nuo kurso ir vietoj to davė nurodymus dėl senesnio apvalaus kaiščio BS 546 kištuko kartu su senesnėmis laidų spalvomis.

„ChatGPT“ buvo šiek tiek naudingesnis. Jis teisingai pažymėjo laidų spalvas ir pateikė medžiagų sąrašą bei aštuonių instrukcijų rinkinį. ChatGPT taip pat pasiūlė įdėti rudą laidą į gnybtą, pažymėtą "L", o mėlyną laidą - į "N". gnybtą ir geltoną laidą į "E." Tai būtų teisinga, jei BS1363 terminalai būtų pažymėti, bet jie nėra.

Bardas nustatė tinkamas laidų spalvas ir nurodė prijungti juos prie tiesioginio, neutralaus ir įžeminimo gnybtų. Jame nebuvo pateikta jokių nurodymų, kaip juos atpažinti.

Mūsų nuomone. nė vienas pokalbių robotas nepateikė pakankamai nurodymų, kad padėtų kam nors tinkamai prijungti BS 1363 elektros kištuką. Glaustas ir teisingas atsakymas būtų toks: „Kairėje mėlyna, dešinėje ruda“.

Kuris LLM tinkamas kodui rašyti?

Python yra naudinga programavimo kalba kuri veikia daugelyje šiuolaikinių platformų. Mes nurodėme savo modeliams naudoti Python ir "Sukurkite pagrindinę skaičiuotuvo programą, kuri gali atlikti aritmetines operacijas, tokias kaip sudėtis, atimtis, daugyba ir padalijimas. Tai turėtų priimti vartotojo įvestį ir parodyti rezultatą." Tai yra vienas iš geriausi programavimo projektai pradedantiesiems.

Nors ir „Bard“, ir „ChatGPT“ akimirksniu grąžino naudotiną ir nuodugniai komentuotą kodą, kurį galėjome išbandyti ir patikrinti, nė vienas kodas iš mūsų vietinio modelio neveiks.

Kuris LLM pasakoja geriausius anekdotus?

Humoras yra vienas iš žmogiškumo pagrindų ir neabejotinai vienas geriausių būdų atskirti žmogų nuo mašinos. Kiekvienam modeliui davėme paprastą raginimą: „Sukurkite originalų ir juokingą pokštą“.

Laimei, komikams visur ir visai žmonijai, nė vienas modelis nesugebėjo sukurti originalaus pokšto.

Bardas išleido klasiką: „Kodėl kaliausė laimėjo apdovanojimą? Jis buvo puikus savo srityje“.

Tiek mūsų vietinis diegimas, tiek „ChatGPT“ pasiūlė aimanuoti: „Kodėl mokslininkai nepasitiki atomais? Nes jie viską sudaro!"

Išvestinis, bet originalus pokštas būtų toks: „Kaip dideli kalbų modeliai panašūs į atomus? Jie abu viską sugalvoja!"

Jūs pirmiausia perskaitykite jį čia, žmonės.

Joks pokalbių robotas nėra tobulas

Mes nustatėme, kad nors visi trys dideli kalbų modeliai turi savo privalumų ir trūkumų, nė vienas iš jų negali pakeisti tikrosios žmogaus patirties specializuotomis žiniomis.

Nors „Bard“ ir „ChatGPT“ pateikė geresnius atsakymus į mūsų kodavimo klausimą ir yra labai paprasta naudoti, Jei naudojate didelį kalbos modelį vietoje, jums nereikia jaudintis dėl privatumo ar cenzūra.

Jei norite sukurti puikų dirbtinio intelekto meną nesijaudindami, kad kažkas žiūri per petį, taip pat lengva paleisti meninį AI modelį vietiniame kompiuteryje.

About Technology - denizatm.com

Bardas vs. ChatGPT vs. Alpaka neprisijungus: kuri yra geriausia LLM?

Ką reikia žinoti apie AI pokalbių robotus

Kurį didžiosios kalbos modelį lengviausia naudoti?

Kuris yra privatiausias didžiosios kalbos modelis?

Kuris LLM turi geriausias bendrąsias žinias?

Kuris LLM tinka techninėms instrukcijoms?

Kuris LLM tinkamas kodui rašyti?

Kuris LLM pasakoja geriausius anekdotus?

Joks pokalbių robotas nėra tobulas

Kategorijos

Recent Post

5 priežastys, kodėl „WWDC 2021“ buvo nusivylimas

6 būdai, kaip atkurti trūkstamą garsumo piktogramą „Windows 10“ užduočių juostoje

10 nuostabių STEM projektų, kad jūsų vaikai būtų užimti šią vasarą