OpenAI GPT modeliai padarė revoliuciją natūralios kalbos apdorojimo (NLP), bet nebent mokate už papildomą mokestį prieigą prie OpenAI paslaugų, negalėsite tiksliai sureguliuoti ir integruoti jų GPT modelių į savo programos. Be to, „OpenAI“ turės prieigą prie visų jūsų pokalbių, o tai gali būti saugumo problema, jei „ChatGPT“ naudosite verslui ir kitose jautresnėse savo gyvenimo srityse. Jei to nemėgstate, galbūt norėsite išbandyti GPT4All.

Taigi, kas tiksliai yra GPT4All? Kaip tai veikia ir kodėl jį naudoti per ChatGPT?

Kas yra GPT4All?

GPT4All yra atvirojo kodo ekosistema, naudojama integruoti LLM į programas nemokant už platformos ar aparatinės įrangos prenumeratą. Jį sukūrė Nomic AI – informacinės kartografijos įmonė, kurios tikslas – pagerinti prieigą prie AI išteklių.

GPT4All sukurtas veikti šiuolaikiniuose ir palyginti moderniuose kompiuteriuose, nereikalaujant interneto ryšio ar net GPU! Tai įmanoma, nes dauguma „GPT4All“ siūlomų modelių buvo suskaičiuoti iki kelių gigabaitų, o norint veikti, reikia tik 4–16 GB RAM.

instagram viewer

Tai leidžia mažesnėms įmonėms, organizacijoms ir nepriklausomiems tyrėjams naudoti ir integruoti LLM konkrečioms programoms. Kadangi GPT4All lengvai įdiegiamas vienu spustelėjimo diegimo programa, žmonės dabar gali naudoti GPT4All ir daugelis jos LLM, skirtų turinio kūrimui, kodo rašymui, dokumentų ir informacijos supratimui susibūrimas.

Kodėl verta naudoti GPT4ALL per „ChatGPT“?

Vaizdo kreditas: Bruce Mars/Atskleiskite purslą

Yra keletas priežasčių, kodėl galbūt norėsite naudoti GPT4All per ChatGPT.

  • Perkeliamumas: „GPT4All“ teikiamiems modeliams reikia tik keturių–aštuonių gigabaitų atminties, jiems nereikia GPU, o juos galima lengvai išsaugoti USB atmintinėje naudojant „GPT4All“ vieno paspaudimo diegimo programą. Dėl to GPT4All ir jo modeliai tikrai nešiojami ir tinkami naudoti beveik bet kuriame šiuolaikiniame kompiuteryje.
  • Privatumas ir saugumas: Kaip paaiškinta anksčiau, jei neturite prieigos prie „ChatGPT Plus“, visas jūsų „ChatGPT“ konversijas gali pasiekti „OpenAI“. GPT4All orientuota į duomenų skaidrumą ir privatumą; jūsų duomenys bus saugomi tik vietinėje aparatinėje įrangoje, nebent tyčia jais bendrinsite su GPT4All, kad padėtumėte plėsti jų modelius.
  • Režimas neprisijungus: GPT yra patentuotas modelis, kuriam reikalinga API prieiga ir nuolatinis interneto ryšys, kad būtų galima pateikti užklausą arba pasiekti modelį. Jei prarasite interneto ryšį arba iškils serverio problema, neturėsite prieigos prie „ChatGPT“. Tai netaikoma GPT4All atveju. Kadangi visi duomenys jau saugomi keturių–aštuonių gigabaitų pakete, o išvados daromos vietoje, jums nereikia interneto ryšio, kad galėtumėte pasiekti bet kokius GPT4All modelius. Galite toliau kalbėtis ir tobulinti savo modelį net neturėdami interneto ryšio.
  • Nemokamas ir atviras šaltinis: Keli GPT4All teikiami LLM yra licencijuoti pagal GPL-2. Tai leidžia kiekvienam tiksliai suderinti ir integruoti savo modelius komerciniam naudojimui nemokant už licenciją.

Kaip veikia GPT4All

Kaip aptarta anksčiau, GPT4All yra ekosistema, naudojama mokyti ir įdiegti LLM vietoje jūsų kompiuteryje, o tai yra neįtikėtinas žygdarbis! Paprastai įkeliant standartinį 25–30 GB LLM reikia 32 GB RAM ir įmonės lygio GPU.

Palyginimui, LLM, kuriuos galite naudoti su GPT4All, reikia tik 3 GB–8 GB atminties ir gali veikti su 4 GB–16 GB RAM. Tai leidžia paleisti visą LLM kraštiniame įrenginyje nereikalaujant GPU ar išorinės debesies pagalbos.

Dėl neuroninio tinklo kvantavimo aparatinės įrangos reikalavimai, skirti paleisti LLM naudojant GPT4All, buvo žymiai sumažinti. Sumažinus tikslumo svorį ir aktyvacijas neuroniniame tinkle, daugelis GPT4All pateiktų modelių gali būti paleisti daugumoje palyginti modernių kompiuterių.

Treniruočių duomenys, naudojami kai kuriuose galimuose modeliuose, buvo renkami naudojant „krūvą“, kuri yra tik išbraukti duomenys iš viešai paskelbto internete turinio. Tada duomenys siunčiami į Nomic AI Atlas AI duomenų bazę, kurią galima pamatyti remiantis koreliacijomis lengvai matomame 2D vektoriniame žemėlapyje (taip pat žinomas kaip AI vektorių duomenų bazė).

„Nomic AI“ mokydamas „Groovy“ modelį ir naudodamas viešai prieinamus duomenis, „Nomic AI“ galėjo išleisti modelį pagal atvirą GPL licenciją, leidžiančią bet kam jį naudoti, net ir komercinėms reikmėms.

Kaip įdiegti GPT4All

Įdiegti GPT4All paprasta, o dabar, kai buvo išleista GPT4All 2 versija, tai dar lengviau! Geriausias būdas įdiegti GPT4All 2 yra atsisiųsti diegimo programą vienu spustelėjimu:

Parsisiųsti:GPT4All skirta „Windows“, „MacOS“ arba „Linux“ (nemokama)

Šios instrukcijos skirtos „Windows“, tačiau GPT4All galite įdiegti kiekvienoje pagrindinėje operacinėje sistemoje.

Atsisiuntę dukart spustelėkite diegimo programą ir pasirinkite Diegti. „Windows Defender“ gali manyti, kad diegimas yra kenkėjiškas, nes „Microsoft“ gali užtrukti, kol trečiųjų šalių programoms suteikia galiojančius parašus. Tačiau tai turėtų būti greitai ištaisyta. Rašydami turėtumėte būti saugūs, kol atsisiuntėte GPT4All programą iš oficialios svetainės. Spustelėkite Įdiegti vis tiek įdiegti GPT4All.

Kai atidarysite programą, turėsite pasirinkti modelį, kurį norite naudoti. GPT4ALL siūlo keletą modelių, kurie visi turės savo stipriąsias ir silpnąsias puses. Norėdami sužinoti, kurį modelį atsisiųsti, pateikiame lentelę, kurioje parodytos jų stipriosios ir silpnosios pusės.

Modelis

Dydis

Pastaba

Parametrai

Tipas

Kvantifikavimas

Hermes

7,58 GB

  • Instrukcijų pagrindu
  • Suteikia ilgus atsakymus
  • Kuruojama naudojant 300 000 necenzūruotų instrukcijų
  • Negalima naudoti komerciniais tikslais

13 mlrd

LLAMA

q4_0

GPT4All Falcon

3,78 GB

  • Greiti atsakymai
  • Instrukcija pagrįsta
  • Licencijuota komerciniam naudojimui

7 milijardai

Sakalas

q4_0

Groovy

8 GB

  • Greiti atsakymai
  • - Kūrybiniai atsakymai
  • Instrukcija pagrįsta
  • Licencijuota komerciniam naudojimui

7 milijardai

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimalus

  • Reikia asmeninės API
  • Išsiųs jūsų pokalbius į OpenAI
  • GPT4All naudojamas tik bendrauti su OpenAI

?

GPT

NA

ChatGPT-4

Minimalus

  • Reikia asmeninės API
  • Išsiųs jūsų pokalbius į OpenAI
  • GPT4All naudojamas tik bendrauti su OpenAI

?

GPT

NA

Snausti

7,58 GB

  • Instrukcija pagrįsta
  • Lėtesnis nei Groovy, bet kokybiškesnis atsakymas
  • Negalima naudoti komerciniais tikslais

13 mlrd

LLAMA

q4_0

MPT pokalbis

4,52 GB

  • Greiti atsakymai
  • Pokalbių pagrindu
  • Negalima naudoti komerciniais tikslais

7 milijardai

MPT

q4_0

Orca

3,53 GB

  • Instrukcija pagrįsta
  • Paaiškina suderintus duomenų rinkinius
  • Orca Research Paper duomenų rinkinio kūrimo metodai
  • Licencijuota komerciniam naudojimui

7 milijardai

OpenLLaMA

q4_0

Vicuna

3,92 GB

  • Instrukcija pagrįsta
  • Negalima naudoti komerciniais tikslais

7 milijardai

LLAMA

q4_2

burtininkas

3,92 GB

  • Instrukcija pagrįsta
  • Negalima naudoti komerciniais tikslais

7 milijardai

LLAMA

q4_2

Vedlys necenzūruotas

7,58 GB

  • Instrukcija pagrįsta
  • Negalima naudoti komerciniais tikslais

13 mlrd

LLAMA

q4_0

Atminkite, kad pateikti modeliai turi skirtingus apribojimų lygius. Ne visi modeliai gali būti komerciškai naudojami nemokamai; kai kuriems reikės daugiau aparatinės įrangos išteklių, o kitiems - API rakto. Mažiausiai ribojantys GPT4All modeliai yra „Groovy“, „GPT4All Falcon“ ir „Orca“.

Ar galite mokyti GPT4All modelius?

Taip, bet ne kvantinės versijos. Norėdami efektyviai sureguliuoti GPT4All modelius, turite atsisiųsti neapdorotus modelius ir naudoti įmonės lygio GPU, pvz. AMD instinktų greitintuvai arba NVIDIA Ampere arba Hopper GPU. Be to, jums reikės apmokyti modelį naudojant AI mokymo sistemą, pvz., „LangChain“, kuriai reikės tam tikrų techninių žinių.

Norint tiksliai sureguliuoti GPT4All modelį, reikės tam tikrų piniginių išteklių ir tam tikrų techninių žinių, bet jei norite pateikti tik tinkintus GPT4All modelio duomenis, galite tęsti modelio lavinimą naudojant patobulintą kartojimą (kuri padeda kalbos modeliui pasiekti ir suprasti informaciją, nepriklausančią baziniam mokymui, kad užbaigtų užduotys). Tai galite padaryti paraginę GPT4All modeliuoti tinkintus duomenis prieš užduodami klausimą. Priskirti duomenys turėtų būti išsaugoti vietoje, o kai būsite paraginti, modelis turėtų galėti pateikti informaciją, kurią kažkada pateikėte.

Ar turėtumėte naudoti GTP4All?

GPT4All idėja yra suteikti nemokamą atvirojo kodo platformą, kurioje žmonės savo kompiuteriuose galėtų paleisti didelius kalbų modelius. Šiuo metu GPT4All ir jo kvantuoti modeliai puikiai tinka eksperimentuoti, mokytis ir išbandyti įvairius LLM saugioje aplinkoje. Profesionaliam darbo krūviui vis tiek rekomenduotume naudoti ChatGPT, nes modelis yra žymiai galingesnis.

Apskritai, nėra jokios priežasties, dėl kurios turėtumėte apsiriboti viena. Kadangi jų naudojimo atvejai nesutampa, turėtumėte pabandyti naudoti abu.