Yra keletas pagrindinių skirtumų tarp senesnio GPT-3.5 modelio ir blizgaus naujo GPT-4 modelio.
Po visų spėlionių ir pretenzijų dėl GPT-4 gebėjimų, 2023 m. kovo 14 d. buvo paleista taip laukta ketvirtoji GPT kalbos modelių šeimos iteracija.
GPT-4 nebuvo su kai kuriomis garsiai reklamuojamomis savybėmis, apie kurias buvo kalbama. Tačiau naujausias modelis žymiai pagerina GPT-3.5 ir jo pirmtakus. Bet kuo GPT-4 skiriasi nuo GPT-3.5? Supažindinsime su kai kuriais pagrindiniais GPT-4 ir GPT-3.5 skirtumais.
1. GPT-4 vs. GPT-3.5: Kūrybiškumas
Vienas iš ryškiausių GPT-4 modelio pranašumų, palyginti su GPT-3.5, yra jo galimybė pateikti kūrybiškesnius atsakymus į raginimus. Nesupraskite manęs neteisingai; GPT-3.5 yra labai kūrybingas. Yra ilgas sąrašas kūrybiškus dalykus, kuriuos galite padaryti naudodami ChatGPT, kuris naudoja modelį. Tačiau kūrybiškumu jis jau lenkia daugelį didelių kalbų modelių.
Tačiau GPT-4 dar labiau pakelia kartelę. Nors GPT-4 kūrybinis pranašumas gali būti nepastebimas bandant išspręsti pagrindines problemas, skirtumas yra Abiejų modelių kūrybiškumas tampa akivaizdus, nes užduotis tampa sunkesnė ir reikalauja aukštesnio lygio kūrybiškumas.
Pavyzdžiui, jei paprašysite abiejų modelių atlikti kūrybinę užduotį, pavyzdžiui, parašyti eilėraštį anglų ir prancūzų kalba kiekvienoje eilėraščio eilutėje, „ChatGPT“ palaiko naujausias GPT-4 modelis duos geresnių rezultatų. Nors GPT-4 atsakymas kiekvienoje eilutėje naudotų abi kalbas, vietoj to GPT-3.5 būtų naudojamos abi kalbos, kiekviena eilutė naudotų vieną kalbą, o kita - kitą.
2. GPT-4 vs. GPT-3.5: vaizdo arba vaizdo įvestis
Nors GPT-3.5 gali priimti tik tekstinius raginimus, GPT-4 yra daugiarūšis ir gali priimti tiek teksto, tiek vaizdo įvestis. Kad būtų aišku, kai sakome vaizdines įvestis, vaizdas nebūtinai turi būti įvesto raginimo vaizdas – tai gali būti bet ko vaizdas. Taigi nuo ranka rašytos matematikos problemos vaizdo iki Reddit memų, GPT-4 gali suprasti ir apibūdinti beveik bet kokį vaizdą.
Skirtingai nuo GPT-3, GPT-4 yra ir kalbos, ir vaizdo modelis.
Per GPT-4 pranešimų tiesioginę transliaciją OpenAI inžinierius pateikė modeliui Discord serverio ekrano kopiją. GPT-4 galėtų aprašyti kiekvieną detalę, įskaitant tuo metu prisijungusių vartotojų vardus. Modeliui taip pat buvo pateiktas pokštų svetainės maketo ranka nupieštas vaizdas su instrukcijomis paverskite ją svetaine ir nuostabiai GPT-4 pateikė veikiantį svetainės kodą, kuris atitiko vaizdas.
3. GPT-4 vs. GPT-3.5: Saugesni atsakai
Nors GPT-4 nėra tobulas, priemonės, kurių jis imasi, kad būtų užtikrintas saugesnis atsakas, yra sveikintinas GPT-3.5 modelio atnaujinimas. Naudodama GPT-3.5, „OpenAI“ ėmėsi labiau saikingai pagrįsto požiūrio į saugą. Kitaip tariant, kai kurios saugos priemonės buvo labiau pasenusios. OpenAI stebėjo, ką darė vartotojai ir užduodamus klausimus, nustatė trūkumus ir bandė juos ištaisyti kelyje.
Naudojant GPT-4, dauguma saugos priemonių jau yra įtrauktos į sistemą modelio lygiu. Kad suprastumėte skirtumą, tai tarsi namo statyba iš tvirtų medžiagų nuo pat pradžių, o ne naudojant bet ką, kas tinka, o tada bandoma pataisyti dalykus, kai atsiranda gedimų. Pagal OpenAI GPT-4 techninė ataskaita [PDF], GPT-4 sukelia toksinius atsakus tik 0,73 % laiko, o GPT-3.5 – 6,48 % toksiškų atsakymų.
4. GPT-4 vs. GPT-3.5: Atsakymo faktas
Vienas iš GPT-3.5 trūkumų yra jos polinkis užtikrintai pateikti nesąmoningą ir melagingą informaciją. AI kalboje tai vadinama „AI haliucinacija“ ir gali sukelti nepasitikėjimą AI sukurta informacija.
GPT-4 haliucinacijos vis dar yra problema. Tačiau, remiantis GPT-4 technine ataskaita, naujajame modelyje haliucinacijų tikimybė yra 19–29 % mažesnė, palyginti su GPT-3.5 modeliu. Tačiau tai ne tik techninė ataskaita. GPT-4 modelio atsakymai „ChatGPT“ yra pastebimai pagrįstesni.
5. GPT-4 vs. GPT-3.5: kontekstinis langas
Mažiau aptariamas skirtumas tarp GPT-4 ir GPT-3.5 yra konteksto langas ir konteksto dydis. Konteksto langas nurodo, kiek duomenų modelis gali išlaikyti savo „atmintyje“ pokalbio seanso metu ir kiek laiko. GPT-4 turi žymiai geresnį konteksto dydį ir langą nei jo pirmtakas.
Praktiškai tai reiškia, kad GPT-4 gali ilgiau atsiminti pokalbio kontekstą, taip pat pokalbio metu duotas instrukcijas.
GPT-3.5 problema yra modelio polinkis nukrypti nuo temos arba nesilaikyti nurodymų, kai vyksta pokalbis. Pavyzdžiui, galite pasakyti modeliui, kad jis kreiptųsi į jus jūsų vardu, ir jis kurį laiką tai darytų, bet tada nesilaikytų nurodymų. Nors ši problema vis dar egzistuoja naudojant GPT-4 modelį, ji yra mažesnė dėl geresnio konteksto lango.
Kita problema yra teksto, kurį galite naudoti raginimui, apimties apribojimas. Ilgo teksto apibendrinimas naudojant GPT-3 paprastai reiškia teksto padalijimą į keletą dalių ir apibendrinimą po truputį. Padidėjęs konteksto ilgis GPT-4 modelyje reiškia, kad galite vienu metu įklijuoti visus PDF failus ir apibendrinti modelį, neskaidydami jo į dalis.
GPT-4: žingsnis į priekį nuo GPT-3.5
Be jokios abejonės, GPT-4 yra reikšmingas žingsnis į priekį, palyginti su savo pirmtakų modeliais. Nors ji vis dar kenčia nuo kai kurių GPT-3.5 apribojimų, reikšmingi patobulinimai keliose srityse ir Pridėjus naujų galimybių, modelis tampa nauju įdomiu žingsniu siekiant tikrai protingos AI kalbos modeliai.