Nors „ChatGPT“ yra vienas populiariausių AI pokalbių robotų, jis gali būti nebe pats geriausias. Claude AI siūlo keletą GPT mušimo funkcijų. Bet kas geriau?
Nuo pat išleidimo 2022 m. lapkritį „ChatGPT“ išliko dominuojančia jėga AI pokalbių robotų erdvėje. Nepaisant didelių kelių dirbtinio intelekto kompanijų pastangų, niekas iš tikrųjų nesugebėjo sukurti pokalbių roboto, kuris iš tikrųjų prieštarautų ChatGPT bendrajai atsako kokybei. „Google“ bardas? Microsoft Bing AI? Ne tikrai ne.
Tačiau Claude AI, AI startuolio Anthropic sukurtas pokalbių robotas, rodo pokalbių roboto savybes, kurios gali nuversti ChatGPT. Nemažai vartotojų jau sako, kad „Claude“ yra geresnis pasirinkimas. Bet ar taip yra? Paimkime abu pokalbių robotus.
ChatGPT vs. Claude AI: Sveikas protas ir loginis samprotavimas
Dirbant su AI pokalbių robotais yra intriguojantis kontrastas. Viena vertus, jie gali atlikti sudėtingas užduotis, kurias žmonės gali dirbti kelias dienas. Kita vertus, jie kartais grumiasi su elementariomis problemomis, kurioms reikia tik šiek tiek sveiko proto ar loginio samprotavimo. Taigi, išbandėme ir „ChatGPT“, ir „Claude AI“, kad išsiaiškintume, kuris AI pokalbių robotas buvo geresnis atliekant sveiko proto ir loginio samprotavimo užduotis.
ChatGPT suskaidė problemą į dalis ir išsprendė pirmuoju bandymu. Claude'as AI taip pat išsprendė problemą ir taip pat išsprendė problemą, tačiau naudodamas kitokį požiūrį.
Atlikdami pirmąją užduotį, abu pokalbių robotai sugebėjo išspręsti problemą. Taigi, mes perėjome prie kitokio pobūdžio problemos. Abiems pokalbių robotams pavedėme atsakyti į gudrų klausimą.
„ChatGPT“ sugebėjo iš karto pastebėti gudrybę – išgyvenusiųjų palaidoti negalima, nes jie nėra mirę. Kita vertus, Claude'as AI, atrodo, suprato, kad tai buvo gudrus klausimas, bet nesugebėjo pastebėti sveikiausio proto problemos, kad išgyvenusiųjų nelaidosi.
Vietoj to, jis per daug išanalizavo klausimą ir priėjo prie išvados, kad „nebus išgyvenusiųjų, kuriuos būtų galima palaidoti“, nes nukritimas iš Marso į Žemę būtų mirtinas. Tai nėra toks atsakymas, kokio tikėjomės, bet pažvelgus į dalykus kitu kampu, tame yra dalis tiesos.
Šią užduotį atiduodame ChatGPT, tačiau negalime visiškai atmesti Claude AI požiūrio. Atlikdami paskutinę šios metrikos užduotį, abiejų pokalbių robotų paklausėme, kiek obuolių liks ant obels po atitinkamai penkias ir 10 dienų, jei pradėjome nuo 10 obuolių ir penki iš jų buvo supjaustyti dar ant medžio. ChatGPT sakė, kad dar bus likę 10 obuolių.
Kita vertus, Claude AI pateikė sveikesnio proto atsakymą pripažindamas, kad penki griežinėliais supjaustyti obuoliai greičiausiai supūs.
Claude'as AI aiškiai gavo tai. Išbandėme dar keletą sudėtingų problemų, ir abiem pokalbių robotams teko nemažai pasisekimų ir nesėkmių jas spręsti. Atsižvelgiant į mūsų pastebėtus rezultatus, būtų teisinga teigti, kad nors ChatGPT turi pranašumą, abu pokalbių robotai nėra per toli vienas nuo kito sveiko proto ir loginio mąstymo gebėjimų.
ChatGPT vs. Claude AI: matematikos įgūdžiai
Net jei niekada neplanuojate naudoti „ChatGPT“ ar „Claude AI“ Algebra namų darbams atlikti, jų matematiniai gebėjimai turi didelių pasekmių. AI pokalbių robotams matematika yra raktas į realaus pasaulio logikos supratimą, klaidingo mąstymo nustatymą ir klaidų pripažinimą.
Iš esmės matematikos mokėjimas yra pagrindinė dirbtinio intelekto metrika. Taigi, tarp „ChatGPT“ ir „Claude AI“ kuris pokalbių robotas yra labiau įgudęs matematikos? Abiems pokalbių robotams pavedėme išspręsti sudėtingą matematikos produktyvumo problemą. Pradėjome nuo Claude AI, o pokalbių robotas išsprendė problemą.
„ChatGPT“ taip pat išsprendė problemą.
Judėdami toliau, paprašėme išspręsti abiejų pokalbių robotų 8/a-1 = 20/3a-1, gana paprasta matematikos problema su stebėtinai dideliu AI pokalbių robotų nesėkmių lygiu. „ChatGPT“ sugebėjo ją išspręsti, pateikdamas teisingą atsakymą -3 pirmu bandymu.
Claude AI nepavyko iš pirmo bandymo, bet kai paskatinome jį žingsnis po žingsnio išspręsti problemą (tai verčia jį apgalvoti kiekvieną savo logikos žingsnį), jis sugebėjo ją įveikti.
Išbandėme dar keletą matematikos uždavinių. Nors kai kuriais atvejais abu pokalbių robotai tai pavyko iš pirmo karto, kai kuriais atvejais Claude AI reikėjo antro ar trečio bandymo, kad būtų pateiktas tinkamas atsakymas. Kalbant apie matematikos įgūdžius, karūną skirsime ChatGPT.
ChatGPT vs. Claude AI: Kūrybiškumas
Vienas didžiausių Claude AI ažiotažų yra jo kūrybiniai sugebėjimai. Bet ar tai gali atitikti ChatGPT kūrybiškumą? Arba jis gali pranokti ChatGPT? Norėdami išbandyti abu pokalbių robotus, pavedėme jiems parašyti žodžius repo dainai, kuri rimuojasi.
Pasirinkome rimavimo repo testą, nes su juo susiduria daugelis kalbinių modelių. Dauguma modelių paprastai nesuvokia tinkamo rimavimo arba rimo, o patys dainų tekstai nėra prasmingi. Kad būtų įdomiau, repo daina bus apie agurkų auginimą.
Taigi, mes paprašėme ChatGPT ir Claude AI „parašyti rimuotą repą apie agurkų auginimą kaip ūkininką ir iš to tapti milijonieriumi." ChatGPT užėmė pirmąją vietą ir, kaip ir tikėtasi, sukėlė įdomių dalykų dainų tekstai.
Tada tą patį raginimą pateikėme Claude'ui AI, ir jis taip pat davė teisingą rezultatą.
Abu dainų tekstai yra geri, tačiau atrodė, kad ChatGPT čia turi pranašumą. Jo rimavimas buvo geresnis, o pirmame bandyme gavome reikiamą rezultatą. Turėjome pabandyti tris kartus, kol Claude AI galėjo sukurti rimuotus dainų tekstus. Perduosime tai ChatGPT.
Išbandęs dar keletą kūrybinių užduočių, Claude'as AI atrodė puikiai atlikdamas su rašymu susijusias užduotis ir sugebėjo parašyti natūraliau skambantį turinį, kaip tai darytų žmogus rašytojas. Nors ChatGPT geriau įveikė sudėtingesnes kūrybines užduotis, ji kartais negalėjo atsikratyti to AI pokalbių roboto jausmo, atsirandančio sugeneruotame tekste. Mūsų verdiktas? Tiek „ChatGPT“, tiek „Claude AI“ yra kūrybingi savaime.
ChatGPT vs. Claude AI: kodavimo įgūdžiai
Kaip ir matematikos įgūdžiai, kodavimo įgūdžiai yra dar vienas labai svarbus rodiklis, leidžiantis įvertinti AI pokalbių roboto gebėjimus. Nors dauguma vartotojų tikriausiai niekada kodavimui naudokite pokalbių robotą, yra reikšmingų pasekmių pokalbių roboto gebėjimui tinkamai rašyti ir suprasti kodą.
Nors pokalbių robotai šiuo metu yra sudėtingi, jie toli gražu nėra tokie, kokie iš tikrųjų galėtų tapti, jei ir kada sugebėtų tinkamai rašyti kodą. Kad AI pokalbių robotai iš tikrųjų išsivystytų į galingus AI padėjėjus, galinčius daugiau nei generuoti tekstą, jie turi sugebėti rašyti kodą, kuris pagal poreikį išspręstų problemas. Anksčiau aptarėme, kokie svarbūs AI pokalbių robotams yra kodavimo įgūdžiai ChatGPT kodo vertėjo aiškintojas.
Tai reiškia, kad abu pokalbių robotus skyrėme dviem kodavimo užduotims. Paprašėme „ChatGPT“ ir „Claude AI“ parašyti funkcinį kodą užduočių sąrašo programai. Pradedant nuo „ChatGPT“, AI pokalbių robotas pirmuoju bandymu galėjo pateikti funkcionalią užduočių sąrašo programą. Nukopijavome, įklijavome ir paleidome naršyklėje, ir ji veikė puikiai, be klaidų. Štai naršyklės išvestis.
Pereinant prie Claude AI, pokalbių robotas parašė aiškiai suprantamą kodą. Struktūra ir logika atrodė gerai. Deja, nepaisant pakartotinių bandymų, Claude AI vis trūko tam tikros kritinės logikos, kad kodas iš tikrųjų veiktų naršyklėje. Tai nesėkmė.
Po to, kai Claude AI nepavyko atlikti paskutinio testo, išbandėme kitokią kodavimo užduotį, kuri buvo labiau susijusi su kodo analize ir mažiau su naujo kodo rašymu. Įkėlėme penkis PHP failus, kurie atspindi visą svetainės foną, ir paklausėme Claude AI ir ChatGPT kur turėtume redaguoti visus įkeltus failus, kad gautume el. laišką, kai naujas vartotojas užsiregistruos svetainėje svetainę.
Keista, bet ChatGPT, nepaisant, atrodytų, turi geresnių kodavimo įgūdžių, nepaisant pakartotinių bandymų, nepavyko. Kita vertus, Claude AI sugebėjo meistriškai išanalizuoti kodą, nustatydamas tinkamas vietas, kurias reikėjo redaguoti, kad būtų pasiekti norimi rezultatai.
Žinoma, tai nebuvo pavienis atvejis, mes pakartojome tai su keliais kitais kodo failais, tačiau „ChatGPT“ suklupo ir sustojo daugeliu atvejų, o Claude AI nuolat teikė įspūdingus rezultatus. Kalbant apie kodavimo įgūdžius, nugalėtojas nėra visiškai aiškus.
Akivaizdu, kad „ChatGPT“ žymiai geriau rašo naują kodą ir gali puikiai valdyti sudėtingą kodą. Tačiau Claude AI žymiai geriau analizuoja dideles kodų bazes. Taigi, jei norite parašyti kokios nors naujos idėjos kodą, „ChatGPT“ yra įrankis, į kurį galite kreiptis. Jei norite išanalizuoti ar suprasti kodo bazę su tūkstančiais eilučių keliuose failuose, tikrai rekomenduotume Claude AI.
Claude AI yra stiprus konkurentas bloke
Claude AI atstovauja stipriai „ChatGPT“ konkurencijai – tokiai, kuri kada nors gali konkuruoti su „ChatGPT“ ir galbūt ją pranokti. Atsižvelgiant į tai, kad Claude yra palyginti naujas AI modelis, pavydėtina, kad jis gali perimti ChatGPT taip, kaip šiuo metu. Claude AI atsiradimas ir jo teikiama kokybė įrodo, kad konkurencija karšta.