„ChatGPT“, „Bing AI“ ir „Google Bard“ yra vieni iš labiausiai atpažįstamų vardų vartotojų dirbtinio intelekto pasaulyje. Visi trys produktai turi vieną bendrą bruožą – jie visi yra generatyvūs AI produktai.
Bet kas tiksliai yra generatyvusis AI ir kas pastaruoju metu sukėlė susižavėjimą šia atgimstančia AI erdve?
Kas yra generuojantis AI?
Generatyvusis AI, trumpinys „generatyvusis dirbtinis intelektas“, yra AI sistemos tipas, galintis generuoti unikalų arba originalų turinį, pvz., tekstą, garsą, vaizdo įrašus ar vaizdus pagal poreikį. Skirtingai nuo kai kurių tradicinių AI sistemų, skirtų tokioms užduotims kaip duomenų klasifikavimas ar analizė, generatyvus AI modeliai labiau rūpinasi naujų ar kūrybinių rezultatų kūrimu pagal jiems skirtas instrukcijas duota.
Nors generatyvus AI gali atrodyti kaip nauja technologija, ji iš tikrųjų egzistuoja dešimtmečius. Keletas iteracijų ir formų buvo bent jau septintajame dešimtmetyje. Dirbtinis intelektas yra didžiulė sritis, o generuojamasis AI yra tik poskyris.
Vienas iš patraukliausių aspektų naudojant a generatyvus AI įrankis, pvz., „ChatGPT“ arba „Google“ Bard AI yra šių įrankių galimybė generuoti turinį, atitinkantį jūsų užklausą. Jūs paprašote ChatGPT parašyti eilėraštį Williamo Shakespeare'o stiliumi ir gaunate kažką stulbinančiai panašaus į Šekspyro kūrybą. Jūs paprašysite, kad jis sukurtų kalbą Donaldo Trumpo stiliumi, ir gautumėte kažką, kas įspūdingai imituoja buvusio JAV prezidento toną. Taigi, kaip tai įmanoma? Kaip generatyvusis AI gali atlikti tokį žavų žygdarbį?
Kaip veikia generuojantis AI
Generatyvaus AI modelio veikimo mechanizmas apima sudėtingą įvairių giluminio mokymosi metodų ir algoritmų sąveiką. Tiksli informacija apie tai, kaip veikia generacinis modelis, priklauso nuo jo tikslų ir pagrindinės architektūros. Pavyzdžiui, generacinis garso fragmentų generavimo modelis turės kitokį veikimo mechanizmą nei tas, kuris skirtas vaizdo įrašams ar tekstui generuoti.
Tačiau iš esmės dauguma, jei ne visi, generaciniai modeliai veikia panašiai savo pagrindiniame lygmenyje. Jie mokosi iš daugybės duomenų, fiksuoja duomenų šablonus ir stilius, o tada naudoja šiuos užfiksuotus šablonus, kad atkurtų pavyzdžius, panašius į tai, ką išmoko iš mokymo duomenų.
Galite galvoti apie generatyvius AI įrankius kaip muzikos kūrėją. Įsivaizduokite, kad šis muzikos kūrėjas klausėsi daugybės dainų ir studijavo daugelio muzikos žanrų harmonijas, melodijas, ritmus ir struktūras. Kitaip tariant, šis kompozitorius turi daug žinių apie muzikos žanrus. Turėdamas šias žinias, kompozitorius gali sukurti originalią ar unikalią muziką, įkvėptą to, ko išmoko.
Taigi, jei jie daug sužinojo apie popmuziką, galite paprašyti jų sukurti pop dainą, ir tai padaryti jiems nekils problemų. Sukurta muzika būtų kompozitoriaus supratimo apie tai, kaip turi atrodyti popmuzika, remiantis tuo, ką jie išmoko, išraiška. Panašiai generatyvaus AI produktas yra AI modelio supratimo apie pagrindines sąvokas, išmoktas iš jo mokymo duomenų, išraiška.
Taigi, jei norite sukurti generatyvųjį AI modelį, kuris generuotų automobilių nuotraukas, turėtumėte pateikti modeliui didžiulį automobilių vaizdų duomenų rinkinį. Norėdami sukurti įspūdingą modelį, turėsite pateikti kuo daugiau automobilių markių ir modelių nuotraukų. Pakankamai pasimokęs, algoritmas sužinos, kaip atrodo kiekviena automobilio markė ar modelis, o pagal poreikį galėsime sukurti beveik bet kurio automobilio vaizdus.
Populiarūs generaciniai AI modeliai
Šiuo metu yra šimtai generatyvių AI modelių, kurie šiuo metu kuriami arba jau diegiami vartotojų AI rinkoje. Kai kurie iš populiariausių, kuriuos turėtumėte žinoti, yra šie:
1. Generatyvus iš anksto apmokytas transformatorius (GPT)
GPT, sukurtas OpenAI, yra vienas iš labiausiai atpažįstamų vardų generacinėje AI erdvėje. Jo populiarumas priklauso nuo jo, kaip pokalbio AI modelio, efektyvumo ir virusinės ChatGPT pokalbių roboto sėkmės, kuris naudoja GPT kaip pagrindinę technologiją. Tai didelis kalbos modelis, sukurtas taip, kad paraginti būtų generuojamas į žmogų panašus tekstas. Tipiškas bet kuriam generaciniam AI modeliui, visos GPT modelio iteracijos buvo išmokyti naudotis didžiuliu kiekiu įvairių tekstinių duomenų.
2. Pathways Language Model (PaLM)
„PaLM“, eksperimentinis „Google“ sukurtas didelės kalbos modelis, yra galingas generacinis AI modelis, galintis atlikti didelį diapazoną. užduočių, tokių kaip kūrybinis rašymas, kodų generavimas, kalbos vertimas ir daugybė kitų natūralios teksto kalbos užduotys. Kaip ir GPT, PaLM buvo apmokytas naudojant didelį tekstinių duomenų korpusą, gautą iš daugybės šaltinių visame žiniatinklyje. tai yra AI modelis, kuris veikia Google Bard AI.
3. Muzikos kalbos modelis (MusicLM)
MusicLM yra dar vienas generatyvus AI modelis iš Google. Jis skirtas generuoti "didelės tikslumo" muziką iš paprastų tekstinių raginimų. Išmokytas tūkstančius valandų muzikos įvairiuose žanruose, generatyvus modelis gali sukurti unikalią muziką, naudodamas paprastus jums reikalingos muzikos aprašymus kaip įvestis. Jei jums įdomu, kaip tai gerai, štai mūsų „MusicLM“ modelio apžvalga.
4. DALL-E
DALL-E yra OpenAI AI vaizdo generavimo modelis sukurta siekiant sukurti kelių stilių unikalius vaizdus iš teksto raginimų. Tai daugiarūšis GPT modelio įgyvendinimas, parengtas naudojant daugybę teksto ir vaizdo porų iš įvairių šaltinių visame internete.
Be generuojamųjų AI modelių, taip pat rasite generuojamųjų AI produktų, tokių kaip Midjourney, DALL-E vaizdo generatorius, Stabilios difuzijos vaizdo generatorius, Hugging Chat ir keli kiti įspūdingi dirbtinio intelekto produktai, maitinami generatyvaus AI modeliai.
Kodėl generatyvusis AI išpopuliarėjo?
2022 m. lapkričio 30 d. OpenAI generalinis direktorius Samas Altmanas tviteryje paskelbė apie ChatGPT paleidimą. Nepaisant to, kad jis buvo „OpenAI“ generalinis direktorius, Altmanas buvo gana nežinomas didesnėje interneto bendruomenėje, o jo tviteryje pasirodė ne itin šmaikštuolis.
Po penkių dienų ChatGPT surinko pirmąjį milijoną vartotojų; tai padarė tokiu greičiu, kokio negirdėjo jokia programa. Galiausiai susirinko dar keli milijonai paversdamas „ChatGPT“ visų laikų greičiausiai augančia programa. Nors „ChatGPT“ nėra pirmasis generacinis AI produktas, jo atėjimas į AI produktų sceną generatyvusis DI į visuomenės sąmonę įtraukė labiau nei bet kuris kitas technologijų produktas iki jo.
Nors ChatGPT buvo ieties viršūnė skatinant ažiotažą apie generatyvųjį dirbtinį intelektą, jis to nepadarė vienas. 2022-ieji bus prisiminti kaip metai, kai generatyvūs AI įrankiai tapo plačiai naudojami. Nuo pokalbių AI pokalbių robotų iki kodų ir meno generatorių – 2022 m. antroji pusė buvo pirmasis kartas, kai rinkoje pasirodė daugybė AI įrankių, kurie buvo tiek masinio patrauklumo, tiek praktiškai naudojami kasdieniame gyvenime. Su šiais įrankiais išpopuliarėjo pagrindinė technologija – generuojantis AI.
Generatyvūs AI įrankiai, tokie kaip Bing AI, Google's Bard, DALL-E, ChatGPT ir Midjourney, sklandžiai veikia įsipynė į mūsų kasdienio gyvenimo audinį, nuolat pateikdami mums savo nuostabių dalykų kūrinius. Nesvarbu, ar tai žavūs ChatGPT sukurti įrašai, ar stebėtinai tikroviški vaizdai „Midjourney“ užburtas generatyvusis AI tapo nuolatiniu palydovu, lydinčiu mus kiekvieną dieną ir diena. Tai yra pastarojo meto generatyvinio AI populiarumo atsiradimas.
Apimkite generatyvųjį AI
Generatyvių dirbtinio intelekto įrankių populiarumas nėra mada. Skirtingai nuo kai kurių naujausių technologijų tendencijų, kurios išpopuliarėjo ir laikui bėgant išnyko, generatyvinis AI yra technologija, turinti realios praktinės naudos. Kadangi ši atgimstanti technologijų niša įsilieja į beveik visus mūsų skaitmeninio gyvenimo aspektus, geriau ieškoti būdų, kaip geriausiai panaudoti technologiją, o ne jaudintis dėl jos.