Daugelis iš mūsų yra girdėję, kad pavadinimas DALL-E, bet galbūt nesate tikri, kas tai yra. Trumpai tariant, tai generatyvus AI modelis, galintis sukurti vaizdus, kurių anksčiau nebuvo, tereikia pasakyti, ką norite sukurti.
Kai buvo išleista tolesnė versija, pavadinta DALL-E 2, ji tikrai išgarsėjo. Vaizdai, kuriuos jis galėjo sukurti, buvo tokios aukštos kokybės ir taip gerai sugeneruoti, kad vargu ar galėtumėte pasakyti, kad tai padarė mašina.
Štai ką reikia žinoti apie DALL-E ir kaip jis veikia.
Kas yra DALL-E?
DALL-E yra generatyvus AI modelis, sukurtas Open AI, kuris gali generuoti vaizdus ir meną iš teksto raginimo. Kitaip tariant, galite parašyti sakinį, tiksliai apibūdinantį tai, ką norite matyti, ir DALL-E gali sukurti tą vaizdą už jus per kelias sekundes.
DALL-E pirmą kartą buvo išleistas 2021 m. sausio mėn. ir nuo to laiko buvo gerokai patobulintas antrojoje versijoje, pavadintoje DALL-E 2. Tai buvo vienas iš kelių skirtingų AI meno generatorių, kurie išpopuliarėjo dėl gebėjimo kurti gražius vaizdus ir meną nuo nulio.
Kadangi norint sukurti vaizdą, jums tereikia parašyti kelis aprašomuosius žodžius, tai pritraukė daug ne menininkų, kuriems įrankis atrodo nepaprastai įdomus ir paprastas naudoti.
DALL-E sukurti vaizdai yra tokie įtikinami, kad juos lengva supainioti su žmogaus sukurtu menu. Jis gali ne tik pavaizduoti mus supančio pasaulio objektus ir peizažus, bet ir pateikti šiuos vaizdus tam tikru stiliumi, pavyzdžiui, skaitmeniniu menu, akvarele ar impresionizmu.
DALL-E pavadinimą gavo iš menininko Salvadoro Dalí ir roboto WALL-E iš animacinio Pixar filmo. DALL-E pavadinimas neabejotinai suteikia mums idėją apie tai, kaip įmonė siekė derinti meną ir AI technologijas.
Galite sužinoti viską apie kaip naudoti Dall-E 2 kuriant AI vaizdus mūsų išsamiame vadove, įskaitant tai, kaip gauti prieigą ir kaip redaguoti konkrečias vaizdo dalis.
Kaip veikia DALL-E?
DALL-E yra gana daug skirtingų technologijų. Tačiau nesigilindami į sudėtingą matematiką, pradėkime nuo to, kaip DALL-E buvo išmokytas naudoti milijonus vaizdų iš viso interneto.
Treniruotėms naudojami vaizdai gaunami iš duomenų rinkinių, kuriuose yra labai daug paveikslėlių su antraštėmis. Kaip galite įsivaizduoti, turėdamas pakankamai duomenų AI modelis gali išmokti atpažinti, kas yra objektas ir kaip jis gali atrodyti vaizde.
Duomenų rinkinys, naudojamas treniruoti DALL-E, nebuvo atskleistas, tačiau vis tiek galite sužinokite, ar jūsų vaizdai išugdė dirbtinio intelekto modelį ir atsisakyti.
DALL-E taip pat buvo sukurtas naudojant kalbos modelį, vadinamą GPT-3, arba generatyvų iš anksto apmokytą transformatorių. Jis buvo išpopuliarintas, kai „Open AI“ išleido „ChatGPT“ – AI pokalbių robotą, su kuriuo galite lengvai kalbėti natūralia žmonių kalba. Ši technologija sumažina atotrūkį tarp teksto ir vaizdo ir padeda įvestus žodžius paversti vaizdu ekrane, sudarytu iš pikselių.
Kita pagrindinė DALL-E dalis yra difuzijos modelio naudojimas. Šis modelis nufotografuoja triukšmingą vaizdą – pagalvokite apie labai piksuotą vaizdą, kuris nėra atpažįstamas – ir veikia atgal, kad gautų aiškų vaizdą, atitinkantį įvestą teksto aprašymą.
Ką galite padaryti su DALL-E?
Žmonės naudoja DALL-E įvairiems dalykams. Galite išbandyti savo jėgas dirbdami dirbtinio intelekto menininku, naudodami jį remiksuodami garsųjį meno kūrinį arba paimti originalų meno kūrinį ir išplėsti jį naudodami DALL-E redagavimo funkcijas.
Dažymas yra DALL-E funkcija, leidžianti sukurti dar didesnius darbus, nes prie esamo meno kūrinio galite pridėti naujai sukurtas vaizdo plokštes. Mokytis kaip naudoti „Dall-E 2“ dažymą kad pamatytumėte, kiek galite išplėsti AI sukurtus vaizdus.
Kurkite dirbtinio intelekto sukurtus vaizdus naudodami DALL-E
DALL-E yra lengvai pasiekiamas dirbtinio intelekto įrankis, kurį galite naudoti kurdami meną arba generuodami vaizdus, kurių niekada anksčiau nebuvo. Jis naudoja neįtikėtiną mašininio mokymosi pažangą, įskaitant GPT-3 ir difuzijos modelius. DALL-E žinios apie žmonių pasaulį, įskaitant meno istoriją, gaunamos iš milijonų vaizdų, kurie greičiausiai buvo surinkti iš interneto.
Kelių naujų technologijų derinys generuojamajame AI reiškia, kad galėsite mėgautis vaizduotės atgaivinimu naudodami tik žodžius, kad nupieštumėte paveikslą.