Kaip naudoti dirbtinį intelektą kuriant vaizdus iš visko, ką tik galite įsivaizduoti

Vos prieš kelis mėnesius, jei norėjote sukurti kažkokį paveikslą, turėjote turėti galimybę piešti, piešti ar naudoti vieną iš fotošopingo įrankių, apie kuriuos kiti nuolat kalba. Tačiau po 2022 m. viskas pasikeitė dėl AI – taip, kaip ir „dirbtiniame intelekte“.

Užuot bandę dominuoti pasaulyje, meniškai linkę dirbtinio intelekto įrankiai gali paversti bet ką, ką jiems apibūdinate, įvaizdžiu.

Ateikite su mumis, kai įžengsime į dirbtinio intelekto teksto vizualizavimo pasaulį, ir sužinokite, kaip galite naudoti tokius įrankius, kad paverstumėte savo mintis tikromis nuotraukomis, tiesiog įvesdami tai, ką turite omenyje.

Dall-E: meninė OpenAI GPT-3 pusė

Pirmieji išpopuliarėję dirbtinio intelekto įrankiai buvo pagrįsti OpenAI GPT-3. Viena iš priežasčių buvo projekto atvirumas išorinei prieigai, todėl buvo pasiūlyta GPT-3 yra kūrybinio darbo ateitis.

Šiandien galite naudoti oficialius įrankius, kuriuos rasite adresu OpenAI beta svetainė arba trečiųjų šalių sprendimai, kurie naudojasi jos kalbinėmis supergaliomis. Pavyzdžiui, galite paprašyti GPT-3 parengti įrašo juodraštį, atsakyti į paprastus klausimus ar net pataisyti ar išversti tekstą.

instagram viewer

2022 m. „OpenAI“ atskleidė, kad GPT-3 taip pat gerai kūrė vaizdus. DALL-E projektas, Pixar WALL-E filmo ir Dali vardo vaidinimas, naudoja GPT-3 ne darbui su tekstu, o kaip vaizdo kūrimo varikliu.

Kaip ir su GPT-3 ir tekstu, DALL-E tikrai nėra kūrybinis genijus, materializuojantis vaizdus iš oro. Vietoj to, jis buvo „apmokytas“ naudojant milijonus vaizdų, kurie jau yra internete. Jo AI galios slypi analizuojant tuos vaizdus, paimant iš jų elementus, koreguojant, modifikuojant, koreguojant ir galiausiai sujungiant juos į naujus vaizdus.

Bent jau tai supaprastinta versija to, kas vyksta fone. Daugumai žmonių rūpės tik tai, ką jie mato priešais save, ir tai yra teksto laukelis, kuriame galite ką nors įvesti ir pamatyti, kaip po kelių minučių tai paverčiama vaizdu.

„Google“ vaizdo atsakymas

„Google“ yra viena iš trijų geriausių „žaidėjų“ atliekant AI tyrimus. Vis dėlto jų pažanga nėra lengvai pastebima, taip pat jų diegimas į produktus nėra toks pat prieinamas kaip OpenAI pasiūlymai.

Vienas iš pirmųjų plačiai prieinamų „Google AI“ diegimų buvo „Google“ dokumentuose ir „Gmail“ – tai išmanesnis automatinis užbaigimas ir pasiūlymai, žinomi kaip „Smart Compose“. Mes nesineriame į detales, nes jau buvome aptarę anksčiau Išmanusis kūrimas (ir kaip galite jį naudoti).

Kai šios funkcijos aktyvios, „Google“ žiniatinklio programos lygina tai, ką vartotojas įveda, su tuo, ką milijonai kitų parašė praeityje. Tada jis siūlo, ką jie įvedė vėliau.

Tai įrodymas, kad nepaisant to, kuo norime tikėti, nesame tokie skirtingi. Jei 99 iš 100 žmonių po žodžio „susitiksime“ įveda „vėliau“, tikriausiai taip ir toliau rašytume.

Mes visi naudojome tam tikrą automatinio užbaigimo formą, net iš „durnių“ eros T9 nuspėjamojo teksto sistemos. Štai kodėl „Google“ AI įrankiai neatrodė tokie protingi kaip „OpenAI“ GPT-3. Jie nesijautė tiek labiau naudojami nei geresnė T9 sistema, patobulinta XXI amžiuje. Ir todėl Imagen atskleidimas šiek tiek sukrėtė.

Kaip ir DALL-E ant steroidų, Imagen yra teksto vizualizacijos įrankis. Atsižvelgiant į tai, kas šiandien yra, „Imagen“ gali sukurti „švaresnius“ ir ryškesnius vaizdus, taip pat žinodama, kaip elgtis su pažangiomis funkcijomis, tokiomis kaip sklaida ir skaidrumas.

Deja, rašymo metu prieiga prie „Imagen“ tebėra apribota, todėl negalėjome jos išbandyti.

DALL-E Mini ir draugai: atvira verslui

Dar negalite laisvai pasiekti DALL-E ir Imagen. Vis dėlto jau yra daug alternatyvų, jei norite kvailioti su AI varomu tekstinių vaizdų generavimu.

Turint omenyje, kad tai yra pirmos dienos, o jų siūlomi rezultatai ar naudotojo patirtis gali būti toli gražu ne optimalūs, vis tiek verta peržiūrėti kai kuriuos toliau nurodytus dalykus.

Memų kūrimas naudojant Dall-E Mini

Dėl daugiau nei tinkamų rezultatų ir patogios sąsajos derinio, o dar svarbiau – plataus prieinamumo, DALL-E mini tapo vienu populiariausių AI teksto vizualizatorių.

Toli gražu nėra tobula, kartais DALL-E mini rezultatai gali būti abstraktesni, nei tikėtasi.

Kartais gali nepavykti sukurti to, ką turėjote galvoje, bet gali būti gana artimi.

Po didžiulio populiarumo, DALL-E mini kūrėjai perkėlė jį į naujus namus su nauju prekės ženklu. Dabar galite rasti naujausią DALL-E mini versiją kaip Craiyon savo svetainėje.

Naudoti „Craiyon“ šiandien taip paprasta, kaip internete ieškoti esamo vaizdo. Galite apsilankyti jos svetainėje, teksto lauke įvesti paveikslėlio aprašymą ir paspausti Enter. Po kurio laiko ekrane pamatysite rezultatus.

Stebina tai, kaip gerai „Craiyon“ ir panašūs įrankiai imituoja vizualinius stilius. Pavyzdžiui, paprašėme sukurti šuniuko ant riedlentės atvaizdus:

Tada panaudojome tikslią frazę, bet po jos pridėjome „Pixar style“. Po kurio laiko Craiyon parodė „karikatūriškesnių“ vaizdų tinklelį, artimesnį tam, ką mes suvokiame kaip „Pixar“ spindulių sekimo grafiką jų mylimuose filmuose.

Craiyon davė dar geresnių rezultatų, kai tame pačiame raginime „Pixar style“ pakeitėme „anime style“.

„Anime“ išvaizda yra labiau stilizuota nei tikroviškesni „Pixar“ vaizdai, kurie, atrodo, padėjo „Craiyon“ sukurti kai kuriuos beveik paruoštus naudoti vaizdus.

Kvailiojimas su latentine difuzija

Latentinės difuzijos modelis, parengtas naudojant LAION-400M duomenų rinkinį, yra dar vienas įdomus AI teksto vizualizatorius. Tačiau jo naudojimas taip pat yra sudėtingesnis. Turite jį paleisti internete virtualioje mašinoje ir žaisti su įvairiais parametrais, o ne tik įvesti teksto lauką. Vis dėlto tai lengviau, nei atrodo.

Aplankykite „Google Latent Diffusion“ bendra erdvė tai šiuo metu yra jo namai.
Slinkite šiek tiek žemyn ir pastebėkite Raginimas laukas po Parametrai. Pakeiskite numatytąjį raginimą į tai, ką norite pavaizduoti vaizde.
Pasirinkite Vykdyti viską nuo Vykdymo laikas meniu arba paspauskite CTRL + F9.
Jei norite, kad sukurtus vaizdus būtų galima eksportuoti tiesiai iš įrankio, atsakykite teigiamai, kai paklausite, ar norite susieti jį su Google disko paskyra. Įrankio konfigūracija užtrunka šiek tiek laiko, o proceso metu reikia atsisiųsti kai kuriuos failus.

Didinant reikšmes Žingsniai, Iteracijos, ir Pavyzdžiai_lygiagrečiai, gali būti gauti išsamesni rezultatai. Tačiau šis įrankis labai reikalauja išteklių „Google“ serveriuose. Dėl to jis gali sugesti, jei per daug padidinsite šias reikšmes arba konkretaus vaizdo kūrimo procesas taps sudėtingesnis nei tikėtasi.

Įdomios alternatyvos

Daug laiko praleidome bandydami DALL-E mini ir Latent Diffusion. Mūsų mokslinis metodas susideda iš dviejų skirtingų dalių. Pirmiausia turėjome sugalvoti sąvokas, kurias būtų galima tiksliai apibūdinti kaip kvailystes. Tada paprašykite tų AI vizualizatorių paversti juos vaizdais. Dažniau, nei tikėtasi, jiems pasisekė, priartėjus prie bendros sąrankos, kurią mes įsivaizdavome.

Taip pat išbandėme keletą galimų šio straipsnio alternatyvų. Mes vis dar laukiame prieigos prie kitų. Kai kurie iš jų, kuriuos verta patikrinti, yra (jokiu būdu):

Vidurinė kelionė
MindsEye beta versija
StarryAI
Svajoti
Disco difuzija

Ar AI sukurtas menas pakeis vizualųjį meną?

Vaizdus generuojančių dirbtinio intelekto įrankių gausa ir nuolat didėjantis populiarumas leidžia daugeliui daryti išvadą, kad vizualinis menas greitai mirs. Kokia prasmė investuoti laiką ir energiją, kad išmoktumėte piešti arba naudoti sudėtingą programinę įrangą, kad įsivaizduotumėte dalykus, kai dirbtinis intelektas gali tai padaryti greičiau (ir netrukus geriau) nei jūs?

Jei pastebėjote, visi šie įrankiai yra „apmokyti duomenų rinkiniuose“. Paprasta anglų kalba tai reiškia, kad jie daro tai, ką daro, nes žmonės tą patį jau padarė anksčiau.

Tai yra užuomina, kodėl tie įrankiai negali pakeisti žmogaus meniškumo, kūrybiškumo ir išradingumo. Jie yra mimikos, išmanieji replikatoriai. Be žmonių sukurtų originalų, kurių jie mokomi, jie negalėtų pagaminti jokios produkcijos.

Vis dėlto tai yra dabar, ir mes pripažįstame, kad nežinome, kas bus ateityje. Kol kas vizualūs menininkai gali saugiai miegoti. DI vystosi greičiu, tačiau daugelis šios temos specialistų sutinka, kad nesvarbu, ar jis kada nors pakeis tokių žmonių, kaip jūsų, darbą. Tik klausimas kada.

Bet ei, tai dar ne viskas likimas ir niūrumas. Kol Skynet ruošiasi imtis mūsų darbo, bent jau galime praskaidrinti savo nuotaiką be vargo kurdami šuniukų atvaizdus ant riedlenčių!

About Technology - denizatm.com

Kaip naudoti dirbtinį intelektą kuriant vaizdus iš visko, ką tik galite įsivaizduoti

Dall-E: meninė OpenAI GPT-3 pusė

„Google“ vaizdo atsakymas

DALL-E Mini ir draugai: atvira verslui

Memų kūrimas naudojant Dall-E Mini

Kvailiojimas su latentine difuzija

Įdomios alternatyvos

Ar AI sukurtas menas pakeis vizualųjį meną?

Kategorijos

Recent Post

Kokia yra „QuickBooks“, veikiančios „Linux“, alternatyva?

Kaip naudoti „BitTorrent“?

Koks yra geriausias „Android“ biuro rinkinys, skirtas tvarkyti įprastus failų tipus?