Dirbtinio intelekto meno generatoriai turi blogą repą, nes pateikia netikslius rankų vaizdus. Palyginkime „Midjourney v5“ su „Dall-E 2“, kad pamatytume, kuris tai veikia geriau.
AI meno generatoriai ir toliau daro įspūdį, leisdami mums sukurti beveik viską, ką tik galime įsivaizduoti. Tačiau atrodo, kad technologija atsitrenkė į plytų sieną, kai reikia sukurti tikroviškai atrodančias rankas.
Čia apžvelgiame dvi pirmaujančias generuojamojo meno programas ir sujungiame jas viena ar kita, kad pamatytume, kurios gali sukurti geresnes rankas: „Midjourney v5“ ar „Dall-E 2“. Ar kuri nors iš šių programų įvaldė rankas? Išsiaiškinkime!
AI problema su rankomis
Nuo tada, kai AI sukurtas menas plačiai paplito internete, buvo kritikuojama AI nupieštų rankų kokybė. Nepaisant naujausių atnaujinimų, kaip matyti iš mūsų palyginimų, rezultatai nebuvo patenkinami.
Abu pretendentai su kiekviena iteracija tobulino savo galimybes ir rezultatų kokybę. Naujausias atnaujinimas, Vidurio kelionės 5 versija, parodė įspūdingą pažangą. Tačiau AI nupieštų rankų problema lieka neišspręsta ir jos negalima ignoruoti.
1 palyginimas: raginimų „Ranka“ ir „Rankos“ naudojimas
Mūsų palyginimuose bus lygiai tokie patys raginimai tiek Dall-E 2, tiek Midjourney v5. Raginimus sukursime taip, kad jie būtų pritaikyti konkrečiai rankai, o ne tiesiog kursime žmones, kurie pamatytų, kaip atrodo rankos. Be to, kiekvienai programai suteikiame tik vieną galimybę (pasileisti) kiekvienam raginimui.
Ranka
Pradėkime nuo paprasčiausio ir aktualiausio raginimo: „ranka“.
Vidurio kelionė v5:
Dall-E 2:
Mes nepradėjome gerai!
Midjourney pasirinko neįprastą kelią – ranką siejo su gana kūrybingomis situacijomis. Užuot sutelkę dėmesį tik į ranką, matome burtininką, pirštines, skeletą ir mažą figūrėlę. Pirštinių paveikslėlyje taip pat trūksta piršto.
Dall-E 2 laikosi priešingo požiūrio ir siūlo mums tik vieną ranką paprastame fone. Tačiau kaip bebūtų keista, yra keistų pozų, ypač su nykščiais, kurios neatrodo natūraliai ar patogiai. Kiekviena ranka taip pat nupjaunama vienoje iš vaizdų pusių.
Kas laimi šį turą? Dėl bendro tikslumo mes jį atiduosime Dall-E 2.
Rankos
Dabar paverskime raginimą daugiskaita „rankos“ ir pažiūrėkime, ką AI sugalvoja.
Vidurio kelionė v5:
Dall-E 2:
Midjourney bandymas „rankomis“ šį kartą pasirodo geriau. Tačiau visi keturi vaizdai yra nespalvoti, ir mums trūksta kelių pirštų. Atidžiau pažiūrėję taip pat galite pastebėti, kad kai kurie skaitmenys yra keistos formos arba susiformuoja vienas į kitą.
Dall-E 2 ir toliau turi rankas su paprastu fonu. Netrūksta skaitmenų, tačiau trečiame paveikslėlyje rankos nukirptos, o kitos versijos atrodo kaip gremėzdiškos kompozicijos ir visiškai stokojančios kūrybiškumo.
Pavadinkime šį palyginimą lygiosiomis. Dall-E 2 laimėtų dėl tikslumo, jei tai būtų vienintelis veiksnys, bet Midjourney sugeba sukurti gražūs nespalvoti vaizdai, net jei visos keturios versijos nėra labai geros tikroviškas.
Jūs visada galite naudokite „Photoshop“, kad pataisytumėte savo Midjouney meną, įskaitant rankas.
2 palyginimas: rankų gestai
Palyginkime keletą rankų gestų, kurie yra beveik visuotinai atpažįstami.
Sukryžiuoti pirštai
Pirma, pabandykime „sulenkę pirštus“.
Vidurio kelionė v5:
Dall-E 2:
Galima drąsiai teigti, kad „Midjourney“ visiškai sugadino šį raginimą. Mums trūksta pirštų ir nė viena versija neatrodo natūraliai.
Dar kartą nusidedu kepurę prieš Dall-E 2 už teisingą pirštų skaičių, bet tai vienintelė gera žinia. Kiekviena versija atrodo taip, lyg pirštai muštų savo jogos pozas Twister žaidime.
Šiame palyginime nėra nugalėtojo.
Nykščiai aukštyn
Toliau einame iškėlę nykštį į viršų.
Vidurio kelionė v5:
Dall-E 2:
Midjourney tiksliai skaičiuoja pirštus, o kiekvieną raginimą elgiasi kūrybiškai. Pastebėjote iliustruojančio stiliaus įvedimą?
Dall-E 2 taip pat gauna taškų už tikslumą, nes prie kiekvieno rezultato nesistengia siūbuoti valties.
Čia nėra aiškaus nugalėtojo.
3 palyginimas: rankos su objektais
Dabar mes padidinsime sudėtingumą ragindami rankas sąveikauti su objektais.
Rankoje laikomas krištolinis rutulys
Pradėkime nuo atsitiktinio objekto, naudodami raginimą „rankoje laikantis krištolo rutulį“.
Vidurio kelionė v5:
Dall-E 2:
Didėjant sudėtingumui, Midjourney pradeda šviesti. Be kelių nenatūraliai atrodančių perteikimų, rankos ir krištolo rutuliai atrodo gražiai. Kelionės vidurio metu net reikia laiko sukurti atspindžius stiklinėje, kuris neabejotinai padidina bendrą kūrybiškumą.
Tačiau pirmą kartą matome, kad Dall-E 2 trūksta skaitmens bent vienoje rankoje, o ketvirtoji rodyklė atrodo tiesiog keistai. Krištoliniai rutuliai taip pat neatrodo tokie įspūdingi, lyginant su Midjourney.
„Midjourney“ iškovojo pirmąją pergalę.
Ranka Laikant vandenį
Išbandykime ką nors dar sudėtingesnio su raginimu „vandens ranka“.
Vidurio kelionė v5:
Dall-E 2:
„Midjourney“ sugeba išvynioti tik vieną vaizdą su tinkamu skaitmenų skaičiumi. Nors ir gražiai perteikta, vėl pradedame matyti įtrūkimus tikėjimo skyriuje.
Dall-E 2 taip pat kovoja su natūraliomis rankomis, tačiau atlieka daug geresnį darbą. Tai taip pat pakeičia fono spalvą tam tikrai įvairovei.
Šį raundą atiduosime Dall-E 2.
4 palyginimas: darbo rankos
Šiam palyginimui sukursime raginimus, kurie bus įtraukti į veiklą.
Molio formavimas rankomis
Pažiūrėkime, kaip dirbtinio intelekto modeliams sekasi su „molio formavimu rankomis“.
Vidurio kelionė v5:
Dall-E 2:
Midjourney praleido pirštą dviejuose vaizduose, bet visa kita atrodo puikiai.
Dall-E 2 vaizdai atrodo painūs ir perpildyti, o pusėje versijų prideda kito žmogaus rankas.
Kraštas eina į Midjourney.
Rankų spaudimo tešla
Išbandykime panašų užsiėmimą „rankomis spaudžia tešlą“.
Vidurio kelionė v5:
Dall-E 2:
„Midjourney“ vaizdai apskritai atrodo puikiai. Tačiau vėlgi pusėje jų trūksta skaitmenų. Tačiau vaizdų negalima kaltinti dėl meniško stiliaus.
Dall-E 2 versijose taip pat trūksta pirštų pusėje perteikimų ir netgi pridedama prie paskutinės rinkinio rankos.
Pavadinkime tai lygiosiomis.
Jei norite patys išbandyti šiuos palyginimus, mes jums parodysime kaip naudoti Midjourney kuriant AI meną.
Ką mums sako rezultatai?
Smagu lyginti ir nustatyti bendrą nugalėtoją. Ir jei turėtume rinktis, vadintume tai Midjourney v5 naudai. Nors „Dall-E 2“ dažniau kurdavo rankas su reikiamu pirštų skaičiumi, būtent „Midjourney“ sukūrė meniškesnius ir patrauklesnius vaizdus.
Tačiau abi programos turi vietą rinkoje menininkams, kurie savo darbams naudoja Dall-E 2 ir Midjourney vaizdus. Abu gali sukurti rankas, kurios gali būti naudojamos kaip išpjovos arba kompozicijos meniniam, redakciniam ir komerciniam naudojimui. Tai tik asmeninių pageidavimų reikalas.
AI galiausiai užkariaus rankas
Generatyvaus meno programos, tokios kaip Dall-E 2 ir Midjourney, nuėjo ilgą kelią kurdamos tikrovišką ir fantastišką meną. Jie vis dar kovoja su generuojamomis rankomis, tačiau atsižvelgiant į generatyviųjų technologijų įsibėgėjimą, artimiausiu metu galime tikėtis tik tobulėjimo.