Supriešinkime didžiausius AI meno žaidėjus vienas prieš kitą ir pažiūrėkime, kuris iš jų bus aukščiausias. DALL-E, Midjourney ar stabili difuzija?

Dirbtinis intelektas nuėjo ilgą kelią įvaizdžio kūrimo srityje. Generatyvios programos, tokios kaip DALL-E, Midjourney ir Stable Diffusion, padarė didelę įtaką mūsų sąveikai su skaitmeniniu turiniu.

Šiame straipsnyje palyginsime kiekvieną programą, kad pamatytume, kuri iš jų apskritai geriau generuoja vaizdus pagal tekstinius raginimus. Pradėkime!

DALL-E 2

DALL-E 2 turi paprastą sąsają, kurią lengva suprasti, ir lengva pradėti kurti vaizdus neprisiregistravus trečiosios šalies platformoje. Tiesiog eikite į svetainę ir įveskite tekstą į Generuoti langelį vaizdui sukurti. Tada DALL-E 2 sukurs keturias raginimo versijas, kurias galėsite redaguoti arba atsisiųsti.

Išskirtinis bruožas

Viena išskirtinių DALL-E 2 savybių yra galimybė kurti, redaguoti ir sujungti kelis vaizdus. Kai pasirenkate norimą vaizdą ir spustelėkite Redaguoti, turėsite galimybę naudoti

instagram viewer
Pridėti kartos rėmelį funkcija, leidžianti prie esamos kartos pridėti papildomų vaizdų kartų.

Įdėję rėmelį įveskite naują raginimą ir DALL-E 2 sugeneruos naują vaizdų rinkinį su galimybe sujungti bet kurį iš jų į pradinį vaizdą.

Tada galite naudoti bet kurią redagavimo funkciją, kad vaizdas būtų tobulas. Pavyzdžiui, galite naudoti Ištrinti įrankį, kad ištrintumėte esamus pikselius, o tada įveskite naują tekstą į laukelį Generuoti, kad jį užpildytumėte. Tai galite padaryti kelis kartus, kad pasiektumėte norimų rezultatų.

Tačiau atminkite, kad kiekvieną kartą spustelėję Generuoti naudojate kreditus. Ir kai jūsų paskirstymas bus panaudotas, turėsite nusipirkti daugiau kreditų, kad galėtumėte tęsti.

Argumentai "už"

  • Paprasta naudoti
  • Daug kūrybinio lankstumo
  • Nereikia jokios trečiosios šalies platformos

Minusai

  • Supaprastinti vaizdai
  • Nėra didelio tikslumo
  • Galima kurti tik kvadratinius vaizdus

Mes padengiame DALL-E 2 pagrindai jei niekada anksčiau jo nenaudojote.

Vidurinė kelionė

Vidurinė kelionė yra neabejotinai AI teksto į vaizdą generatorius, kurį reikia įveikti. Turėdamas galingą funkcijų rinkinį, jis gali sukurti labai meniškus ir patikimus vaizdus, ​​kurių kiti AI konkurentai dar turi nuosekliai pasiekti. Tačiau priešingai nei DALL-E 2, prieš pradėdami naudoti, turite susikurti Discord paskyrą.

Net ir su papildomais sudėtingumo sluoksniais ir nepaisant to, kad turite įvesti tokias komandas kaip /imagine Norėdami sukurti savo vaizdus, ​​​​netrukus atleisite Midjourney dėl gražaus meno, kurį galite sukurti keliais žodžiais.

Kaip ir su DALL-E 2, sukuriamos keturios versijos ir galite pasirinkti vieną ar daugiau iš jų, kad atsisiųstumėte arba sukurtumėte variantus. Tačiau yra daugiau lankstumo naudojant vaizdo santykius; galite nustatyti bet kokį pageidaujamą santykį, pridėdami kiekvieną vaizdą --ar o po to seka santykis, mūsų pavyzdyje, 3:2.

Rezultatų kokybė yra neabejotina Midjourney magija.

Išskirtinis bruožas

Viena iš įdomesnių ir galingesnių „Midjourney“ funkcijų yra galimybė įkelti savo vaizdus ir tada Midjourney sukurti jiems raginimus, kuriuos galite naudoti kurdami visiškai naujus vaizdus. Rašydami /describe, jūsų prašoma įkelti vieną iš savo vaizdų.

Įkėlęs „Midjourney“ pateiks keturis raginimus su savo interpretacija, ką mato.

Tada galite naudoti šiuos raginimus, kad sukurtumėte visiškai kitokį vaizdų rinkinį.

Turėdamas tiek daug kūrybingo lankstumo, „Midjourney“ siūlo beveik begalines galimybes.

Argumentai "už"

  • Aukštos kokybės vaizdai
  • Vartotojai gali programuoti pasirinktinius santykius
  • Daug lankstumo valdant vaizdo parametrus

Minusai

  • Sudėtingesnis naudojimas
  • Reikalaujama, kad vartotojai prisiregistruotų naudodami „Discord“.
  • Vaizdo generavimo laikas labai pailgėja, kai išnaudojamos greitosios valandos

Tu gali kurkite nuostabius portretų fonus naudodami Midjourney kad jūsų nuotraukos išsiskirtų.

Stabili difuzija

Stabili difuzija atstovauja laukiniams vakarams generatyvių AI programų. Kadangi yra daug internetinių programų ir įdiegimo parinkčių, nėra lengva palyginti „Stable Diffusion“ su DALL-E 2 ir „Midjourney“. Taip yra daugiausia dėl skirtumų tarp žiniatinklio versijų ir diegimo modelių, susijusių su parinktimis ir išvesties kokybe. Kitaip tariant, įdiegtos „Stable Diffusion“ versijos paprastai suteiks daug geresnių rezultatų ir kūrybinės laisvės.

Pažiūrėsime į oficialią Stable Diffusion svetainę, „Stability AI“ sukurta „DreamStudio“.ir parodys, kaip pradėti naudoti programą, kad suprastumėte jos galimybes.

„Stable Diffusion“ išdėstymas „DreamStudio“ yra netvarkingas nei „DALL-E 2“ ir „Midjourney“, tačiau juo vis tiek paprasta naudotis. Bandomieji vartotojai gauna 200 nemokamų kreditų, kad sukurtų raginimus, kurie įvedami į Raginimas dėžė. Tačiau be to, yra ir a Neigiamas raginimas langelį, kuriame galite užbėgti už akių „Stable Diffusion“ ir nieko nepalikti.

Kairiajame meniu yra keletas kitų esminių funkcijų, kurios turės įtakos bendram įvaizdžiui ir kredito naudojimui. Ten yra Stilius parinkčių langelis, Įkelti paveikslėlį, ir Nustatymai (atsižvelgiant į santykį ir generuojamų vaizdų skaičių). Viduje Išplėstinė skirtukas, yra Greita jėga, Kartos žingsniai, Sėkla, ir Modelis.

Užvedus pelės žymeklį ant kiekvienos iš šių parinkčių, pateikiamas trumpas kiekvienos funkcijos aprašymas. Tačiau norėdami iš tikrųjų suprasti, ką kiekvienas iš jų daro praktiškai, turite juos tiesiog išbandyti. Tačiau stebėkite savo kreditus, nes tai nėra sistema „vienas kreditas už vieną vaizdą“.

Išskirtinis bruožas

The Neigiamas raginimas tikriausiai yra išskirtinė „DreamStudio“ stabilios difuzijos savybė. Tai taip pat tariamai puikus įrankis kitose „Stable Diffusion“ versijose, padedantis pagerinti bendrą vaizdo kokybę. Šiose versijose neigiamų teiginių įvedimas padeda algoritmams sukurti tikslesnius ir aukštesnės kokybės vaizdus.

Kai veikia neigiami raginimai, jie veikia gerai. Tačiau daugeliu atvejų išleisite kreditus stengdamiesi tobulinti norimą išvaizdą.

Argumentai "už"

  • Kelios žiniatinklio ir įdiegtų versijų parinktys
  • Daugiau kūrybinės laisvės (kai kuriose versijose galite sukurti necenzūruotus vaizdus)
  • Daug valdiklių, leidžiančių tinkinti vaizdo parametrus

Minusai

  • Dega per kreditus mokamose versijose
  • Stačia mokymosi kreivė
  • Vaizdo kokybė yra labai netikėta, atsižvelgiant į tai, kurią versiją turite

Jei jums reikia pagalbos kuriant raginimus, parodysime kaip naudoti „ChatGPT“ AI vaizdams kurti.

Kuri programa yra geresnė?

Taigi, kuri programa yra geriausia, „DALL-E 2“, „Midjourney“ ar „Stable Diffusion“? Tai sunkus klausimas, nes naudotojai turės skirtingus lūkesčius ir yra skirtingų šių programų versijų, dėl kurių tiesioginiai palyginimai yra nerealūs. Tačiau kiekvieną savo pavyzdį galime įvertinti pagal šias kategorijas.

Vaizdo kokybės reitingas

„Midjourney“ mūsų pavyzdžiuose sukūrė geriausios kokybės vaizdus. Jie buvo tikroviškesni ir gražiau perteikti nei DALL-E 2 ir Stable Diffusion.

Naudojimo paprastumas

Iš dėžutės DALL-E 2 buvo lengviausia naudoti. Tam naudoti nereikėjo trečiosios šalies programos, o meniu buvo paprastas ir supaprastintas.

Savybės ir galimybės

„Midjourney“ pralenkia savo konkurentus, nes turi daugiau funkcijų ir galimybių, kurios užtikrina nuoseklesnį aukštos kokybės vaizdą.

Greitis

DALL-E 2 sukuria vaizdus greičiausiai (maždaug per 12 sekundžių), maždaug sekunde aplenkdamas stabilų sklaidą, o vidutinę kelionę (greituoju režimu) – didesne parašte.

Lankstumas ir pritaikymas

„Stable Diffusion“ yra lankstumo ir pritaikymo klasė. Vis daugėja versijų, leidžiančių vartotojams ne tik kurti vaizdus, ​​kurie paprastai yra cenzūruojami, tačiau yra versijų, kurios netgi sukuria aukštos kokybės vaizdus, ​​​​kurie yra tiesiogiai modeliuojami iš „Midjourney“. vaizdai.

„Midjourney“ ir „DALL-E 2“ užėmė pirmąsias vietas pagal laimėtų kategorijų skaičių, tačiau bendras nugalėtojas turės eiti į „Midjourney“, remiantis vien vaizdo kokybe.

Konkurencijai stiprėjant, dirbtinio intelekto turinio naudotojai yra geriau aptarnaujami

Daugiausia, ką galime pasiūlyti, yra geriausių atlikėjų tarp DALL-E 2, Midjourney ir Stable Diffusion momentinė nuotrauka bet kuriuo momentu. Dirbtinio intelekto technologijų sritis nuolat vystosi, kasdien prie rinkos prisijungia daugybė pretendentų. Tai labai naudinga generatyviųjų AI programų naudotojams, nes skatina inovacijas ir sumažina mūsų visų sąnaudas norint pasiekti šiuos neįtikėtinus kūrybinius įrankius.