AI įrankiai muzikos kūrime nėra nieko naujo. O kaip su AI sukurta muzika nuo nulio? Tai dabar irgi realybė.

Generatyvusis AI pamažu plinta į vis daugiau kūrybinės industrijos disciplinų. Jis prasidėjo naudojant AI meno generatorius, o vėliau išplito į rašymą naudojant AI sukurtą tekstą. Dabar į šį sąrašą galime įtraukti muzikos.

Netolimoje ateityje AI sukurta muzika, sukurta nuo nulio, taps realybe. Tiesą sakant, tai jau įmanoma naudojant „Jukebox“, OpenAI muziką kuriantį AI modelį. Jis dar nepasiekiamas lengvai naudojamoje programoje ir dar neskamba pakankamai gerai, tačiau algoritminiai kaulai yra.

Štai ką reikia žinoti apie OpenAI Jukebox ir ką su juo galite padaryti.

Jukebox: AI, generuojantis muziką kaip neapdorotą garsą

Jukebox yra neuroninis tinklas, galintis generuoti muziką neapdoroto garso forma, kai suteikiate jai įvestį, pvz., žanrą, atlikėją ar dainų tekstus. Ją 2020 m. balandžio mėn. išleido „OpenAI“, ta pati įmonė, kuri mums atnešė dirbtinio intelekto meno generatorių „Dall-E“ ir AI pokalbių robotą „ChatGPT“.

instagram viewer

Skirtingai nuo Dall-E, kuris greitai išplito visame pasaulyje ir pavertė AI karštligiška naujienų ir žiniasklaidos tema, Jukebox po jo išleidimo neužregistravo didelio susidomėjimo. Viena iš priežasčių yra ta, kad joje nėra patogios žiniatinklio programos – bent jau kol kas.

Kodą galite rasti adresu OpenAI svetainė, kartu su išsamiu paaiškinimu, kaip veikia kodavimo ir dekodavimo procesas.

Kita tikėtina priežastis yra ta, kad tai užima daug laiko ir skaičiavimo galios. Kad suprastumėte, vos vienos minutės garso įrašas gali užtrukti 9 valandas. Jei norite pamatyti, ką dirbtinio intelekto modelis gali padaryti kurdamas muziką, jums reikės noro ištirti modelį jo kodo forma, taip pat daug kantrybės.

Arba galite pereiti prie Jukebox Sample Explorer. Čia OpenAI paskelbė savo eksperimentus kuriant dainas, panašias į Ella Fitzgerald arba 2Pac.

Kad būtų aišku, kiti AI muzikos įrankiai yra tam, kad padėtų jums sukurti dainą, bet jie negeneruoja garso nuo nulio. Vietoj to, jie arba derina iš anksto įrašytus pavyzdžius, arba sukuria MIDI informaciją, kuri perduodama per skaitmeninį sintezatorių.

Kaip skamba Jukebox?

Jukebox rezultatai atpažįstami, bet keisti. Nesunku suprasti dainos formą ir žanrą, kuriam ji priklauso, bet rezultatų kokybę leidžia skambėti taip, lyg klausytumėtės seniausios įrašytos muzikos: tai yra prislopintos daugybe triukšmo.

Galima drąsiai teigti, kad „Jukebox“ nesukuria tokio didelio tikslumo garso, kokį girdėtumėte iš gerų ausinių. Tai labiau panašu į muzikos klausymą iš radijo stoties, kuri nėra visiškai suderinta su tinkamu dažniu. Kai kurios dainos yra pakartotinės, o kitos yra esamų dainų tęsiniai. Taip pat yra naujų menininkų ir stilių bei nematytų dainų tekstų kategorija.

Nepaisant garso kokybės, ankstyvieji eksperimentuotojai apibūdina, kad juos žavisi baisus Jukebox kuriamos muzikos grožis ir keista prigimtis. „Kaip garso takelis dokumentacijai apie nežinomą šalį su nežinoma kultūra“, – rašo Merzmench ant Medium.

Šiuo metu rezultatai toli gražu nėra pakankamai geri, kad būtų galima kopijuoti ar net pakeisti žmonių sukurtą muziką, tačiau technologijos sparčiai juda ir netrukus tokie modeliai kaip Jukebox galės atlikti šiuos žygdarbius taip pat.

Kaip buvo mokomas OpenAI Jukebox

Dalis to, kaip „Jukebox“ gali kurti muziką, kurios dar niekada nebuvo, yra ta, kad ji mokoma pagal tikrų muzikantų muziką. OpenAI paaiškina, kad:

„Siekdami išmokyti šį modelį, tikrinome žiniatinklį, kad sukurtume naują 1,2 milijono dainų duomenų rinkinį (iš kurių 600 000 yra anglų kalba), susietą su atitinkamais dainų tekstais ir metaduomenimis iš LyricWiki.

Duomenų tikrinimas yra praktika, kurią naudoja kai kurios dirbtinio intelekto įmonės, kad sukurtų duomenų rinkinį, iš kurio AI modelis gali mokytis ir priimti sprendimus generuodamas vaizdą, tekstą arba šiuo atveju muziką. Duomenų rinkiniai, sukurti tikrinant, yra prieštaringi, nes sutikimas visų pirma gaunamas ne iš duomenų savininkų. Nors kai kurios platformos tai leidžia atsisakyti savo turinio iš duomenų rinkinių.

Galite manyti, kad 1,2 milijono dainų yra daug, bet palyginimui, Dall-E 2 buvo išmokytas šimtus milijonų vaizdo ir teksto porų iš interneto. Turint tai omenyje, Jukebox turi savo apribojimus.

Jo palyginti mažas treniruočių baseinas negali užfiksuoti žmonių muzikos turtų ir įvairovės. „OpenAI“ pareiškė, kad ji daugiausia mokoma Vakarų muzikos, o tai rodo aiškų šališkumą nustatant, kokią muziką ji gali generuoti.

Ką galite padaryti su Jukebox?

Taigi, ką galite padaryti su „Jukebox“, atsižvelgiant į jo apribojimus? Greitas būdas atsakyti į šį klausimą yra pasakyti, ko negalite padaryti su Jukebox.

Kadangi vienos minutės muzikos atkūrimas trunka beveik pusę dienos, tai nėra labai naudinga kuriant muziką. Bent jau ne tradicine prasme. Paprastai muzikantai juda pirmyn ir atgal nuo grojimo instrumentu (improvizavimo) iki dainos struktūros planavimo. Tokie patys eksperimentai neįmanomi su Jukebox.

Kadangi šiame etape nėra lengva sukurti dainą naudojant „Jukebox“, galite galvoti apie tai kaip apie naują būdą generuoti muzikos pavyzdžius. Sukūrę jums patinkantį garsą, galite naudoti jį savo kūrybiniuose projektuose, kaip tai darote įprastai.

Žemiau esantis vaizdo įrašas yra kažkas, naudojant muziką, sukurtą naudojant Jukebox, kad pabrėžtų trumpą montažinį vaizdo įrašą.

Dirbtinis intelektas taip pat turi platų pritaikymo spektrą už kūrybinių programų ribų, todėl verta suprasti, kas yra AI ir jo keliamus pavojus.

Ar jus jaudina AI muzika?

Jukebox sukurtos muzikos nelengva atmesti, o nepaisant visų keistumo ir siaubingos žmogaus-mašinos kokybės, galiausiai ji skamba kaip muzika. Nors muzikos pramonė jau kurį laiką naudoja AI įrankius, galimybė kurti muziką kaip neapdorotą garsą yra tik dabar realybė.

Tačiau nors tokie modeliai kaip Jukebox egzistuoja, jie dar turi būti supakuoti į komercinį įrankį ir vis tiek neatitinka žmonių muzikantų galimybių.