Orodja AI v glasbeni produkciji niso nič novega. Kaj pa glasba, ustvarjena iz nič z AI? Tudi to je zdaj realnost.
Generativna umetna inteligenca se počasi širi na vedno več disciplin v kreativni industriji. Začelo se je z umetniškimi generatorji z umetno inteligenco in se nato razširilo na pisanje z besedilom, ustvarjenim z umetno inteligenco. Zdaj lahko na ta seznam dodamo glasbo.
V bližnji prihodnosti bo glasba, ustvarjena z umetno inteligenco, ustvarjena iz nič, postala resničnost. Pravzaprav je to že možno z Jukeboxom, modelom umetne inteligence OpenAI za ustvarjanje glasbe. Še ni na voljo v aplikaciji, ki je enostavna za uporabo, in še ne zveni dovolj dobro, vendar algoritemske kosti so tam.
Tukaj je tisto, kar morate vedeti o Jukeboxu OpenAI in kaj lahko počnete z njim.
Jukebox: AI, ki ustvarja glasbo kot neobdelani zvok
Jukebox je nevronska mreža, ki lahko ustvari glasbo v surovi zvočni obliki, ko ji vnesete vnos, kot je žanr, izvajalec ali besedilo. Aprila 2020 ga je izdal OpenAI, isto podjetje, ki nam je prineslo umetniški generator z umetno inteligenco z imenom Dall-E in klepetalni robot z umetno inteligenco z imenom ChatGPT.
Za razliko od Dall-E, ki se je hitro razširil po svetu in je AI postal vroča tema novic in medijev, Jukebox po izdaji ni zabeležil širokega nabora zanimanja. Eden od razlogov za to je, da nima uporabniku prijazne spletne aplikacije – vsaj še ne.
Kodo najdete na Spletno mesto OpenAI, poleg poglobljene razlage, kako poteka postopek kodiranja in dekodiranja.
Drug verjeten razlog je, da zahteva ogromno časa in računalniške moči. Za lažjo predstavo lahko povemo, da lahko upodabljanje samo ene minute zvoka traja 9 ur. Potrebovali boste pripravljenost za raziskovanje modela v njegovi obliki kode in veliko potrpljenja, če želite videti, kaj lahko naredi model AI za ustvarjanje glasbe.
Lahko pa preskočite na Jukebox Sample Explorer. Tukaj je OpenAI objavil svoje poskuse ustvarjanja pesmi v podobi Elle Fitzgerald ali 2Paca.
Da bo jasno, druga glasbena orodja AI obstajajo, da vam pomagajo ustvariti pesem, vendar ne ustvarijo zvoka iz nič. Namesto tega bodisi združujejo vnaprej posnete vzorce ali ustvarjajo informacije MIDI, ki se prenesejo skozi digitalni sintetizator.
Kako zveni Jukebox?
Rezultati Jukeboxa so sicer prepoznavni, a čudni. Ni težko razumeti oblike skladbe in žanra, ki mu pripada, ampak kakovost rezultatov zveni, kot da poslušate nekaj najzgodnejših posnetkov: to je pridušeno z veliko hrup.
Lahko rečemo, da Jukebox ne proizvaja zvoka visoke ločljivosti, kot bi ga slišali iz par dobrih slušalk. To je bolj podobno poslušanju glasbe z radijske postaje, ki ni povsem uglašena na pravo frekvenco. Nekatere pesmi so ponovne izvedbe, druge pa nadaljevanje obstoječih pesmi. Obstaja tudi kategorija za nove avtorje in sloge ter nevidena besedila.
Kljub kakovosti zvoka prvi eksperimentatorji opisujejo, da so bili navdušeni nad srhljivo lepoto in bizarno naravo glasbe, ki jo je ustvaril Jukebox. "Kot zvočni posnetek za dokumentacijo o neznani državi z neznano kulturo", piše Merzmench na Mediumu.
Trenutno rezultati še zdaleč niso dovolj dobri, da bi kopirali ali celo nadomestili glasbo, ki so jo ustvarili ljudje, vendar tehnologija se hitro razvija in kmalu bodo modeli, kot je Jukebox, sposobni doseči te podvige preveč.
Kako je bil učen Jukebox OpenAI
Del tega, kako je Jukebox sposoben ustvarjati glasbo, ki še nikoli ni obstajala, je to, da je izurjen na glasbi pravih glasbenikov. OpenAI pojasnjuje, da:
"Da bi usposobili ta model, smo preiskali splet, da bi pripravili nov nabor podatkov 1,2 milijona pesmi (600.000 jih je v angleščini), povezanih z ustreznimi besedili in metapodatki iz LyricWiki."
Iskanje po podatkih je praksa, ki jo nekatera podjetja z umetno inteligenco uporabljajo za ustvarjanje niza podatkov, ki jih lahko model umetne inteligence uporabi za učenje in sprejemanje odločitev pri ustvarjanju slike, besedila ali v tem primeru glasbe. Podatkovni nizi, ustvarjeni s pajkom, so sporni, ker soglasje ni pridobljeno od lastnikov podatkov. Čeprav vam nekatere platforme to omogočajo izključite svojo vsebino iz naborov podatkov.
Morda mislite, da je 1,2 milijona pesmi veliko, toda za primerjavo, Dall-E 2 je bil uren na stotinah milijonov parov slika-besedilo iz interneta. S tem v mislih ima Jukebox svoje omejitve.
Njegov razmeroma majhen bazen za usposabljanje ne more zajeti bogastva in raznolikosti človeške glasbe. OpenAI je izjavil, da je v veliki meri usposobljen za zahodno glasbo, kar predstavlja jasno pristranskost glede glasbe, ki jo je sposoben ustvariti.
Kaj lahko storite z Jukeboxom?
Torej, glede na njegove omejitve, kaj lahko storite z Jukeboxom? Na to vprašanje lahko hitro odgovorite tako, da poveste, česa ne morete storiti z Jukeboxom.
Ker upodabljanje ene minute glasbe traja skoraj pol dneva, ni preveč uporabno za ustvarjanje glasbe. Vsaj ne v tradicionalnem smislu. Običajno se glasbeniki premikajo naprej in nazaj med igranjem na instrument (improvizacijo) in načrtovanjem strukture pesmi. Enako eksperimentiranje ni mogoče z Jukeboxom.
Ker na tej stopnji z Jukeboxom ni lahko oblikovati skladbe, si ga lahko predstavljate bolj kot nov način ustvarjanja glasbenih vzorcev. Ko ustvarite zvok, ki vam je všeč, ga lahko uporabite v svojih ustvarjalnih projektih, kot bi to običajno storili.
Spodnji videoposnetek je rezultat nekoga, ki je uporabil glasbo, ustvarjeno z Jukeboxom, da bi poudaril kratek montažni video.
Umetna inteligenca ima širok spekter uporabe tudi zunaj kreativnih aplikacij, zato je vredna razumevanje, kaj je umetna inteligenca in nevarnosti, ki jih predstavlja.
Vas je ganila AI Music?
Glasbe, ki jo ustvarja Jukebox, ni enostavno zavreči in kljub vsej njeni nenavadnosti in srhljivi kakovosti človek-stroj na koncu vendarle zveni kot glasba. Medtem ko glasbena industrija že nekaj časa uporablja orodja AI, je možnost ustvarjanja glasbe kot surovega zvoka šele zdaj realnost.
Čeprav modeli, kot je Jukebox, obstajajo, jih je treba šele zapakirati v komercialno orodje in še vedno ne dosegajo zmogljivosti človeških glasbenikov.