Google je na GitHub izdal svojo izvorno kodo Lyra audio audio kodek beta, s čimer je vsem razvijalcem na voljo neverjetna kakovost obdelave zvoka z nizko hitrostjo. Kodek je najbolj uporaben v situacijah z vdelano in pasovno širino, ko je treba shraniti čim več podatkov.
Lyra: Skoraj nič nikoli ni zvenelo tako dobro
Zvočni kodek deluje na principu zagotavljanja najbolj naravnega zvoka govora z najnižjo možno hitrostjo prenosa podatkov. Uspelo mu je ustvariti skoraj srhljive stopnje reprodukcije zvoka s hitrostjo do 3 kbps. Google uporablja stiskanje Lyre v realnem času že v svoji aplikaciji Duo, čeprav vas ne bi krivili, da sploh ne bi zaznali razlike od običajnega pasovno širinskega zvoka.
Da bi prikazal, kako boljša je Lyra od drugih kodekov, Google ponuja primere prek a objava v spletnem dnevniku primerjava kompresijskega kodeka, ki ga poganja strojno učenje, z drugimi možnostmi 3 in 6 kbps.
To je nočna dnevna razlika in razvijalci po vsem svetu bodo imeli pomembno orodje za izboljšanje kakovosti komunikacije, kjer je pasovna širina omejena. Je tudi odličen motivator za razvijalce, ki želijo ustvarjati nove aplikacije na razvijajočih se trgih, kar bo Google zagotovo pokrival v letošnjem letu
brezplačna virtualna Google I / O spletna konferenca.Izvorna koda beta je trenutno zasnovana za 64-bitne naprave Arm, čeprav bodo primeri delovali tudi v 64-bitnih sistemih x86 Linux. Izvorna koda je v celoti dokumentirana, čeprav je v različici beta, stran GitHub pa vsebuje navodila za namestitev in kako zgraditi Lyro na Linuxu za 64-bitne cilje Arm.
Če želite dobiti izvorno kodo Lyra beta, pojdite na Stran Lyra GitHub.
Kako deluje Lyra?
Medtem ko je dejanski postopek, ki ga Lyra uporablja, neverjetno zapletena kombinacija modelov strojnega učenja, na katerih so usposobljeni tisoč ur govornih podatkov in optimizacij obstoječe tehnologije avdio kodekov, teorija je povsem mirna preprosto.
Vsakih 40 ms so funkcije prevzete iz govora in stisnjene na 3 kbps. Te lastnosti predstavljajo govorne energijske točke v frekvenčnem spektru, ki so najbližje človekovemu slušnemu govornemu odzivu - stvari, ki jih moramo prepoznati in razumeti, ko nekdo govori.
Ključni del, zaradi česar je Lyra posebna, je, kako uporablja te informacije:
Vendar tradicionalni parametrični kodeki, ki iz govora preprosto izvlečejo kritične parametre, ki so potem lahko uporablja se za poustvarjanje signala na sprejemnem koncu, doseganje nizkih bitnih hitrosti, vendar pogosto zveni robotsko in nenaravno. Te pomanjkljivosti so privedle do razvoja nove generacije visokokakovostnih avdio generativnih modelov, ki so je revolucioniral področje, saj ni mogel samo razlikovati med signali, ampak tudi ustvarjati popolnoma nove tistih.
Po prenosu Lyra obnovi valovno obliko tako, da s tem postopkom izpolni manjkajoče, hkrati pa nekako ni preveč računsko zapletena.
Po eni strani gre za tehnološko čudo, ki bo delovalo skoraj povsod. Po drugi strani pa še vedno nisem stoodstotno prepričan, da to ni čarovništvo.
Google Duo je ena najboljših aplikacij za video klice. Ima veliko funkcij, tu pa so tiste, za katere menimo, da bi jih res morali uporabljati.
Preberite Naprej
- Tehnične novice
- Android
- Strojno učenje
Ian Buckley je svobodni novinar, glasbenik, performer in video producent, ki živi v Berlinu v Nemčiji. Ko ne piše ali je na odru, se ukvarja z elektroniko ali kodo DIY v upanju, da bo postal nor znanstvenik.
Naročite se na naše novice
Pridružite se našemu glasilu za tehnične nasvete, preglede, brezplačne e-knjige in ekskluzivne ponudbe!
Še en korak…!
Potrdite svoj e-poštni naslov v e-poštnem sporočilu, ki smo vam ga pravkar poslali.