Ste se kdaj vprašali, kako Shazam 'sliši' glasbo, ki jo predvajate, in jo prepozna s tako natančnostjo? No, niste sami.

Tehnologija, ki poganja storitev prepoznavanja glasbe, je za mnoge skrivnost, še posebej, ker je storitev začela delovati pred leti, ko so pametni telefoni in strojno učenje postali stvar.

V tem članku si bomo ogledali, kako deluje Shazam in kako lahko natančno prepozna glasbo.

Kaj je Shazam?

Shazam je priljubljena aplikacija za prepoznavanje glasbe, s katero lahko poiščete informacije o novi pesmi, ki jo imate radi, vendar ne poznate naslova ali imena izvajalca.

Recimo, da ste v kavarni ali se sprehajate po vogalu in slišite novo pesem, ki bi jo želeli imeti v svoji glasbeni knjižnici. Shazam vam pomaga z lahkoto najti skladbo. Vse, kar morate storiti, je, da v aplikacijo posnamete nekaj sekund pesmi.

Aplikacija Shazam uporablja sofisticirano tehnologijo za prepoznavanje zvoka za prepoznavanje glasbe, ki jo slišite sekund, tako da lahko izveste ime izvajalca in spremljate, gledate videoposnetke in celo kupite ali predvajate pesem na svojem naprave.

Prenesi: Shazam za iOS |Android (Prost)

Kako deluje Shazam?

Galerija slik (4 slike)
Razširi
Razširi
Razširi
Razširi

Slika 1 od 4

Slika 2 od 4

Slika 3 od 4

Slika 4 od 4

Shazam uporablja lastniško tehnologijo, ki jo je razvil Avery Lin-Chun Wang, soustanovitelj aplikacije in glavni znanstvenik za podatke, da bi ugotovil ujemanja skladb, ki so bile povprašane na njeni platformi. Tehnologija ustvarja prstne odtise za zvočne posnetke, kar je skrivna omaka za izjemne Shazamove sposobnosti prepoznavanja.

Shazam ustvarja in shranjuje zvočne prstne odtise, sestavljene iz zbirk numeričnih podatkov za vsako več kot 15 milijard skladb. Ko uporabnik »Shazams« skladbo, Shazam hitro ustvari zvočni prstni odtis zvoka, ki ga prejme iz pametnega telefona ali mikrofona računalnika.

Ko konča z ustvarjanjem zvočnega prstnega odtisa za snemanje, Shazam naloži avdio prstni odtis (ne zvoka) na svoj strežnik, kjer izvede iskanje po zbirki podatkov za ujemanja. Če najdete ujemanje, vrne informacije o pesmi z možnostmi, kam jih pretakati ali kupiti, skupaj z identifikacijskimi podatki.

Kaj je zvočni prstni odtis?

Zvočni prstni odtis je strnjen digitalni povzetek zvočnih signalov. Uporabljajo se za identifikacijo zvočnega vzorca ali iskanje podobnih predmetov v zvočni zbirki podatkov.

Shazamova tehnologija avdio prstnih odtisov se lahko ujema z neoznačenimi deli zvočne vsebine z ustreznimi ujemanji v svoji avdio bazi. Shazam identificira naslov skladbe, ki ste jo posneli (neoznačena zvočna vsebina), tako da prstni odtis skladbe ujema s prstnim odtisom pesmi v svoji zbirki podatkov.

Shazam v svoji bazi podatkov ustvari edinstvene prstne odtise za pesmi z uporabo določenih podatkovnih točk, ki so bile identificirane s pomočjo spektrograma.

Kaj je spektrogram?

Spektrogram je tridimenzionalni graf, ki se uporablja kot prikaz zvoka. Spektrogram prikazuje spremembo frekvenc v določenem obdobju, pri čemer upošteva tudi amplitudo ali prostornino. Spodnja fotografija je primer odčitavanja spektrograma.

Zasluga za sliko: Akcija za ohranitev obale Changhua /https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

V intervjuju z Znanstveni ameriški, Avery Wang je razkril, da algoritem Shazam za ustvarjanje zvočnih prstnih odtisov uporablja točke spektrograma, ki predstavljajo note z največ energije.

Če ignorira večino informacij v pesmi in se osredotoči le na nekaj opredeljujočih opomb, lahko Shazam poišče svojo bazo podatkov in z neverjetno hitrostjo zagotovi natančna ujemanja za poizvedbe pesmi.

Kako Shazam lahko prepozna pesmi na hrupnih krajih?

Shazam uporablja posnetke pesmi brez hrupa in popačenja v ozadju, da ustvari prstne odtise za svojo bazo podatkov. Ko posnamete pesem z aplikacijo na hrupnem mestu, ustvari zvočni prstni odtis vašega posnetka tako, da prepozna zapise z največ energije na posnetku.

Nato v svoji bazi podatkov poišče ujemanje zvočnih prstnih odtisov vašega posnetka, pod pogojem, da raven hrupa v ozadju ni bila dovolj visoka, da bi izkrivila podatke, uporabljene za ustvarjanje zvoka prstni odtis.

Časi, ko vam Shazam ne more pomagati pri prepoznavanju pesmi

Shazam se odlično zna ujemati skladbe, tudi nejasne glasbe, za katero mislite, da je morda ne bi imelo v svoji bazi podatkov. Toda ali obstajajo trenutki, ko Shazam ne more prepoznati skladbe?

Popačeno snemanje

Ko skladbo shazam na mestu, kjer je raven hrupa v ozadju previsoka, šum izkrivlja podatke na spektrogramu. Zaradi tega se bo zvočni prstni odtis vašega posnetka razlikoval od prstnega odtisa izvirne pesmi.

Ko se to zgodi, Shazam vrne Pesem ni znana dialoga, ker ne more najti ujemanja za zvočni prstni odtis.

Glasba v živo

Shazam ni sposoben prepoznati glasbe iz nastopov v živo. To je zato, ker se zvok, ki ga posnamete v nastopih v živo, pogosto razlikuje od prvotne različice pesmi, ki jo Shazam uporablja za ustvarjanje zvočnih prstnih odtisov.

Edini način, kako Shazam lahko prepozna skladbo med nastopom v živo, je, če je skupina dovolj usposobljena, da skladbo izvede točno tako, kot je bila posneta. Srečno s skupino, ki to poskuša...

Vaš glasovni posnetek

"Bi lahko dobil, da bi Shazam prepoznal pesem, ki sem jo pel, če bi bil res dober pevec?"

Skratka, ne.

Algoritem Shazam lahko prepozna samo predhodno posneto glasbo. Če želite, da Shazam prepozna pesem, ki jo pojete, morate imeti enak vokal z instrumentali v natančnem tempu z originalnim posnetkom pesmi.

Vaše brnenje

Shazam ne more prepoznati ujemanj za hrume, ker njegov algoritem uporablja natančne frekvence in amplitude za ustvarjanje zvočnih prstnih odtisov za skladbe v svoji bazi podatkov.

Ko pesem zazveni, ji Shazam ustvari prstni odtis. Ker pa je šumenje le poskus ponovne sinteze pesmi, algoritem ne bo ustrezal posnetku.

Je Shazam edina aplikacija za identifikacijo glasbe?

Shazam je bil prva storitev za identifikacijo glasbe in je trenutno najpogostejša aplikacija za identifikacijo pesmi. Vendar obstajajo druge aplikacije, s katerimi lahko prepoznate skladbo igranje okoli vas. Nekateri lahko celo prepoznajo pesem, ki jo pojete ali brunete.

Tri najbolj priljubljene alternative Shazam so SoundHound, Musixmatch Lyrics in Genius. Musixmatch in Genius vam v prvi vrsti pomagata prepoznati besedila za glasbo, ki se predvaja okoli vas, medtem ko je SoundHound najbližji Shazamov konkurent.

Sorodno: Najboljše aplikacije za prepoznavanje glasbe za iskanje skladb po njihovih melodijah

Z aplikacijo SoundHound lahko počnete skoraj vse, kar počne Shazam. Njegova glavna prednost pred Shazamom je ta, da ima dodano funkcionalnost prepoznavanja pesmi, ki jih pojete ali brunete.

Kreditna slika: Sulastri Sulastri / Shutterstock.com

E-naslov
Kako prepoznati glasbo in pesmi v videoposnetkih YouTube

Se sprašujete, kako prepoznati pesem iz videoposnetka v YouTubu? Tu je navodilo za iskanje pesmi v YouTubu za prepoznavanje glasbe iz videoposnetkov.

Preberite Naprej

Sorodne teme
  • Pojasnjena tehnologija
  • Shazam
  • Odkritje glasbe
  • SoundHound
  • Musixmatch
O avtorju
John Awa-abuon (6 objavljenih člankov)

John je ljubitelj tehnologije po rojstvu, po izobrazbi ustvarjalec digitalnih vsebin in Tech Life Writer by Profession. John verjame v pomoč ljudem pri reševanju problemov in piše članke, ki počnejo prav to.

Več od Johna Awa-abuona

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, preglede, brezplačne e-knjige in ekskluzivne ponudbe!

Še en korak…!

Potrdite svoj e-poštni naslov v e-poštnem sporočilu, ki smo vam ga pravkar poslali.

.