Kako rade aplikacije za identifikaciju glazbe poput Shazama?

Identifikacija iPhone aplikacije Shazam

Shazam

Aplikacije za identifikaciju glazbe isprva se čine kao magije, ali ispod haube je sofisticirana algoritam koja može pronaći pjesme u trenu. Evo kako oni rade.

Magija glazbene identifikacije

To se vjerojatno svima nama dogodilo. Večerate u lijepom restoranu, družite se u kafiću ili šetate dućanom, kada odjednom čujete sjajnu pjesmu koja svira preko zvučnika. Možda je to pjesma koju ste već slušali ili pjesma koju nikada niste čuli. Dakle, izvlačite telefon, otvarate Shazam i držite uređaj do stropa. Aplikacija vam u tren oka govori koja je pjesma, tko je izvođač i gdje je streamati.





Brze su, izuzetno točne i mogu prepoznati čak i najnejasnije pjesme. Ukratko, rade tako da izoliraju pjesmu iz snimke i pretražuju je u opsežnoj bazi podataka. Ali tehnologija koja stoji iza toga kako to rade prilično je složena i impresivna.

Možda ćete biti šokirani kada znate da je aplikacija Shazam koju danas poznajemo objavljena davne 2002. godine, a sustav je tada bio jednako precizan i brz kao i sada. To je sve zahvaljujući jedinstvenom algoritmu koji bi revolucionirao glazbeni svijet.



Nije samo u stihovima

Na prvi pogled, aplikacije za identifikaciju glazbe poput Shazama mogu izgledati jednostavne. Možda mislite da samo slušaju stihove, isto kao i bilo koji glasovni asistent, i pretražuju ga u bazi podataka riječi pjesme da ti kažem koja je pjesma.

Međutim, većina aplikacija za identifikaciju glazbe sposobna je reći koji je naslov instrumentala ili čak pjevač obrade pjesme. To je zato što, umjesto da analiziraju tekst pjesme, traže otiske prstiju koji su jedinstveni za svaku pjesmu u njihovim opsežnim bazama podataka.

POVEZANO: Kako pogledati tekstove pjesama na iPhoneu, iPadu, Macu ili Apple TV-u



Tehnologija otiska prsta

Shazam na iPhoneu X

Denys Prykhodov/Shutterstock.com

Vjerojatno imate uređaje koji se mogu otključati pomoću vašeg otiska prsta, što je raspored malih linija na vašem prstu koji su jedinstveni za vas. Slično tome, kada držite mikrofon kako biste snimili kratki isječak pjesme, ovaj se isječak pretvara u obrasce podataka koje Shazam ili neka druga aplikacija može potražiti u svojoj bazi podataka.

Na prvi pogled čini se da ta metoda ima nekoliko problema. Većinu vremena kada čujete glazbu u javnosti, zvučnici uzrokuju pozadinsku buku i izobličenje, što može učiniti pjesme neprepoznatljivim ili rezultirati netočnim podudaranjem. Također, postoji mnogo podataka zarobljenih čak i u kratkom zvučnom isječku, što može usporiti traženje ovih obrazaca u bazi podataka od milijuna pjesama.

U intervjuu s Znanstveni američki 2003. godine Avery Li-Chun Wang, glavni znanstvenik za podatke i suosnivač Shazama, objašnjava kako njihov algoritam rješava ove probleme. Informacije audio isječka mogu se vizualizirati pomoću 3D grafikona poznatog kao spektrogram, koji predstavlja promjenu frekvencija tijekom određenog vremenskog razdoblja. Također uzima u obzir amplitudu, koliko je glasan zvuk. To je predstavljeno u spektrogramu korištenjem intenziteta boje.

Shazam glazbeni spektrogram

Avery Li-Chun Wang / Shazam

Na isti način na koji ljudi ne mogu percipirati zvuk ako nisu na određenoj frekvenciji, umjesto da uzima u obzir cijelu pjesmu prilikom pretraživanja, Shazam uzima samo vrhunce, što je najveći energetski sadržaj u audio isječku. Otisci prstiju koje snima uzimaju samo točke najviše frekvencije unutar danog vremenskog okvira, a zatim točke vršne amplitude unutar tih frekvencija.

U istraživačkom radu za Sveučilište Columbia , Wang je izjavio da im metoda omogućuje uklanjanje većine nepotrebnih dijelova audio isječka poput pozadinske buke i uklanjanje izobličenja. Također čini veličinu otisaka dovoljno malom da su potrebne samo milisekunde da se pjesma identificira u njihovoj ogromnoj bazi podataka.

Shazamov utjecaj

Osim što su korisne za prosječne slušatelje koji čuju pjesmu koja im se sviđa, aplikacije za identifikaciju glazbe također pomažu u oblikovanju glazbenog svijeta.

Oglas

Radio stanice i streaming usluge često koriste podatke o tome što ljudi najviše Shazamiraju kako bi shvatili koje pjesme sluša javnost. To je korisno jer ukazuje na privlačnost i potencijalnu popularnost pjesme, bez obzira na izvođača. Kada identificirate pjesmu s aplikacijom, odmah ćete vidjeti koliko je ljudi također pokušalo identificirati.

Soundhound glazbena identifikacija

Soundhound

Od uspona Shazama pojavilo se i nekoliko konkurenata. Soundhound tvrdi da može identificirati pjesmu jednostavno po tome što je pjevate ili pjevušite, s mješovitim rezultatima. Tu je i identifikator pjesme integriran s glasovnim aplikacijama kao što su Google asistent koji rade vrlo slično Shazamovom sustavu.

POVEZANO: Najbolje stranice za strujanje besplatne glazbe

PROČITAJTE SLJEDEĆE Profilna fotografija za Vicente Water Vann Vincent
Vann Vicente je četiri godine bio pisac o tehnologiji, s fokusom na objašnjavanje usmjereno na prosječne potrošače. Također radi kao digitalni marketer za regionalnu web stranicu za e-trgovinu. Ulagao je u internetsku kulturu, društvene medije i način na koji ljudi komuniciraju s webom.
Pročitajte cijelu biografiju

Zanimljivi Članci