
Oletko koskaan kuullut kappaletta radiosta tai kahvilassa ja miettinyt kuumeisesti mikä kappale tämä on? Tilanne on turhankin tuttu: melodia jää päähän soimaan, mutta kappaleen nimi ja esittäjä pysyvät mysteerinä. Ennen vanhaan vaihtoehtoina olivat kysyä kavereilta, hyräillä melodiaa jollekin musikaaliselle tuttavalle tai yrittää muistinvaraisesti hakea kappaletta muutaman satunnaisen sanoituksen perusteella netistä. Nykyään onneksi musiikin tunnistusonnistuu älypuhelimen avulla sekunneissa. Ihmiset kirjoittavat hakukoneeseen kysymyksiä kuten “tunnista kappale sovellus” tai “biisin tunnistus app” etsiessään keinoa selvittää soivan laulun tiedot. Tässä artikkelissa perehdymme syvällisesti siihen, miten kappaleen tunnistus teknologian avulla tapahtuu, ja esittelemme parhaat tavat ja sovellukset, joilla mikä tahansa biisi löytyy hetkessä. Lyhyet kappaleet ja selkeät väliotsikot auttavat sinua hahmottamaan kokonaisuuden helposti.
Mikä kappale tämä on? – Arkinen ongelma, johon teknologia vastaa
Moni meistä on kokenut tilanteen, jossa taustalla soiva musiikki on tuttua mutta emme millään saa kappaleen nimeä mieleen. Saatat hyräillä melodiaa itseksesi ja kysyä mielessäsi: “Mikä biisi tämä oikein on?” Tällainen laulun tunnistus pelkän muistissa pyörivän sävelmän perusteella on perinteisesti ollut haastavaa. Internetin hakukoneet voivat auttaa, jos muistat pätkän sanoja – voit kirjoittaa hakukenttään vaikkapa “song lyrics I got a feeling” ja usein oikea kappale löytyy. Mutta entä silloin, kun et muista sanoituksia lainkaan tai kappale on instrumentaali? Pelkkä hyräily tai sävelmän muistikuva ei vielä jokin aika sitten riittänyt kappaleen etsintään.
Onneksi nykyään on olemassa musiikin tunnistus -sovelluksia ja palveluita, jotka on suunniteltu ratkaisemaan juuri tämä pulma. Älypuhelimille on kehitetty useita tunnista biisi -sovelluksia, jotka kuuntelevat muutaman sekunnin näytteen ympärillä soivasta musiikista ja tunnistavat kappaleen automaattisesti. Samoin virtuaaliavustajat (kuten Siri ja Google Assistant) osaavat vastata kysymykseen “Mikä kappale soi?” ja kertoa soitettavan kappaleen nimen. Lisäksi on kehitetty tekniikoita, joiden avulla voit jopa tunnistaa kappaleen hyräilemällä melodiaa puhelimellesi. Seuraavissa luvuissa kerromme, miten nämä taikuudelta tuntuvat tekniikat toimivat kulissien takana.
Miten biisin tunnistus toimii?
Kun musiikin tunnistus sovellus kuten Shazam tunnistaa kappaleen, taustalla hyödynnetään ns. akustista sormenjälkeä. Käytännössä sovellus nauhoittaa lyhyen pätkän kuultavaa ääntä ja muuntaa sen erityiseen matemaattiseen tiivisteeseen – ikään kuin äänen digitaaliseen sormenjälkeen. Jokaisella kappaleella on uniikki ääniprofiili, joka voidaan tallentaa numerosarjana tai koodeina. Sovellus vertailee nauhoitetun näytteen sormenjälkeä valtavaan tietokantaan, joka sisältää miljoonien kappaleiden sormenjäljet, ja etsii sopivinta osumaa.
Musiikin tunnistus perustuu tyypillisesti äänisignaalin piirteiden analysointiin. Yleisin tapa on käyttää spektrianalyysiä: ääninäyte pilkotaan hyvin pieniin aikaikkunoihin, joista kullekin lasketaan taajuusspektri (esimerkiksi FFT-muunnos). Näin saadaan selville, mitä äänen taajuuksia näytteessä esiintyy ja kuinka voimakkaina. Kappaleen tunnistamisen kannalta olennaista on löytää tunnusomaiset piikit eli voimakkaimmat taajuudet kussakin aikaikkunassa. Nämä spektripiikit toimivat ”sormenjäljen” rakennuspalikoina – ne ovat kuin tähtikuvioita, jotka erottavat yhden kappaleen toisesta. Algoritmi poimii kunkin ääninäyte-ikkunan tärkeimmät taajuuspiikit ja yhdistää ne hash-koodiksi, joka edustaa kyseistä musiikkipätkää.
Akustinen sormenjälki on suunniteltu kestämään häiriöitä: sen tulisi toimia silloinkin, kun taustalla on melua, musiikki on hieman vääristynyttä tai vaikkapa lyhyeltä puhelinmikrofonin tallenteelta. Hyvä sormenjälki on spesifi, eli erottaa kappaleet toisistaan jo muutaman sekunnin näytteellä, mutta samalla robusti eli tunnistaa oikein vaikka äänessä olisi kohinaa. Esimerkiksi Shazam on hyvin tarkka – se kykenee löytämään oikean kappaleen jopa meluisassa ympäristössä, jossa taustalla on puhetta. Tämä onnistuu, koska algoritmi keskittyy kestävään ydininformaatioon äänestä: jos tunnusomaiset taajuuspiikit täsmäävät tietokannan merkintään, systeemi tunnistaa kappaleen vaikka äänenlaatu ei olisi täydellinen.
Kaavio: Musiikintunnistuspalvelun toiminta – käyttäjän laite (client) tekee ympäröivästä musiikista ääninäytteen ja laskee siitä sormenjäljen, jonka se lähettää palvelimelle. Palvelin vertaa sormenjälkeä laajasta fingerprint-tietokannasta löytyviin tallenteisiin. Kun sopiva osuma löytyy, palvelin hakee metatietokannasta kappaleen tiedot (nimi, esittäjä ym.) ja palauttaa ne käyttäjälle.
Jotta musiikin tunnistus toimisi globaalisti, taustalla on valtava tietokanta. Esimerkiksi Shazam-palvelu on vuosien varrella kerännyt sormenjäljet käytännössä kaikista suosituista julkaistuista kappaleista – se kattoi jo 11 miljoonaa kappaletta vuonna 2010-luvulla, ja kanta on yhä kasvanut. Jokaisesta uudesta biisistä tallennetaan lyhyt pätkä (tai useampi) sormenjälkimuotoon tietokantaan. Kun käyttäjä nauhoittaa näytteen, algoritmi pystyy hae kappaletta -tyyppisellä tietokantahautauksella sekunnin murto-osissa löytämään vastaavan sormenjäljen ja palauttamaan oikean kappaleen nimen. Koko prosessi – ääninäytteen nauhoitus, piirteiden analysointi, vertailu miljoonien raitojen joukkoon ja tuloksen palautus – voi tapahtua muutamassa sekunnissa tehokkaan haun ja optimoinnin ansiosta. Ei ihme, että Shazamin ja vastaavien sovellusten toimintavarmuus ja nopeus tuntuvat monesta suorastaan taikuudelta.
Hyräilemällä tunnistus – pelkkä melodia riittää
Entä jos et saa ääninäytettä alkuperäisestä kappaleesta, vaan ainoastaan hyräilet tai laulat melodiaa itse? Myös tähän ongelmaan on kehitetty ratkaisuja. Humming– eli hyräilytunnistus on musiikinhakutekniikan alahaara, jossa käyttäjän hyräilemää sävelmää verrataan kappaleiden melodioihin. Palvelu kuten SoundHound (alun perin Midomi) ja Googlen humming-to-search pyrkivät tunnistamaan laulun pelkän hyräillyn melodian perusteella. Teknisesti tämä on vaikeampaa kuin suoran ääninäytteen tunnistus, koska ihmiset hyräilevät epätäydellisesti: tempo, sävellaji ja tarkka nuotti voivat poiketa alkuperäisestä. Siitä huolimatta koneoppimismallit pystyvät yllättävän hyvin erottamaan melodian ydinkulun ja vertaamaan sitä tietokannassa oleviin kappaleisiin.
Googlen vuonna 2020 julkaisema “Hum to Search” -ominaisuus on tästä hyvä esimerkki. Google kuvaa, että heidän mallinsa muuntaa hyräilyn ensin numerosarjaksi, joka edustaa kappaleen melodiaa. Malli on opetettu sadoilla tuhansilla esimerkeillä niin ihmisäänten hyräilyistä kuin alkuperäisistä studioversioistakin, jotta se tunnistaisi samat melodiat esitystavasta riippumatta. Oleellista on suodattaa pois kaikki muu – sanat, soittimien sävyt, tausta – ja keskittyä vain sävelkulkuun. Käytännössä hyräilystä muodostetaan samanlainen sormenjälki, tosin se pohjautuu lähinnä sävelkorkojen vaihteluun ajan suhteen. Tätä sormenjälkeä verrataan sitten valtavaan musiikkitietokantaan reaaliajassa, ja käyttäjälle tarjotaan todennäköisimmät kappalevaihtoehdot. Google kertoi ominaisuutta lanseratessaan, että “tarvitset vain hyräilyn – sanat tai täydellinen sävelkorva eivät ole pakollisia”. Tämä avaa aivan uusia mahdollisuuksia: seuraavan kerran kun päähäsi juolahtaa pätkä melodiaa etkä muista lähdettä, voit yksinkertaisesti hyräillä sen puhelimellesi ja antaa tekoälyn etsiä oikean kappaleen.
On silti hyvä muistaa, että hyräilytunnistus ei ole vielä aukotonta. Jos hyräilet erittäin epävireisesti tai kappaleen melodia on hyvin samankaltainen monessa eri laulussa, sovellus ei välttämättä tarjoa oikeaa osumaa heti kärkeen. Usein tuloksena onkin lista mahdollisista kappaleista, joista voit valita, mikä niistä vastaa haettua melodiaa. Tekniikka kuitenkin paranee jatkuvasti. SoundHound on tarjonnut hyräilyn tunnistusta jo yli vuosikymmenen, ja Googlen koneoppimismallit tuovat siihen lisää tarkkuutta laajan data-aineiston voimin. Tulevaisuudessa voimme odottaa yhä parempaa kykyä tunnistaa biisi ihmisen laulaman pätkän perusteella – ehkäpä jonain päivänä riittää, että viheltää kertosäkeen ja puhelin löytää takuuvarmasti oikean kappaleen.
Suosituimmat musiikintunnistus-sovellukset ja -palvelut
Kun tarvitset “tunnista biisi” -sovellusta puhelimeesi, valittavana on useita erinomaisia vaihtoehtoja. Seuraavaksi esittelemme tunnetuimmat musiikin tunnistus sovellukset – kuinka ne toimivat ja mitä erityispiirteitä niillä on. Näiden avulla kappaleen tunnistus käy helposti niin arjessa kuin erikoistilanteissakin.
Shazam – klassinen kappaleen tunnistus -sovellus
Shazam on kenties se kaikkein tunnetuin palvelu, joka tulee mieleen, kun puhutaan musiikin tunnistamisesta. Shazam on toiminut edelläkävijänä jo 2000-luvun alusta saakka – yritys perustettiin vuonna 1999 ja palvelu lanseerattiin 2002 aluksi puhelinpalveluna, jossa soittamalla tiettyyn numeroon sai tekstiviestillä tiedon soivasta kappaleesta. Sittemmin Shazam on kasvanut huippusuosituksi älypuhelinsovellukseksi. Vuonna 2017 Shazamilla oli raportoitu yli 100 miljoonaa aktiivista kuukausikäyttäjää, ja vuoteen 2018 mennessä sovellusta oli ladattu yli miljardi kertaa. Apple osti Shazamin vuonna 2018, ja nykyisin se integroituu tiiviisti Applen ekosysteemiin (esimerkiksi iPhonen Siri käyttää Shazamia laulukyselyihin).
Shazamin toimintaperiaate on jo pitkälti kuvattu aiemmin: se kuuntelee ympärillä soivaa musiikkia hetken ja vertaa kuulemaansa tietokantaan löytääkseen vastaavuuden. Shazam hyödyntää spektrogrammia akustisen sormenjäljen luomiseen ja etsii sille osumaa miljoonien kappaleiden joukosta. Käytännössä käyttäjän tarvitsee vain avata sovellus (tai painaa ohjauskeskuksen “Tunnista musiikki” -painiketta iPhonessa) ja antaa puhelimen kuunnella muutama sekunti musiikkia. Tämän jälkeen Shazam ilmoittaa kappaleen nimen ja esittäjän, ja näyttää usein myös lisätietoja kuten albumin, kappaleen sanat sekä linkit suoratoistopalveluihin. Shazam on tunnettu nopeudestaan ja tarkkuudestaan – se tunnistaa kappaleet luotettavasti jopa meluisissa olosuhteissa.
Shazam tallentaa kaikki tunnistetut kappaleet käyttäjän omaan “Shazam-kirjastoon”, josta niitä voi myöhemmin katsella. Käyttäjä voi myös jakaa tunnistamiaan biisejä eteenpäin somessa tai viestinä, ja sovellus suosittelee muita saman tyylisiä artisteja ja trendaavia kappaleita, mikä auttaa uuden musiikin löytämisessä. Mielenkiintoinen ominaisuus on offline-tunnistus: Shazam pystyy toimimaan myös ilman nettiyhteyttä tallentamalla ääninäytteen – kun yhteys on jälleen käytettävissä, se lähettää sormenjäljen palvelimelle ja tunnistaa kappaleen jälkikäteen. Tämä on kätevää vaikkapa matkustettaessa lentokoneessa tai alueella, jossa ei ole kenttää: voit tunnistaa kappaleen offline-tilassa, ja tiedot päivittyvät automaattisesti kun netti taas toimii.
Apple on sulauttanut Shazamin syvälle laitteisiinsa: kuten mainittua, voit kysyä “Hei Siri, mikä kappale soi?” ja Siri näyttää tunnistetun kappaleen nimen sekä tallentaa tiedon Shazam-historiaasi. iPhonen Ohjauskeskukseen on myös lisättävissä Musiikin tunnistus -painike, jolla Shazamin tunnistus käynnistyy yhdellä pyyhkäisyllä. Shazam on saatavilla myös Android-laitteille ja jopa tietokoneille (esim. Macin valikkoriviltä musiikin tunnistus onnistuu nykyisin helposti). Sovellus on ilmainen käyttää, ja koska Apple omistaa sen, siinä ei nykyään ole mainoksiakaan ainakaan iOS-versiossa – Shazam Encore -nimellä kulkenut maksullinen versio poistui tarpeettomana.
Yhteenvetona Shazam on luotettava, helppokäyttöinen ja kattava biisin tunnistus -appi, joka on syystäkin saavuttanut ikonisen aseman. Monet eivät edes puhu “musiikin tunnistamisesta” vaan yksinkertaisesti sanovat “shazamaa tämä biisi” tarkoittaen kappaleen tunnistamista sovelluksella. Shazam on asettanut standardin, jota muut yrittävät tavoittaa.
SoundHound – tunnista biisi myös hyräilemällä
SoundHound on toinen pitkän linjan musiikintunnistaja, joka erottuu edukseen erityisesti yhdellä ainutlaatuisella taidollaan: SoundHound osaa tunnistaa laulun myös käyttäjän hyräilyn tai laulun perusteella. SoundHound sai alkunsa 2005 ja sen varhainen verkkopalvelu Midomi mahdollisti jo tuolloin kappaleiden etsimisen hyräilemällä mikrofoonille. Sittemmin Midomi-nimi jäi historiaan ja sovellus tunnetaan SoundHoundina.
SoundHoundin perustoiminnot ääninäytteen suhteen ovat samankaltaiset kuin Shazamissa – napinpainalluksella sovellus kuuntelee ympärillä soivaa musiikkia ja ilmoittaa kappaleen nimen sekä esittäjän. SoundHoundinkin taustalla on suuri tietokanta ja akustisten sormenjälkien vertailu. SoundHound väittää teknologiansa pohjautuvan yhteen maailman suurimmista musiikkikantojen kirjastoista, minkä ansiosta se löytää biisit nopeasti ja luotettavasti. Sovelluksesta löytyy myös ominaisuuksia laulunsanojen näyttämiseen reaaliajassa (LiveLyrics) ja integroitumista suoraan Spotifyhin tai Apple Musiciin, jotta käyttäjä voi toiston tunnistetusta kappaleesta haluamallaan alustalla.
SoundHoundin kruununjalokivi on kuitenkin äänihaku. Voit yksinkertaisesti sanoa englanniksi “Hey SoundHound, what song is this?” tai aloittaa sovelluksessa äänikomennon, jonka jälkeen hyräile tai laula pätkä mieleesi jäänyttä melodiaa. SoundHound analysoi hyräilemäsi sävelmän ja pyrkii tunnistamaan kappaleen samalla tavoin kuin Google Humin tapainen palvelu. Käytännössä tämä toimii vaihtelevasti, mutta kun melodia on tarpeeksi tunnistettava ja hyräily kohtuullisen lähellä oikeaa, SoundHound osuu usein oikeaan. Moni käyttäjä on vuosien varrella ylistänyt SoundHoundia juuri siitä, että “toisin kuin Shazam, se ymmärtää jos itse laulat tai hyräilet kappaletta”. Jos siis sinulla on pätkä sävelmää päässäsi etkä pääse sitä kuulemaan mistään, SoundHound on kokeilemisen arvoinen.
SoundHound tarjoaa myös laajemmin ääniohjausta musiikin toistoon: sovelluksessa on sisäänrakennettu “Hey SoundHound” -avustaja, jolta voi kysyä esimerkiksi tietoja artistista tai pyytää soittamaan lisää saman tyylistä musiikkia. Tältä osin SoundHound on laajentunut musiikintunnistuksesta kohti täydempää musiikkipalvelua. Käyttäjälle se kuitenkin näyttäytyy ennen kaikkea oranssina nappina, jota painamalla saa tietää mikä biisi milloinkin soi. SoundHound on saatavilla ilmaiseksi (mainosrahoitteisena) sekä maksullisena mainoksettomana versiona.
SoundHoundin kaltainen musiikin tunnistus -sovellus toiminnassa: Sovellus kuuntelee hetken soivaa kappaletta ja tunnistaa sen. Tuloksena näytölle ilmestyvät kappaleen nimi, esittäjä, albumin kansikuva sekä usein myös mahdollisuus toistaa kappaletta esimerkiksi Apple Musicissa. LiveLyrics-toiminnolla sanat rullaavat ruudulla musiikin mukana.
Google Assistant ja Sound Search – “Mikä kappale tämä on” Googlella
Google on tuonut musiikintunnistuksen osaksi omia palvelujaan useammalla tavalla. Google Assistant eli Googlen virtuaaliavustaja osaa vastata esimerkiksi kysymykseen “Hei Google, mikä kappale soi?” aivan kuten Siri iPhonella. Kun esität tämän kysymyksen Android-puhelimelle (tai Google-haun sovelluksessa iPhonella), laite kuuntelee ympärillä soivaa musiikkia muutaman sekunnin ja tunnistaa kappaleen. Taustalla on Googlen oma Sound Search -teknologia, joka pohjautuu syviin neuroverkkoihin ja laajaan kappaletietokantaan. Google kertoi tuoneensa tämän musiikinhakutoiminnon alun perin Androidiin vuonna 2018 laajentaen tunnistuksen kattamaan “miljoonien kappaleiden katalogin”. Käytännössä Googlen äänitunnistus toimii hyvin samankaltaisesti kuin Shazam: akustinen sormenjälki lasketaan ja haetaan osumaa pilvipalvelusta.
Ainutlaatuinen Google-ominaisuus on Now Playing, joka esiteltiin Pixel 2 -puhelimissa vuonna 2017. Pixel-puhelimet tunnistavat ympärillä soivia kappaleita automaattisesti ja offline-tilassa jatkuvasti taustalla. Käytännössä laite kuuntelee koko ajan hiljaisella teholla musiikkia, ja jos se havaitsee kappaleen, sen nimi ilmestyy lukitusnäytölle – tähän ei tarvita internet-yhteyttä. Tämä on mahdollista, koska Pixel-laitteilla on suppea, laitteelle tallennettu tunnistustietokanta ja hyvin optimoitu sormenjälkihaku, joka pyörii alhaisella virrankulutuksella taustaprosessina. Now Playing tunnistaa vain suosituimpia kappaleita (tietokantaan mahtuu tuhansia nimiä), mutta se on hieno osoitus teknologian kehityksestä: jatkuva tunnistus on toteutettavissa reaaliaikaisesti ilman pilvipalvelua.
Toisille Android-käyttäjille (ja myös iPhoneille) Google tarjoaa musiikintunnistusta Google-sovelluksen kautta. Haku-widgetissä on mikrofonikuvake, josta löytyy “Etsi kappale” -toiminto – sitä napauttamalla voit laittaa puhelimen kuuntelemaan ja se tunnistaa parhaillaan soivan musiikin. Lisäksi Google-hakuun rakennettu hyräilyhaku (Hum to Search, josta kerroimme aiemmin) on saatavilla myös suomeksi Androidilla. Voit siis vaihtoehtoisesti hyräillä tai vihellellä laulun, kun olet valinnut “Etsi kappale” -vaihtoehdon, ja Google tarjoaa tuloksia melodiantunnistuksen perusteella. Google on kertonut laajentavansa hum-hakua jatkuvasti useammille kielille ja parantavansa sen osumatarkkuutta koneoppimisen keinoin.
Googlen vahvuus on tietenkin sen ekosysteemin laajuus: koska monella on Google Assistant käytössään kaiuttimissa, puhelimissa, tietokoneissa, musiikin tunnistus on tuotu lähes kaikkien ulottuville ilman erillistä sovellusta. Esimerkiksi YouTube Musiikki -palveluun on vuonna 2023 lisätty kokeiluna hum-toiminto, jossa käyttäjä voi hyräillä kappaletta sovellukselle ja se yrittää löytää vastaavuuden (käyttäen todennäköisesti samaa taustamallia kuin Google Assistant).
Kannattaa huomioida, että Googlen tunnistus on kytköksissä sen hakukoneeseen, joten se ei tallenna samalla tavoin henkilökohtaista “löytöhistoriaa” kuin vaikkapa Shazam, ellet käytä erikseen Shazam-sovellusta. Pixel-puhelimilla tosin Now Playing pitää lokia tunnistamistaan kappaleista, ja Assistantinkin tunnistukset voi asettaa tallentumaan Google-tilin aktiviteetteihin. Google ei myöskään tarjoa erillistä musiikin tunnistus sovellusta, vaan toiminto on osa Google-hakuja ja -avustajaa. Silti Google on erittäin varteenotettava vaihtoehto, koska se on usein jo laitteessa valmiina ja tunnistaa kappaleet vähintään yhtä nopeasti kuin erilliset sovellukset.
Muut tavat tunnistaa musiikkia
Edellä mainittujen suurimpien palveluiden lisäksi on olemassa muitakin keinoja ja sovelluksia musiikin tunnistamiseen. Tässä muutamia mainintoja:
- Musixmatch: Suosittu laulunsanojen näyttösovellus Musixmatch sisältää myös musiikintunnistusominaisuuden. Se hyödyntää puhelimen mikrofonia ja tunnistaa soivan biisin, minkä jälkeen se näyttää synkronoidut laulunsanat ruudulla. Musixmatch on kätevä erityisesti silloin, kun haluat sekä tietää kappaleen että laulaa mukana – sen tunnistus on toteutettu yhteistyössä esim. ACRCloud-palvelun kanssa ja toimii Shazamin tapaan. Myös Genius-sovellus (tunnettu lyrics-tietokanta) tarjoaa vastaavan “What’s playing” -toiminnon, joka tunnistaa kappaleen ja avaa sanat sekä tietoja kappaleesta.
- Spotify ja muut suoratoistopalvelut: Vaikka Spotify ei itsenäisesti tunnista ulkopuolelta tulevaa ääntä, se on integroitu Shazamiin: Shazamissa tunnistetun biisin voi yhdellä painalluksella avata Spotifyssä. Spotify-sovellus osaa toisaalta hakea kappaleita hyräilyn perusteella tekstihakuna – jos kirjoitat hakukenttään vaikkapa “pam pam paraparapam”, se yrittää löytää vastaavan kappaleen nimien ja sanoitusten perusteella. Tulos ei ole yhtä varma kuin varsinaiset tunnistusohjelmat, mutta joskus luova tekstihaku auttaa. Myös YouTube (ja YouTube Music) voi tunnistaa, mitä kappaleita videoissa soi, ja ehdottaa linkkejä niihin.
- AHA Music ja muut selainlaajennukset: Tietokoneella musiikkia tunnistaakseen ei välttämättä tarvita puhelinta lainkaan. Esimerkiksi AHA Music on Chrome-selaimen laajennus, joka tunnistaa selaimessa toistettavan kappaleen käyttämällä audio fingerprint -tekniikkaa. Tämä on hyödyllistä, jos vaikka katsot videota ja taustalla soiva musiikki kiinnostaa – laajennus kertoo kappaleen nimen pysäyttämättä toistoa. Shazam on julkaissut myös Chrome-laajennuksen samoihin tarkoituksiin.
- Klassisen musiikin tunnistus: Erikoismainintana, klassinen musiikki tuottaa joskus haasteita tunnistusalgoritmeille. Teokset ovat pitkiä, instrumentaalisia ja niistä on lukuisia eri esityksiä. Shazam ja SoundHound tunnistavat kyllä tunnettuja klassisen musiikin äänitteitä, mutta eivät aina osaa erottaa esimerkiksi orkesteriversiota toisesta. Tähän on kehitetty omia sovelluksia kuten SoundHoundin Classical Mode aikoinaan, ja vaikkapa MusicID-niminen appi on keskittynyt klassiseen. Tulokset voivat silti vaihdella. Klassisen ystävälle paras työkalu onkin usein vanha kunnon kysyminen – tai netin musiikkifoorumit, joilla asiantuntijat tunnistavat teoksia korvakuulolta.
Musiikin tunnistuksen tulevaisuus
Teknologia on jo nyt tuonut arkeemme pienen palan “taikuutta”: kännykkä pystyy kuuntelemaan muutaman sekunnin huminaa tai hälyä ja kertomaan täsmälleen, mikä kappale on kyseessä. Tulevaisuudessa voimme odottaa musiikintunnistuksen kehittyvän vielä pidemmälle. Keinoäly ja koneoppiminen mahdollistavat entistä hienovaraisemmat tunnistukset – ehkä sovellukset osaavat jatkossa tunnistaa esitystilanteen (liveversio vs. studioversio) tai erottaa cover-kappaleen alkuperäisestä. Myös käyttäjän laulaman näytteen ymmärtämisessä nähdään varmasti harppauksia: kun mallit saavat lisää dataa erilaisista hyräilyistä ja laulutyyleistä, ne oppivat sietämään paremmin epävireisyyttä ja tempon vaihtelua.
Lisäksi musiikintunnistuksen konsepti voi laajentua uusille alueille. Kenties tulevat sovellukset voivat yhdistää audio- ja kuvahakua – esimerkiksi videotilanteissa tunnistus osaa kertoa sekä kappaleen että vaikka tanssin koreografin samalla. Automaattinen musiikintunnistus on jo löytänyt tiensä autoihin (mm. SoundHound on lisensoitu auton viihdejärjestelmiin) ja kodin älylaitteisiin. On mahdollista, että älytelevisio tai -kuuloke tulevaisuudessa tunnistaa aina kuulemasi biisit ja pitää niistä lokia, josta voit jälkeenpäin katsoa “Mikä biisi soi eilen illalla kahvilassa”.
Yksityisyyden kannalta jatkuva tunnistaminen herättää toki kysymyksiä – esimerkiksi Pixel-puhelinten Now Playing toimii on-device, joten ääni ei lähde minnekään pilveen. Vastaavasti Apple on panostanut siihen, että Sirin/Shazamin tunnistamat kappaleet synkronoidaan iCloudiin salatusti. Käyttäjän kannalta on hyvä, että laitteet osaavat paljon, mutta ne eivät vuoda henkilökohtaisia kuuntelutietoja ulkopuolelle.
Yhteenvetona, musiikin tunnistus on vakiintunut osaksi musiikin kuuntelukokemusta. Olipa käytössäsi sitten Shazam, SoundHound, Google tai jokin muu biisin tunnistus app, voit luottaa siihen että enää yksikään hyvä kappale ei jää nimen osalta arvoitukseksi. Seuraavan kerran, kun kuulet upean laulun etkä tunnista esittäjää, tiedät mitä tehdä – muutama napautus tai hyräytys puhelimelle, ja mysteeri ratkeaa. Kuten eräs käyttäjä osuvasti kommentoi: “Tämä ohjelma on puhdasta taikuutta – oikeasti kyse on matematiikasta”. Juuri tuota taikuuden tuntua nämä sovellukset tuovat arkeemme, tehden musiikin löytämisestä ja tunnistamisesta helpompaa ja hauskempaa kuin koskaan ennen.
Lähteet:
- Shazamin tekniikasta ja historiasta: Mobiili.fi-uutinen Applen Shazam-kaupasta, Ping.fm UKK Shazamista
- Akustisesta sormenjäljestä ja audioiden vertailusta: Wikipedia “Search by sound”
- Googlen hum-to-search -ominaisuudesta: Google Blog -artikkeli
- Pixel-puhelinten Now Playing -toiminnosta: Mobiili.fi
- SoundHoundin humming-ominaisuuksista: Reddit-keskustelu (käyttäjäkokemuksia)
- Shazamin tarkkuudesta ja toiminnasta melussa: Ping.fm


