Slik fungerer Googles Hum to Search-funksjon

Innholdsfortegnelse:

Slik fungerer Googles Hum to Search-funksjon
Slik fungerer Googles Hum to Search-funksjon
Anonim

Key takeaways

  • Google har lansert et nytt verktøy som lar brukere søke etter sanger ved å nynne, synge eller plystre.
  • Det nye verktøyet bruker maskinlæring for å matche et nynnet spor med en database med mer enn en halv million sanger som oppdateres kontinuerlig.
  • Google-brukere spør hvilken sang som spilles nesten 100 ganger hver måned.
Image
Image

Google har lansert en ny funksjon k alt «Hum to Search» for å løse et frustrerende problem: å ha en sang fast i hodet og ikke kunne finne ut hva den heter.

Ideen med å nynne for å finne en sang virker utrolig enkel, så hvorfor lanserer Google denne funksjonen først i 2020? Vel, det viser seg at det å identifisere sanger på denne måten faktisk er ganske komplisert, delvis fordi våre nynnede versjoner har en tendens til å være ganske forskjellige fra originalsporet. I et nylig innlegg på sin AI-blogg forklarer Google hvordan den brukte maskinlæring for å fikse dette problemet, og til slutt hjelpe folk med å finne en sang ved å nynne, plystre eller synge melodien selv når gjengivelsen deres er mindre enn nøyaktig.

"Vårt fokus for Hum to Search er å hjelpe folk med å identifisere og finne musikk som sitter fast i hodet deres," sa en Google-talsperson til Lifewire i en e-post.

Bare begynn å nynne

Google-brukere spør hvilken sang som spilles nesten 100 millioner ganger hver måned, sa Aparna Chennapragada, Googles visepresident og daglig leder for forbrukerhandel, en video som introduserer flere nye søkefunksjoner. Nå er det en måte å finne ut av det.

«Hum to Search»-funksjonen er innebygd i Googles mobilapp, Google Search-widget og Google Assistant. For å få tilgang til den via appen, trykk på mikrofonikonet og si "Hva er denne sangen?" Å velge "Søk en sang"-knappen fungerer også.

For å fungere riktig krever funksjonen at du nynner i minst 10-15 sekunder. Android-brukere kan nynne for å finne sanger på mer enn 20 språk, mens bare engelske sanger fungerer på iPhone. Verktøyet er ikke alltid i stand til å identifisere en sang med en gang, men når det først gjør det, er resultatene ganske gode.

"Mer enn halvparten av sangene med et bredt sett med variabler (tone, tonehøyde, volum osv.) gjenkjennes av våre algoritmer, men nøyaktigheten avhenger selvfølgelig av kvaliteten på nynningen, typen sangen og mer», fort alte Google-talspersonen til Lifewire i en e-post. "Men når det først er gjenkjent, er omtrent fire av fem svar riktige."

Dette er imidlertid ikke første gang nynning har blitt brukt i en musikkidentifiseringsapp. SoundHound tilbyr en lignende funksjon, som bemerket av CNN Business, og er også tilgjengelig på Android og iOS. I følge Googles talsperson reiser ikke den nye funksjonen noen personvernbekymringer, og den endrer heller ikke måten Google håndterer lydbaserte interaksjoner på, sa de til Lifewire i en e-post.

Machine Learning

Til tross for det enkle konseptet, er det teknisk vanskelig å nynne en melodi for å finne studioinnspillingen. Det er flere grunner til dette, forklarer Google Researchs Christian Frank i et blogginnlegg 12. november. For det første kan en nynnet versjon av sangen skille seg veldig fra selve innspillingen, noe som gjør det vanskelig å matche de to. Så selv om Shazam og en rekke andre apper allerede eksisterer for å identifisere den sangen du hører på en restaurant eller et annet offentlig sted, kan det være vanskeligere å bruke en nynnet melodi som grunnlag for det søket.

"Med tekster, bakgrunnsvokal og instrumenter kan lyden til en musikal- eller studioinnspilling være ganske forskjellig fra en nynnet melodi," skriver Frank."Ved en feiltakelse eller design, når noen nynner sin tolkning av en sang, kan tonehøyden, tonearten, tempoet eller rytmen ofte variere litt eller til og med betydelig."

Image
Image

Fordi de nynnede versjonene av sangene kan være så forskjellige fra originalene, bemerker Frank at mange tidligere metoder har krevd å matche en persons nynning med en versjon av sangen som bare har en melodi, eller et spor som inkluderer nynning. Dette har gjort brukstilfeller i den virkelige verden utfordrende, siden databasene med disse sangene kan begrenses og må oppdateres manuelt.

Google forklarer at for Hum to Search-funksjonen bruker den maskinlæringsmodeller for å gjøre lyd om til en "tallbasert sekvens" som representerer melodien til sangen - det den sier kan ses på som et "fingeravtrykk".."

Mer brukervennlig

Bruken av maskinlæring i Googles Hum to Search-funksjon gjør verktøyet mye enklere å bruke i den virkelige verden. Fordi Hum to Search matcher søkerens nynnede melodi med den faktiske sangen, kan verktøyet jobbe med de nye sangene etter hvert som de slippes i stedet for en database som hele tiden må oppdateres med nynnede versjoner av hvert spor. Dessuten trenger du ikke perfekt tonehøyde for å bruke det.

"Det nåværende systemet når et høyt nivå av nøyaktighet på en sangdatabase som inneholder over en halv million sanger som vi kontinuerlig oppdaterer," sa Google i sin Hum to Search-kunngjøring. "Dette sangkorpuset har fortsatt plass til å vokse til å inkludere flere av verdens mange melodier."

Anbefalt: