Ar kada susimąstėte, kaip „Shazam“ girdi jūsų grojamą muziką ir identifikuoja ją tokiu tikslumu? Na, jūs ne vienas.

Muzikos atpažinimo paslaugą valdanti technologija yra daugelio paslaptis, ypač todėl, kad ši paslauga buvo pradėta kurti daugelį metų anksčiau nei išmanieji telefonai ir mašininis mokymasis tapo dalyku.

Šiame straipsnyje mes apžvelgsime, kaip „Shazam“ veikia ir kaip jis gali tiksliai atpažinti muziką.

Kas yra Šazamas?

Šazamas yra populiari muzikos atpažinimo programa, kurią galite naudoti norėdami rasti informaciją apie naują mėgstamą dainą, bet nežinote atlikėjo pavadinimo ar vardo.

Tarkime, kad esate kavinėje ar vaikštinėjate už kampinės parduotuvės, ir išgirstate naują dainą, kurią norėtumėte turėti savo muzikos bibliotekoje. „Shazam“ padeda lengvai rasti dainą. Viskas, ką jums reikia padaryti, tai įrašyti kelias sekundes dainos į programą.

Programa „Shazam“ naudoja pažangią garso atpažinimo technologiją, kad atpažintų klausomą muziką sekundžių, kad galėtumėte sužinoti atlikėjo vardą ir stebėti, žiūrėti vaizdo įrašus ir netgi nusipirkti ar perduoti dainą prietaisą.

Parsisiųsti: Šazamas už „iOS“ |„Android“ (Laisvas)

Kaip veikia „Shazam“?

Vaizdų galerija (4 vaizdai)
Išskleisti
Išskleisti
Išskleisti
Išskleisti

1 vaizdas iš 4

2 vaizdas iš 4

3 vaizdas iš 4

4 vaizdas iš 4

„Shazam“ naudoja patentuotą technologiją, kurią sukūrė programos įkūrėjas ir vyriausiasis duomenų mokslininkas Avery Lin-Chun Wang, kad nustatytų savo platformoje ieškomų dainų atitikmenis. Ši technologija sukuria pirštų atspaudus garso įrašams, o tai yra paslaptingas padažas už nuostabių „Shazam“ atpažinimo įgūdžių.

„Shazam“ sukuria ir saugo garso pirštų atspaudus, susidedančius iš kiekvienos daugiau nei 15 milijardų dainų skaitinių duomenų rinkinių. Kai vartotojas „Shazams“ dainą, „Shazam“ greitai sukuria garso, gauto iš išmaniojo telefono ar kompiuterio mikrofono, piršto atspaudą.

Sukūręs garso piršto atspaudą įrašymui, „Shazam“ įkelia garso piršto atspaudą (ne garso įrašą) į savo serverį, kur vykdo atitikmenų paiešką duomenų bazėje. Jei randama atitiktis, ji pateikia informaciją apie dainą su parinktimis, kur ją srautu perduoti ar pirkti, kartu su identifikavimo informacija.

Kas yra garso piršto atspaudas?

Garso piršto atspaudas yra glausta skaitmeninė garso signalų suvestinė. Jie naudojami garso pavyzdžiui identifikuoti arba panašiems elementams rasti garso duomenų bazėje.

„Shazam“ garso pirštų atspaudų technologija gali suderinti nepažymėtus garso turinio gabalus su atitinkamais atitikmenimis jo garso duomenų bazėje. „Shazam“ identifikuoja jūsų įrašytos dainos pavadinimą (nepažymėtą garso turinį), suderindamas dainos pirštų atspaudus su savo duomenų bazėje esančių dainų pirštų atspaudais.

„Shazam“ sukuria unikalius dainų pirštų atspaudus savo duomenų bazėje, naudodamas tam tikrus duomenų taškus, identifikuojamus spektrogramos pagalba.

Kas yra spektrograma?

Spektrograma yra trimatis grafikas, naudojamas kaip garsas. Spektrogramoje parodomas dažnių pokytis per tam tikrą laikotarpį, taip pat atsižvelgiama į amplitudę ar tūrį. Žemiau pateikta nuotrauka yra spektrogramos skaitymo pavyzdys.

Vaizdo kreditas: Changhua pakrantės apsaugos veiksmas /https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

2003 m. Interviu su Mokslinis amerikietis, Avery Wang atskleidė, kad „Shazam“ algoritmas naudoja garso spektro taškus, žyminčius didžiausios energijos užrašus, kad sukurtų garso pirštų atspaudus.

Nepaisydamas daugumos dainos informacijos ir sutelkdamas dėmesį tik į keletą apibrėžiančių natų, „Shazam“ gali ieškoti neįtikėtinu greičiu savo duomenų bazėje ir tiksliai pateikti dainų užklausas.

Kaip Shazamas sugeba atpažinti dainas triukšmingose ​​vietose?

„Shazam“ naudoja dainų įrašus, kuriuose nėra triukšmo ir iškraipymų, kad sukurtų pirštų atspaudus savo duomenų bazei. Kai įrašote dainą naudodamiesi programa triukšmingoje vietoje, ji sukuria jūsų įrašo garso piršto atspaudą, nustatant įrašus, kurių energija yra didžiausia.

Tada ji ieško savo duomenų bazėje jūsų įrašo garso pirštų atspaudų atitikties, su sąlyga, kad fono triukšmo lygis nebuvo pakankamai aukštas, kad iškreiptų duomenis, naudojamus garso įrašui kurti piršto antspaudas.

Laikai, kai „Shazam“ negali padėti nustatyti dainos

„Shazam“ puikiai derina dainas, net ir neaiškią muziką, kurios, jūsų manymu, jos duomenų bazėje gali nebūti. Bet ar yra momentų, kai Shazamas negali nustatyti takelio?

Iškreiptas įrašymas

Kai Shazam dainą vietoje, kur fono triukšmo lygis yra per didelis, triukšmas iškraipo spektrogramos duomenis. Dėl to įrašo garso piršto atspaudas skirsis nuo originalios dainos.

Kai tai atsitiks, Shazamas grąžina Daina nežinoma dialogą, nes jis negali rasti garso piršto atspaudo atitikties.

Gyva muzika

„Shazam“ nesugeba atpažinti muzikos iš gyvų pasirodymų. Taip yra todėl, kad garso įrašas, kurį įrašote gyvų pasirodymų metu, dažnai skiriasi nuo originalios dainos, kurią „Shazam“ naudoja garso pirštų atspaudams kurti, versijos.

Vienintelis būdas „Shazam“ atpažinti dainą gyvo pasirodymo metu yra tai, kad grupė yra pakankamai kvalifikuota, kad atliktų dainą tiksliai taip, kaip ji buvo įrašyta. Sėkmės bandant tai padaryti grupei...

Jūsų balso įrašymas

"Ar galėčiau priversti Shazamą atpažinti dainą, kurią dainavau, jei buvau tikrai geras dainininkas?"

Trumpai tariant, ne.

„Shazam“ algoritmas gali identifikuoti tik iš anksto įrašytą muziką. Kad „Shazam“ atpažintų dainą, kurią dainuojate, jums reikia turėti tą patį vokalą su instrumentais tiksliai tokiu tempu, kaip ir originalus dainos įrašas.

Jūsų dūzgimas

„Shazam“ negali nustatyti humuso atitikmenų, nes jo algoritmas naudoja tikslius dažnius ir amplitudes, kad sukurtų garso pirštų atspaudus savo duomenų bazėje esančioms dainoms.

Kai dūzgiate dainą, Shazamas sukuria jai pirštų atspaudus. Kadangi dūzgimas yra tik bandymas iš naujo sintezuoti dainą, algoritmas neatitiks įrašo.

Ar „Shazam“ yra vienintelė muzikos identifikavimo programa?

„Shazam“ buvo pirmoji muzikos atpažinimo paslauga ir šiuo metu yra plačiausiai naudojama dainų atpažinimo programa. Tačiau yra kitas programas, kurias galite naudoti dainai identifikuoti žaisdamas aplink tave. Kai kurie netgi gali nustatyti dainą, kurią dainuojate ar dūzgiate.

Trys populiariausios „Shazam“ alternatyvos yra „SoundHound“, „Musixmatch Lyrics“ ir „Genius“. „Musixmatch“ ir „Genius“ pirmiausia padeda atpažinti aplink jus grojančios muzikos žodžius, o „SoundHound“ yra artimiausias „Shazam“ konkurentas.

Susijęs: Geriausios muzikos atpažinimo programos, skirtos rasti dainas pagal jų melodiją

Galite naudoti „SoundHound“ programą, kad atliktumėte beveik viską, ką daro „Shazam“. Pagrindinis jo pranašumas prieš „Shazam“ yra tas, kad jis turi papildomą funkciją atpažinti dainas, kurias dainuojate ar dūzgiate.

Vaizdo kreditas: Sulastri Sulastri / Shutterstock.com

El
Kaip atpažinti muziką ir dainas „YouTube“ vaizdo įrašuose

Įdomu, kaip atpažinti dainą iš „YouTube“ vaizdo įrašo? Čia pateikiama „YouTube“ dainų ieškojimo instrukcija, leidžianti atpažinti muziką iš vaizdo įrašų.

Skaitykite toliau

Susijusios temos
  • Paaiškinta technologija
  • Šazamas
  • Muzikos atradimas
  • „SoundHound“
  • Musixmatch
Apie autorių
Jonas Awa-abuonas (Paskelbti 6 straipsniai)

Jonas yra technologijų mylėtojas nuo gimimo, skaitmeninio turinio kūrėjas pagal išsilavinimą ir „Tech Lifestyle Writer“ pagal profesiją. Jonas tiki, kad padeda žmonėms spręsti problemas, ir jis rašo straipsnius, kurie tai daro.

Daugiau iš John Awa-abuon

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kuriame rasite techninių patarimų, apžvalgų, nemokamų el. Knygų ir išskirtinių pasiūlymų!

Dar vienas žingsnis…!

Prašome patvirtinti savo el. Pašto adresą el. Laiške, kurį jums ką tik išsiuntėme.

.