Godkända
Ljudfingeravtryck - En dekomponeringsstudie
Niklas Gälldin () och Victor Hultman ()
Start
2024-01-15
Presentation
2024-06-13 11:15
Plats:
E:3139
Avslutat:
2024-06-30
Examensrapport:
Sammanfattning
Ljudfingeravtryck är en välkänd teknik som genererar unika fingeravtryck för ljudsignaler vilka som senare kan användas för identifiering. Ett välkänt exempel på detta är Shazam-applikationen vars koncept är att matcha en kort låtsnutt med en databas för att hitta namnet på låten och artisten. Generellt skapas ljudfingeravtrycken genom att applicera en tids-frekvens-transform på ljudsignalen och extrahera de mest framträdande komponenterna i tids-frekvensdomänen. Det är standard att använda korttids Fouriertransformen (STFT) men det finns också transformer med andra egenskaper. Denna studie jämför prestandan för STFT med Hyper Localized Wavelet Transform (HLT) inom en ljudfingeravtrycksprocess, med fokus på tre viktiga mätvärden: korrekt identifiering av låtar (precision), robusthet mot brus och minnesanvändning. Resultaten visar att medan STFT och HLT uppvisar jämförbar precision, visar den senare överlägsen robusthet mot brus med mindre minnesanvändning. Vidare visade sig STFT generera ungefär 1,23 gånger mer data vid skapandet av fingeravtrycksdatabasen jämfört med HLT.
Handledare: Henrik Jörntell () och Kaan Kesgin () och Fredrik Edman (EIT)
Examinator: Erik Larsson (EIT)