Bachelorarbeit - Details

Untersuchung geeigneter Features zur Rekonstruktion verlorener Sprachsignalanteile

Betreuer:Lars Thieling

Themengebiet: Sprachsignalverarbeitung, Machine Learning

Kategorie: Masterarbeit (MA)

Status: offen

Tools: Matlab, Python

Aufgabenstellung:

Audio- bzw. Sprachsignale sind häufig Störungen ausgesetzt, bei denen das Nutzsignal in Frequenz- und/oder Zeit-begrenzten Anteilen verzerrt wird. Ein Ansatz, z.B. in der Störgeräuschreduktion oder der Echo-Kompensation, ist es, diese Verzerrungen zu dämpfen oder zu entfernen. Dies führt jedoch zu hörbaren Artefakten. Durch Rekonstruktion des Nutzsignals können diese Artefakte behoben werden. In Anlehnung an das Image Inpainting aus der digitalen Bildverarbeitung, wird dieser Rekonstruktionsprozess für den Fall von Sprachsignalen als Speech Inpainting bezeichnet.

Aufgrund der vielversprechenden Ergebnisse beim Image Inpainting bieten sich dabei Ansätze aus dem Bereich des Machine Learning an. Um die Komplexität der verwendeten Machine Learning Modelle und damit verbunden die benötigte Dauer des Trainings sowie Menge der Trainingsdaten möglichst gering zu halten, wird i.d.R. eine Feature Extraction eingesetzt. Diese führt eine Dimensionsreduktion der rohen Zeitsignale in handlichere Darstellungen (Features) durch.

In dieser Arbeit sollen geeignete Sprach-Features für die Anwendung des Speech Inpaintings ermittelt werden. Dazu sollen zunächst potentielle Features recherchiert werden. Hier bieten sich beispielsweise die in der Spracherkennung häufig verwendeten Mel Frequency Cepstral Coefficients (MFCCs) oder die Linear Predictive Coding (LPC) Koeffizienten an. Anschließend soll eine Evaluierung der potentiellen Features durchgeführt werden. Hierzu können Ansätze aus der sogenannten Feature Selection angewendet werden, welche z.B. als Qualitätsmaß die aus der Informationstheorie bekannte Transinformation verwenden. Die besten Features sollen ausgewählt und zum Training eines geeigneten Machine Learning Algorithmus herangezogen werden.

zurück