Kolloquium - Details zum Vortrag

Sie werden über Vorträge rechtzeitig per E-Mail informiert werden, wenn Sie den Newsletter des kommunikationstechnischen Kolloquiums abonnieren.

Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht erforderlich.

Bachelor-Vortrag: Untersuchung der statistischen Abhängigkeiten aufeinanderfolgender Sprachsegmente

Alexej Sobolew
Montag, 21. Oktober 2019
14:45 Uhr
Hörsaal 4G

In der Praxis sind Audio- und Sprachsignale Störungen ausgesetzt. Dadurch entstehen zeit- und frequenzbegrenzte Verzerrungen, die z. B. mithilfe der Störgeräuschreduktion oder der Echo-Kompensation abgeschwächt werden können. Bei diesen Vorgängen entstehen allerdings hörbare Artefakte. Die Linderung dieser Artefakte kann durch die Rekonstruktion der geschädigten Stellen erfolgen. Dieser Rekonstruktionsprozess wird als Speech Inpainting bezeichnet. Zur Rekonstruktion existieren Ansätze mithilfe von Machine-Learning-Algorithmen. Ziel ist die Reduktion der Komplexität der Modelle der Machine-Learning-Algorithmen. Dazu müssen die Eingangsdaten auf ihre Relevanz hin untersucht und die signifikanten Anteile extrahiert werden.

Um dieses Ziel zu erreichen, werden die Daten zunächst auf die Eigenschaften der Normalverteilung untersucht. Als Qualitätsmaß für die statistischen Abhängigkeiten werden die Korrelation und die Transinformation gewählt. Die Normalverteilung erweist sich hierbei für die Untersuchung mithilfe der Korrelation als sinnvoll. Des Weiteren werden die zeitlichen Abhängigkeiten analysiert und die Daten auf ihre Frequenzabhängigkeit erforscht. Darauffolgend wird die Auswirkung der Zunahme zusätzlicher Elemente ermittelt. Hierbei muss zunächst auf die Vergleichbarkeit der Ergebnisse unterschiedlich-dimensionaler Eingangsdaten geachtet werden. Dazu kann eine passend gewählte Normierung verwendet werden. Im anschließenden Schritt werden die Daten in unterschiedliche Cluster aufgeteilt, um weitere Zusammenhänge zu erkennen.

zurück