Colloquium - Details
You will receive information about presentations in time if you subscribe to the newsletter of the Colloquium Communications Technology.
Bachelor-Vortrag: Untersuchung der statistischen Abhängigkeiten aufeinanderfolgender Sprachsegmente
Alexej Sobolew
Montag, 21. Oktober 2019
14:45 Uhr
Hörsaal 4G
In der Praxis sind Audio- und Sprachsignale Störungen ausgesetzt. Dadurch entstehen zeit- und frequenzbegrenzte Verzerrungen, die z. B. mithilfe der Störgeräuschreduktion oder der Echo-Kompensation abgeschwächt werden können. Bei diesen Vorgängen entstehen allerdings hörbare Artefakte. Die Linderung dieser Artefakte kann durch die Rekonstruktion der geschädigten Stellen erfolgen. Dieser Rekonstruktionsprozess wird als Speech Inpainting bezeichnet. Zur Rekonstruktion existieren Ansätze mithilfe von Machine-Learning-Algorithmen. Ziel ist die Reduktion der Komplexität der Modelle der Machine-Learning-Algorithmen. Dazu müssen die Eingangsdaten auf ihre Relevanz hin untersucht und die signifikanten Anteile extrahiert werden.
Um dieses Ziel zu erreichen, werden die Daten zunächst auf die Eigenschaften der Normalverteilung untersucht. Als Qualitätsmaß für die statistischen Abhängigkeiten werden die Korrelation und die Transinformation gewählt. Die Normalverteilung erweist sich hierbei für die Untersuchung mithilfe der Korrelation als sinnvoll. Des Weiteren werden die zeitlichen Abhängigkeiten analysiert und die Daten auf ihre Frequenzabhängigkeit erforscht. Darauffolgend wird die Auswirkung der Zunahme zusätzlicher Elemente ermittelt. Hierbei muss zunächst auf die Vergleichbarkeit der Ergebnisse unterschiedlich-dimensionaler Eingangsdaten geachtet werden. Dazu kann eine passend gewählte Normierung verwendet werden. Im anschließenden Schritt werden die Daten in unterschiedliche Cluster aufgeteilt, um weitere Zusammenhänge zu erkennen.
