Termin – Detailansicht

Sie verwenden einen Browser, in dem JavaScript deaktiviert ist. Dadurch wird verhindert, dass Sie die volle Funktionalität dieser Webseite nutzen können. Zur Navigation müssen Sie daher die Sitemap nutzen.

You are currently using a browser with deactivated JavaScript. There you can't use all the features of this website. In order to navigate the site, please use the Sitemap .

Bachelor-Vortrag: Sprackaktivitätserkennung durch maschinelles Lernen

Haoran Xi
Dienstag, 12. Dezember 2017
10:00 Uhr
Hörsaal 4G IKS

Voice Activity Detection (VAD) wird oft im Gebiet der Sprachsignalübertragung und Sprachaktivitätserkennung eingesetzt. Verarbeitungsprozesse werden zum Beispiel dadurch während der Sprachpause deaktiviert, um Übertragungskapazität einzusparen und die Schätzung der Störungen zu aktualisieren. Leider treten hier nicht selten unerwünschte Störgeräusche auf. Dies hat zur Folge, dass sich mit der Senkung des Signal-zu-Rausch-Verhältnisses (SNR) die Performance der VAD verschlechtert. In den vergangenen Jahren wurden zahlreiche konventionelle VADS entwickelt, die auf unterschiedlichen vorgegebenen Modellen basieren.

In dieser Arbeit wird eine neue VAD entwickelt, die nicht mit konventionellen Algorithmen arbeitet, sondern mit Algorithmen des Machine Learning durchgeführt wird. Es werden die Features vier konventioneller VADs extrahiert. Die Features bilden die Inputs für die Machine Learning Algorithmen und deren Training. Danach folgt der Vergleich der trainierten Machine Learning VADs und den entsprechenden konventionellen VADs. Anschließend werden die Features aus verschiedenen konventionellen VADs durch ein bestimmtes Verfahren kombiniert. Dabei wird untersucht, mit welcher Kombination von Features die höchste Accuracy der Machine Learning VAD ezielt werden kann. Am Ende wird die optimierte Machine Learning VAD mit konventionellen VADs bei verschiedenen Störgeräuschen verglichen.

zurück