Colloquium - Details

You will receive information about presentations in time if you subscribe to the newsletter of the Colloquium Communications Technology.

All interested students are cordially invited, registration is not required.

Bachelor-Vortrag: Sprackaktivitätserkennung durch maschinelles Lernen

Haoran Xi
Dienstag, 12. Dezember 2017
10:00 Uhr
Hörsaal 4G

Voice Activity Detection (VAD) wird oft im Gebiet der Sprachsignalübertragung und Sprachaktivitätserkennung eingesetzt. Verarbeitungsprozesse werden zum Beispiel dadurch während der Sprachpause deaktiviert, um Übertragungskapazität einzusparen und die Schätzung der Störungen zu aktualisieren. Leider treten hier nicht selten unerwünschte Störgeräusche auf. Dies hat zur Folge, dass sich mit der Senkung des Signal-zu-Rausch-Verhältnisses (SNR) die Performance der VAD verschlechtert. In den vergangenen Jahren wurden zahlreiche konventionelle VADS entwickelt, die auf unterschiedlichen vorgegebenen Modellen basieren.

In dieser Arbeit wird eine neue VAD entwickelt, die nicht mit konventionellen Algorithmen arbeitet, sondern mit Algorithmen des Machine Learning durchgeführt wird. Es werden die Features vier konventioneller VADs extrahiert. Die Features bilden die Inputs für die Machine Learning Algorithmen und deren Training. Danach folgt der Vergleich der trainierten Machine Learning VADs und den entsprechenden konventionellen VADs. Anschließend werden die Features aus verschiedenen konventionellen VADs durch ein bestimmtes Verfahren kombiniert. Dabei wird untersucht, mit welcher Kombination von Features die höchste Accuracy der Machine Learning VAD ezielt werden kann. Am Ende wird die optimierte Machine Learning VAD mit konventionellen VADs bei verschiedenen Störgeräuschen verglichen.

back