Kolloquium - Details zum Vortrag
Sie werden über Vorträge rechtzeitig per E-Mail informiert werden, wenn Sie den Newsletter des kommunikationstechnischen Kolloquiums abonnieren.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht erforderlich.
Bachelor-Vortrag: Sprackaktivitätserkennung durch maschinelles Lernen
Haoran Xi
Dienstag, 12. Dezember 2017
10:00 Uhr
Hörsaal 4G
Voice Activity Detection (VAD) wird oft im Gebiet der Sprachsignalübertragung und Sprachaktivitätserkennung eingesetzt. Verarbeitungsprozesse werden zum Beispiel dadurch während der Sprachpause deaktiviert, um Übertragungskapazität einzusparen und die Schätzung der Störungen zu aktualisieren. Leider treten hier nicht selten unerwünschte Störgeräusche auf. Dies hat zur Folge, dass sich mit der Senkung des Signal-zu-Rausch-Verhältnisses (SNR) die Performance der VAD verschlechtert. In den vergangenen Jahren wurden zahlreiche konventionelle VADS entwickelt, die auf unterschiedlichen vorgegebenen Modellen basieren.
In dieser Arbeit wird eine neue VAD entwickelt, die nicht mit konventionellen Algorithmen arbeitet, sondern mit Algorithmen des Machine Learning durchgeführt wird. Es werden die Features vier konventioneller VADs extrahiert. Die Features bilden die Inputs für die Machine Learning Algorithmen und deren Training. Danach folgt der Vergleich der trainierten Machine Learning VADs und den entsprechenden konventionellen VADs. Anschließend werden die Features aus verschiedenen konventionellen VADs durch ein bestimmtes Verfahren kombiniert. Dabei wird untersucht, mit welcher Kombination von Features die höchste Accuracy der Machine Learning VAD ezielt werden kann. Am Ende wird die optimierte Machine Learning VAD mit konventionellen VADs bei verschiedenen Störgeräuschen verglichen.
