Machine Learning for Speech and Audio Processing

Sie verwenden einen Browser, in dem JavaScript deaktiviert ist. Dadurch wird verhindert, dass Sie die volle Funktionalität dieser Webseite nutzen können. Zur Navigation müssen Sie daher die Sitemap nutzen.

You are currently using a browser with deactivated JavaScript. There you can't use all the features of this website. In order to navigate the site, please use the Sitemap .

Dozent: Prof. Dr.-Ing. Peter Jax

Ansprechpartner: Egke Chatzimoustafa

Typ: Master-Vorlesung

Credits: 4

Anmeldung über RWTHonline

Vorlesungssprache: Englisch

Unterlagen:
Die Folien zur Vorlesung und Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.

Vorlesung:

ab Freitag, 17. April 2026
08:30 - 10:00 Uhr
IKS, Hörsaal 4G

Übung:

ab Freitag, 17. April 2026
10:15 - 11:00 Uhr
IKS, Hörsaal 4G

Sprechstunden:

Bitte kontaktieren Sie für einen individuellen Termin Egke Chatzimoustafa.

Prüfung

Mittwoch, 04. März 2026
Die Prüfung findet mündlich statt.

Zwecks Terminvergabe kontaktieren Sie bitte bis zum 15.02.26 Simone Sedgwick.

Die Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Die formale Verknüpfung zu den Modulkatalogen ist in RWTHonline zu finden.

Inhalt der Vorlesung

Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:

Klassifikations- und Schätzungsverfahren
- Bayes'sche Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
- Techniken zur Merkmalsextraktion
- Modellierung statistischer Verteilungen
- Grundlegende Klassifikationsverfahren
Statistische Modellierung
- K-Means Clustering
- Gaussian Mixture Models (GMMs)
- Expectation-Maximization (EM) Algorithmus
Modellierung sequentieller Daten
- Hidden Markov Models (HMMs)
- Schätzung und Klassifikation mit HMMs
- Linear Dynamical Systems (LDS)
Nicht-negative Matrixfaktorisierung
Neuronale Netze und Deep Learning
- Elemente Neuronaler Netze
- Feed-Forward Neuronale Netze
- Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent (SGD)
- Spezialisierte Netzwerkarchitekturen: CNNs, RNNs, LSTMs
- Fortschrittliche Lernstrategien