Machine Learning for Speech and Audio Processing
Dozent: Prof. Dr.-Ing. Peter Jax
Ansprechpartner: Egke Chatzimoustafa
Typ: Master-Vorlesung
Credits: 4
Anmeldung über RWTHonline
Vorlesungssprache: Englisch
Unterlagen:
Die Folien zur Vorlesung und Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.
Termine
Vorlesung:
ab Freitag, 17. April 2026
08:30 - 10:00 Uhr
IKS, Hörsaal 4G
Übung:
ab Freitag, 17. April 2026
10:15 - 11:00 Uhr
IKS, Hörsaal 4G
Sprechstunden:
Bitte kontaktieren Sie für einen individuellen Termin Egke Chatzimoustafa.
Prüfung
Mittwoch, 04. März 2026
Die Prüfung findet mündlich statt.
Zwecks Terminvergabe kontaktieren Sie bitte bis zum 15.02.26 Simone Sedgwick.
Die Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Die formale Verknüpfung zu den Modulkatalogen ist in RWTHonline zu finden.
Inhalt der Vorlesung
Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:
- Klassifikations- und Schätzungsverfahren
- Bayes'sche Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
- Techniken zur Merkmalsextraktion
- Modellierung statistischer Verteilungen
- Grundlegende Klassifikationsverfahren
- Statistische Modellierung
- K-Means Clustering
- Gaussian Mixture Models (GMMs)
- Expectation-Maximization (EM) Algorithmus
- Modellierung sequentieller Daten
- Hidden Markov Models (HMMs)
- Schätzung und Klassifikation mit HMMs
- Linear Dynamical Systems (LDS)
- Nicht-negative Matrixfaktorisierung
- Neuronale Netze und Deep Learning
- Elemente Neuronaler Netze
- Feed-Forward Neuronale Netze
- Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent (SGD)
- Spezialisierte Netzwerkarchitekturen: CNNs, RNNs, LSTMs
- Fortschrittliche Lernstrategien
In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.
Evaluierung
Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.
Sommersemester 2025
Teilnehmer an der Evaluierung: 5
Vorlesung:
Konzept der Vorlesung: 1,0
Materialien: 1,6
Vermittlung der Lehrinhalte: 1,0
Übung:
Konzept der Übung: 1,2
Materialien: 1,4
Vermittlung der Lehrinhalte: 1,2