Machine Learning for Speech and Audio Processing

Dozent: Prof. Dr.-Ing. Peter Jax

Ansprechpartner: Egke Chatzimoustafa

Typ: Master-Vorlesung

Credits: 4

Anmeldung über RWTHonline

Vorlesungssprache: Englisch

Unterlagen:
Die Folien zur Vorlesung und Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.

Termine

Vorlesung:

ab Freitag, 11. April 2025
08:30 - 10:00 Uhr
Hörsaal FT

Übung:

ab Freitag, 11. April 2025
10:15 - 11:00 Uhr
Hörsaal FT

Prüfung

Donnerstag, 05. März 2026
09:00 - 10:30 Uhr
AH IV.

Prüfungsdauer: 1,5 Stunden

Anmerkung: Es handelt sich um eine schriftliche Prüfung. Dieser Termin bezieht sich auch auf die schriftlichen Leistungsnachweise.

Hilfsmittel: Für die Prüfung sind außer einem nicht programmierbaren Taschenrechner keine weiteren Materialien erlaubt. Die Liste der zulässigen Taschenrechner findet sich unter https://www.rwth-aachen.de/go/id/bkzrkw.

Bitte beachten: Bringen Sie bitte Ihren Studierendenausweis (BlueCard) mit.

Die Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Die formale Verknüpfung zu den Modulkatalogen ist in RWTHonline zu finden.

Inhalt der Vorlesung

Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:

  • Klassifikations- und Schätzungsverfahren
    • Bayes'sche  Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
    • Techniken zur Merkmalsextraktion
    • Modellierung statistischer Verteilungen
    • Grundlegende Klassifikationsverfahren
  • Statistische Modellierung
    • K-Means Clustering
    • Gaussian Mixture Models (GMMs)
    • Expectation-Maximization (EM) Algorithmus
  • Modellierung sequentieller Daten
    • Hidden Markov Models (HMMs)
    • Schätzung und Klassifikation mit HMMs
    • Linear Dynamical Systems (LDS)
  • Nicht-negative Matrixfaktorisierung
  • Neuronale Netze und Deep Learning
    • Elemente Neuronaler Netze
    • Feed-Forward Neuronale Netze
    • Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent (SGD)
    • Spezialisierte Netzwerkarchitekturen: CNNs, RNNs, LSTMs
    • Fortschrittliche Lernstrategien

In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.

Evaluierung

Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.

Sommersemester 2025

Teilnehmer an der Evaluierung: 5

Vorlesung:
Konzept der Vorlesung: 1,0
Materialien: 1,6
Vermittlung der Lehrinhalte: 1,0

Übung:
Konzept der Übung: 1,2
Materialien: 1,4
Vermittlung der Lehrinhalte: 1,2

MLSAP_Vorlesung_SS25.pdf
MLSAP_Übung_SS25.pdf