Machine Learning for Speech and Audio Processing
Dozent: Prof. Dr.-Ing. Peter Jax
Ansprechpartner: Lars Thieling, Maximilian Kentgens
Typ: Master-Vorlesung
Credits: 4
Vorlesung in RWTHonline
Übung in RWTHonline
Lernraum RWTHmoodle
(Anmeldung über RWTHonline)
Vorlesungssprache: Englisch
Unterlagen:
Die Folien zur Vorlesung und Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.
Termine
Vorlesung:
ab Freitag, 8. April 2022
08:30 - 10:00 Uhr
Hörsaal 4G
Übung:
ab Freitag, 8. April 2022
10:15 - 11:00 Uhr
Hörsaal 4G
Sprechstunden:
Mittwoch, 21.07.2021
10:15-11:15
online
Montag, 26.07.2021
14:00-15:00
online
Montag, 02.08.2021
14:00-15:30
online
Prüfung
Donnerstag, 11. August 2022
14:00-15:30 Uhr
Hörsaal PPS H1/H2
Prüfungsdauer: 1,5 Stunden
Anmerkung: Es handelt sich um eine schriftliche Prüfung. Dieser Termin bezieht sich auch auf die schriftlichen Leistungsnachweise.
Hilfsmittel: Zur Lösung der Klausur darf eine beidseitig beschriebene DIN A4 Formelsammlung verwendet werden. Andere schriftliche Hilfsmittel (z.B. Vorlesungsunterlagen, Übungsmitschriften) sind nicht erlaubt. Die Verwendung eines Taschenrechners ist erlaubt.
Die Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Die formale Verknüpfung zu den Modulkatalogen ist in RWTHonline zu finden.
Inhalt der Vorlesung
Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:
- Klassifikations- und Schätzungsverfahren
- Grundlegende Probleme der Klassifikation
- Techniken zur Merkmalsextraktion
- Grundlegende Klassifikationsverfahren
- Statistische Modellierung
- Stochastische Prozesse und Modelle
- Gaussian Mixture Models (GMMs)
- Hidden Markov Models (HMMs)
- Trainingsmethoden
- Bayes'sche Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
- Partikelfilter
- Nicht-negative Matrixfaktorisierung
- Dictionary‐basiertes Konzept
- Neuronale Netze und Deep Learning
- Feed-Forward Neuronale Netze
- Grundlegende Anwendungen
- Lernstrategien: Supervised vs. Unsupervised vs. Reinforcement Learning
- Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent
- Lernverhalten und die "Magie" von Hyper-Parametern
- Generative Networks im Gegensatz zu gerichteten Graphen
- Von "Shallow" bis "Deep": Der Kompromiss zwischen Verständlichkeit und Performance
- Spezielle Netzwerkarchitekturen
- Anwendungen aus der Signalverarbeitung
- Interpretation und Realisierung
In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.
Evaluierung
Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.
Sommersemester 2020
Teilnehmer an der Evaluierung (Vorlesung/Übung): 16/10
Vorlesung:
Globalindikator: 1,4
Konzept der Vorlesung: 1,4
Vermittlung und Verhalten: 1,4
Übung:
Globalindikator: 1,4
Konzept der Übung: 1,5
Vermittlung und Verhalten: 1,4