Machine Learning for Speech and Audio Processing

Dozent: Prof. Dr.-Ing. Peter Jax

Ansprechpartner: Lars Thieling, Maximilian Kentgens

Typ: Master-Vorlesung

Credits: 4

Vorlesung in RWTHonline
Übung in RWTHonline
Lernraum RWTHmoodle
(Anmeldung über RWTHonline)

Vorlesungssprache: Englisch

Unterlagen:
Die Folien zur Vorlesung werden in der ersten Vorlesung sowie von Irina Ronkartz verkauft. Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.

Termine

Bei Terminänderungen, bezüglich der aktuellen Situation, zum Start der Vorlesung und Übung werden Sie über RWTHmoodle informiert.

Vorlesung:

ab Freitag, 17. April 2020
08:30 - 10:00 Uhr
Hörsaal FT

Die Vorlesung findet ab dem 17.04.2020 online statt.
Weitere Informationen dazu über RWTHmoodle.

Übung:

ab Freitag, 17. April 2020
10:15 - 11:00 Uhr
Hörsaal FT

Die Übung findet ab dem 17.04.2020 online statt.
Weitere Informationen dazu über RWTHmoodle.

Prüfung

Die Prüfung findet im WS 2019/20 unter Vorbehalt am 22.04. und 29.04. von 11-12 und 14-16 Uhr mündlich statt. Terminvergabe bei Simone Sedgwick (sedgwick@iks.rwth-aachen.de).

Bitte beachten: Bringen Sie bitte Ihren Studierendenausweis (BlueCard) mit!

Klausur SS2020:
Donnerstag, 20. August 2020

08:30 - 10:00 Uhr
AM Großer Hörsaal

Prüfungsdauer: 1,5 Stunden

Anmerkung: Es handelt sich um eine schriftliche Prüfung. Dieser Termin bezieht sich auch auf die schriftlichen Leistungsnachweise.

Hilfsmittel: Zur Lösung der Klausur sind alle Hilfsmittel außer programmierbare Taschenrechner und Kommunikationsgeräte erlaubt.

Bitte beachten: Bringen Sie bitte Ihren Studierendenausweichs (BlueCard) mit.

Die neue Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Ab dem Sommersemester 2019 ist die Veranstaltung MLSAP im ELECTIVE Katalog der Vertiefungsrichtungen „Communications Engineering“ (COMM), „Computer Engineering“ (COMP) und „Systems and Automation“ (SYAT) kurrikular verankert.

Inhalt der Vorlesung

Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:

  • Klassifikations- und Schätzungsverfahren
    • Grundlegende Probleme der Klassifikation
    • Techniken zur Merkmalsextraktion
    • Grundlegende Klassifikationsverfahren
  • Statistische Modellierung
    • Stochastische Prozesse und Modelle
    • Gaussian Mixture Models (GMMs)
    • Hidden Markov Models (HMMs)
    • Trainingsmethoden
    • Bayes'sche  Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
    • Partikelfilter
  • Nicht-negative Matrixfaktorisierung
    • Dictionary‐basiertes Konzept
  • Neuronale Netze und Deep Learning
    • Feed-Forward Neuronale Netze
    • Grundlegende Anwendungen
    • Lernstrategien: Supervised vs. Unsupervised vs. Reinforcement Learning
    • Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent
    • Lernverhalten und die "Magie" von Hyper-Parametern
    • Generative Networks im Gegensatz zu gerichteten Graphen
    • Von "Shallow" bis "Deep": Der Kompromiss zwischen Verständlichkeit und Performance
    • Spezielle Netzwerkarchitekturen
    • Anwendungen aus der Signalverarbeitung
    • Interpretation und Realisierung

In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.

Evaluierung

Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.

Sommersemester 2019

Teilnehmer an der Evaluierung (Vorlesung/Übung): 32/32

Vorlesung:
Globalindikator: 1,3
Konzept der Vorlesung: 1,4
Vermittlung und Verhalten: 1,3

Übung:
Globalindikator: 1,4
Konzept der Übung: 1,5
Vermittlung und Verhalten: 1,4

MLSAP_Vorlesung_SS19.pdf
MLSAP_Uebung_SS19.pdf