Machine Learning for Speech and Audio Processing

Dozent: Prof. Dr.-Ing. Peter Jax

Ansprechpartner: Lars ThielingJörn Erik Fleischhauer

Typ: Master-Vorlesung

Credits: 4

Anmeldung über RWTHonline

Vorlesungssprache: Englisch

Unterlagen:
Die Folien zur Vorlesung und Übungsaufgaben werden in RWTHmoodle zur Verfügung gestellt.

Termine

Vorlesung:

ab Freitag, 8. April 2022
08:30 - 10:00 Uhr
Hörsaal 4G

Übung:

ab Freitag, 8. April 2022
10:15 - 11:00 Uhr
Hörsaal 4G

Sprechstunden:

Termine werden individuell vergeben.

Prüfung

Die Prüfung findet im WS 23 am Mittwoch, den 1.3.2023 mündlich im IKS statt. Terminvergabe bei Simone Sedgwick. (sedgwick(at)iks.rwth-aachen.de)

Bitte beachten: Bringen Sie bitte Ihren Studierendenausweis (BlueCard) mit!

Die Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Die formale Verknüpfung zu den Modulkatalogen ist in RWTHonline zu finden.

Inhalt der Vorlesung

Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:

  • Klassifikations- und Schätzungsverfahren
    • Grundlegende Probleme der Klassifikation
    • Techniken zur Merkmalsextraktion
    • Grundlegende Klassifikationsverfahren
  • Statistische Modellierung
    • Stochastische Prozesse und Modelle
    • Gaussian Mixture Models (GMMs)
    • Hidden Markov Models (HMMs)
    • Trainingsmethoden
    • Bayes'sche  Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
    • Partikelfilter
  • Nicht-negative Matrixfaktorisierung
    • Dictionary‐basiertes Konzept
  • Neuronale Netze und Deep Learning
    • Feed-Forward Neuronale Netze
    • Grundlegende Anwendungen
    • Lernstrategien: Supervised vs. Unsupervised vs. Reinforcement Learning
    • Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent
    • Lernverhalten und die "Magie" von Hyper-Parametern
    • Generative Networks im Gegensatz zu gerichteten Graphen
    • Von "Shallow" bis "Deep": Der Kompromiss zwischen Verständlichkeit und Performance
    • Spezielle Netzwerkarchitekturen
    • Anwendungen aus der Signalverarbeitung
    • Interpretation und Realisierung

In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.

Evaluierung

Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.

Sommersemester 2020

Teilnehmer an der Evaluierung5

Vorlesung:
Globalindikator: 1,6
Konzept der Vorlesung: 1,5
Vermittlung und Verhalten: 1,6

 

 

MLSAP_Vorlesung_SS22.pdf