Machine Learning for Speech and Audio Processing (Neu!)

Dozent: Prof. Dr.-Ing. Peter Jax

Ansprechpartner: Lars Thieling, Maximilian Kentgens

Typ: Master-Vorlesung

Credits: 4

Veranstaltung in Campus
Lernraum L2P
(Anmeldung über Simone Sedgwick)

Vorlesungssprache: Englisch

Unterlagen:
Skripte und Übungsaufgaben werden vorlesungsbegleitend zur Verfügung gestellt.

Termine

Vorlesung:

ab Freitag, 5. April 2019
08:30 - 10:00 Uhr
Hörsaal 4G

Übung:

ab Freitag, 5. April 2019
10:15 - 11:00 Uhr
Hörsaal 4G

Sprechstunden:

Bei Bedarf bitte mit Themenangabe an Lars Thieling wenden.

Prüfung

Donnerstag, 1. August 2019
09:00-10:30
Hörsaal Aula 2

Hilfsmittel: Hilfsmittel wie Vorlesungsunterlagen oder Bücher sind nicht zugelassen.

Bitte beachten: Bringen Sie bitte Ihren Studierendenausweis (BlueCard) mit!

Die neue Vorlesung "Machine Learning for Speech and Audio Processing (MLSAP)" richtet sich insbesondere an Studierende im Master-Studiengang "Elektrotechnik, Informationstechnik und Technische Informatik". Ab dem Sommersemester 2019 ist die Veranstaltung MLSAP im ELECTIVE Katalog der Vertiefungsrichtungen „Communications Engineering“ (COMM), „Computer Engineering“ (COMP) und „Systems and Automation“ (SYAT) kurrikular verankert.

ACHTUNG: Aufgrund der umfangreichen Umstellungen in RWTHonline ist die Veranstaltung leider noch nicht in den Modulkatalogen sichtbar. Interessierte Studierende können die Veranstaltung dennoch als reguläres Wahlpflichtfach aus dem ELECTIVE Katalog belegen. Bei Fragen stehen wir gerne zur Verfügung.

Inhalt der Vorlesung

Die einsemestrige Vorlesung behandelt Themen des maschinellen Lernens mit Anwendungen für Probleme der Sprach- und Audiosignalverarbeitung:

  • Klassifikations- und Schätzungsverfahren
    • Grundlegende Probleme der Klassifikation
    • Techniken zur Merkmalsextraktion
    • Grundlegende Klassifikationsverfahren
  • Statistische Modellierung
    • Stochastische Prozesse und Modelle
    • Gaussian Mixture Models (GMMs)
    • Hidden Markov Models (HMMs)
    • Trainingsmethoden
    • Bayes'sche  Wahrscheinlichkeitstheorie: Klassifikation und Schätzung
    • Partikelfilter
  • Nicht-negative Matrixfaktorisierung
    • Dictionary‐basiertes Konzept
  • Neuronale Netze und Deep Learning
    • Feed-Forward Neuronale Netze
    • Grundlegende Anwendungen
    • Lernstrategien: Supervised vs. Unsupervised vs. Reinforcement Learning
    • Training der synaptischen Gewichte: Backpropagation und Stochastic Gradient Descent
    • Lernverhalten und die "Magie" von Hyper-Parametern
    • Generative Networks im Gegensatz zu gerichteten Graphen
    • Von "Shallow" bis "Deep": Der Kompromiss zwischen Verständlichkeit und Performance
    • Spezielle Netzwerkarchitekturen
    • Anwendungen aus der Signalverarbeitung
    • Interpretation und Realisierung

In der begleitenden Übung werden einzelne Themen unter praktischen Randbedingungen anhand von Beispielen vertieft.

Evaluierung

Hier werden die letzten Evaluierungsergebnisse für die Lehrveranstaltung "Machine Learning for Speech and Audio Processing" zusammengefasst.

Sommersemester 2018

Teilnehmer an der Evaluierung: 12
Globalindikator: 1,3

Vorlesung:
Konzept der Vorlesung: 1,2
Vermittlung und Verhalten: 1,3

Übung:
Konzept der Übung: 1,5
Vermittlung und Verhalten: 1,3

MLSAP_Vorlesung_Uebung_SS18.pdf