RWTH Aachen
University
Institut für Nachrichtengeräte
und Datenverarbeitung
Prof. Dr.-Ing. P. Vary
Direkt zum Inhalt
Direkt zur Navigation
Startseite
  • Deutsch
  • English
Zur Hauptseite

Kolloquium Kommunikationstechnik

Sie werden über Vorträge rechtzeitig per E-Mail informiert werden, wenn Sie den Newsletter des kommunikationstechnischen Kolloquiums abonnieren.

Donnerstag 10. November 2016 10:00

16.11.2016 -Vortrag: Hörverbesserung von Sprache in gestörten Umgebungen mit Hilfe von psychoakustischen Effekten

Vortragender:

Konstantin Zähl, Bachelorstudent

Thema: 

"Hörverbesserung von Sprache in gestörten Umgebungen mit Hilfe von psychoakustischen Effekten"

Datum:

Mittwoch, 16. November 2016

Zeit:

11:15 Uhr

Ort:

Hörsaal 4G des IKS

Wird bei Kommunikationssystemen Sprache übertragen und auf der Empfängerseite in Schall umgewandelt, so besteht die Gefahr, dass diese von Umgebungsgeräuschen überlagert wird. Dies kann zu einer Verschlechterung der Sprachverständlichkeit und einer erhöhten Höranstrengung führen.

Das Ziel von Near End Listening Enhancement (NELE) ist die Verbesserung von Sprachverständlichkeit in Szenarien wie beispielsweise der mobilen Telefonie. Dazu werden die spektralen Eigenschaften von sowohl Sprach- als auch Störsignal analysiert. Unter Einhaltung von Leistungsbeschränkung werden anschließend die einzelnen Frequenzbänder des Sprachsignals gedämpft oder verstärkt.

In dieser Arbeit wurden psychoakustische Effekte und ihr Einfluss auf Sprachverbesserung präsentiert und untersucht. Die Performanz von zwei bereits existenten NELE Algorithmen, SauertA7 und InverseNoise, wurde ausgewertet. Dazu wurden sowohl der Speech Intelligibility Index (SII) als auch der Speech Transmission Index (STI) für verschiedene Szenarien erhoben und verglichen.

In einem ersten Schritt wurden die beiden Algorithmen mit anderen Algorithmen verglichen, die ohne Einbezug der Störung arbeiten. Im Anschluss wurden die verschiedenen Frequenzverstärkungsstrategien der beiden NELE Algorithmen evaluiert. Ziel von SauertA7 ist es, das SII Ergebnis zu maximieren. Nähert sich die Störung in ihrer spektralen Verteilung weißem Rauschen an, so werden Frequenzbänder, die stärker zur Sprachverständlichkeit beitragen oder nur schlecht hörbar sind, auf Kosten von weniger wichtigen Frequenzbändern angehoben.

InverseNoise dagegen verteilt die Energie des Sprachsignals so um, dass gerade die wenig gestörten Bereiche verstärkt werden. Sind es vor allem einzelne Frequenzbänder, die sehr stark gestört werden, so kann es vorteilhaft sein diese Frequenzbereiche des Sprachsignals abzuschwächen um dafür die weniger gestörten Bänder zu verstärken und die Leistungsbeschränkung einzuhalten.

Eine Methode, welche abhängig von der Hintergrundstörung bestimmt, welcher der beiden untersuchten NELE Algorithmen bevorzugt zu wählen ist, wurde zusammen mit neuen, psychoakustisch motivierten Frequenzverstärkungsstrategien, vorgeschlagen.

Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht erforderlich.