Colloquium - Details
You will receive information about presentations in time if you subscribe to the newsletter of the Colloquium Communications Technology.
Bachelor-Vortrag: Hörverbesserung von Sprache in gestörten Umgebungen mit Hilfe von psychoakustischen Effekten
Konstantin Zähl
16. November 2016
11:15 Uhr
Hörsaal 4G IKS
Wird bei Kommunikationssystemen Sprache übertragen und auf der Empfängerseite in Schall umgewandelt, so besteht die Gefahr, dass diese von Umgebungsgeräuschen überlagert wird. Dies kann zu einer Verschlechterung der Sprachverständlichkeit und einer erhöhten Höranstrengung führen.
Das Ziel von Near End Listening Enhancement (NELE) ist die Verbesserung von Sprachverständlichkeit in Szenarien wie beispielsweise der mobilen Telefonie. Dazu werden die spektralen Eigenschaften von sowohl Sprach- als auch Störsignal analysiert. Unter Einhaltung von Leistungsbeschränkung werden anschließend die einzelnen Frequenzbänder des Sprachsignals gedämpft oder verstärkt. In dieser Arbeit wurden psychoakustische Effekte und ihr Einfluss auf Sprachverbesserung präsentiert und untersucht. Die Performanz von zwei bereits existenten NELE Algorithmen, SauertA7 und InverseNoise, wurde ausgewertet. Dazu wurden sowohl der Speech Intelligibility Index (SII) als auch der Speech Transmission Index (STI) für verschiedene Szenarien erhoben und verglichen.
In einem ersten Schritt wurden die beiden Algorithmen mit anderen Algorithmen verglichen, die ohne Einbezug der Störung arbeiten. Im Anschluss wurden die verschiedenen Frequenzverstärkungsstrategien der beiden NELE Algorithmen evaluiert. Ziel von SauertA7 ist es, das SII Ergebnis zu maximieren. Nähert sich die Störung in ihrer spektralen Verteilung weißem Rauschen an, so werden Frequenzbänder, die stärker zur Sprachverständlichkeit beitragen oder nur schlecht hörbar sind, auf Kosten von weniger wichtigen Frequenzbändern angehoben. InverseNoise dagegen verteilt die Energie des Sprachsignals so um, dass gerade die wenig gestörten Bereiche verstärkt werden. Sind es vor allem einzelne Frequenzbänder, die sehr stark gestört werden, so kann es vorteilhaft sein diese Frequenzbereiche des Sprachsignals abzuschwächen um dafür die weniger gestörten Bänder zu verstärken und die Leistungsbeschränkung einzuhalten.
Eine Methode, welche abhängig von der Hintergrundstörung bestimmt, welcher der beiden untersuchten NELE Algorithmen bevorzugt zu wählen ist, wurde zusammen mit neuen, psychoakustisch motivierten Frequenzverstärkungsstrategien, vorgeschlagen.
