Publications-Detail

HD-Voice-3D: Herausforderungen und Lösungen bei der Audiosignalverarbeitung

Authors:
Rüngeler, M.Krüger, H. ,  Behler, G. ,  Vary, P.
Book Title:
Workshop Audiosignal- und Sprachverarbeitung (WASP)
Organization:
Gesellschaft für Informatik
Pages:
p.p. 2972-2986
Date:
Sep. 2013
Note:

Workshop im Rahmen der 43. Jahrestagung der Gesellschaft für Informatik

Language:
German

Abstract

Der Übergang von Schmalband-Sprache zu Breitband-Sprache mit höherer Qualität - auch bezeichnet als HD-Voice - in öffentlichen Telefonnetzen war und ist (immer noch) ein steiniger Weg: Telekommunikationsanbieter fürchten zusätzliche Investitions- und Betriebskosten durch Einführung neuer Technologien mehr, als dass sie einen Vorteil in höherer Kommunikationsqualität im Kundensinne und damit Kundenzufriedenheit suchen.
Erst die Einführung von neuartigen Voice-over-Internet-Protocol (VoIP) Anwendungen im Zuge der weiten Verbreitung hochratiger Internetanschlüsse, in denen fast ausschliesslich HD-Voice-Technologie zum Einsatz kommt, scheint hier gerade einen Durchbruch zu schaffen, der zu einem Umdenken führt.
Aber was kommt nach HD-Voice? Wir denken, dass es HD-Voice-3D ist - auch bezeichnet als Binaurale Telefonie -, die den nächsten evolutionären Schritt darstellen wird. Dabei werden durch die Übertragung von Binauralsignalen anstatt monauraler Signale nicht nur die Inhalte von Sprache an sich, sondern auch die Atmosphäre und die akustische Umgebung realitätsnah von einem zum anderen Ende transportiert. Das Resultat ist das Gefühl, mit den Ohren des Kommunikationspartners zu hören - so als wäre man wirklich vor Ort. Der Vorteil bei HD-Voice-3D gegenüber einer Stereoübertragung liegt darin, dass nicht nur die Unterscheidung zwischen Signalen von links und rechts, sondern auch von oben, unten, hinten und vorne ermöglicht wird. Der Grund liegt in der binauralen Aufnahmetechnik, die durch Abschattungs-, Beugungs- und andere Filtereffekte an Korpus, Kopf und Ohren eine natürliche räumliche Klangwahrnehmung erreicht.
In Bezug auf die Sprach/Audiosignalverarbeitung muss bei der Binauralen Telefonie jedoch im Vergleich zur Signalverarbeitung bei der monauralen Telefonie einiges beachtet werden, um die sogenannten „Binauralen Cues“, also bestimmte Eigenschaften des binauralen Audiosignals die zu einem realistischen räumlichen Eindruck bei der Perzeption der übertragenen Signale führen, nicht zu zerstören.
In diesem Paper werden typische Funktionalitäten eines binauralen VoIP-Terminals vorgestellt, ihre Auswirkung auf Binauralsignale diskutiert und erste Lösungsansätze präsentiert. Weiter wird die Thematik mittels eines Echzeit-Demonstrators vertieft, der auf dem WASP-Event „HD-Voice-3D zum Anfassen“ vorgestellt werden soll.

Download

BibTeX

Copyright © by IKS
ruengeler2013c.pdf
This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each author's copyright. In most cases, these works may not be reposted without the explicit permission of the copyright holder.