Publications-Detail

Breitbandige Sprachcodierung: Zeitbereichs- und Frequenzbereichskonzepte

Authors:
Schnitzler, J.
Editors:
Vary, P.
Ph. D. Dissertation
 
School:
IND, RWTH Aachen
Adress:
Templergraben 55, 52056 Aachen
Series:
Aachener Beiträge zu Digitalen Nachrichtensystemen (ABDN)
Number:
12
Date:
Jul. 1999
Language:
German

Abstract

Heutige digitale Sprachübertragungssysteme im Bereich des Festnetzes und des Mobilfunks zeichen sich meist durch eine Beschränkung auf die Frequenzbandbreite von 0.3-3.4 kHz des analogen Telefonnetzes aus. Die zur Übertragung zulässige Datenrate wird dabei gegebenenfalls mit Hilfe einer Codierung reduziert. In der vorliegenden Arbeit werden Verfahren der digitalen Signalverarbeitung behandelt, mit denen breitbandige (0.05-7kHz) Sprachsignale bei niedrigen Datenraten (um 1Bit pro Abtastwert) codiert werden können. Die untersuchten Algorithmen zielen auf Anwendung im Bereich einer qualitativ hochwertigen Sprachübertragung, z.B. für verbesserte mobile und leitungsgebundene Telefonnetze oder Bildtelefonie- und Videokonferenzsysteme. Die genannten Anwendungen bedingen zum Teil Sekundäranforderungen z.B. bezüglich der Übertragung von Hintergrundgeräuschen und Musiksignalen, so dass die breitbandige Sprachcodierung eine Zwischenstellung zwischen der traditionellen Telefonsprachcodierung und der Audiocodierung einnimmt. In dieser Arbeit werden daher Konzepte aus beiden Bereichen, d.h. sprachmodellgestützte parametrische Zeitbereichsalgorithmen und psychoakustisch motivierte Frequenzbereichsverfahren sowei mögliche Kombinationsansätze untersucht. Einige Ergebnisse der Arbeit sind in Vorschläge für die Standardisierung eines breitbandigen Codecs für Sprach- und Musiksignale bei 16, 24 und 32 kBit/s (Standardisierungsvorhaben ITU-T Q.20/16) sowie in eine für die europäische Standardisierungsinstitution ETSI durchgeführte Studie zur breitbandigen Codierung im GSM-Mobilfunksystem eingebracht worden. Im Zusammenhang mit Zeitberichsverfahren stellt vor allem das auf einem Modell der Spracherzeugung beruhende Verfahren der linear-prädiktiven Analyse-durch-Synthese (AdS) Codierung im Mittelpunkt. Im Hinblick auf eine Frequenzbereichsdarstellung werden die grundlegenden Konzepte der Teilband- und Transformationscodierung betrachtet und Analogien zur prädiktiven Codierung im Zeitbereich diskutiert. Bei der Kombination von Zeit- und Frequenzbereichsansätzen werden mehrere Lösungsansätze untersucht, die nicht nur eine verbesserte Sprachqualität unter unterschiedlichen Einsatzbedingungen gewähren, sondern auch den Entwurf von bezüglich Bitrate und Bandbreite skalierbaren Systemen gestatten.

Download

BibTeX