Publications-Detail

Skalierbare Sprachcodierung auf Basis der Wavelet-Transformation

Authors:
Stegmann, J.
Editors:
Vary, P.
Ph. D. Dissertation
 
School:
IND, RWTH Aachen
Adress:
Templergraben 55, 52056 Aachen
Series:
Aachener Beiträge zu Digitalen Nachrichtensystemen (ABDN)
Number:
13
Date:
2000
Language:
German

Abstract

In dieser Arbeit werden skalierbare Sprachcodierungsverfahren entwickelt, deren Bitraten durch Vorgaben des Telekommunikationsnetzes (z.B. Mobilfunk, Internet) innerhalb eines großen Bereichs dynamisch variiert werden können. Wegen der angestrebten niedrigen Bitraten von weniger als 1,5 Bit pro Abtastwert werden modellgestützte hybride Codierverfahren mit linearer Prädiktion im Zeitbereich und konstanter Bitrate für die Prädiktionsfilter zugrunde gelegt.
Die Skalierbarkeit der Bitrate wird durch Transformationscodierung des Residualsignals mit adaptiver Bitzuteilung erreicht. Mit Hilfe der Wavelet-Transformation wird eine Oktavband-Zerlegung des Residualsignals durchgeführt. Man erreicht dadurch eine hohe Frequenzauflösung für Teilbänder mit niedriger Mittenfrequenz. Die Maskierungseigenschaften des Gehörs können ähnlich wie bei Frequenzbereichs-Codierung vorteilhaft genutzt werden.
Es werden die Eigenschaften der diskreten Wavelet-Transformation diskutiert und mit denen der Spektral-Transformationen auf Basis der diskreten Cosinus-Transformation hinsichtlich ihrer Eignung für den Einsatz in einem prädiktiven Transformationscodierverfahren verglichen.
Schließlich wird ein prädiktives Transformationscodierverfahren auf Basis der Wavelet-Transformation entwickelt, das für den Betrieb zwischen 4 und 32 kbit/s geeignet ist. Die Bitrate kann dabei in Schritten con minimal 0,05 kbit/s mit einer Zeitaufläsung von 20 ms skaliert werden. Das Verfahren wird bezüglich Sprachqualität und Komplexität mit verschiedenen Sprachcodec-Standards verglichen.

Download

BibTeX