Colloquium - Details

You will receive information about presentations in time if you subscribe to the newsletter of the Colloquium Communications Technology.

All interested students are cordially invited, registration is not required.

Master-Vortrag: Codierung mit rückwärtsadaptiver linearer Prädiktion und Noise Shaping

Marc Dielissen
23. September 2015
11:00 Uhr
Hörsaal 4G IKS

Im Bereich der Sprachkodierung kommen heutzutage in der Praxis vor allem vorwärtsadaptive Ansätze zur linear-prädiktiven Codierung zum Einsatz. Verglichen mit diesen Ansätzen, bieten rückwärtsadaptive Verfahren zur linear-prädiktiven Quellcodierung den Vorteil, dass keine Prädiktionskoeffizienten von Encoder zu Decoder übertragen werden müssen und dass eine sehr niedrige algorithmische Verzögerung erreicht werden kann, da die Filterkoeffizienten des Analysefilters mit jedem Abtastwert adaptiert werden. Die rückwärtsadaptiven Quellcodierer waren den vorwärtsadaptiven Verfahren in der Vergangenheit jedoch bei der Codierung bei extrem niedrigen Bitraten unterlegen: Zum einen wurde in rückwärtsadaptiven Verfahren  ein sogenanntes Noise-Shaping – die spektrale Gewichtung des Quantisierungsfehlers zur verbesserten psychoakustischen Wahrnehmung - in der Regel nicht eingesetzt. Zum anderen kam hierbei in den meisten Fällen ein skalarer Quantisierer zum Einsatz, der einem vektorbasierten Ansatz unterlegen ist, und auch eine Langzeit-Prädiktion zur Modellierung stimmhafter Sprachanteile wurde nicht angewendet.

In dieser Arbeit wird untersucht, wie das Verfahren der rückwärtsadaptiven linear-prädiktiven Codierung verbessert werden kann. Dazu wird im ersten Teil die typischerweise eingesetzte Struktur eines rückwärts-adaptiven Codierers um ein neuartiges Noise-Shaping Verfahren erweitert. Um eine Bewertung der Auswirkung des Noise-Shapings auch praxisbezogen zu evaluieren, wird das neue Verfahren dann exemplarisch in die Sprachcodecs G.726 und G.722 integriert. Im Kern kommen dabei verschiedene Filterstrukturen zum Einsatz: die ADPCM-, NLMS-, GAL- und eine Block-adaptive Struktur. Abzielend auf eine insgesamt verbesserte lineare Prädiktion, wird darüber hinaus ein Kalman-Filter basierter Ansatz zur rückwärts-adaptiven Steuerung entworfen, umgesetzt und untersucht.     

Im zweiten Teil der Arbeit wird dann das Prinzip der rückwärts-adaptiven linearen Prädiktion in einem weiter gefassten Kontext angewendet: Es wird ein neuartiger Ansatz zur rückwärtsadaptiven Langzeitprädiktion entwickelt, umgesetzt und untersucht, der ähnlich dem Modified-Filtered-X Verfahren aus dem Active Noise Control Bereich ist. Im letzten Teil der Arbeit werden die entwickelten und untersuchten Verfahren zur Quellcodierung schließlich in einem hybriden digital-analogen System mit Noise Shaping eingesetzt und ihre Funktionsweise evaluiert. Insgesamt zeigt sich in objektiven und subjektiven Sprachqualitätsmessungen, dass die vorgeschlagenen neuartigen Verfahren bei gleichbleibender Übertragungsbitrate in Systemen mit rückwärtsadaptiver linear-prädiktiver Quellcodierung zu einer Verbesserung der erreichbaren subjektiven Sprachqualität führen.

back