
摘要:當(dāng)前多聲道數(shù)字音頻系統(tǒng)已經(jīng)發(fā)展成音樂(lè)制作的主流,廣泛應(yīng)用于影院和數(shù)字電視及廣播中,本文分析了多聲道數(shù)字音頻系統(tǒng)發(fā)展的趨勢(shì)及遇到的問(wèn)題,介紹了幾種常見(jiàn)的多聲道音頻編碼方式以及一種先進(jìn)的多聲道音頻質(zhì)量評(píng)估方法。
關(guān)鍵詞:多聲道數(shù)字音頻;AAC;DTS;MC-PEAQ
中圖分類號(hào):G201 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-8122(2011)05-0110-01
隨著數(shù)字時(shí)代的發(fā)展,人們不再滿足于單聲道、立體聲所帶來(lái)的音響效果。存儲(chǔ)媒體容量和傳輸帶寬的增加,使得高質(zhì)量多聲道數(shù)字音頻系統(tǒng)成為新的傳播媒體方式。多聲道數(shù)字音頻系統(tǒng)通過(guò)擴(kuò)展聲道,在提高音頻質(zhì)量的同時(shí),可以給聽(tīng)眾帶來(lái)音像環(huán)繞的效果。當(dāng)前多聲道數(shù)字音頻系統(tǒng)已發(fā)展成音樂(lè)制作的主流,不僅廣泛應(yīng)用于電影院、家庭影院,還滲透到數(shù)字電視和數(shù)字廣播中。
一、多聲道數(shù)字音頻系統(tǒng)面臨的問(wèn)題
采用多聲道數(shù)字音頻系統(tǒng)進(jìn)行音頻傳輸,可以獲得高質(zhì)量的音頻效果。但是從單聲道、雙聲道立體聲等向多聲道的過(guò)渡,對(duì)存儲(chǔ)媒體容量和傳輸帶寬提出了更高的要求。在不影響數(shù)字音頻質(zhì)量的前提下,降低多聲道數(shù)字音頻系統(tǒng)的數(shù)據(jù)率是阻礙多聲道音頻系統(tǒng)發(fā)展的重要問(wèn)題。[1][2]
CD采用線性PCM編碼,一張CD的總的音頻容量低于800MB,其采樣頻率多為FS=44.1kHz,均勻量化的采樣精度為16bit,總數(shù)據(jù)率BCD=1.4112Mbps,對(duì)于一小時(shí)的CD格式的音樂(lè)節(jié)目,其存儲(chǔ)量約為635.04MB。而多聲道數(shù)字音頻系統(tǒng)的總數(shù)據(jù)率BCD=3.5986Mbps,對(duì)于同樣一小時(shí)的音樂(lè)節(jié)目,多聲道數(shù)字音頻系統(tǒng)需要1.62GB的存儲(chǔ)空間,這遠(yuǎn)遠(yuǎn)超過(guò)了CD的存儲(chǔ)容量(<800MB)。同時(shí),傳輸帶寬也給多聲道音頻系統(tǒng)的發(fā)展造成了限制。
二、多聲道數(shù)字音頻系統(tǒng)編碼方式[1][2]
(一)MPEG-2 AAC。AAC是MPEG-2標(biāo)準(zhǔn)中一種非常強(qiáng)大的聲音感知編碼標(biāo)準(zhǔn),可支持48鉻主聲道、16鉻低頻音效加強(qiáng)通道LFE、16個(gè)多語(yǔ)言通道和16個(gè)數(shù)據(jù)流。AAC在壓縮比為11︰1的情況下,即每個(gè)聲道數(shù)據(jù)率為64Kb/s,可以將5.1聲道系統(tǒng)的數(shù)據(jù)率壓縮到320Kb/s而不會(huì)對(duì)音頻質(zhì)量造成較明顯的損害。AAC相對(duì)于MPEG-1 Layer II壓縮率提高了1倍,而且質(zhì)量更高;在保證音效質(zhì)量相同的條件下,與MPEG-2層3相比,AAC的數(shù)據(jù)率僅為其70%。
(二)DTS。DTS相干聲學(xué)編碼是一種最優(yōu)化的差分子音頻編碼方法,系統(tǒng)編解碼電路不對(duì)稱,信號(hào)處理的復(fù)雜措施偏向于由編碼系統(tǒng)負(fù)擔(dān)。DTS系統(tǒng)可以在壓縮比為4︰1的情況下提供高質(zhì)量的多聲道音頻信息。
三、一種多聲道音頻質(zhì)量評(píng)估方法
在多聲道音頻系統(tǒng)中,聲道間存在著相關(guān)度和冗余度,采用Karhunen-Loeve變換(KLT)可以有效去除聲道間的相關(guān)度,進(jìn)一步減小數(shù)據(jù)率。為了評(píng)價(jià)在編碼前采取KLT去除聲道相關(guān)度的好處,提出了一種多聲道音效質(zhì)量評(píng)估的MC-PEAQ方法。MC-PEAQ利用某一通道的解碼多聲道信號(hào)和揚(yáng)聲器的預(yù)定安置位置,重建監(jiān)聽(tīng)點(diǎn)的音頻場(chǎng)。此外,還引入了外耳和身體對(duì)人類聽(tīng)覺(jué)過(guò)程中聲源定位的影響作用,從而可以獲得含壓縮效應(yīng)和空間信息的雙聲道信號(hào)。雙聲道信號(hào)最終輸入到標(biāo)準(zhǔn)PEAQ,輸出質(zhì)量檢測(cè)(MC-ODG),原理如圖1所示。
圖1多聲道PEAQ原理示意圖[3]
隨著多聲道音頻編碼技術(shù)的改進(jìn)和發(fā)展,使得多聲道數(shù)字音頻系統(tǒng)多聲道高質(zhì)量傳輸音頻成為可能,在今后的數(shù)字廣播發(fā)展中,不受帶寬限制,可提供更高質(zhì)量、更多聲道的多聲道數(shù)字音頻系統(tǒng)會(huì)占據(jù)主導(dǎo)地位。
參考文獻(xiàn):
[1]胡澤.多聲道數(shù)字音頻系統(tǒng)的編碼及應(yīng)用[J].北京廣播學(xué)院學(xué)報(bào)(自然科學(xué)版),2001(3).
[2]吳帆,朱偉.多通道音頻壓縮編碼原理及應(yīng)用[J].數(shù)字音頻,2003(11).
[3]Soledad Torres-Guijarro, Jon A. Beracoechea-Aacute;lava, Luis I. Ortiz- Berenguer, et al. Inter-channel de-correlation for perceptual audio coding [J]. Applied Acoustics,2005.