徐 寧,殷海兵,郭龍盛
(中國計量學(xué)院信息工程學(xué)院,浙江杭州310018)
視頻編碼標準H.264/AVC的測試模型采用基于拉普拉斯分布的二次R-Q模型。編碼過程中,通過碼率控制分配編碼比特,獲得量化參數(shù)QP,并且獲得率失真參數(shù)λ進行率失真優(yōu)化,而QP和λ是影響視頻編碼效率的關(guān)鍵因素。視頻實時傳輸,緩沖區(qū)十分有限,幀級碼流控制不能精確控制,宏塊級碼流控制更為精細[1],而進行運動估計、模式選擇需要用到率失真參數(shù)λ。因此,R-Q模型宏塊級應(yīng)用尤為重要。
實驗證明,DCT系數(shù)統(tǒng)計概率分布符合一定的概率密度函數(shù),據(jù)此建立R-Q模型。早期,學(xué)者們認為DCT系數(shù)中的AC系數(shù)符合高斯分布。后來,學(xué)者相繼提出拉普拉斯分布、廣義高斯分布和柯西分布,其中拉普拉斯分布應(yīng)用廣泛[2]。運用以上這些分布進而推導(dǎo)相應(yīng)的R-Q模型。
關(guān)于R-Q模型的研究很多,文獻[1-2]基于柯西分布提出R-Q模型;文獻[3]提出一種基于拉普拉斯分布的R-Q模型;文獻[4]和文獻[5]分別對文獻[3]中的R-Q模型進行改進、優(yōu)化。文獻[6]基于文獻[2]提出一種新的R-Q模型;文獻[7]提出一種基于廣義高斯分布的R-Q模型。文獻[8]根據(jù)碼率與零值在變換系數(shù)量化后所占百分比之間的關(guān)系,提出一種新的模型。本文主要對4種主流R-Q模型宏塊級精準度和復(fù)雜度進行分析。
運用拉普拉斯分布概率密度函數(shù)推導(dǎo)出率失真函數(shù)R(D),對其進行泰勒級數(shù)展開、簡化得到[3]

式(2)為式(1)的應(yīng)用

文獻[4]對式(2)進行改進、簡化,得

式中,參數(shù)p與編碼幀類型有關(guān)。
文獻[2]作者根據(jù)柯西分布概率密度函數(shù),理論推導(dǎo),簡化R-Q模型為

式中,參數(shù)p與編碼幀熵值有關(guān)。
文獻[7]詳細敘述了此模型,用于編碼比特預(yù)測,降低模式選擇復(fù)雜度。此模型理論推導(dǎo)與上述模型不同,首先根據(jù)廣義高斯分布概率密度函數(shù)計算像素點自信息,然后根據(jù)塊自信息預(yù)測編碼比特,整個過程參數(shù)多、運算復(fù)雜,即使大部分數(shù)值采用查表方式獲得。式(5)是塊自信息與編碼比特之間的表達式

式中,rB代表塊信息量。
對式(2),(3),(4)和(5)4種R-Q模型進行測試、比較。
本節(jié)通過實驗對上述4種R-Q模型宏塊級精準度進行分析。MAD model,SATD model,Cauchy model,GGD model分別代表基于拉普拉斯分布的R-Q模型、基于拉普拉斯分布的改進R-Q模型、基于柯西分布的R-Q模型及基于廣義高斯分布的R-Q模型。本實驗采用JM12.0作為測試代碼,測試條件:RDOptimization=1,RateControlEnable=0,SearchRange=16,ProfileIDC=77,NumberReferenceFrames=1。
圖1~4分別表示4種模型誤差分布情況,橫坐標表示預(yù)測產(chǎn)生的誤差,縱坐標表示擁有相應(yīng)誤差的宏塊數(shù)目,可以大概看出,較之其他3幅圖,圖3誤差分布范圍窄,精準度高。

圖1 SATD模型誤差分布

實驗分別測試qcif,cif,720p這3種分辨力序列。表1~4給出4種R-Q模型在不同分辨力序列下比較的詳細信息。各表表身第2~5列測試數(shù)據(jù)是4種模型預(yù)測誤差率在20%以內(nèi)的概率。第2列數(shù)據(jù)數(shù)值比其他3列高,基于廣義高斯分布R-Q模型的精準度之所以如此高,正如第1節(jié)所述,此模型依據(jù)廣義高斯分布概率密度函數(shù)計算像素點自信息,進而預(yù)測編碼比特;而其他3種模型的預(yù)測是根據(jù)相應(yīng)的概率密度函數(shù),計算熵值(自信息均值),然后預(yù)測編碼比特。
各表第6,7列數(shù)據(jù)分別等于第3,4列數(shù)據(jù)之差和第4,5列數(shù)據(jù)之差。從第6列數(shù)據(jù)來看,基于柯西分布的R-Q模型與基于拉普拉斯分布的R-Q改進模型差別很小,式(3)和式(4)結(jié)構(gòu)相似,但參數(shù)賦值不同,式(4)參數(shù)是根據(jù)已編碼宏塊信息設(shè)定,式(3)參數(shù)包含當前編碼宏塊復(fù)雜度信息SATD,這是式(3)比式(4)精準度高的一個原因。由第7列數(shù)據(jù),結(jié)合式(2)和式(3),基于拉普拉斯分布的R-Q改進模型,無論從精準度還是復(fù)雜度方面,要比之前的模型好。

表1 4種模型的測試數(shù)據(jù)1(qcif分辨力序列)

表2 4種模型的測試數(shù)據(jù)2(cif分辨力序列)

表3 4種模型的測試數(shù)據(jù)3(720p分辨力序列)

表4 4種模型的測試數(shù)據(jù)4(qcif mobile序列)
表4說明了量化后為零的系數(shù)占的比例(percentage of zero)對于R-Q模型精準度的影響。這4行數(shù)據(jù)是qcif的mobile序列在QP分別為28,32,34,36下的測試數(shù)據(jù)。從這些數(shù)據(jù)可以看出,隨著QP的增大,percentage of zero增大,R-Q模型精準度下降。依據(jù)建立4種R-Q模型的推導(dǎo)過程,可以認為理論上量化后為零的系數(shù)都參與了編碼比特預(yù)測,而在實際編碼過程中,并不是所有量化后為零的系數(shù)都貢獻編碼比特,為零的系數(shù)理論概率值與實際存在差別,因此4種模型的精準度有所下降,但這并不是唯一導(dǎo)致精準度下降的原因。
表1~3中*1、*2和*3行數(shù)據(jù)分別是qcif,cif和720p測試序列每列數(shù)據(jù)的均值。從上述3行數(shù)據(jù)來看,720p測試序列4種模型的預(yù)測精準度不及qcif,cif測試序列。這與測試序列內(nèi)容有關(guān):720p的測試序列視頻內(nèi)容平坦,無劇烈運動,時間相關(guān)性強,因此,量化后為零的系數(shù)所占的比例(percentage of zero)較其他2種分辨力測試序列高。
從第2列數(shù)據(jù)看到,測試序列football的精準度最低,但它的percentage of zero不是最高的,這說明系數(shù)為零的比例并不是影響R-Q模型精準度的唯一原因。測試序列football較之其他測試序列,時間相關(guān)性不強,場景變化快;而4種R-Q模型參數(shù)根據(jù)已編碼宏塊信息設(shè)定,也就是系數(shù)準確度受到時間相關(guān)性影響,因此football精準度較之其他測試序列低;這列數(shù)據(jù)中cif的mobile的精準度最高。此測試序列內(nèi)容空間復(fù)雜度較之其他測試序列高,percentage of zero較之其他測試序列低,實際量化后系數(shù)為零的概率與理論值差值小,因此,此測試序列的精準度高。
實驗證明:1)因為上述R-Q模型是由概率密度函數(shù)計算自信息或熵值(自信息均值),預(yù)測編碼比特數(shù),理論上量化后系數(shù)為零的概率與實際概率存在差別,所以存在誤差。2)產(chǎn)生誤差的另外一個原因是,R-Q模型系數(shù)準確度的影響。由于上述R-Q模型系數(shù)由已編碼宏塊信息設(shè)定,因此若測試序列時間相關(guān)性不強,則影響到系數(shù)準確度,進而影響R-Q模型精準度。
根據(jù)R-Q模型結(jié)構(gòu)把4種模型分為兩類:
1)基于廣義高斯分布R-Q模型:此模型參數(shù)計算和更新分為自信息參數(shù)更新和預(yù)測編碼比特參數(shù)更新,根據(jù)相鄰參考幀內(nèi)容計算自信息參數(shù)更新,而預(yù)測編碼比特的參數(shù)更新運用線性回歸方法計算。此模型共有18個參數(shù)進行計算和更新,每幀自信息參數(shù)計算和更新復(fù)雜度為16×(1次×指數(shù)+1次×對數(shù)+2次×除法)運算。每個宏塊的預(yù)測編碼比特參數(shù)計算和更新復(fù)雜度為2×(1次×指數(shù)+1次×乘法)運算,此模型精準度高,適合于編碼比特預(yù)測,但復(fù)雜度高不適合用于碼率控制。
2)其他3種R-Q模型:每種模型只擁有一個計算和更新的參數(shù),當前編碼宏塊采用已編碼幀對應(yīng)宏塊的參數(shù)進行運算、宏塊編碼之后,運用實際編碼比特進行參數(shù)更新,每個宏塊預(yù)測編碼比特的參數(shù)計算和更新復(fù)雜度為1×(1次×指數(shù)+1次×除法)運算;雖然3種模型精度不及前一種模型,但復(fù)雜度低,適合用于碼率控制。
本文對4種R-Q模型宏塊級精準度進行分析。1)分析4種模型的推導(dǎo)過程,基于廣義高斯分布的R-Q模型與其他3種模型推導(dǎo)過程有所區(qū)別。因為兩者的用途不同,前者用于編碼比特預(yù)測,精準度高,但運算復(fù)雜,而后者用于碼率控制進行碼率分配、QP選擇。2)4種R-Q模型產(chǎn)生預(yù)測誤差的原因有兩個:(1)DCT系數(shù)統(tǒng)計分布中,系數(shù)為零的概率理論值與實際的概率不符;(2)R-Q模型參數(shù)的準確度受到視頻內(nèi)容時間相關(guān)性影響。
綜合上述分析,R-Q模型精準度受到兩方面因素影響,有待于進一步改進。本文為改進R-Q模型及提出新的R-Q模型和優(yōu)化碼率控制算法提供了基礎(chǔ)的數(shù)據(jù)分析,并且將R-Q模型用于模式選擇中編碼比特數(shù)預(yù)測復(fù)雜度過高,需進一步簡化。
[1]SANZ-RODRIGUEZ S,DEL-AMA-ESTEBAN O,DE-FRUTOS-LOPEZ M,et al.Cauchy-density-based basic unit layer rate controller for H.264/AVC[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(8):1139-1143.
[2]KAMACI N,ALUNBASAK Y,MERSEREAU R M.Frame bit allocation for the H.264/AVC Video coder via cauchy-density-based rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(8):994-1005.
[3]CHIANG T,ZHANG Ya-qin.A new rate control scheme using quadratic rate distortion model[J].IEEE Trans.Circuits Syst.Video Technol.,1997,7(1):246-250.
[4]KWON D K,SHEN M Y,KUO C C J.Rate control for H.264 video with enhanced rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2007,17(5):517-529.
[5]MA Siwei,GAO Wen,LU Yan.Rate-distortion analysis for H.264/AVC video coding and its application to rate control[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(12):1533-1544.
[6]HU Sudeng,WANG Hanli,KWONG S,et al.Frame level rate control for H.264/AVC with novel rate-quantization model[C]//Proc.IEEE International Conference on Multimedia & Expo.Singapore,2010.[S.l.]:IEEE Press,2010:226-231.
[7]ZHAO Xin,SUN Jun,MA Siwei,et al.Novel statistical modeling,analysis and implementation of rate-distortion estimation for H.264/AVC Coders[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(5):647-660.
[8]李浩,張穎,張兆揚.一種H.264視頻編碼碼率控制方法[J].電視技術(shù),2003,27(12):10-20.