404 Not Found

nginx 404 Not Found

404 Not Found

nginx

AVS2視頻編碼碼率控制算法

2016-09-07 01:10:26羅敏珂周益民

系統(tǒng)工程與電子技術(shù) 2016年9期

關(guān)鍵詞：模型

羅敏珂, 周益民,, 鐘　敏, 朱　策

(1. 電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,四川成都 611731； 2. 電子科技大學(xué)機(jī)器人研究中心,四川成都 611731)

AVS2視頻編碼碼率控制算法

羅敏珂1, 周益民1,2, 鐘敏1, 朱策2

(1. 電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,四川成都 611731； 2. 電子科技大學(xué)機(jī)器人研究中心,四川成都 611731)

碼率控制是視頻圖像編碼技術(shù)中的重要組成部分,旨在受限的通信帶寬下提供最小失真的圖像質(zhì)量同時(shí)保證比特流的平穩(wěn)輸出,長期以來既是研究重點(diǎn)也是應(yīng)用熱點(diǎn)。面向中國自主知識(shí)產(chǎn)權(quán)的新一代音視頻編碼標(biāo)準(zhǔn)(audiovideocodingstandard2.0,AVS2)中碼率控制技術(shù),將模糊控制理論與碼率控制相結(jié)合,提出了一種新的碼率控制算法。首先根據(jù)模糊控制器原理建立快速查詢表,接著基于指數(shù)率失真模型進(jìn)行了基本論域到模糊子集論域的映射,而后將假設(shè)參考解碼緩沖區(qū)反饋值及其差值帶入模糊控制查詢表得出量化參數(shù)(QuantizationParameter,QP)值變化增量。最終的編碼過程采用系統(tǒng)QP值與增量之和來進(jìn)行。在通用測(cè)試條件下的實(shí)驗(yàn)結(jié)果表明,新算法比特率失真比率(Bj?ntegaarddeltabitrate,BDBR,BD-rate)取得增益效果明顯,比特率控制精度高。算法實(shí)現(xiàn)簡潔,計(jì)算復(fù)雜度低,特別適合恒定目標(biāo)比特率編碼端速率控制。相關(guān)成果已被AVS2標(biāo)準(zhǔn)工作組采納,集成在參考模型軟件RD10.0中。

碼率控制；模糊控制器；率失真模型；率失真優(yōu)化

0　引　言

信息技術(shù)迅猛發(fā)展的今天,網(wǎng)絡(luò)視頻應(yīng)用增長速度極快,其核心價(jià)值正逐步向產(chǎn)業(yè)鏈下游延伸,推進(jìn)不同產(chǎn)業(yè)相互融合。在2015年,互聯(lián)網(wǎng)上交換的數(shù)據(jù)中85%已被視頻流占據(jù)。相較于圖像和音頻數(shù)據(jù),視頻數(shù)據(jù)具有存儲(chǔ)和傳輸規(guī)模相對(duì)較大的特征,在網(wǎng)絡(luò)分發(fā)中將面臨更多的挑戰(zhàn),特別是超高清用戶體驗(yàn)等一些新的應(yīng)用受到技術(shù)瓶頸的限制。

受限于實(shí)時(shí)可變且相對(duì)有限的網(wǎng)絡(luò)帶寬,網(wǎng)絡(luò)視頻服務(wù)的播放質(zhì)量常常不盡如人意,碼率控制[1]在視頻圖像壓縮和網(wǎng)絡(luò)多媒體傳輸?shù)阮I(lǐng)域的重要性愈發(fā)凸顯。作為編碼器端的算法模塊,碼率控制基于網(wǎng)絡(luò)可用帶寬嚴(yán)格控制信道上輸出的視頻比特流速率,達(dá)到視頻圖像傳輸和播放的穩(wěn)定,并期望獲得視覺質(zhì)量和帶寬利用之間最佳平衡。長期以來,既是研究的熱點(diǎn)也是研究的重點(diǎn)。

碼率控制總是伴隨視頻編碼標(biāo)準(zhǔn)的發(fā)展而不斷進(jìn)步。在歷史發(fā)展的軌跡中,一些重要的模型和算法相繼被提出,經(jīng)典的如流體流動(dòng)模型[2]、二次模型[3]、ρ-域模型[4]、線性模型[5]、指數(shù)模型[6]等。多數(shù)碼率控制技術(shù)[7-8]都建立在假定被控編碼器對(duì)象具備較為精確的率-失真(rate-distortion,R-D)數(shù)學(xué)模型基礎(chǔ)上[9-10]。為了進(jìn)一步增加編碼效率,碼率控制研究者在R-D模型[11-12]或率-量化參數(shù)(rate-quantizationparameter,R-Q)模型[13-14]的基礎(chǔ)上,提出了全幀內(nèi)參考碼率控制算法[15]、可升級(jí)視頻編碼碼率控制算法[16]、比特率分配策略[17-18]等。但實(shí)際情況是視頻編碼過程具有非線性、時(shí)變性、變結(jié)構(gòu)、多層次、多因素等許多特點(diǎn)。即使建立了相應(yīng)的數(shù)學(xué)模型,也面臨復(fù)雜度、更新方法、適應(yīng)性方面的挑戰(zhàn)。這將使得工程實(shí)施和控制成為難點(diǎn)。

模糊邏輯控制簡稱模糊控制,是一種計(jì)算機(jī)數(shù)控技術(shù)[19]。主要以模糊集合論、模糊語言變量和模糊邏輯推理為支撐,描述人在自然界的直觀感受,從而達(dá)到人們所期望的控制效果。1965年,美國的Zadeh提出并建立了模糊集合論。1973年他明確給出了模糊邏輯控制的定義和定理[20]。1974年,英國的Mamdani率先用模糊控制原理組成的模糊控制器控制鍋爐和蒸汽機(jī)的溫度,獲得成功[21]。這項(xiàng)跨時(shí)代的工作邁出了模糊控制理論在工業(yè)應(yīng)用上的第一步。模糊控制方法與經(jīng)典定量分析方法在本質(zhì)上是不同的。模糊控制主要有3個(gè)特點(diǎn)：①語言變量替代了數(shù)學(xué)變量,或?qū)烧呓Y(jié)合應(yīng)用；②刻畫變量之間的函數(shù)關(guān)系用模糊條件語句來進(jìn)行；③復(fù)雜關(guān)系通常用模糊算法來表達(dá)。模糊邏輯控制器通過若干規(guī)則總結(jié),經(jīng)過必要數(shù)學(xué)處理,建立模糊規(guī)則。在實(shí)際應(yīng)用中,根據(jù)控制規(guī)則和推理法則做出模糊控制最終決策,完成控制動(dòng)作。

2002年6月中國數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組成立,由北京大學(xué)高文院士牽頭,著手制定“信息技術(shù)先進(jìn)音視頻編碼”系列標(biāo)準(zhǔn)(audiovideocodingstandard,AVS)。AVS系列標(biāo)準(zhǔn)的制定解決了H.264/AVC專利許可的諸多限制問題。現(xiàn)已被國際標(biāo)準(zhǔn)化組織納入為國際標(biāo)準(zhǔn)MPEG-China,與H.264/AVC一起在國際上競爭IPTV標(biāo)準(zhǔn)。

2015年9月,AVS工作組正式公布了新一代視頻編碼標(biāo)準(zhǔn)AVS2的基準(zhǔn)檔次。新標(biāo)準(zhǔn)的基準(zhǔn)檔次在常規(guī)視頻編碼的性能甚至超過了同期國際標(biāo)準(zhǔn)HEVC/H.265,比上一代國家標(biāo)準(zhǔn)AVS1以及國際標(biāo)準(zhǔn)H.264/AVC的效率提高接近一倍。AVS2新的技術(shù)或者是實(shí)現(xiàn)方案必將對(duì)未來的視頻圖像編碼器提出非常高的性能要求,也將對(duì)碼率控制模塊提出新的挑戰(zhàn)。因此,面向AVS2的碼率控制模型和算法具有很強(qiáng)的研究價(jià)值。

本文主要工作基于AVS2編碼器,將模糊控制理論與碼率控制相結(jié)合,提出了一個(gè)模糊邏輯碼率控制算法。根據(jù)經(jīng)典模糊控制原理,建立模糊集合、隸屬函數(shù)表,設(shè)計(jì)相應(yīng)的規(guī)則,利用推理法則得出模糊控制查詢表。通過虛擬緩沖區(qū)反饋差值數(shù)據(jù)進(jìn)行模糊控制查詢表的查表操作,根據(jù)返回值獲得量化參數(shù)(quantizationparameter,QP)變化增量用于編碼,完成恒定比特率控制。本文提出的模糊邏輯碼率控制算法支持隨機(jī)存取(random-access,RA)、低延遲(low-delay,LD)、全I(xiàn)幀(all-intra,AI)3種典型編碼結(jié)構(gòu),編碼性能增益明顯,控制精度高,已經(jīng)被AVS2專家組采納并集成到參考軟件RD10.0[22]中。

1　模糊邏輯碼率控制

模糊控制最主要的特點(diǎn)是在被控對(duì)象的數(shù)學(xué)模型不存在或模型太復(fù)雜的情況下,借助經(jīng)驗(yàn)型語言知識(shí)完成控制任務(wù)。視頻編碼碼率控制的過程恰好就是一種不可預(yù)知且不精確的控制系統(tǒng),被控對(duì)象比特率和量化參數(shù)之間沒有嚴(yán)格的數(shù)學(xué)模型。

1.1模糊控制原理

模糊控制的基本原理如圖1所示。它分為模糊化接口、推理機(jī)、知識(shí)庫、清晰化接口4個(gè)部分。首先,輸入的確定量通過模糊化接口模糊化后轉(zhuǎn)化為用于模糊控制的模糊矢量；接著,模糊矢量通過知識(shí)庫和推理機(jī)計(jì)算得出用于控制的模糊輸出值；最后,清晰化接口將模糊輸出值轉(zhuǎn)化為用于控制的精確值。

圖1　模糊控制器原理Fig.1　Principle of fuzzy controller

1.2模糊化接口

模糊化接口的作用是將確定的輸入量轉(zhuǎn)化為用于推理機(jī)進(jìn)行模糊推理的模糊矢量。模糊控制系統(tǒng)采用雙輸入和單輸出的形式,其中一個(gè)輸入變量是真實(shí)值和系統(tǒng)目標(biāo)值的誤差,另一個(gè)是上述誤差的變化量。輸出的控制量由系統(tǒng)所決定,由于在視頻編解碼器中主要是使用QP值來調(diào)節(jié)編碼輸出比特以及避免緩沖上溢和下溢的。因此,采用QP作為模糊控制器的受控對(duì)象。

按照碼率控制特有的假設(shè)參考解碼緩沖區(qū)(hypotheticalreferencedecoder,HRD)的原始定義,不失一般性,本文用像素點(diǎn)比特來作為計(jì)量單位以統(tǒng)一不同分辨率和不同幀率的圖像。在編碼時(shí)刻t,目標(biāo)比特率TBRt可以由式(1)轉(zhuǎn)化為像素點(diǎn)目標(biāo)比特:

(1)

式中,FC表示實(shí)際編碼幀率；W和H分別表示像素點(diǎn)的寬和高。在第t幀編碼完成后,用Rt記錄真實(shí)的輸出比特,則當(dāng)前時(shí)刻緩沖區(qū)容量Bt可由式(2)更新得到：

(2)

將真實(shí)緩沖區(qū)高度Bt與目標(biāo)緩沖區(qū)高度BTarget之差記為緩沖區(qū)誤差et,緩沖區(qū)誤差的變化量記為ect,計(jì)算過程為

(3)

(4)

為了避免HRD緩沖區(qū)的上溢和下溢,減少真實(shí)緩沖區(qū)與目標(biāo)緩沖區(qū)之間的誤差,Bt的初始值和目標(biāo)值都固定設(shè)置為0。當(dāng)Bt>0時(shí),表示過度使用比特；當(dāng)Bt<0時(shí),表示使用比特不足,碼率控制的目標(biāo)就是盡可能地使Bt接近目標(biāo)值0。

連續(xù)圖像之間的內(nèi)容和運(yùn)動(dòng)復(fù)雜度都具有高度的關(guān)聯(lián)性,所以編碼t-1時(shí)刻和編碼t時(shí)刻的QP值是非常相近的。定義模糊控制器的輸出變量u為QP增量。

模糊控制器的輸入輸出確定后,就需要設(shè)計(jì)模糊控制系統(tǒng)了。定義E,EC和U分別為et,etc和u的論域上的模糊集。采用有限的整數(shù)離散化模糊子集論域S：

(5)

由于輸入變量et和etc的真實(shí)變化范圍與模糊子集論域不同,因此,需要通過刻度變換將輸入變量的真實(shí)變化范圍離散到[-6,6]區(qū)間。如果輸入變量et和etc的變化范圍分別為[aE,bE]和[aEC,bEC],那么可以通過式(6)量化得到模糊輸入變量e和ec：

(6)

而后再進(jìn)行邊界綁定至模糊子集論域[-6,6]的范圍內(nèi)：

(7)

在模糊化接口中,量化的精確輸入量仍需被模糊詞集模糊化,模糊子集論域?qū)⒈荒：~集分割。模糊分割的個(gè)數(shù)決定了模糊控制的精度,過多的模糊分割等級(jí)將導(dǎo)致更多的控制規(guī)則和更大的計(jì)算復(fù)雜度,相反,過少的模糊分割等級(jí)將降低控制精度。為了平衡控制精度和計(jì)算復(fù)雜度,大多數(shù)方案都采用七級(jí)模糊詞集,并取得了良好的控制效果。本文同樣采用七級(jí)模糊詞集：負(fù)大(NB),負(fù)中(NM),負(fù)小(NS),零(ZO),正小(PS),正中(PM),正大(PB)。定義E,EC和U的模糊詞集均為{NB,NM,NS,ZO,PS,PM,PB}。

1.3知識(shí)庫

知識(shí)庫是由數(shù)據(jù)和規(guī)則兩個(gè)部分組成。數(shù)據(jù)庫中存放著所有輸入輸出變量的全部模糊子集的隸屬度矢量值。規(guī)則庫則存放著“推理機(jī)”推理時(shí)所需的模糊控制規(guī)則。

模糊推理過程是將模糊化結(jié)果引入模糊規(guī)則并結(jié)合隸屬度值推導(dǎo)進(jìn)行。選定模糊子集論域S和模糊變量詞集后,需要確定隸屬函數(shù)來將確定的輸入量轉(zhuǎn)化為模糊子集。由于不同系統(tǒng)的需求存在差異,采用的隸屬函數(shù)曲線也不盡相同。為了降低計(jì)算復(fù)雜度,本文采用“三角形”隸屬函數(shù)曲線。表1給出了模糊子集E,EC和U的隸屬值分布情況。

表1　模糊變量不同等級(jí)的隸屬度值表

模糊控制規(guī)則是基于專家經(jīng)驗(yàn)或者人為設(shè)置的,對(duì)模糊控制系統(tǒng)有著決定性的作用。模糊規(guī)則的數(shù)量以及精確度將直接影響模糊控制系統(tǒng)的性能。本文工作采用雙輸入和單輸出的模糊控制器。雙輸入分別為E和EC,輸出為控制變量U。規(guī)則采取二值邏輯ifEandECthenU。七級(jí)模糊詞集對(duì)應(yīng)7×7=49個(gè)模糊控制規(guī)則,用以表示輸入變量E、EC和輸出變量U之間的關(guān)系,如表2所示。其中E和EC可表示為一維7元素集合,U可表示為二維7×7元素集合。請(qǐng)注意,模糊控制規(guī)則表2可根據(jù)不同的經(jīng)驗(yàn)做適當(dāng)調(diào)整。

表2　模糊控制規(guī)則表

1.4推理機(jī)

推理機(jī)根據(jù)輸入的模糊量結(jié)合知識(shí)庫完成模糊推理。再通過求解模糊關(guān)系方程,將最終獲得模糊控制量。

假設(shè)表2中的一條規(guī)則為ifEisAiandECisBithenUisCi,其中Ai、Bi、Ci是由隸屬度函數(shù)確定的模糊詞集:

(8)

(9)

(10)

式中,μAi(e)、μBi(ec)和μCi(u)是相對(duì)應(yīng)的隸屬度值。該規(guī)則可以推理出模糊關(guān)系Ri:

Ri=Ai?Bi?Ci

(11)

式中,?為取小操作。根據(jù)模糊規(guī)則逐個(gè)計(jì)算,可得最終的模糊關(guān)系Re:

(12)

式中,∪為取并操作。

(13)

1.5清晰化接口

(14)

表3　模糊控制查詢表

(15)

(16)

最終,一個(gè)用于碼率控制的快速查詢表可以被列出,如表4所示。

表4　簡化的模糊控制查詢表

2　量化參數(shù)調(diào)整

碼率控制架構(gòu)如圖2所示。HRD緩沖區(qū)計(jì)數(shù)器模擬了解碼緩沖區(qū)的狀態(tài),在稍作變換后,可換算成真實(shí)的緩沖區(qū)狀態(tài)。圖2中的緩沖區(qū)初始值為0,隨著輸入的幀編碼比特?cái)?shù)和輸出的比特?cái)?shù)形成差值。

圖2　基于模糊控制器的碼率控制架構(gòu)Fig.2　Architecture of rate control based on fuzzy controller

該差值的正負(fù)波動(dòng)代表著在編碼時(shí)刻t,網(wǎng)絡(luò)帶寬數(shù)據(jù)傳輸和編碼比特率的消長情況。瞬時(shí)緩沖區(qū)值越接近0表示編碼比特率和目標(biāo)比特率越平衡。在整個(gè)碼率控制過程中,緩沖區(qū)的最大值與最小值之差表示在真實(shí)情況下緩沖區(qū)最小的配置需求。

編碼器輸出的幀比特?cái)?shù)Bt被計(jì)數(shù)增加至HRD緩沖區(qū)計(jì)數(shù)器中,同時(shí)從該編碼器中減去單位時(shí)間輸出的比特?cái)?shù)BTarget。這樣將獲得緩沖區(qū)計(jì)數(shù)差值Et。緩沖區(qū)差值Et與

上一時(shí)刻緩沖區(qū)差值Et-1作差運(yùn)算,得到當(dāng)前時(shí)刻緩沖區(qū)計(jì)數(shù)器差值的差值ECt。Et和ECt作為兩個(gè)必要參數(shù)被輸入到模糊控制器中進(jìn)行運(yùn)算,獲得調(diào)節(jié)QP值的變化強(qiáng)度即變化增量ΔQ。上一時(shí)刻編碼所用QP值Qt-1與QP變化增量ΔQ的和Qt將被用于t時(shí)刻幀編碼：

(17)

通常情況下,QP值需要被綁定在一個(gè)合理的范圍內(nèi)以避免兩個(gè)連續(xù)幀之間出現(xiàn)較大的質(zhì)量波動(dòng)。因此,采用式(18)來進(jìn)行QP值綁定：

(18)

在AVS2中Qmin和Qmax的取值分別為0和63。

3　論域的確定

在模糊控制器中,輸入變量et和ect的實(shí)際變化范圍[aE,bE]和[aEC,bEC]定義為基本論域,反映的是碼率控制所能調(diào)控的恰當(dāng)合理范圍,并將被轉(zhuǎn)化為E和EC的模糊子集論域。本文通過R-Q率失真模型獲得該基本論域。

對(duì)AVS2編碼器進(jìn)行通測(cè)可以獲得不同序列及檔次下的比特率和QP值關(guān)系。建立指數(shù)函數(shù)描述R-Q關(guān)系由圖3給出。從圖3中可以看到,不同序列不同檔次下的AI、LD、RA3種編碼結(jié)構(gòu),R-Q模型都呈現(xiàn)非常明顯的指數(shù)函數(shù)特性,相關(guān)系數(shù)非常接近理論最優(yōu)值1。

圖3　指數(shù)曲線擬合R-Q模型Fig.3　Exponential curve fitting of R-Q model

結(jié)合圖3中指數(shù)模型的曲線擬合,R-Q模型用指數(shù)函數(shù)描述：

(19)

式中，R表示比特率；Q表示量化參數(shù)QP值；α和β為模型參數(shù)。

對(duì)R-Q模型式(19)進(jìn)行一階微分：

(20)

不失一般性,在較小的QP值變化范圍內(nèi),用ΔR≈dR,ΔQ≈dQ,那么QP值變化幅度為±2,比特率的誤差et的范圍即為幀編碼比特變化的一階變化值范圍：

(21)

其中，β建議取根據(jù)圖3中不同結(jié)構(gòu)給出的均值,也可統(tǒng)一采用經(jīng)驗(yàn)值0.12。比特率R值因編碼結(jié)構(gòu)的不同而不同,在AI和LD下由上一個(gè)已編碼幀的比特率表示,而在RA下由上一個(gè)圖像組(groupofpicture,GOP)已編碼圖像的比特率和表示。

誤差的變化ect的范圍需要考慮到兩次疊加極大QP變化量。因此,在誤差變化范圍區(qū)間[aE,bE]基礎(chǔ)上擴(kuò)展max{|ΔQ|}=2倍。式(22)給出了誤差變化區(qū)間的計(jì)算:

(22)

4　量化參數(shù)的初始化

在碼率控制的實(shí)際應(yīng)用中,人們常常預(yù)先給定目標(biāo)比特率而非指定初始QP值而開始編碼。此外,即使人們猜測(cè)并給出測(cè)點(diǎn)初始QP值,也往往與最佳初始QP之間存在一定的誤差,從而影響了編碼性能。因此,本論文還提出了一種比特率-量化-梯度(rateQPgradient,RQG)線性數(shù)學(xué)模型的初始QP自動(dòng)設(shè)定方法。其中,R為比特率，Q為量化參數(shù)，G為首幀像素點(diǎn)梯度均值。

比特率和量化參數(shù)之間的數(shù)學(xué)關(guān)系通常以指數(shù)函數(shù)形式呈現(xiàn)[23]。指數(shù)關(guān)系可以被取對(duì)數(shù)后合理改寫為線性關(guān)系,在給定的序列,內(nèi)容特征確定情況下,如式(23)所示lnR與Q的線性關(guān)系非常明顯。

lnR∝Q

(23)

圖4(a)給出了QP測(cè)點(diǎn)27、32、38、45下視頻序列BasketballPass_416×240_50的測(cè)試情況。可以明顯觀察到式(23)所示的線性關(guān)系。

視頻編碼的比特率與其紋理特征之間存在相關(guān)性。通常以圖像的高通濾波梯度和表示其紋理特征,以圖像梯度G的均值來表示。梯度G的計(jì)算方法為

(24)

許多研究都表明R和G之間存在強(qiáng)烈的線性關(guān)系,特別是I幀編碼時(shí)[24]。當(dāng)QP固定,比特率R和首I幀梯度G之間存在的線性關(guān)系可以被改寫,如式(25)所示。圖4(b)給出了QP值為45時(shí)測(cè)試數(shù)據(jù)情況。

lnR∝lnG

(25)

圖4　比特率對(duì)數(shù)分別與QP和梯度對(duì)數(shù)的線性關(guān)系Fig.4　Linear of ln R vs. QP and ln R vs. ln G

基于上述分析,式(23)、式(25)分別表示了lnR與Q、lnG兩個(gè)變量之間存在線性關(guān)系,即可得多元線性RQG模型:

lnR=f(Q,lnG)=p1·Q+p2·lnG+p3

(26)

式中,p1,p2,p3是模型的3個(gè)參數(shù)。

基于RQG模型,對(duì)通測(cè)序列的lnR,Q,lnG 3個(gè)變量進(jìn)行回歸統(tǒng)計(jì)。可得皮爾森·卡爾相關(guān)系數(shù)值分別高達(dá)0.960、0.824、0.869。根據(jù)回歸結(jié)果可得AI、LD、RA3種編碼結(jié)構(gòu)下RQG模型及參數(shù)值：

lnR=-0.089 8·Q+1.1911·lnG+6.520 7

(27)

lnR=-0.120 1·Q+1.0293·lnG+5.656 3

(28)

lnR=-0.111 7·Q+0.9546·lnG+5.494 1

(29)

當(dāng)輸入目標(biāo)比特率和首幀像素點(diǎn)梯度均值后即可計(jì)算給出預(yù)測(cè)的初始QP值QIni。這部分工作已被AVS2標(biāo)準(zhǔn)采納至RD12.1[25]。

5　測(cè)試與分析

為了評(píng)價(jià)新提出的碼率控制算法的性能,本文按照AVS2通測(cè)條件在AVS2編碼器RD12.0[26]上進(jìn)行了測(cè)試。測(cè)試包含AI、LD、RA3種典型配置。用27、32、38、45共4個(gè)測(cè)點(diǎn)進(jìn)行通測(cè)配置下的編碼測(cè)試作為性能比對(duì)依據(jù)。為了公平性,再用4個(gè)測(cè)點(diǎn)的實(shí)際比特率和初始QP值進(jìn)行碼率控制對(duì)齊測(cè)點(diǎn)編碼測(cè)試。

表5給出了本文算法與RD12.0通測(cè)的結(jié)果比較。在AI配置下,當(dāng)碼率控制功能開啟后,其比特率失真比率(Bj?ntegaarddeltabitrate,BDBR,BD-rate)增益的均值在Y分量為0.17%,在U分量和V分量分別有0.86%和0.96%的增益。編解碼時(shí)間方面均呈現(xiàn)節(jié)省狀態(tài)。在LD配置下,其BD-Rate增益較大,當(dāng)碼率控制功能開啟后增益均值在Y分量為1.27%,在U分量和V分量分別為2.68%和2.86%,編碼時(shí)間處于節(jié)省狀態(tài)。在RA配置下,當(dāng)碼率控制功能開啟后,其BD-Rate增益的均值在Y分量為0.07%,在U分量和V分量分別有2.75%和2.79%的增益。編碼時(shí)間大量節(jié)省。

表5　測(cè)試性能比較

表6給出了各種配置下比特率控制相對(duì)誤差的絕對(duì)值均值。從表6中可以看出,3種模式都達(dá)到了非常高的精度。從均值統(tǒng)計(jì)來看,AI、LD和RA結(jié)構(gòu)下平均誤差分別是0.01%、0.24%和0.69%,比特率控制精度非常高,足夠滿足視頻傳輸中的實(shí)際需求。

為了進(jìn)一步體現(xiàn)碼率控制的性能,圖5、圖6和圖7分別給出了模糊邏輯碼率控制在AI、LD和RA3種結(jié)構(gòu)下4個(gè)QP值測(cè)點(diǎn)的HRD緩沖區(qū)狀態(tài)曲線，圖中縱坐標(biāo)是緩沖區(qū)的高度，單位是每像素點(diǎn)比特(bitperpixel,bpp)，橫坐標(biāo)

是編碼圖像的幀數(shù)。

表6　碼率控制比特率相對(duì)誤差

圖5　AI配置下模糊邏輯碼率控制緩沖區(qū)狀態(tài)圖Fig.5　Buffer state of fuzzy logic rate control on AI configuration

圖6　LD配置下模糊邏輯碼率控制緩沖區(qū)狀態(tài)圖Fig.6　Buffer state of fuzzy logic rate control on LD configuration

圖7　RA配置下模糊邏輯碼率控制緩沖區(qū)狀態(tài)圖Fig.7　Buffer state of fuzzy logic rate control on RA configuration

如圖5所示,AI結(jié)構(gòu)下,目標(biāo)線被設(shè)置為常數(shù)0。可以看到實(shí)際的緩沖區(qū)曲線圍繞目標(biāo)0線做上下小幅震蕩。波動(dòng)幅度小,控制精度高。在圖6中,初始的目標(biāo)線是首I-幀沖高的高度,隨著編碼過程直線遞減為至最后一幀歸0,可以看出緩沖區(qū)曲線小幅波動(dòng)并緩慢遞降至0。在圖7中,目標(biāo)線在I-幀到來緩沖區(qū)沖高后時(shí)被設(shè)置,編碼過程中逐步遞降至一個(gè)I-幀周期的末尾。受控曲線仍然以小幅波動(dòng)形式緩慢遞降至0。圖5～圖7表明新提出的碼率控制算法具有控制精度高的特點(diǎn)。這是由于模糊邏輯控制理論在碼率控制應(yīng)用中是合理的，同時(shí)也體現(xiàn)出本文在模糊控制規(guī)則的制定、查詢表的生成，論域的確定等方面做出了有效貢獻(xiàn)。

6　結(jié)　論

面向中國自主知識(shí)產(chǎn)權(quán)的下一代音視頻編碼標(biāo)準(zhǔn)AVS2,本文提出并集成了一種新的視頻編碼模糊邏輯碼率控制算法。算法具有計(jì)算復(fù)雜度低、實(shí)現(xiàn)簡單、控制精度高、BD-Rate性能表現(xiàn)優(yōu)異的特點(diǎn)。算法在RD10.0中的集成填補(bǔ)了現(xiàn)有AVS2參考模型軟件RD中碼率控制模塊的空白,為AVS2標(biāo)準(zhǔn)的推廣和應(yīng)用提供了技術(shù)支持。依托本文算法,初始QP值設(shè)定方法和LCU級(jí)的碼率控制目前已經(jīng)完成功能集成。下一步的工作將是深入研究R-D關(guān)系,在設(shè)定最高目標(biāo)比特率的基礎(chǔ)上進(jìn)行基于視覺質(zhì)量控制的策略算法研究。

[1]ChenZ,NganKN.Recentadvancesinratecontrolforvideocoding[J]. Signal Processing: Image Communication, 2007, 22(1): 19-38.

[2]Ribas-CorberaJ,ChouPA,RegunathanSL.AgeneralizedhypotheticalreferencedecoderforH. 264/AVC[J]. IEEE Trans. on Circuits and Systems for Video Technology, 2003, 13(7): 674-687.

[3]ChiangT,ZhangY.Newratecontrolschemeusingquadraticratedistortionmodel[J]. IEEE Trans. on Circuits and Systems for Video Technology, 1997, 7(1): 246-250.

[4]HeZ,KimYK,MitraSK.Low-delayratecontrolforDCTvideocodingviaρ-domainsourcemodeling[J]. IEEE Trans. on Circuits and Systems for Video Technology, 2001, 11(8): 928-940.

[5]MaSW.GaoW,YuanLJ,etal.RatecontrolforH.264/AVCvideocodingstandard[J]. Chinese Journal of Electronics, 2014, 32(12): 2024-2027. (馬思偉, 高文, 袁祿軍, 等. 一種面向H.264/AVC的碼率控制算法[J]. 電子學(xué)報(bào), 2014, 32(12): 2024-2027.)

[6]ZhouYM,SunY,FengZD,etal.Newrate-distortionmodelingandefficientratecontrolforH.264/AVCvideocoding[J]. Signal Processing: Image Communication, 2009, 24(5): 345-356.

[7]LiZG,PanF,PangK,etal.AdaptivebasicunitlayerratecontrolforJVT[C]∥Proc. of the Joint Video Team of ISO/IEC MPEG & ITU-T VCEG 7th Meeting, 2003:1-12.

[8]LiB,LiH,LiL,etal.RatecontrolbyR-lambdamodelforHEVC[C] ∥Proc. of the ITU-T/ISO/IEC Joint Collaborative Team on Video Coding 11th Meeting, 2012: 1-5.

[9]XuL,KwongS,ZhangY.Low-complexityencoderframeworkforwindow-levelratecontroloptimization[J]. IEEE Trans. on Industrial Electronics, 2013, 60(5): 1850-1858.

[10]SeoC,MoonJ,HanJ.Ratecontrolforconsistentobjectivequalityinhighefficiencyvideocoding[J].IEEE Trans.on Image Processing, 2013, 22(6): 2442-2454.

[11]XuJ,WuDP.Gammaratetheoryforcausalratecontrolinsourcecodingandvediocoding[J]. Journal of Visual Communication and Image Representation,2014, 25(8): 1886-1893.

[12]LiY,JiaHZ,ZhuC,etal.Window-basedratecontrolforvideoqualityoptimizationwithanovelINTER-dependentrate-distortionmodel[J]. Signal Processing: Image Communication, 2014,29(10): 1046-1062.

[13]ChoiH,YooJ,NamJ,etal.Pixel-wiseunifiedrate-quantizationmodelformulti-levelratecontrol[J]. IEEE Journal on Selected Topics in Signal Processing, 2013,7(6): 1112-1123.

[14]LiangX,WangQ,ZhouY,etal.AnovelRQmodelbasedratecontrolschemeinHEVC[C] ∥Proc. of the Visual Communications and Image Processing, 2013: 1-6.

[15]YanB,WangMH.Adaptivedistortion-basedintra-rateestimationforH.264/AVCratecontrol[J]. IEEE Signal Processing Letters, 2009 16(3): 145-148.

[16]YangJ,SunY,ZhouYM,etal.IncrementalratecontrolforH.264/AVCscalableextension[J]. Multimedia Tools and Application,2013,64(3): 581-598.

[17]ZhouYM,SunY,FengZD,etal.PID-basedbitallocationstra-tegyforH.264/AVCratecontrol[J]. IEEE Trans. on Circuits and Systems II: Express Briefs, 2011,58(3): 184-188.

[18]WuYD,SunY,FengZD,etal.AnoveltotalvariationbasedframelayerratecontrolalgorithmforH.264/AVC[J]. Journal of Visual Communication and Image Representation, 2014,25(5): 879-890.

[19]ZadehLA.Fuzzysets[J]. Information and Control, 1965,8(3): 338-353.

[20]ZadehLA.Outlineofanewapproachtotheanalysisofcomplexsystemsanddecisionprocesses[J]. IEEE Trans.on Systems, Man and Cybernetics, 1973,3(1): 28-44.

[21]MamdaniEH.Applicationoffuzzyalgorithmsforthecontrolofasimpledynamicplant[J]. Proceedings of the Institution of Electrical Engineers, 1974,121(12): 1585-1588.

[22]ZhouYM,ZhuC,ZhongM,etal.AVS2ratecontrolbasedonfuzzylogic(AdoptedtoRD10.0) [C]∥Proc. of the 51th Conference on Audio Video Coding Standard,2014: 1-12. (周益民,朱策,鐘敏,等. 基于模糊邏輯的AVS2碼率控制(采納至RD10.0)[C]∥第51次中國音視頻標(biāo)準(zhǔn)會(huì)議,2014:1-12.

[23]ZhouYM,SunY,FengZD,etal.Newrate-distortionmodelingandefficientratecontrolforH.264/AVCvideocoding[J]. Signal Processing: Image Communication, 2009,24(5): 345-356.

[24]TianL,ZhouYM,SunY.Novelratecontrolschemeforintraframevideocodingwithexponentialrate-distortionmodelonH.264/AVC[J]. Journal of Visual Communication and Image Representation, 2012, 23(6): 873-882.

[25]LuoMK,ZhouYM,ZhongM,etal.RatecontrolinitialQPautosetting(AdoptedtoRD12.1) [C]∥Proc.of the 53th Conference on Audio Video Coding Standard,2015:1-8:(羅敏珂,周益民,鐘敏,等.碼率控制初始QP自動(dòng)設(shè)定(采納至RD12.1)[C]∥第53次中國音視頻標(biāo)準(zhǔn)會(huì)議,2015:1-8.

[26]RD12.0. [EB/OL]. [2015-07-24].ftp:∥124.207.250.92/public/codec/video_codec/AVS2_P2/.

RatecontrolalgorithmofAVS2videocoding

LUOMin-ke1,ZHOUYi-min1,2,ZHONGMin1,ZHUCe2

(1. School of Computer Science and Engineering, University of Electronic Science and Technology of China,Chengdu 611731, China; 2. Center for Robotics, University of Electronic Science and Technology of China, Chengdu 611731, China)

Ratecontrolisanessentialcomponentofthevideocodingtechnology,focusingonprovidingtheminimumdistortionofvideoimagequalityunderthelimitedbandwidthofcommunicationasmuchaspossible.Itisdevelopedasaresearchhotspot.Theworkismeantforthenewgenerationofaudiovideocodingstandard(AVS2)intheratecontroltechnology,combiningthefuzzycontroltheoryandtheratecontrol,anewratecontrolalgorithmisproposed.First,afastlookuptableiscreateddependingontheprincipleoftheindustrialfuzzycontroller.Second,amappingfromthefunctionaldomaintotheinternaldomainiscreated.Third,anincrementalquantizationparameter(QP)valuecanbefoundwhentakingthehypotheticalreferencedecoderbuffervaluesanditserrorvaluesintothefuzzycontrollerquery.Finally,theencoderadoptsthesystemQPwithitsincrement.Theexperimentalresultsshowthat,underthecommontestcondition,theratecontrolalgorithmcanachievesignificantBD-rategainandmaintainhighbitrateaccuracy.Theproposedalgorithmisappliedsimplywithlowcomputationalcomplexity.Thisproposalparticularlysuitableforconstanttargetbitratecontrol.ThisworkisapprovedbytheAVS2standardworkinggroupandintegratedintothereferencesoftwaremodelRD10.0.

ratecontrol;fuzzycontroller;rate-distortionmodel;rate-distortionoptimization

2015-10-20；

2016-03-08；網(wǎng)絡(luò)優(yōu)先出版日期：2016-06-21。

國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2015AA015903)；國家自然科學(xué)基金(61571102)；四川省科技支撐計(jì)劃(2014GZ0005)；中央高校基本科研業(yè)務(wù)費(fèi)(ZYGX2015J065)資助課題

TN919.8

ADOI:10.3969/j.issn.1001-506X.2016.09.32

羅敏珂(1992-),男,碩士研究生,主要研究方向?yàn)橐曨l圖像編碼與碼率控制。

E-mail：201321060445@std.uestc.edu.cn

周益民(1980-),男,副教授,博士,主要研究方向?yàn)橐曨l編碼與多媒體傳輸。

E-mail：yiminzhou@uestc.edu.cn

鐘敏(1991-),女,碩士研究生,主要研究方向?yàn)橐曨l圖像編碼與碼率控制。

E-mail：201321060446@std.uestc.edu.cn

朱策(1969-),男,教授,博士,主要研究方向?yàn)閳D像處理與通信。

E-mail：eczhu@uestc.edu.cn

網(wǎng)絡(luò)優(yōu)先出版地址：http:∥www.cnki.net/kcms/detail/11.2422.TN.20160621.1439.002.html

404 Not Found

nginx

404 Not Found

404 Not Found

404 Not Found

404 Not Found

404 Not Found

404 Not Found

AVS2視頻編碼碼率控制算法

0 引 言

1 模糊邏輯碼率控制

2 量化參數(shù)調(diào)整

3 論域的確定

4 量化參數(shù)的初始化

5 測(cè)試與分析

6 結(jié) 論

404 Not Found

404 Not Found

404 Not Found

404 Not Found

404 Not Found

0　引　言

1　模糊邏輯碼率控制

2　量化參數(shù)調(diào)整

3　論域的確定

4　量化參數(shù)的初始化

5　測(cè)試與分析

6　結(jié)　論