基于運動特征的HEVC幀間模式快速判決算法

2016-06-23 06:02:52金智鵬代紹慶王利華

電視技術 2016年1期

關鍵詞：深度特征

金智鵬，代紹慶，王利華

(1.嘉興職業技術學院　信息技術分院，浙江嘉興 314036；2.浙江(嘉興)微軟技術研究中心，浙江嘉興 314000)

基于運動特征的HEVC幀間模式快速判決算法

金智鵬1，代紹慶1，王利華2

(1.嘉興職業技術學院信息技術分院，浙江嘉興 314036；2.浙江(嘉興)微軟技術研究中心，浙江嘉興 314000)

摘要:為降低HEVC幀間預測編碼過程的計算復雜度，提出了一種新的基于運動特征的編碼單元(CodingUnits，CU)及預測單元(PredictionUnits，PU)快速判決算法。首先，通過二階幀差法檢測運動劇烈程度，并分析運動特征對CU及PU時域相關性的影響。然后，利用前幀相同位置CU及PU的最優模式預測當前CU的深度范圍，并根據運動劇烈程度優化預測范圍。最后，根據預測范圍跳過和終止部分不必要的CU深度和PU模式，從而加快幀間編碼速度。在HM12.0平臺上的實驗測試表明，該算法在BDPSNR僅降低0.068dB、BDBR只增加1.530%的情況下，提高了48.389%的編碼速度。

關鍵詞:HEVC；幀間預測；編碼單元(CU)；預測單元(PU)；前幀相同位置；CU深度范圍

新一代高性能視頻編碼國際標準(HighEfficiencyVideoCoding，HEVC)主要面向高清晰度、高幀率、高壓縮率的應用需求[1]。相比H.264，HEVC采用了四叉樹結構的編碼單元(CodingUnits，CU)、預測單元(PredictionUnits，PU)和變換單元(TransformUnits，TU)等眾多新技術[2]，將壓縮效率提高了一倍。

HEVC將每幀圖像按最大編碼單元(LargestCodingUnits，LCU)進行劃分，每個LCU又可分為一個或多個不同深度(depth)的CU，包括64×64(depth=0)、32×32(depth=1)、16×16(depth=2)、8×8(depth=3)等4種CU模式。每一深度的CU又可按2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N等8種PU模式進行預測編碼[3]。在編碼過程中，HEVC采用遍歷方式比較上述各種CU及其PU模式的率失真代價，并根據率失真代價確定LCU的最優四叉樹結構以及各深度CU的最優PU預測模式，這使得編碼器的計算量非常巨大。

為了降低編碼復雜度，HEVC采納了早期編碼單元設置(EarlyCodingUnit，ECU)[4]、快速合并模式(FastDecisionforMerge，FDM)[5]、編碼標志快速終止(CodedBlockFlag，CBF)[6]、自適應CU深度遍歷(AdaptiveCUDepthRange，ACUDR)[7]等一些快速編碼算法，以減少編碼時間。

為進一步提高HEVC的編碼速度，Kim等人[8]通過分析運動矢量差和CBF，提前檢測當前PU是否滿足Skip模式，并終止后續PU預測模式的遍歷計算。Lee等人[9]等利用時域相關性來預測當前CU的深度范圍，跳過部分可能性較低的CU模式。Shen等人[10]利用時空相關性以及CU層間相關性來預測當前CU的深度范圍，并通過檢查運動矢量和率失真代價，提前終止PU模式的計算，以降低編碼復雜度。

近來，蔣等人[11]提出了一種基于貝葉斯決策的CU快速判決算法，通過相鄰LCU的四叉樹結構來預測當前LCU的深度范圍，并依據率失真代價和閾值的比較進行CU提前終止判決。晏等人[12]提出了一種CU分級判決快速算法，采用自適應權值量化分析時空相鄰CU之間的相關性，并預測當前CU的深度范圍，跳過和提前終止不必要的深度計算。

上述快速算法在很大程度上減少了CU遍歷范圍，但若能結合CU運動特征分類進行CU深度預測，可進一步提高編碼速度。本研究將基于CU的運動特征，分類進行CU及PU模式的快速判決，加快HEVC幀間編碼速度。

1HEVC幀間模式快速判決算法

1.1CU運動特征檢測

在幀間編碼過程中，背景和紋理平滑區往往采用大尺寸CU進行編碼，以降低編碼碼率；運動劇烈區域往往采用小尺寸CU進行編碼，以提高編碼質量。因此，預判CU的運動特征是提高編碼速度的關鍵。

幀間差分法是比較常用且有效的運動對象檢測法[13]，即利用前后兩幀相同位置處像素的亮度絕對差來衡量運動變化程度。本文采用LCU中4個32×32子CU的二階亮度絕對差來檢測運動對象并衡量其運動幅度。32×32子CU的一階幀差(FirstDifferenceofCU，FD)計算如下

(1)

式中：FD(cur)表示當前32×32子CU的一階幀差；fcur(x,y)表示當前32×32子CU的亮度像素值；gcol(x,y)表示前一幀相同位置處32×32子CU的亮度像素值。

但是由于攝像機抖動、鏡頭運動、光照等影響，一階幀差的運動對象檢測效果并不理想。鑒于由攝像機抖動所產生的幀間差是持續的、大小相近的，因此本文通過計算二階幀差，濾除由攝像機抖動等因素所帶來的擾動和噪聲。32×32子CU的二階幀差(Second Order Difference of CU，SOD)的定義如下

(2)

式中：SOD(cur)表示當前32×32子CU的二階幀差；FD(col)表示前一幀相同位置處子CU的一階幀差。

基于上述分析，本文根據二階幀差SOD來衡量CU的運動特征，并將當前CU分為3種類型：背景平滑區、運動平緩區和運動劇烈區。具體分類如下

(3)

根據編碼經驗，設置T1=128，T2=3×T1，能取得較佳的編碼效果。

1.2運動特征對CU及PU時域相關性的影響

為了掌握相鄰兩幀之間CU及PU最優模式的相關性概率，分析CU運動特征對CU及PU模式劃分的影響，本文采用ClassA～E的15個不同分辨率和運動特性的視頻序列進行編碼統計。測試平臺為HEVC參考軟件HM12.0[14]，統計結果如圖1和表1所示。

表1中，PCU表示相鄰兩幀相同位置CU其模式相同的概率，即CU模式相同的面積/圖像總面積；PPU表示相同位置PU模式相同的概率。據表1的數據統計可知，運動劇烈區，其相鄰兩幀之間的PCU平均僅為50.4%；說明其時域相關性較弱，前幀相同位置的最優CU模式不具有參考意義。而對于背景平滑區，其相鄰兩幀之間的CU及PU模式有著高度的相似性，其PCU平均為82.6%，其PPU平均達89.2%，分別比運動劇烈區高出32.2%和27.7%。因此，對于背景平滑區，可以使用前幀相同位置的最優CU及PU模式來預測當前CU及PU的模式范圍；其預測準確性高，且對不同類型的序列都比較穩定。

表1相鄰兩幀之間CU及PU最優模式的相關性概率 %

從圖1可見，各種PU預測模式中，2N×2N模式的使用概率高達84.6%，遠高于其他預測模式的使用率。結合表1的統計數據，若當前CU被判為背景平滑區，則當前CU的PU模式更有可能為前幀對應位置的最優PU模式和2N×2N模式；因此，根據一定的判斷條件跳過其他冗余PU模式是合理的。

1.3CU劃分模式快速判決

步驟1)第1個P幀圖像，根據LCU的一階幀差結果進行運動區和背景區的判斷。如果當前LCU的一階幀差FD>1 920，則判為運動區；否則判為背景區。對運動區遍歷計算深度depth=1～3的CU模式，并根據率失真代價選擇最優的CU四叉樹結構；對背景區，則直接確定depth=0為最佳CU模式。

步驟2)后續P幀圖像，先進行二階幀差計算，判斷當前CU的運動特征，并根據CU特征選取相應的編碼策略。如果當前LCU中某個32×32子CU的二階幀差SOD>T2，則判定當前LCU處于運動區，轉入步驟3)；否則，判定當前LCU處于背景區，轉入步驟4)。

步驟3)運動區。如果當前32×32子CU的二階幀差SOD>T2，屬于運動劇烈區，則設置當前CU的深度遍歷范圍為depth=1～3。非運動劇烈區，首先獲取前幀相同位置處CU的最小深度MinDepth和最大深度MaxDepth，作為當前CU劃分的預測范圍。然后進一步優化，如果當前32×32子CU的二階幀差SOD>T1，屬于運動平緩區，則修正CU預測范圍MinDepth--、MaxDepth++。轉入步驟5)。

步驟4)背景區。首先獲取前幀相同位置處CU的最小深度MinDepth和最大深度MaxDepth，作為當前CU的預測范圍。進一步優化，如果當前32×32子CU的二階幀差SOD>T1，屬于運動平緩區，則MaxDepth++；如果當前32×32子CU的二階幀差SOD≤T1，屬于背景平滑區，則MinDepth--。

步驟5)跳過和終止不必要的CU深度，進行編碼計算。根據對當前CU的預測范圍，跳過深度depth

步驟6)對LCU中的每個子CU，遞歸進行步驟2)～5)的判決過程。

1.4 PU預測模式快速判決算法

步驟1)第1個P幀圖像，采用PU預測模式全遍歷計算，根據率失真代價選擇最優的PU預測模式。

步驟2)后續P幀圖像，依據二階幀差計算結果，分運動區、平緩區、背景區等3種情況設置PU模式候選范圍。

步驟3)運動區，采用所有PU預測模式全遍歷計算。

步驟4)平緩區，采用2N×2N、2N×N、N×2N、和前幀對應位置的最優PU模式組成候選集。

步驟5)背景區，采用2N×2N、前幀對應位置的最優PU模式組成候選集。

步驟6)根據PU模式候選集，計算最優PU模式。如果在2N×2N模式下，殘差經量化后的所有系數為0，且運動矢量差值也為0，則認定2N×2N模式為當前CU的最優PU模式，提前終止PU模式候選集的計算。

本文算法CU及PU模式判決過程如圖2所示。

2實驗結果及數據分析

為測試與分析快速算法的性能，在HM12.0軟件平臺上按通用測試條件[15]進行測試分析。編碼器采用低復雜度配置、低延時編碼方案，具體測試參數為：

IPPP，MaxPartitionDepth=4，MotionSearchRange=64；采用快速合并模式判決算法(FastDecisionforMerge，FDM)、快速運動估計搜索算法(EnhancedPredictiveZonalSearch，EPZS)和運動搜索加速算法(FastEncoderDecision，FEN)；編碼QP設置為22、27、32和37。

算法性能采用BDBR和BDPSNR[16]指標進行評價，分別表示同樣PSNR下碼率的損失和相同碼率下PSNR的損失情況。采用平均節省時間(AverageSavingTime，AST)表示編碼復雜度，其定義如下

(4)

式中：AST表示本文算法相比HM12.0節省的編碼時間；Timeproposed和TimeHM12.0分別表示本文算法和HM12.0的總體編碼時間。

由表2可見，與HM12.0編碼器相比，本文算法的BDBR平均增加1.530%，BDPSNR平均損失0.068dB，編碼時間AST平均節省48.389%。這一結果說明，本文提出的HEVC幀間模式快速判決算法具有良好的率失真性能，能大幅降低編碼時間。特別是對于背景靜止、運動復雜度較低的序列，本文算法可以跳過大量不必要的CU深度和PU模式計算，加速效果尤為顯著。

表2本文快速算法測試結果與HM12.0的比較

圖3和圖4分別為HM12.0和本文快速算法對“BasketballPass”(416×240)序列進行編碼的最優CU劃分示意圖。根據圖3和圖4的對比可見，僅有5處地方CU劃分結構不同，且CU劃分深度差都僅為1(如圖4中圓圈標識的區域)。這說明本文快速算法的CU劃分準確性較高。

為進一步評估本文快速算法的性能，筆者將文獻[11]中編碼單元裁剪與快速選擇算法、文獻[12]中時空相關的CU分級判決算法和本文基于運動特征的快速算法進行比較。從表3各種快速算法的率失真和編碼時間對比數據可知，與文獻[11]提出的算法相比，本文算法的BDBR降低0.65%，編碼時間能多節省6%；與文獻[12]提出的算法相比，本文算法的編碼時間能節省3%，BDPSNR提高0.02dB，BDBR降低0.98%。因此，本文快速算法的綜合性能要優于這兩種快速算法。其主要原因是本文算法通過二階幀差法提取運動對象，提高了對不同運動特征的CU及PU的預測針對性和準確性，特別是有效減少了背景平滑區的CU及PU遍歷范圍。

3小結

根據運動特征對CU及PU時域相關性的影響分析，本文提出了一種新的基于運動特征的CU及PU模式快速判決算法。該算法首先采用二階幀差法提取運動對象并判定運動劇烈程度，然后根據運動特征采用不同的編碼策略。對運動劇烈區，仍以大范圍遍歷計算為主；對背景平滑區，則主要以前幀相同位置CU及PU的最優模式來預測當前CU的深度范圍，從而有效減少了CU及PU的遍歷范圍。實驗結果顯示，本文算法提高了48.389%的編碼速度，能促進HEVC面向高清視頻監控、視頻會議以及低復雜度實時編碼等領域的應用。

參考文獻：

[1]沈燕飛，李錦濤，朱珍民，等. 高效視頻編碼[J]. 計算機學報，2013，36(11)：2340-2355.

[2]CORREAG，ASSUNCAOP，AGOSTINIL，etal.Performanceandcomputationalcomplexityassessmentofhigh-efficiencyvideodecoders[J].IEEEtransactionsoncircuitsandsystemsforvideotechnology，2012，22(12)：1899-1909.

[3]劉昱，胡曉爽，段繼忠. 新一代視頻編碼技術HEVC算法分析及比較[J]. 電視技術，2012，36(20)：45-49.

[4]CHOIK，PARKSH，JANGES.CodingtreepruningbasedCUearlytermination[C]//Proc.JCT-VC6thMeeting.Torino：JCT-VC， 2011：14-22.

[5]LAROCHEG，POIRIERT，ONNOP.Encoderspeed-upforthemotionvectorpredictorcostestimation[C]//Proc.JCT-VC8thmeeting.SanJose，CA，USA：JCT-VC，2012：121-128.

[6]GWEONRH，LEEYL，LIMJ.EarlyterminationofCUencodingtoreduceHEVCcomplexity[C]//Proc.JCT-VC6thmeeting.Torino：JCT-VC，2011：1-5.

[7]LIX，ANJC，GUOX，etal.AdaptiveCUdepthrange[C]//Proc.JCT-VC5thMeeting.Geneva：JCT-VC，2011.

[8]KIMJ，YANGJ，WONK，etal.EarlydeterminationofmodedecisionforHEVC[C]//Proc.PictureCodingSymposium(PCS).Kraków，Poland：PCS2012：449-452.

[9]LEEHS，KIMKY，KIMTR，etal.Fastencodingalgorithmbasedondepthofcoding-unitforhighefficiencyvideocoding[J].Opticalengineering，2012，51(6)：56-61.

[10]SHENLiquan，LIUZhi，ZHANGXinpeng，etal.AneffectiveCUsizedecisionmethodforHEVCencoders[J].IEEEtransactionsonmultimedia，2013，15(2)：465-470.

[11]蔣剛毅，楊小祥，彭宗舉，等. 高效視頻編碼的快速編碼單元深度遍歷選擇和早期編碼單元裁剪[J]. 光學精密工程，2014，22(5)：1322-1330.

[12]晏軻，滕國偉，胡錦雯，等. 一種基于時空相關性的編碼單元深度快速分級判決算法[J]. 光電子·激光，2014，25(1)：156-162.

[13]姚春蓮，郭克友. 一種利用幀差信息的實時運動對象檢測算法[J]. 計算機工程與應用，2011，47(8S)：390-393.

[14]JCT-VC．HEVCReferenceSoftwareHM-12.0 [EB/OL][2014-09-01].https//hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-12.0.

[15]BOSSENF.JCTVC-L1100,Commontestconditionsandsoftwarereferenceconfigurations[S].2013.

[16]PATEUXS，JUNGJ.Anexceladd-inforcomputingbjontegaardmetricanditsevolution[S].2007.

金智鵬(1982— )，碩士，副教授，主要研究方向為低復雜度視頻編碼與傳輸、圖像質量評價等；

代紹慶(1972— )，碩士，副教授，主要研究圖像壓縮、圖像處理與模式識別；

王利華(1977— )，高級工程師，主要研究網絡視頻測試與傳輸技術。

責任編輯：時雯

FastintermodedecisionalgorithmforHEVCbasedonmotionfeatures

JINZhipeng1，DAIShaoqing1，WANGLihua2

(1.Information Technology Branch Institute，Jiaxing Vocational Technical College，Zhejiang Jiaxing 314036，China；2. Zhejiang(Jiaxing) Microsoft's Technology Research Center，Zhejiang Jiaxing 314000，China)

Keywords:HEVC；interprediction；codingunits(CU)；predictionunits(PU)；co-locatedposition；CUdepthrange

Abstract:ToreducethecomplexityofHEVCinterpredictioncoding，anovelfastCU(CodingUnits)andPU(PredictionUnits)modedecisionalgorithmbasedonmotionfeaturesisproposed.Firstly，todetectmovementintensitythroughsecondorderdifferencemethod，andtoanalyzetheimpactofmotionfeaturestoCUandPUtemporalcorrelation.Secondly，topredictthecurrentCUdepthrangeandPUmodeusingthebestCUandPUmodeoftheco-locatedpositioninthepreviousframe.Then，tooptimizethepredictedrangeaccordingtothemotionfeatures.Finally，inordertospeeduptheinterpredictioncoding，toskipandterminationofsomeunnecessaryCUandPUmodeaccordingtothepredictedrange.ExperimentalresultsonHM12.0showthattheproposedalgorithmcanreduceencodingtimefor48.389%，whileBDPSNRlossisonly0.068dBandBRBRincrementis1.530%．

中圖分類號：TN919.8

文獻標志碼:A

DOI：10.16280/j.videoe.2016.01.003

基金項目：浙江省教育廳科研計劃項目(Y201431212)；嘉興市科技計劃項目(2014AY11003)

作者簡介：

收稿日期：2014-9-12

文獻引用格式：金智鵬,代紹慶,王利華.基于運動特征的HEVC幀間模式快速判決算法[J].電視技術,2016，40(1)：13-18.

JINZP，DAISQ，WANGLH.FastintermodedecisionalgorithmforHEVCbasedonmotionfeatures[J].Videoengineering,2016,40(1)：13-18.