吳國光,劉桂雄,周松斌
(華南理工大學機械與汽車工程學院,廣東廣州 510640)
基于低復雜度自適應幀的WVSN視頻編碼方法
吳國光,劉桂雄,周松斌
(華南理工大學機械與汽車工程學院,廣東廣州 510640)
針對WVSN視頻節點資源受限與視頻編碼方法復雜度高等問題,提出一種基于低復雜度自適應幀的視頻編碼方法。由“隔塊-對角線”差異值計算方法求得差異值,建立自適應幀傳輸機制,避免逐幀判斷,減少計算量。幀內圖像采用多邊形DCT裁剪JPEG壓縮,減少二維DCT計算復雜度。實驗結果表明,該方法在保證視頻質量前提下,能有效降低視頻編碼復雜度,與無裁剪JPEG圖像壓縮相比,當前幀、差分幀JPEG壓縮DCT計算量分別減少9.4%、56.3%;與M-JPEG視頻編碼相比,平均PSNR減少3.1%情況下,平均文件大小顯著減少55.0%。
無線視頻傳感器網絡;視頻編碼;低復雜度;自適應
無線視頻傳感器網絡(wireless video sensor network,WVSN)在視頻監控、運動檢測與跟蹤等領域廣泛應用,但節點資源受限、視頻數據量大,嚴重制約其發展,故必須在傳輸數據前對視頻數據編碼[1]。MPEG-x、H.26x等基于運動估計補償提高壓縮率,但計算量大難以在WVSN應用[2];分布式信源編碼技術將復雜度從編碼端轉移至解碼端,但解碼須編碼節點保持同步、建立多個信源數據相互關系模型等[3-4];多節點協同編碼方法減少圖像重疊部分數據傳輸,但僅適合于視頻節點高密度分布場合[5];個體信源編碼方法的差分JPEG編碼具有數據傳輸量小、信息源間無需通信特點,可在WVSN中應用[6],國內外學者在減少JPEG壓縮計算量、提高差分JPEG編碼適應性等方面開展許多工作。Mammeri等[7-8]將DCT系數按矩形、三角形裁剪減少計算量,但裁剪模式較少;Lecuire等提出Cordic-Loeffler快速DCT算法與矩形DCT裁剪結合,但只能簡單組合使用[9-10];文獻[11]采用周期性產生并傳輸參考幀方法,但存在應用適用性、靈活性問題;Aghdasi等通過比較參考幀、差分幀發送像素總數,動態更新參考幀,提高方法自適應能力,但算法復雜[12]。基于差分JPEG方法,本文提出一種低復雜度自適應視頻編碼方法,詳細闡述自適應幀傳輸機制、幀內圖像壓縮方法、編碼參數初始化與自適應調整方法。
圖1為基于低復雜度自適應幀的視頻編碼方法原理框圖。原始圖像、參考幀數據由自適應幀更新算法生成當前幀、差分幀,采用多邊形裁剪壓縮后經無線方式發送至接收端。無線視頻節點資源受限,視頻編碼算法應權衡復雜度、場景變化程度與編碼質量要求。故建立低復雜度參考幀更新機制、圖像壓縮方法以及視頻編碼參數自適應選取方法是實現低復雜度自適應幀的視頻編碼方法的關鍵。

圖1 基于低復雜度自適應幀的視頻編碼方法原理框圖
1.1 低復雜度自適應幀更新機制
差分JPEG壓縮發送數據分為當前幀、差分幀,參考幀是視頻節點發送數據的判定依據。若當前幀圖像與參考幀圖像差異值大于設定閾值,則發送當前幀并更新參考幀,否則發送差分幀,差異值計算方法、幀傳輸判定是自適應幀更新機制的核心。
為克服逐像素相減累加求差異值法計算量大的問題,下面提出一種“隔塊-對角線”差異值計算方法,圖2為該算法示意圖。

圖2 “隔塊-對角線”差異值計算方法示意圖
圖2(a)將圖像分為8×8 DCT塊,標記“1”表示計算該塊差異值,“0”表示不計算;圖2(b)針對圖2(a)中每個DCT塊,只計算標記“a”位置像素點差異值;圖2(c)為“隔塊-對角線”差異值計算方法完整示意圖。設圖像行、列象素數分別為Pline、Prow,當前幀、參考幀圖像分別為Cf、Rf,則差異值Dsum計算式為

可以看出,該算法較逐像素相減累加法計算量減少87.5%。
基于差異值Dsum,由自適應幀傳輸機制確定發送幀類型,圖3為該方法示意圖,傳輸類型分為發送當前幀、單次發送差分幀、連續發送p個差分幀3種,連續發送p個差分幀針對場景變化較慢情況,可避免逐幀判斷從而減少計算量。

圖3 自適應幀傳輸方法示意圖
由于圖3閾值THDsum、TH′Dsum及p值與其他視頻編碼參數有關,這些參數將在視頻編碼參數自適應選取方法中進一步討論。
1.2 多邊形裁剪JPEG壓縮方法
幀內壓縮采用發明專利技術“一種基于多邊形裁剪DCT的JPEG圖像壓縮方法”[13],圖4(a)為該方法示意圖(裁剪系數為10),僅計算選取區域系數,其他系數置0,裁剪模式為15種。若裁剪系數為ρ,則多邊形裁剪系數個數N(ρ)為

圖4(b)為DCT系數個數與裁剪系數關系圖。
N(ρ)是ρ函數,ρ越大則N(ρ)越多,計算量增加,越接近標準JPEG壓縮系數個數。選擇滿足圖像壓縮質量下的N(ρ)非常關鍵,既要保證質量,又要盡量降低計算量。基于圖像所含頻率成分不同,以及WVSN應用場合對圖像壓縮質量要求差異,本文采用多邊形裁剪JPEG壓縮圖像與標準JPEG壓縮圖像均方根誤差(MSE)為壓縮質量衡量指標,與設定閾值比較,求得合理裁剪系數。設標準JPEG、多邊形裁剪JPEG壓縮圖像分別為I、I′,則

圖4(c)為MSE與ρ關系趨勢圖,ρ增大,MSE減小,且當ρ=15時MSE=0。設滿足編碼質量要求時MSE閾值為THMSE,則合理裁剪系數為

多邊形裁剪JPEG壓縮方法具有較多裁剪模式,DCT計算個數隨裁剪系數變化較平緩,可滿足多種應用場合編碼質量要求。
1.3 視頻編碼參數自適應選取方法
視頻參數對視頻壓縮質量、編碼效率有直接影響,經驗值法受主觀因素影響較大。圖5為本文提出的一種參數自適應選取方法。
視頻傳輸初始階段,視頻節點發送n幀原始圖像至視頻集成平臺,集成平臺將圖像序列分為當前幀、差分幀不同組合,求得圖像序列合理組合方式mopt、當前幀、差分幀裁剪系數ρc與ρD、閾值THDsum、TH′Dsum等參數并傳輸至視頻節點;正常傳輸階段,視頻節點采集圖像后由差異值計算方法求得Dsum并得到傳輸幀類型,圖像壓縮后傳輸;集成平臺接收后解碼、顯示并實時監測實際傳輸時圖像序列組合方式m。對于場景變化較慢情況,可令m≤mopt;對于m<0.5mopt場景變化較快情況,設定上述情況連續出現次數t≥3,才重新初始化,保證視頻場景變化有效性,避免系統參數頻繁初始化。

圖4 多邊形DCT系數裁剪方法及對應特性曲線圖

圖5 視頻編碼參數自適應選取方法流程圖
1.3.1 合理圖像序列組合方式選取
圖6為當前幀、差分幀圖像序列組合方式示意圖,n幀原始圖像可分為n-1方式,方式mi∈[1,n-1],表示發送1當前幀、i幀差分幀。

圖6 當前幀、差分幀圖像序列組合方式示意圖
圖像序列組合方式影響數據傳輸量、視頻傳輸質量,若實際傳輸時圖像序列組合方式m越小,則當前幀nc越多、數據量越大,視頻質量越好。將n幀圖像按圖6分為n-1個組合方式,依次計算當前幀與參考幀差異值并取平均。圖7為平均差異值Dˉsum趨勢示意圖,可以看出,m越大,Dˉsum越大,則mopt應取與平均差異值Dˉsum-mean最接近方式


圖7 圖像序列不同組合方式平均差異值趨勢示意圖
1.3.2 合理裁剪系數選取
由多邊形裁剪壓縮裁剪系數選取方法可求得組合方式mopt下當前幀、差分幀裁剪系數并取算術平均值,求得當前幀、差分幀合理裁剪系數ρc、ρD計算式為

1.3.3 自適應幀傳輸方法參數選取
合理圖像序列組合方式mopt下,有1個當前幀、mopt-1個差分幀,可求得最大、最小差異值分別為Dsum-max、Dsum-min,則圖3中閾值THDsum=Dsum-max、TH′Dsum= 0.5(Dsum-max+Dsum-min)。若Round為取整運算,則視頻傳輸時,由Dsum可得p(p≤mopt)值計算式為

初始化階段,接收端由上述方法求得視頻編碼各參數。為保證參數能適應場景變化,圖像傳輸階段,接收端實時監測實際傳輸時圖像序列組合方式m并根據圖5流程決定是否重新更新參數。
在Matlab平臺建立仿真環境,測試視頻來自http://trace.eas.asu.edu/yuv/視頻測試序列Hall Monitor(QCIF),應用于建筑安全監控,共300幀,取亮度分量為測試對象,1~14幀畫面無變化,系視頻起始階段,故選取15~300幀為仿真測試視頻。第15~30幀為初始化階段參數選取序列,圖8為第15,19,23,30幀圖像。

圖8 測試視頻序列
2.1 視頻編碼初始化參數選取結果
圖10為圖像序列組合方式為12時,即每發送1個當前幀,發送12個差分幀,Dsum與差分幀序號曲線圖。由自適應幀傳輸機制可得THDsum=4.71,TH′Dsum=3.47,p=Round[16.21-3.23Dsum](p≤mop)t。

圖9 平均差異值Dsum與圖像序列組合方式關系圖

圖10 組合方式為12時Dsum與差分幀序號i關系圖
測試視頻合理圖像序列組合方式下當前幀、差分幀個數分別為2和14,圖11為當前幀、差分幀分別采用多邊形裁剪JPEG壓縮裁剪系數與標準無裁剪JPEG壓縮MSE曲線圖。
若THMSE=0,即與無裁剪壓縮差異為0,則由式(6)可分別求得ρc=12、ρc=7,由式(2)可求得,當前幀、差分幀JPEG壓縮DCT計算量分別減少9.4%、56.3%。
2.2 視頻傳輸仿真實驗結果
得到視頻編碼初始化參數后,對余下圖像序列進行仿真測試,測試結果與動態JPEG編碼(M-JPEG)[14](采用逐幀JPEG壓縮,在WVSN中較常使用)進行對比,圖12為本文提出方法與M-JPEG法PSNR、圖像文件大小對比圖。
由圖12可看出,本文方法與M-JPEG圖像平均PSNR分別為37.6,38.8 dB,降低3.1%,但圖像平均文件大小分別為6.8,15.1 kb,顯著減少55.0%,故權衡圖像質量、運算量、數據傳輸量指標,本文研究編碼方法優于M-JPEG,適合應用于資源受限的WVSN。

圖11 組合方式mopt下當前幀、差分幀MSE曲線圖

圖12 本文方法與M-JPEG法對比圖
本文提出的低復雜度自適應視頻編碼方法,基于當前幀與參考幀差異值動態更新參考幀,避免逐幀判斷,減少運算量;自適應幀傳輸機制采用“隔塊-對角線”差異值計算方法具有運算量小、較適用于中近景監控場合等特點;幀內圖像壓縮采用多邊形裁剪JPEG壓縮方法,實現圖像質量精細調節,具有適用性好、裁剪模式多、復雜度低特點;無線視頻節點編碼參數由視頻數據求得初始化參數,可避免經驗值法受主觀因素影響較大且適應性不強問題。測試視頻實驗表明本文編碼方法在保證視頻編碼質量前提下,可顯著降低編碼運算量、數據傳輸量,適合于資源受限的WVSN。
[1]Akyildiz I F,Melodia T,Chowdhury K R.A survey on wireless multimedia sensor networks[J].Computer Networks,2007,51(4):921-960.
[2]Misra S,Reisslein M,Xue G L.A survey of multimedia stream ing in wireless sensor networks[J].IEEE Communicatons Surveys&Tutorials,2008,10(4):18-39.
[3]Puri R,Majumdar A,Ishwar P,et al.Distributed video coding in wireless sensor networks[J].IEEE Signal Process Mag,2006(23):94-106.
[4]Pereira F,Torres L,Guillemot C,et al.Distributed video coding:selecting themost promising application scenarios[J]. Signal Process:Image Commmun,2008(23):339-352.
[5]Ye C H,Ramchandran K.Robust distributed multiview video compression for wireless camera networks[J].IEEE Transactions on Image Processing,2010,19(4):995-1008.
[6]Lee D U,Kim H,Rahimi M,et al.Energy-efficient image compression for resource-constrained platforms[J]. IEEE Transactions on Image Processing,2010,18(9):2100-2113.
[7]Mammeri A,Khoumsi A,Ziou D,et al.Energy-aware JPEG for visual sensor networks[M].MCSEAI,2008-O-ran,Algeria:1-7.
[8]Mammeri A,Khoumsi A,Ziou D,et al.Modeling and adapting JPEG to the energy requirements of VSN[C]∥Proceedings of 17th International Conference on Computer Communications and Networks:Virgin Islands,2008:1-6.
[9]Heyne B,Sun C C,Goetze J,et al.A computationally efficient high-quality cordic based DCT[C]∥Proc Conf EUSIPCO:Florence Italy,2006.
[10]Lecuire V,Makkaoui L,Moureaux J M.Fast zonal DCT for energy conservation in wireless image sensor networks[J].Electronics Letters,2012,48(2):125-127.
[11]Feng W,Kaiser E,Feng W C,et al.Panoptes:scalable low-power video sensor networking technologies[J]. ACM Transctions on Multimedia Computing,Communications and Applications,2005,1(2):151-167.
[12]Aghdasi H S,Abbaspour M,Moghadam M E,et al.An energy-efficient and high-quality video transmission architecture in wireless video-based sensor netowrk[J]. Sensors,2008(8):4529-4559.
[13]劉桂雄,吳國光,譚勇.一種基于多邊形裁剪DCT的JPEG圖像壓縮方法[P].中國,201210131458.1.
[14]Dung T V,Nguyen T Q.Quality enhancement for motion JPEG using temporal redundancies[J].IEEE Transactions on Circuits and Systems for Video Technology,2008,18(5):609-619.
WVSN video coding method based on low complexity self-adaptive frame
WU Guo-guang,LIU Gui-xiong,ZHOU Song-bin
(School of Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,China)
For resolving the problem of constrained resources of node in WVSN and high complexity video coding,a video coding method based on low complexity self-adaptive frame was proposed.The difference value is calculated based on"interlaced-diagonal"method,and the type mechanism of the self-adaptive frame is established to avoid judging each frame to decrease the computation complexity.And intra-frame image coding is based on polygonal DCT pruning JPEG to decrease the complexity of 2D DCT.Simulation results indicate that on the premise of video quality,the proposed method can effectively decrease the complexity of video coding.Compared to JPEG without DCT pruning,the computation amount of DCT in current-frame and differenceframe are decreased by 9.4%and 56.3%respectively.Compared to M-JPEG,the average image size decreased by 55.0%while the average PSNR decreased by 3.1%.
wireless video sensor network;video coding;low complexity;self-adaptation
TP212.9;TN944+.4;TN941.1;TP273+.21
A
1674-5124(2013)03-0073-06
2012-07-23;
:2012-09-29
中國博士后科學基金項目(2012M 511562);廣東省高等學校高層次人才項目(粵教師函[2010] 79號文)
吳國光(1983-),男,廣東梅州市人,博士研究生,主要從事先進傳感與先進儀器研究。