高彥軍
(鄭州地鐵集團有限公司運營分公司,河南鄭州 450000)
通過監控視頻采集到的信息具有較強的直觀性,但是由于監控視頻自身占用空間較大且不易上傳,因此,需要對監控視頻進行處理,以提升監控視頻的應用效果。可以通過壓縮編碼技術降低視頻的占用空間,為監控視頻的處理創造有利條件。
針對視頻壓縮問題,相關領域的學者進行了深入地研究。文獻[1]提出一種全高清視頻實時壓縮編碼與存儲系統設計方法,該方法將H.264 作為技術支撐,對視頻進行壓縮編碼處理,同時,通過FPGA+FLASH 方式對編碼處理后的視頻進行存儲。相比傳統壓縮編碼方法,該方法的壓縮編碼效率得到了提高,但是其在技術應用方面具有一定的局限性,導致該方法的整體效率較低。文獻[2]提出了一種基于JND 與梯度顯著度的HDR 視頻編碼方法,以最大熵定理為基礎,分割HDR 視頻幀,得到視頻的不同區域。修正HDR 視頻幀的JND 閾值,同時,考慮視頻的視覺影像因素,建立感知模型,通過該模型實現視頻壓縮編碼。該方法能夠實現高性能的監控視頻壓縮編碼,但是該方法的覆蓋面積過大,導致對視頻的壓縮編碼時間較長。
針對上述問題,該文提出一種基于標準H.265 的監控視頻壓縮編碼方法,該方法的主要創新點如下:
1)采用H.265 技術對視頻的色度幀數進行預測,根據預測結果選取色度幀內候選的最優模式,有助于降低傳統方法預測的復雜度。
2)進一步運用DM 推導模式從不同的預測結果中可以獲取最佳的監控視頻壓縮編碼方式,避免冗余計算,有利于提升視頻壓縮編碼效率。
3)H.265 技術可以直接避免幀間的像素數據提取操作,大幅度提高了插值精準度。
在監控視頻格式中利用H.265/HEVC 選取色度幀內預測參數,并通過DM 模式進行參數提取,該模式運用分量空間形式對色度幀數進行預測,具有復雜度低的特點,能夠很好地得到分量空間內亮度最大的位置,通過亮度的對比尋找不同色度幀數之間的關系變化情況[3-4]。得知DM 模式下色度幀數根據亮度不同而出現預測結果的變化后,可進行最優模式的選擇[5-6]。
在監控視頻格式中選取LM-L 格式、LM-T 格式和DC 格式數據進行初步預測,計算出每個種類格式的SATD,從計算結果中分析出三種模式的適應環境;對初步獲取的三種模式進行選擇,對三種模式的失真情況進行對比,選擇最優的模式;并對最優模式進行記錄和儲存,實現幀內預測和幀間預測[7-8]。
選取DM 模式對色度亮度參數分量間的相關性進行計算,得到色度編碼的質量閾值。一個色度亮度可以被多個DM 模式提取相關性信息,基于此可以初步構建出DM 模式候選列表,構造方法如表1所示。

表1 DM模式候選列表構造方法
為了強調監控視頻壓縮編碼模式的最佳狀態,該文還對候選列表進行冗余檢查,引入可以識別色度的算法。在監控視頻的某一幀圖像中截取部分面積,然后引入不同模式,在不同模式下添加選擇最佳模式的算法,算法公式如下:
式中,width、height 分別代表監控視頻截取圖像的長度和高度;x代表幀數的代號[9-10]。
DM 推導模式可以對一幀的監控視頻進行不同方向的預測,從不同的預測結果中可以獲取最佳的監控視頻壓縮編碼方式。對色度幀內預測環境進行初始化,調整初始模式為DM 模式,調控DM 亮度預測模式中的角度范圍為4 ≤M≤88,對M加減N值,得到的結果分別為M1和M2,式(2)和式(3)為DM 推導模式,算法表達式為:
傳統的DM 推導算法受到角度范圍的約束,通過以上計算可以很好地避免冗余檢查,確定最優模式[11]。
H.265 監控視頻壓縮編碼具有樹形編碼結構,在進行壓縮編碼的過程中可以將一幀圖像劃分成為多個相互獨立的編碼樹單元,H.265 技術下的編碼數單元大小為64×64,能夠融入到高分辨率的監控視頻中,從而為更高效率的壓縮編碼提供硬性基礎[12-14]。64×64 的編碼數單元還可以進一步實現分解,最多可以劃分為三叉,每叉單元均可以根據相關的編碼特征進行格式的平滑處理,若編碼數單元小于64×64可以不進行下一階段的分解,按照編碼數單元的紋理即可完成監控視頻的初步壓縮編碼。得到的樹形編碼結構如圖1 所示。

圖1 樹形編碼結構
考慮到監控視頻硬件設備是否支持H.265 技術的實現問題,該文對亮度大小為4×4 的幀內預測進行了強制變換,使監控視頻在解壓編碼的過程中亮度參數只能在DCT2 和DST7 之間反復切換。DCT2切換到DST7 的計算公式如下:
式中,T(j)代表基函數;j、i分別代表DCT2 和DST7 函數核類型。DST7 切換到DCT2 的計算函數如下所示:
式中,M(j)表示DST7切換到DCT2的計算函數[15]。
H.265 監控視頻完成樹形編碼結構的劃分后,按照預測單元的量化模式變化情況需要進行幀內/幀間預測。其中,幀內預測技術的實現基于監控視頻中每一幀的兩個相鄰的重構圖像,H.265 技術下的幀間預測技術在1/2 幀間使用對稱8 階濾波器,在1/4幀間使用非對稱7 階濾波器,直接避免了幀間的像素數據提取操作,大幅度提高了插值精準度。除此之外,幀間預測技術還利用時域/空域運動向量的相關性,定義了播放狀態下不同預測模式下的編碼參數,通過一個編碼參數便可以索引到整個監控視頻的待壓縮編碼片段[16]。H.265 技術下的所有編碼流程均裝設了傳輸加速方案,使得監控視頻的壓縮編碼速度能夠與視頻監控的播放采集速度相匹配。
為了驗證該文提出的基于標準H.265 的監控視頻壓縮編碼方法的實際應用效果,進行實驗研究。選用傳統的全高清視頻實時壓縮編碼與存儲系統設計方法(文獻[1]方法)和基于JND 與梯度顯著度的HDR 視頻編碼方法(文獻[2]方法)進行實驗對比。
由于5.0 Hz 的無線頻段能夠在短時間內實現長距離傳輸,且信號強度更強,穩定性更好,因此該文選用5.0 Hz 的無線頻段作為實驗研究對象,設置傳輸距離為3 km,數據傳輸速率在600 Mb/s 以上,每隔500 m 設置一個中繼點,實驗環境如圖2 所示。

圖2 實驗環境
在上述參數設置與實驗環境下進行實驗分析。在實驗中,將壓縮效率、編碼效率與壓縮編碼成本作為實驗指標,對該文方法、文獻[1]方法和文獻[2]方法進行對比,得出相關結論。
1)壓縮效率對比
壓縮效率實驗結果如圖3 所示。

圖3 壓縮效率實驗結果
觀察圖3 可知,相比文獻[1]方法與文獻[2]方法,該文方法的壓縮效率得到了大幅度提升,說明該文方法解決了傳統方法存在的視頻壓縮編碼效率較低的問題,具有較強的壓縮編碼能力。
2)編碼效率對比
同時分析編碼效率,得到的編碼效率實驗結果如圖4 所示。

圖4 編碼效率實驗結果
根據圖4 可知,該文提出的編碼方法編碼效率最高,原因是H.265 為幀內預測模式提供了30 多種幀內預測途徑,與傳統方法相比,能夠更細致地對圖像角度進行劃分,使得H.265 監控視頻壓縮編碼具有更高的精確度,在提高了精確度的同時也減少了殘差數據在壓縮編碼中的存在量,進而提高了壓縮效率。幀間預測技術是一種運動補償方法,可以在監控視頻實時播放的狀態下,利用插值法提取監控視頻中非整數像素,因此,能夠在短時間內實現高質量數據編碼。
3)成本對比
標準H.265 能夠結合上游芯片和IC 技術,降低工作運行成本,為驗證標準H.265 在監控視頻壓縮編碼方面的成本降低能力,對編碼成本進行分析,得到的實驗結果如表2 所示。
觀察表2 可知,該文提出的H.265 壓縮編碼成本遠低于傳統的壓縮編碼方法。該文提出的壓縮方法通過H.265 不同編碼格式下的視頻資源分別傳輸到壓縮終端,終端內支持各種APP 端和flash端的流暢播放,通過壓縮編碼技術進行了空間釋放,增加了CPU 的運算處理能力,減少了硬件設備的高負荷運轉,避免了壓縮編碼后的監控視頻出現畫面卡頓、格式不兼容和音頻錯位等問題,有效降低了成本。
綜上所述,基于H.265 的視頻壓縮方法相比傳統方法具有更高的壓縮與編碼效率,且能夠實現在較短的寬帶內完成監控內容的上傳,成本更低,能夠很好地解決成本問題,更適用于實際的壓縮工作。
H.265 作為未來視頻壓縮編碼市場的主要技術標準,相比傳統技術具有更高的工作效率和壓縮空間。該文基于H.265 技術標準設計了監控視頻的壓縮編碼方法,解決了監控視頻壓縮編碼CPU 過負荷參與而導致的壓縮空間小問題,還運用各種模式預測方法選擇了最佳的壓縮編碼模式,大幅度提高了壓縮編碼效率。在樹形編碼結構、幀內/幀間預測技術和采樣自適應補償等技術優勢的基礎上,實現了監控視頻壓縮編碼方法流程運作。