劉帆 強發(fā)軍 趙明旭 倪旭 韓冷



摘要:本文對圖像質量主觀評價和客觀評價方法進行了介紹和優(yōu)缺點分析,針對主觀評價方法耗時耗力、隨機性大等缺點,構建了一種圖像質量客觀評價模型,介紹幾種常用的圖像質量客觀評價算法并對其進行計算機仿真,實現(xiàn)了多路圖像質量高低定量排序。進行對比實驗,對該圖像質量客觀評價模型進行驗證,實驗結果表明該模型所采用的客觀圖像質量評價與主觀評價基本保持一致。
關鍵詞:圖像處理;質量評價;主觀評價;客觀評價;算法設計
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2020)06-0107-04
1 圖像質量評價方法
圖像質量的評價方法可以分為主觀評價和客觀評價兩大類,其中,主觀評價方法直觀、比較準確以及有效,但是由于在一定的測試環(huán)境中由多個觀測者來對圖像進行評分,然后對大量評分數(shù)據(jù)進行統(tǒng)計分析,因此耗時,不易實現(xiàn);客觀評價方法一般是由某個數(shù)學模型來計算出圖像質量的分數(shù),比較經濟實用,但是要求客觀評價的結果應該與主觀評價的結果具有較好的相關性。
1.1 主觀評價方法
圖像質量主觀評價就是選擇一批非專業(yè)的觀測員,讓他們在特定的環(huán)境下,連續(xù)觀看一系列的測試序列,觀看時長大概10到30分鐘,然后采用不同的方法讓他們對視頻序列的質量評分。主觀評價結果有兩種表示方法:一種是絕對評分MOS(Mean Opinion Score),表示待測視頻的絕對質量;另一種是差值表達DMOS(Difference Mean Opinion Score),表示待測視頻與參考視頻質量的差值。主觀評價方法主要包括雙刺激連續(xù)質量分級法、雙刺激損傷分級法、單刺激連續(xù)質量評估法、絕對分類評價法等4種。
由于人是視頻的最終接收者,因此主觀評價是最可靠和最準確的方法。但是主觀評價方法需要投入大量的人力和物力,測試環(huán)境要求嚴格,評測得到結果所需時間長,而且無法嵌入到實際的系統(tǒng)中,應用范圍很有限。目前主觀評價方法主要用于驗證客觀評價方法的有效性,可以根據(jù)主觀評價實驗來驗證其他方法的結果。
1.2 客觀評價方法
圖像質量主觀評估由于需要大量的非專業(yè)人員對圖像進行評價,比較耗時且結果易受多種因素影響,因此在實際應用中需要一種客觀的、簡單的圖像質量評價方法。根據(jù)用于評價的輸入數(shù)據(jù)形式,可以將客觀評價方法主要分為五類:(1)媒體層模型(Media-layer models),利用解碼后的視頻信號來計算體驗質量QoE(Quality of Experience),不需要測試系統(tǒng)的任何信息,因此能很好應用到如編解碼比較和編解碼優(yōu)化的場景中。(2)帶參數(shù)的包層模型(Parametric packet-layer models),與媒體層不同的是,該模型預測QoE只用到包頭的信息,而不接觸媒體信息,因此該模型的算法復雜度低。(3)參數(shù)規(guī)劃模型(Parametric planning models),只使用與媒體相關的網絡規(guī)劃參數(shù)和終端應用參數(shù),因此需要事先知道測試系統(tǒng)的信息。(4)碼流模型(Bitstream-layer models),利用碼流信息和包頭信息來度量QoE。(5)混合模型(Hybrid models),將以上兩個或更多的模型特性結合一起,能夠使用的信息更加全面。
1.3 影響圖像質量的因素
在研究圖像頻質量評價方法前,有必要分析影響圖像頻質量的因素。一方面,當前網絡帶寬有限,如果要在網絡上實現(xiàn)圖像頻高速傳播,必須對圖像頻進行一系列處理,如信號采集、壓縮等[1-2],這樣可以減小圖像頻文件的大小以適應網絡帶寬。然而,對圖像頻進行壓縮處理的同時,必然會引起圖像頻質量下降。另一方面,網絡的不可靠性同樣會對圖像頻帶來各種各樣的失真。當前IP網絡盡力傳輸機制,無法保證服務質量。同時,在現(xiàn)實網絡中有諸多不穩(wěn)定的因素如:網絡傳輸過程中,設備電壓不穩(wěn),導致比特傳輸錯誤;網絡發(fā)生堵塞,導致數(shù)據(jù)包丟失。所以不可靠的網絡傳輸也是圖像頻質量降低的重要原因。
由此可知網絡應用的圖像頻質量的損傷主要來源于兩個因素。一是為了適應網絡的需求,對圖像頻進行壓縮編碼,而有損壓縮的編碼方式使得解碼后的圖像頻無法完全恢復成原始圖像頻,從而產生的圖像頻質量模糊等現(xiàn)象。二是網絡的不穩(wěn)定性導致可能出現(xiàn)的傳輸誤碼,從而導致圖像頻質量失真等現(xiàn)象。
2 圖像質量客觀評價算法設計
2.1 算法概述
清晰度也指模糊度或粗糙度,是指人眼能感覺出的相鄰影像間的明顯程度,圖像質量的好壞與其清晰度直接相關。導致圖像清晰度下降的原因是模糊現(xiàn)象的產生,在圖像的采集、傳輸、壓縮和濾波等各種處理過程中都可能產生模糊,比如曝光期間成像系統(tǒng)和被攝物體相對運動產生的運動模糊,成像系統(tǒng)聚焦不良或部分景物處于散焦狀態(tài)產生的離焦模糊,光的衍射、以及壓縮之后高頻丟失等產生的各類模糊,電子系統(tǒng)高頻性能不良也會損失圖像的高頻分量而使圖像模糊等。圖像模糊是由于圖像高頻分量的丟失造成的邊緣或者細節(jié)不清晰,清晰圖像比模糊圖像包含更豐富的細節(jié)信息,即高頻分量[3],圖像邊緣和紋理失真很小,幾乎可以忽略。所以可以通過衡量圖像包含高頻分量所占的比例來評價圖像的清晰度。在數(shù)字圖像處理中,梯度函數(shù)常被用來提取邊緣信息,聚焦越好的圖像,具有越尖銳的邊緣,圖像梯度函數(shù)值就越大。常用的梯度函數(shù)有:能量梯度函數(shù)、方差函數(shù)和Roberts梯度算子等。
2.1.1 能量梯度函數(shù)
利用相鄰點的差分計算一個點的梯度值,計算公式如下:
2.1.2 方差函數(shù)
該方法是一個比較流行的自動對焦的清晰度評價函數(shù)。由于清晰圖像比模糊圖像存在更大的灰度級差異,所以方差函數(shù)可作為圖像清晰度高低的一個評價標準。方差函數(shù)計算公式如下:
2.1.3 Roberts梯度算子
2.2 算法仿真
由于方差函數(shù)法運算過程簡便,算法復雜度低,被廣泛應用于圖像質量評價中,因此這里也采取方差函數(shù)法進行圖像質量評價。
在VC++環(huán)境[4-5]下編寫程序,利用4幅施加不同程度高斯噪聲的圖像來檢驗圖像質量評價算法,如圖1所示,高斯噪聲系數(shù)σ越大,圖像中包含的高斯噪聲越多,圖像質量越差。采取方差函數(shù)法對4幅圖像進行計算,得到的評價值分別為:43.95,41.66,39.87,36.63,評價值與圖像效果的對應性較強。
對matlab系統(tǒng)自帶的lena圖片施加不同程度高斯噪聲進行圖像質量評價算法驗證。采取方差函數(shù)法對4幅圖像進行計算,如圖2所示,得到的評價值分別為:50.89,47.56,45.38,42.21,評價值與圖像效果的對應性較強。
3 對比實驗
3.1 實驗素材選取
實驗素材的選取對整個研究過程具有重要地位,所選擇的視頻素材序列要盡可能多的視頻場景,而且所包含的內容需包含典型的空域復雜度(SC,Spatial Complexity)和時域復雜度(TC,Temporal Complexity)??沼驈碗s度越高,表示視頻圖像包含的邊緣與紋理越多;時域復雜度越高,視頻運動越劇烈。文本將序列分為四類,其中第I類表示運動平緩但空域內容復雜;第II類表示運動劇烈且空域內容復雜:第III類表示運動平緩且空域內容平滑;第IV類表示運動劇烈但空域內容簡單。本文所選取的原始視頻序列涵蓋所有這四種類型。
3.2 主觀評價過程
3.2.1 觀測人員
觀測人員即是應邀請參加主觀評價的評分人員,參與評測的人員都是隨即選取的技術人員,并且不是研究視頻圖像方面的專業(yè)人員,一共有8人參與此次主觀評測,并且所有的觀測人員具有正常的視力。每個失真序列都被所有的觀測者評價。在評測開始之前,每個觀測者都被告知實驗的目的,并且經歷一段短時間的訓練。訓練的視頻序列不屬于本文建立的視頻數(shù)據(jù)庫里的一部分。每個訓練視頻持續(xù)時間為10s,并且視頻質量從好到壞。
3.2.2 顯示設備
實驗中,在PC使用Matlab的XGL工具箱進行視頻的播放以及打分。界面如圖3所示。視頻顯示設備為23ich的液晶顯示器,分辨率為1440×900。為了避免由于尺寸變換帶來失真,視頻以各自原始分辨率播放,顯示畫面的其余部分為黑色背景,并在畫面下方有一個連續(xù)標尺,并有一個十字光標在標尺正中。在視頻播放完之后,會在屏幕上顯示一個質量打分標尺,標尺最左端標記“Bad”,最右端標記“Excellent”,中間等間隔距離分別標記“Poor”、“Fair”和“Good”,5個質量等級分別對應1-5分。觀測者可用鼠標移動標尺中央處的十字光標。在移動十字光標后,觀測者要求按下鍵盤上的任意鍵來輸入對視頻的打分。一旦打分鍵入,將無法更改。當完成當前的評分,下一個視頻將開始播放。
3.2.3 主觀評價數(shù)據(jù)處理
采用MOSj來表示視頻j的評分,N為參與評分的人數(shù),dij表示第i個人對視頻j的評分,則MOSj如下式計算:
3.3 實驗結果
對圖1和圖2分別進行主觀圖像質量評價,得到結果如表1和表2所示??梢钥闯觯?.2節(jié)中所采用的客觀評價得分排序與主觀評價相同。實驗結果表明該模型所采用的客觀圖像質量評價與主觀評價基本保持一致,驗證了模型和算法的正確性。
4 結語
圖像質量的評價方法可以分為主觀評價和客觀評價兩大類,其中,主觀評價方法直觀、比較準確以及有效,但是由于在一定的測試環(huán)境中由多個觀測者來對圖像進行評分,然后對大量評分數(shù)據(jù)進行統(tǒng)計分析,因此耗時,不易實現(xiàn);本文針對主觀評價方法的缺點,構建了一種圖像質量客觀評價模型,設計了算法并對其進行計算機仿真,實現(xiàn)了多路圖像質量高低定量排序。進行對比實驗,對該圖像質量客觀評價模型進行驗證,實驗結果表明該模型所采用的客觀圖像質量評價與主觀評價基本保持一致,驗證了模型和算法的正確性。
參考文獻
[1] 阮秋琦.數(shù)字圖像處理(MTALAB版)(第二版)[M].北京:電子工業(yè)出版社,2014.
[2] 左飛,萬晉森,劉航.數(shù)字圖像處理原理與實踐[M].北京:電子工業(yè)出版社,2012.
[3] 原魁,何文浩,肖晗.基于FPGA的嵌入式圖像處理系統(tǒng)設計[M].北京:電子工業(yè)出版社,2013.
[4] 齊舒.Visual C++.NET高級編程(第1版)[M].北京:清華大學出版社,2002.
[5] 葉乃文,王丹.面對對象程序設計(第2版)[M].北京:清華大學出版社,2009.