王嘯晨,潘 榕
(1.天津大學 電子信息工程學院,天津 300072; 2. 國家廣播電視產品質量監督檢驗中心,北京 100015)
基于圖像失真類型的自適應圖像質量評價方法
王嘯晨1,潘榕2
(1.天津大學電子信息工程學院,天津 300072; 2. 國家廣播電視產品質量監督檢驗中心,北京 100015)
摘要:提出了一種圖像質量評價方法,所提出的評價算法抽取DCT系數特征來代表圖像的失真類型,使用基于支持向量機的分類器對圖像失真類型進行預測,隨后針對每一種失真類型,給出相應的融合評價算法,對圖像進行質量評價。實驗結果表明,該算法在整體性能上要優于傳統的PSNR及SSIM等圖像質量評價算法。
關鍵詞:支持向量機;圖像質量評價;特征提取;失真類型
圖像質量評價是數字圖像處理領域中的一個熱點問題,建立高效、精準的圖像質量評價體系具有重要的理論意義和實際應用價值。從評價主體角度來講,可將圖像質量評價方法分為兩類:主觀質量評價和客觀質量評價[1]。主觀質量評價[2]最為準確、可靠,但耗時、耗力,易受實驗環境、觀察者喜好等因素影響,評價結果往往不穩定,不適用于實際應用中的實時處理要求。客觀評價[2]利用數學和工程的方法對圖像質量進行評價,其追求的目標是建立客觀評價體系,使評價結果盡可能地與主觀評價保持一致,擁有低成本、高效率等優點,從而可被廣泛引入實際應用中。
從算法對原始圖像的依賴程度來講,客觀質量評價算法可分為全參考型、部分參考型及無參考型[3]。本文主要討論全參考型的算法。根據算法所依據理論的不同,全參考型算法可分為以下幾類:1)基于像素誤差統計的算法。峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)[4]和均方誤差(Mean Squared Error,MSE)[5]是普遍使用的兩種評價方法,通過計算對應像素點灰度值之間的誤差來表征圖像質量;2)基于圖像結構特征的算法,Wang Zhou等人提出的SSIM(Structural SIMilarity)[6]將結構相似度引入圖像質量評價,取得了里程碑式的突破;3)結合信息論理論的算法,視覺信息保真度(Visual Information Fidelity,VIF)[7]是從信息論角度出發,通過計算原始圖像與失真圖像間的互信息評價圖像質量;4)基于人眼視覺模型的算法,其典型代表為Sarnoff實驗室提出的基于人眼視覺特性的剛辨差(Just Noticeable Difference,JND)[8]模型。
全參考圖像質量評價的方法很多,但同一圖像采用不同方法評價質量,得到的結果卻不盡相同。本文研究的客觀質量評價算法建立在全參考型評價基礎上,依據圖片失真類型提出了一種自適應圖像質量評價算法(Distortion based Self-adaption Algorithm,DSA)。該方案首先采用機器學習對訓練樣本進行統計學習,建立分類模型,智能地實現圖像失真類型的判斷;然后自適應地給出每種失真類型對應的融合評價算法,得出其客觀評價分值,使其與主觀評價更接近。本方法在TID2008數據庫[9]上進行了實驗,結果表明,在圖像失真類型分類及質量評價算法選擇方面均有很好的準確度,且能較快算出與主觀評價打分更接近的客觀評價值。
1失真圖像的特征提取
TID2008數據庫所提供的圖片信息均按照失真類型進行了分類。為了依據失真圖像的特性對圖像進行失真類型預測,首先需要選擇性能良好的圖像特征表征圖片失真信息。本文首先對圖像做預處理以建立規范化差值圖像,然后進行分塊、DCT變換等步驟,從中提取特征向量用于圖像失真類型的分類。
1.1圖像預處理
對于一幅大小為M×N的失真圖像與其對應的原始圖像,首先將它們轉化為灰度圖像,然后進行歸一化處理,把圖像像素動態范圍統一到[0,1]區間,再利用圖像差值法得到兩幅圖像的差值圖像。
1.2提取DCT特征
離散余弦變換(Discrete Cosine Transform,DCT)[10]是一種空域到頻域的變換,能很好地去除圖像空間的相關性,描述圖像信號的空間特征。圖像經DCT變換后的主要能量集中在其DCT系數左上角的低頻系數中,因此可以用這一小部分系數來代表整個圖像的特征。本文中采用二維DCT變換對圖像進行特征提取。
將預處理后得到的差值圖像分割成n×n大小的非重疊塊,因此共有B=(M/n)×(N/n)個圖像塊。按從左到右、從上到下的順序對圖像塊進行編號,Blocki記為第i個圖像塊,其中1≤i≤B。對圖像塊Blocki進行二維DCT變換得到n×n個DCT域系數。
位于圖像塊左上角的DCT系數是直流系數,反映了圖像塊的平均亮度,而圖像塊中的其他系數均為交流系數,代表了圖像塊的紋理信息,本文所需的失真類型特征應該從交流系數中提取。從第一個交流系數開始,進行Zigzag掃描,得到重新排列的DCT交流系數Cj:j=1,2,…,n2-1。DCT域的低頻系數代表了圖像塊的主要信息,所以本文抽取圖像塊的前α個系數組成特征向量,其中1≤α≤n2-1。則圖像塊Blocki的特征為
vi={C1,C2,…,Cj,…,Cα}
(1)
那么第k幅差值圖像的圖像特征為
Vk={v1,v2,…,vi,…,vB}
(2)
式中:Vk為α×B維的實數向量。
圖像特征提取過程如圖1所示。TID2008數據庫中的圖像大小均為512×384,以8×8尺寸對圖像進行不重疊分塊,共到3 072個圖像塊。在保證分類器準確率的前提下,為進一步降低數據量,本文每隔4行4列取塊,共抽取192個塊。對這192個塊做二維DCT變換并進行Zigzag掃描,本文選取α=10,即前10個DCT交流系數,由式(1)~(2)可得到1 920維的失真類型特征Fk,后文中將使用此特征來訓練圖像失真類型分類器。

圖1 圖像特征提取流程
2基于支持向量機的圖像失真類型分類
支持向量機(Support Vector Machine,SVM)[11]是Vapnik等人提出的一種基于統計理論的機器學習算法,非常適合于解決非線性分類、高維模式識別等問題。對于低維空間中的線性不可分問題,SVM可通過核函數將低維樣本投射到高維空間中,使其在高維空間中變得線性可分或者接近于線性可分,在新的空間中構造軟間隔的最優超平面,實現樣本的分類。
本文的實驗平臺是MATLAB,使用的SVM工具包為LIBSVM-3.14。在分類過程中,為提高分類的準確率,本文采用網格搜索算法對分類參數c,g進行了尋優。網格搜索法即在某范圍內,遍歷參數,尋找最優的c,g,使得分類器的性能達到最好。
本文選取高斯模糊和JPEG壓縮兩種失真類型的圖像進行失真分類實驗。兩類失真共選取200個樣本圖像,其中用于建立分類模型的訓練樣本共100幅(JPEG壓縮50幅,高斯模糊50幅)圖像,組成100組圖像特征(Fk,k=1,2,…,100)并進行訓練,可得到相應的支持向量、最優分類面方程的權值以及偏置量,即SVM分類器。對剩余100組測試樣本進行失真類型預測,結果如表1所示。
表1分類準確率

比較項高斯模糊JPEG待測圖像數量5050預測正確數量5049準確率/%10098
由表1可知,高斯模糊的分類準確率為100%,JPEG的分類準確率為98%,整體分類準確率為99%,性能很好。其中SVM的參數尋優結果為c=4,g=0.015 625。
3圖像質量評價模型
目前來說,雖然經過多年的發展,圖像質量評價算法不斷涌現,但是大多數算法都很難滿足需求,即與人眼的主觀評價達成高度一致。本文設計了一種基于圖像失真類型的自適應評價算法,該算法可依據圖像的失真類型,智能地選取相應的計算公式,對圖像進行質量評價。
通過最小二乘法求解式(3),可以確定每一種失真類型所對應的一組μmi和c,建立自適應評價模型,即
(3)
其中:MOS(Mean Opinion Score)為已知主觀評價打分值;m為4種經典圖像質量評價算法的序號,即IQA1代表PSNR,IQA2代表SSIM,IQA3代表JND,IQA4代表VIF;i為評價指標的冪次;μmi為每一個IQAm或其冪次項的權重系數,c為常數項。本實驗研究的失真類型為兩類(高斯模糊、JPEG),即對應的μmi和c有兩組,通過實驗可得如表2所示的結果。
表2質量評價模型參數

失真類型cμ11μ12μ21μ22μ31μ32μ41μ42高斯模糊0.379-0.1063.456-1.2150.8850.795-0.6920.994-0.531JPEG-0.0203.066-6.1070.378-0.371-0.5780.2031.568-1.245
自適應評價模型建立之后,本算法可依據SVM分類器預測的圖像失真類型,選用對應于該失真類型的一組μmi和c,采用下式得出客觀評價指標DSA
(4)
4質量評價模型的性能
衡量一個圖像質量評價方法的性能,即評估客觀預測和主觀評價的一致程度主要有3個指標:1)Pearson相關系數(Linear Correlation Coefficient,LCC),反映了客觀評價指標與MOS間的線性相關性;2)Spearman等級相關系數(Spearman’s Rank Ordered Correlation Coefficient,SROCC),反映了客觀評價指標與MOS間的單調相關性;3)均方根誤差(Root Mean Squared Error,RMSE),反映了評價誤差。其中,LCC,SROCC的取值范圍均為[-1,1],其絕對值越接近1,則表示一致性程度越高;RMSE作為誤差指標,其值越低,則代表評價算法性能越好。
質量評價實驗中仍采用上文第3章節中的訓練集和測試集進行實驗,依據式(3)建立評價模型。根據式(4)計算這些圖像的DSA,得出PSNR,SSIM,JND,VIF及DSA的評價指標SROCC,LCC,RMSE并進行比較,如表3所示。圖2中畫出了測試集合中DSA和MOS的散點圖和擬合曲線。
表3算法性能指標

性能指標SROCCLCCRMSEPSNR0.8534050.8508970.357818SSIM0.9311010.8295390.293137JND0.9006100.893650.387128VIF0.9138070.9469740.217573DSA0.9587750.9614090.05959
由表3和圖2可見,相比于PSNR,SSIM,JND,VIF算法,本文提出的基于失真類型的自適應圖像質量評價算法在所有評價指標中均獲得了更好的效果,散點圖分布在一條曲線周圍,與MOS值高度一致,可以被應用于實際的圖像評價系統中。



圖2 DSA和MOS的散點圖和擬合曲線
5小結
本文建議采用機器學習對失真差值圖像進行分析,建立用于失真類型分類的SVM分類器。基于所建立的失真類型分類器及傳統質量評價算法的性能分析,本文提出了一種自適應圖像質量評價模型DSA,該模型可以依據待測圖像的失真類型,自適應地選擇質量評價算法及計算參數。實驗結果表明,DSA算法能很好地對圖像失真類型進行分類,得出客觀評價值,且與主觀評價指標有很好的一致性。
參考文獻:
[1]DUSAUSSOY N J,ABODOU E. Survey of image quality measurement[C]//Proc. 1986 ACM Fall joint Computer Conference.[S.l.]:ACM Press,1986:71-78.
[2]WANG Z,BOVIK A. Modern image quality assessment[M].New York:Morgan and Claypool Publishing Company,2006:1-102.
[3]WANG Z,BOVIK A,SHEIKH H. Image quality assessment: from error visibility to structural similarity[J].IEEE transactions on image processing,2004,13(4):600-612.
[4]AVCIBAS I,SANKUR B,SAYOOD K. Statistical evaluation of image quality measures[J]. Journal of electronic lmaging,2002,11(2):206-213.
[5]AHMET E,PAUL F. Image quality measures and their performance[J]. IEEE transactions on communication,1995,43(12):2959-2965.
[6]WANG Z,BOVIK A,SHEIKH H,et al. Image quality assessment: from error visibility to structural similarity [J]. IEEE transactions on image processing,2004,13(4):600-612.
[7]SHEIKH H,BOVIK A. Image information and visual quality [J]. IEEE transactions on image processing,2006,15(2):430-444.
[8]LUBIN J. A visual discrimination model for image system design and evaluation [M]. NJ:World Scientific Publishers,1995:245-283.
[9]PONOMARENKO N,CARLI M,LUKIN V,et al. Color image database for evaluation of image quality metrics [C]//Proc. Int. Workshop Multimedia Signal Processing.[S.l.]:IEEE Press,2008:403-408.
[10]AHMED N,NATARAJAN T,RAO K. R. Discrete consine transform [J]. IEEE transactions on computers,1974,100(1):90-93.
[11]VAPNIK V. N. An overview of statistical learning theory[J]. IEEE transactions on neural networks,1999,10(5):988-999.
責任編輯:許盈
Self-adaption image quality assessment scheme based on distortion type classification
WANG Xiaochen1,PAN Rong2
(1.SchoolofElectronicInformationEngineering,TianjinUniversity,Tianjin300072,China;2.NationalTestingandInspectionCenterforRadioandTVProducts,Beijing100015,China)
Abstract:In this paper, a distortion type based image quality assessment algorithm is proposed. DCT coefficients are extracted as distortion feature vectors of images and the distortion type is predicted via support vector machine, then assess the image quality by a fusion assessment algorithm corresponding to each distortion type. Experimentation on the standard database is carried out, and it is found that the proposed method outperforms the traditional image quality assessment algorithms.
Key words:support vector machine; image quality assessment; feature extraction; distortion type
中圖分類號:TN911.73
文獻標識碼:A
DOI:10.16280/j.videoe.2016.02.026
收稿日期:2015-11-17
文獻引用格式:王嘯晨,潘榕. 基于圖像失真類型的自適應圖像質量評價方法[J].電視技術,2016,40(2):137-140.
WANG X C,PAN R. Self-adaption image quality assessment scheme based on distortion type classification[J].Video engineering,2016,40(2):137-140.