應宏微 蔣剛毅 郁 梅 彭宗舉 邵 楓(寧波大學信息科學與工程學院 寧波 315211)(寧波工程學院電子與信息工程學院 寧波 315211)(南京大學計算機軟件新技術國家重點實驗室 南京 210093)
?
基于場景模式的立體圖像舒適度客觀評價模型
應宏微①②蔣剛毅*①③郁梅①③彭宗舉①邵楓①
①(寧波大學信息科學與工程學院寧波315211)
②(寧波工程學院電子與信息工程學院寧波315211)
③(南京大學計算機軟件新技術國家重點實驗室南京210093)
摘要:為了預測雙目立體圖像內容對視覺健康可能產生的危害,該文提出一種基于場景模式的立體圖像舒適度客觀評價模型。根據場景中前景目標和后景區域相對于顯示屏幕的凹凸性以及是否處于舒適觀看區,將自然場景抽象為多種場景模式。在模式選擇階段,從視差圖中自適應分割出前景目標和后景區域,根據前、后景的視差角特征確定場景所屬的模式;在建模階段,采用前、后景的視差角特征結合前景的寬度角和曲折度特征對各個場景模式分別進行建模,并量化了前、后景視差因素對視覺舒適度的影響。在IVY數據庫上的實驗結果表明,所提出的模型與主觀感知存在較好的一致性,Pearson相關系數高于0.91,Spearman相關系數高于0.90,Kendall相關系數高于0.74,平均絕對值誤差低于0.24,均方根誤差低于0.32,與現有的方法相比,該文所提出的模型的評價效果更好,更接近于主觀測試結果。
關鍵詞:立體圖像;舒適度評價;場景模式;雙目視覺
近幾年來,以3D電影、3D游戲為代表的3D文化產業所產生的巨大需求,帶動了立體視覺相關產品的飛速發展,使用戶得到了全新的視覺體驗[1,2]。但由于人眼視覺機制、3D內容、顯示器參數、觀看條件等原因,人們在觀看3D節目后會產生諸如眼疲勞、頭痛、惡心等生理上的不舒適感[3],從而限制了3D圖像/視頻系統的廣泛應用。為了改善這個問題,3D產業發展需要舒適度評價體系以指導3D內容制作、后期處理等方面的工作,此時視覺舒適度評價(Visual Comfort Assessment,VCA)就引起人們的關注[4]。
立體圖像引起不舒適的原因有許多,從人的生理線索來說,視差是產生深度感知的主要途徑[5],但由于人眼觀看立體景物時存在的“調節”(accommodation)與“會聚”(輻輳,vergence)的矛盾機制,過大的視差也是引起雙目無法融合,導致視覺疲勞的主要因素[6]。寬度因素也是一種對舒適度影響較大的特征,文獻[7,8]發現,在視差因素固定的情況下,雙目融合限制和目標寬度因素呈現為一種線性關系,寬度越小,融合限制越強,越容易引起不舒適感。此外,圖像的空間頻率特征會對雙目融合產生影響[9,10],隨著頻率下降、雙目融合限制會放松。文獻[11]發現對圖像進行模糊或者銳化會影響視覺舒適度,當視差超過雙目融合限制時,如果空間頻率較低,主觀實驗受試者中感到不舒適的人數相對較少。文獻[12]的主觀實驗表明,立體圖像低空間頻率所致的模糊可以增加觀看舒適度。
就立體圖像舒適度的客觀評價,文獻[13]提出了基于加權最大視差、相對視差和目標寬度特征(WMX+RD+OT)的立體圖像舒適度評價方法,使用M5P回歸樹算法建立客觀評價模型,文獻[8]設計了主觀實驗研究了前景目標的視差因素及寬度因素與舒適度的關系,提出了基于前景目標視差角和寬度角特征的舒適度客觀評價模型(D+W)。文獻[14]提出一種基于視覺重要區域的立體圖像舒適度客觀評價模型,首先利用2維圖像顯著圖和視差圖像得到立體圖像視覺重要區域,然后提取視覺重要區域的視差幅度特征、視差梯度邊緣特征以及空間頻率特征,并建立特征信息與平均主觀評分值的關系。以上模型在韓國先進科學技術院(Korea Advanced Institute of Science and Technology)的圖像和視頻系統實驗室提供的立體圖像數據庫[15](IVY)上進行測試,都取得了較好的性能。其中文獻[13]所使用的相對視差特征和文獻[12]所使用的視差梯度邊緣特征隱含了立體圖像局部區域的前、后景視差信息,所得到模型的性能較文獻[8]更好。
本文根據場景中前景目標和后景區域的深度設計了多種場景模式,在每種場景模式下分別建立舒適度客觀評價模型,所提出的模型組能更精確地反映視差對視覺舒適度感知的影響,實驗結果顯示提高了自然立體圖像視覺舒適度的評價性能。
在文獻[8]主觀實驗所布置的場景僅為一種模式:前景目標凸出于屏幕,視差類型為交叉視差;后景區域為屏幕,視差為0。所提出的D+W模型反映了前景目標的視差和寬度對視覺舒適度的影響,若該模型以5分制表示,則如式(1)所示:

但在IVY數據庫中,許多自然立體圖像的前景目標超過了式(1)的視差限制,背景區域也并非固定于屏幕。用均方根誤差(Root Mean Squared Error,RMSE)和平均絕對值誤差(Mean Absolute Error,MAE)來度量該模型的誤差,如果僅測試滿足D∈的立體圖像,得到RMSE=0.347,MAE =0.266;如果測試IVY數據庫中所有的立體圖像,得到RMSE=0.450,MAE=0.332,即誤差上升。這說明當D+W模型面對更復雜的場景時,評價性能會有所下降。
真實的場景中通常存在多個目標物體,由于深度位置上的差異,它們對視覺舒適度的影響并不相同。為了簡化研究,根據立體顯示器場景中各立體內容的深度,可將它們抽象為前景目標、后景區域和顯示器屏幕3部分。人眼對場景中不同深度目標的關注度是不相同的,一般而言,距觀看者較近的前景目標所獲得的關注度較高,對舒適度感知的影響較大[16],后景區域則相對較小。同時,若前景目標離人眼太近或后景區域離人眼太遠,超過了雙目的潘諾融合限制(Panum’s fusion limit),都會引起不舒適感。因此為得到性能較佳的舒適度模型,須分析不同深度位置的立體內容對人眼舒適度感知的影響程度。本文提出根據前、后景相對于屏幕的凹凸性以及是否處于舒適區(Zone of Comfortable Viewing,ZCV)[17],將立體顯示器所顯示的自然場景分為10種模式,如圖1所示。

圖1 立體顯示器所顯示的自然場景的分類
雙目調節和會聚矛盾是影響立體圖像舒適度的生理機制。調節雙目的實際對焦距離即為“調節”,當雙目觀看某一景物時,睫狀肌會自動的調節晶狀體的屈光力,使景物發出的光線能落于視網膜的中央凹處,確保成像清晰。與此同時,雙目的視軸也要轉向內側,使視軸均朝向被注視的景物,這種現象稱為“會聚”。在觀看自然世界時,人眼的調節和會聚是相互協作聯合運動的,焦點的調節始終跟隨著會聚的變化,二者是一致的。然而在觀看人工制作的立體影像時,由于調節的距離即是眼睛到立體顯示屏的距離,而會聚的距離則是人眼到顯示于屏幕前方或后方的景物的距離,兩者距離不一致,就會產生沖突。
視差角體現了雙目調節和會聚的矛盾,根據文獻[18]定義的視差角特征,定義k為調節角,f和b分別是前景和背景的會聚角,則前景目標的視差角fa為

后景區域的視差角ba為

當視差角絕對值大于1°時,通常雙目將無法融合,會產生“復視”等不舒適感,因此將視差角絕對值小于1°的區域稱為舒適區域,如圖1中兩條虛線內的區域所示,虛線外的則為非舒適區域[17]。
采用IVY數據庫作為立體圖像樣本數據集合。由于該數據庫中所有立體圖像的后景視差角絕對值均小于1°,即都處于舒適區內,而場景模式10僅有1幅圖像,因此本文僅對4,5,8,9這4類模式展開研究。
為得到性能更優的視覺舒適度評價方法,本文對4類場景模式分別建立了視覺舒適度模型。首先提取影響視覺舒適度的特征,然后對文獻[8]的D+W模型進行擴展,添加前景目標的曲折度衰減系數,建立了各場景模式下的模型,還得到了每種場景下前、后景對視覺舒適度影響力的量化結果。本文提出的視覺舒適度評價方法的框架如圖2所示。

圖 2 所提出的視覺舒適度評價方法框架
3.1 模型的特征提取
IVY數據庫使用深度估計軟件(Depth Estimation Reference Software,DERS)[19]獲得右視點的視差圖像。統計視差圖像的灰度直方圖,使用最大類間方差法(OTSU)對視差直方圖進行自適應分割,得到前景區域和后景區域,視前景區域中各連通域為前景目標。計算出各前景目標的平均視差幅值F、后景區域的平均視差幅值B,結合人眼到顯示器的距離h、瞳距p、顯示器寬度L、水平分辨率N等先驗知識,以圖3所示的視差角幾何示意圖為例,可得以式(4)~式(6)所示的前景會聚角f,后景會聚角b,調節角k。

圖3 視差角幾何示意圖

然后根據式(2),式(3),可確定前景視差角fa和后景視差角ba。
通過行掃描得到各前景目標的平均寬度W,然后將其轉化為前景目標的寬度角Wa,以圖4所示的寬度角幾何示意圖為例,則


圖 4 寬度角幾何示意圖
根據研究,當前景目標處于非舒適區時,立體圖像中樹枝形態的曲折度較大的前景目標會顯著降低視覺舒適度,以數據庫中的51號立體圖像為例,如圖5所示,前景目標為兩串樹枝,其形態表現出高頻特征,是引起人眼不舒適的重要原因。
在前景目標分割結果的二值圖中,設前景目標像素值為“1”,后景區域像素值為“0”,對前景目標行掃描,得到每一行由“1”構成的線段數,然后計算所有含有“1”線段的行的平均線段數Sr;同理可得所有含有“1”線段的列的平均線段數Sc。Sr和Sc值越大,則說明前景目標的曲折度越大。用前景視差角fa,Sr和Sc來度量曲折度,當,同時滿足時(Tf,Tr,Tc是經驗閾值,將在下文的實驗中確定),認為該前景目標的曲折度將引起視覺舒適度的顯著衰減。

圖5 前景目標曲折度示例(數據庫中的編號51圖像)
3.2 本文模型
式(1)所示的D+W模型由 4項組成,第1項是常數項,第2~4項體現了前景視差、前景目標寬度這兩個因素對視覺舒適度的影響。固定式(1)中的W,可知舒適度和視差D存在一個線性關系。但該模型在視差因素上僅考慮前景目標對舒適度的影響,而在不同的場景模式下,人眼對前后景的關注程度也會有所不同,因此本文將D+W模型進行擴展,綜合了前、后景視差對視覺舒適度的共同影響。保持式(1)中與寬度因素相關的項,定義場景模式n的全局視差角:


式(8)和式(9)中的系數qn,Un,Vn,P需要通過定量的實驗分析加以確定。
下面通過實驗分析對所提出的舒適度客觀評價模型,確定其中未知系數的最優值。所采用的IVY立體圖像庫由120幅分辨率為1920×1080的立體圖像組成,包含了各種室內場景和室外場景圖像。該立體圖像庫的主觀實驗按照ITU-R BT.500-11和ITU-R BT.1438規定的標準進行,對立體圖像按照5個等級(5表示非常舒適,4表示舒適,3表示一般舒適,2表示比較不舒適,1表示非常不舒適)進行主觀評分,最終得到每幅立體圖像的平均主觀評分值(Mean Opinion Score,MOS)。
4.1 各場景模式的建模
對4類場景模式(4,5,8,9)分別進行定量分析,以確定式(8)和式(9)中的系數。暫不考慮曲折度衰減系數P,先求系數qn,Un,Vn,定義:

式(10)中已屏蔽P。令式(1)的第2項為0,即先屏蔽舒適度與視差角的線性關系項,保留常數項和與寬度因素相關的項,得到


在不同的場景模式下,人眼對于前景和后景的關注程度有所不同,各場景模式下q的取值需通過以下的實驗分析確定。
以場景模式4為例,在該場景中q取不同值時,ERR與Da的線性擬合情況如圖6所示。從圖6(a)中可以看出,當q =0.1,即前景和后景視差角權重分別為0.1和0.9時,圖中的散點較為散亂;圖6(c)中當q =1.0,即前景和后景視差角權重分別為1和0時,圖中的散點也較為散亂。說明q取0.1或1.0時的全局視差角不能很好地體現與視覺舒適的線性關系。當q =0.7時,,此時散點的擬合程度最好,擬合直線方程為ERR =,如圖6(b)所示,得到的SMMO4為

場景模式5,8,9中ERR與Da的線性擬合情況分別如圖7,圖8和圖9所示。
圖10中的菱形線表示場景模式4中,q取不同值時所得到的SMMO4與主觀MOS值的平均絕對值誤差(MAE)。可以看到q =0.7時MAE最小,此時模型最精確。
同理可得場景模式5中,當q =0.6時,Da=與主觀MOS的MAE最小,模型最精確。該場景中ERR與Da的擬合直線方程為,如圖7所示,q取值與SMMO5的MAE的關系如圖10中方形線所示。得到的SMMO5為



場景模式10的特點是前景和后景都凹于屏幕,且都處于舒適區。但IVY數據庫中僅14號圖像位于該場景模式中,根據文獻[8]所述,寬度因素對視覺舒適度的影響和視差類型(交叉或非交叉)無關,文獻[20]認為在交叉和非交叉視差兩種情況下,寬度因素對雙目融合限制的影響是相似的。因此前后景的凹凸性不影響寬度因素對舒適度所起的作用;同時,當前后景都處于舒適區時,雙目可以融合,視差因素(包括視差大小,視差類型)對舒適度所起的影響較小。由于該場景模式前后景的凹凸性相同,且都處于舒適區,可近似視為場景模式9的對稱模式,因此,使用場景模式9的式(16)模型計算該立體圖像的客觀評價值。

圖6 場景模式4中ERR和Da的線性擬合圖

圖7 場景模式5中ERR和Da的線性擬合圖

圖8 場景模式8中ERR和Da的線性擬合圖

圖9 場景模式9中ERR和Da的線性擬合圖
根據式(13)~式(16)的計算,可得到暫不考慮前景曲折度時的模型性能指標,如表1中的SMMO所示。
4.2 基于前景曲折度的模型調整
進一步考慮前景目標曲折度對舒適度的影響,根據文獻[6]所述,當前景視差角大于2°時,雙目出現了不舒適的“復視”現象。本文在實驗中也發現,此時若前景目標呈較為曲折的形態時,舒適度將急劇地衰減。設前景角視差閾值Tf=2°,行與列的平均前景線段數閾值Tr=2,Tc=1.5,當前景角視差絕對值,且同時滿足行平均前景線段數Sr> Tr、列平均前景線段數Sc> Tc時,定義視覺舒適度衰減系數P對SMMO模型進行調整。滿足上述條件的有場景模式4中的29,51,52,102號以及模式5中的49,50號共6幅立體圖像,它們的前景目標形態均表現出較大的曲折度。
圖11中的橫坐標表示需要調整客觀評價值的立體圖像編號,菱形點表示主觀MOS值,矩形點表示調整前的客觀評價分SMMO。從圖中可以看到,SMMO比主觀MOS值明顯要高,而折線的形態基本一致,因此可認為當前景目標曲折度大于曲折閾值時,視覺舒適感會進一步衰減。根據實驗測試,取衰減系數P =1.6以修正SMMO,調整后的客觀評價分如圖11的圓形點所示。最終的模型SMM表示為

4.3 系數q的取值分析
圖12顯示了SMM舒適度評價模型中,各場景的前后景視差角的權重系數q。圖中,a表示前景區域,b表示后景區域,a和b旁邊所標注的權重系數值,反映了前后景視差因素對視覺舒適度的影響力。
根據前后景的凹凸性,可將模式4、模式8歸為一類,模式5、模式9歸為另一類,兩類的區別在于后景的凹凸性,從圖12中可總結出,后景凸比后景凹對視覺舒適度的影響更大。
根據前景是否處于舒適區,可將模式4、模式5歸為前景超出舒適區一類,模式8、模式9歸為前景處于舒適區內一類,從圖12中可總結出,超出舒適區的前景比舒適區內的前景對視覺舒適度的影響越大
綜合以上的觀察,可以得出“越凸出的區域,對視覺影響越大”的結論,這和人傾向于關注離自己更近的物體的視覺特性是相一致的。q值的確定,量化了前后景對視覺舒適度的影響程度。

圖 10 q取值與SMMO模型的平均絕對值誤差(MAE)的關系

圖 11 主觀MOS值、調整前后的客觀評價值的對比

圖12 各場景模式的前后景視差因素權重
4.4 模型的性能及對比
由于在主觀質量評價實驗中會引入一系列非線性因素,為避免非線性因素對客觀評價模型性能的影響,需要將模型的客觀評價分值x做非線性擬合,本文采用5參數Logistic函數進行非線性擬合,如式(18)所示,從而預測得到客觀模型預測值y。

其中,參數β1,β2,β3,β4和β5通過訓練得到。然后計算y與平均主觀評分值MOS的相關性來度量客觀模型的性能,在本文中采用Pearson相關系數(Pearson Linear Correlation Coefficient,PLCC),Spearman 相關系數(Spearman Rank-Order Correlation Coefficient,SROCC)、Kendall相關系數(Kendall Rank-Order Correlation Coefficient,KROCC)、平均絕對值誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)5組客觀參量,其中,PLCC,SROCC和KROCC反映客觀評價模型預測值的相關性、單調性和一致性,MAE和RMSE反映客觀評價模型預測值的準確性。PLCC,SRCC,KRCC越大,MAE,RMSE越小說明客觀評價預測值與平均主觀評分值MOS的相關性越好。
表1給出了本文提出SMMO和SMM模型與文獻[8,13,14]所提出的模型在IVY數據庫上的各項性能指標對比,由表中數據可以看出,SMMO模型與文獻[14]所提出的模型性能相近,SMM模型的性能則優于其他模型。
隨著3維視頻圖像技術的迅猛發展,研究影響舒適度的各種因素,建立舒適度客觀評價模型是當前亟需解決的問題,它對3維內容制作,促進顯示器設計與制造等相關技術的發展進步具有指導作用。
本文研究了立體圖像中影響舒適性的因素和對應的圖像特征,包括前后景的會聚角、屏幕調節角、視差角、寬度角,以及度量前景目標曲折度的各特征,在各類立體圖像場景模式的基礎上,提出了一個立體圖像舒適度的客觀評價模型SMM。在公開的IVY立體圖像數據庫上,用5種性能指標對提出的客觀評價模型進行評價,實驗顯示,模型的相關性、單調性、一致性、準確性與現有的方法相比,性能更好。

表1 舒適度客觀模型的性能指標及對比
參考文獻
[1]HEWAGE C T E R and MARINI M G.Quality of experience for 3D video streaming[J].IEEE Communications Magazine,2013,51(5):101-107.
[2]蔣驍辰,李國平,王國中,等.基于AVS+實時編碼的多核并行視頻編碼算法[J].電子與信息學報,2014,36(4):810-816.doi:103724/SP.J.1146.2013.00845.JIANG Xiaochen,LI Guoping,WANG Guozhong,et al.Multi-core parallel video coding algorithm based on AVS+ real-time encoding[J].Journal of Electronics & Information Technology,2014,36(4):810-816.doi:103724/SP.J.1146.2013.00845.
[3]KIM D and SOHN K.Visual fatigue prediction for stereoscopic image[J].IEEE Transactions on Circuits and Systems for Video Technology,2011,21(2):231-236.
[4]LI J,BARKOWSKY M,and CALLET P L.Visual discomfort of stereoscopic 3D videos:Influence of 3D motion[J].Displays,2014,35(1):49-57.
[5]UKAI K and HOWARTH P A.Visual fatigue caused by viewing stereoscopic motion images:Background,theories and observations[J].Displays,2008,29(2):106-116.
[6]PARK J,LEE S,and BOVIK A C.3D visual discomfort prediction:Vergence,foveation,and the physiological optics of accommodation[J].IEEE Journal of Selected Topics in Signal Processing,2014,8(3):415-427.
[7]RICHARDS W and KAYE M G.Local versus global stereopsis:two mechanisms[J].Visual Research,1974,14(12):1345-1347.
[8]LEE S,JUNG Y J,SOHN H,et al.Effect of stimulus width on the perceived visual discomfort in viewing stereoscopic 3-D-TV[J].IEEE Transactions on Broadcasting,2013,59(4):580-590.
[9]SCHOR C,WOOD I,and OGAWA J.Binocular sensory fusion is limited by spatial resolution[J].Visual Research,1984,24(7):661-665.
[10]SCHOR C,HECKMANN T,and TYLER C W.Binocular fusion limits are independent of contrast,luminance gradient and component phases[J].Visual Research,1989,29(7):821-835.
[11]WOPKING M.Viewing comfort with stereoscopic pictures:an experimental study on the subjective effects of disparity magnitude and depth of focus[J].Journal of the Society for Information Display,1995,3(3):101-103.
[12]王勤,王瓊華,劉春玲.視差與空間頻率對自由立體顯示器觀看舒適度的影響[J].光電子 · 激光,2012,23(8):1604-1608.WANG Qin,WANG Qionghua,and LIU Chunling.Effects of parallax and spatial frequency on visual comfort in autostereoscopic display[J].Journal of Optoelectronics ·Laser,2012,23(8):1604-1608.
[13]SOHN H,JUNG Y J,LEE S,et al.Predicting visual discomfort using object size and disparity information in stereoscopic images[J].IEEE Transactions on Broadcasting,2013,59(1):28-37.
[14]姜求平,邵楓,蔣剛毅,等.基于視覺重要區域的立體圖像視覺舒適度客觀評價方法[J].電子與信息學報,2014,36(4):875-881.doi:103724/SP.J.1146.2013.00946.JIANG Qiuping,SHAO Feng,JIANG Gangyi,et al.An objective stereoscopic image visual comfort assessment metric based on visual important regions[J].Journal of Electronics & Information Technology,2014,36(4):875-881.doi:103724/SP.J.1146.2013.00946.
[15]KAIST Image and Video System Lab.IVY LAB Stereoscopic 3D image database for visual discomfort prediction[OL].http://ivylab.kaist.ac.kr/demo/3DVCA/3DVCA.htm.2013.
[16]KIM H,LEE S,and BOVIK A C.Saliency prediction on stereoscopic videos[J].IEEE Transactions on Image Processing,2014,23(4):1476-1490.
[17]LAMBOOIJ M,IJSSELSTEIJN W,FORTUIN M,et al.Visual discomfort and visual fatigue of stereoscopic displays:a review[J].Journal of Imaging Science and Technology,2009,53(4):030201.
[18]HOLLIMAN N.3D Display Systems[M].London:UK,IOP Press,2004:7-8.
[19]ISO/IEC JTC1/SC29/WG11 M16923.Depth Estimation Reference Software(DERS)5.0[R].Xian,China,2009.
[20]WILCOX L M and HESS R F.Dmax for stereopsis depends on size,not spatial frequency content[J].Visual Research,1995,35(9):1061-1069.
應宏微:男,1979年生,博士生,研究方向為立體圖像/視頻的視覺舒適度評價.
蔣剛毅:男,1964年生,教授,研究方向為多媒體信息通信、圖像處理與視頻編碼.
郁梅:女,1968年生,教授,研究方向為多媒體信息通信、圖像處理與視頻編碼.
彭宗舉:男,1973年生,副教授,研究方向為圖像信號處理、3維視頻編碼.
邵楓:男,1980年生,副教授,研究方向為多媒體信息通信、圖像處理與視頻編碼.
Objective Visual Comfort Assessment Model of Stereo Image Based on Scene Mode
YING Hongwei①②JIANG Gangyi①③YU Mei①③PENG Zongju①SHAO Feng①
①(Faculty of Information Science and Engineering,Ningbo University,Ningbo 315211,China)
②(School of Electronic and Information Engineering,Ningbo University of Technology,Ningbo 315211,China)
③(State Key Laboratory for Novel Software Technology at Nanjing University,Nanjing 210093,China)
Abstract:To predict the effects induced by stereo image content on visual health,a new objective Visual Comfort Assessment(VCA)method of stereo image is proposed based on scene modes.Natural scene is abstracted as multiple scene modes according to two position states of foreground object and background region.One is the convex-concave to screen,and the other is the whether locate on zone of comfortable viewing.In the process of mode selection,disparity map is utilized to segment scene into foreground object and background region adaptively.Then,the scene’s mode can be determined by disparity angle features of both foreground object and background region.In the modeling stage,disparity angle features of foreground object and background region,width angle and sinuosity features of foreground object are utilized to build objective VCA models in various scene modes.The experimental results tested on IVY database show that high consistency exists between the proposed model and subjective perception that Pearson linear correlation coefficient is higher than 0.91,Spearman rank-order correlation coefficient is higher than 0.90,Kendall rank-order correlation coefficient is higher than 0.74,Mean Absolute Error(MAE)is lower than 0.24 and Root Mean Squared Error(RMSE)is lower than 0.32.Compared with other existing methods,the proposed model has the better assessment performance and is much closer to the subjective assessment scores.
Key words:Stereo image; Visual comfort assessment; Scene mode; Binocular vision
基金項目:國家自然科學基金(U1301257,61171163,61271270,61271021,61311140262),寧波市自然科學基金(2013A610113)
*通信作者:蔣剛毅jianggangyi@126.com
收稿日期:2015-03-04;改回日期:2015-11-18;網絡出版:2016-01-04
DOI:10.11999/JEIT150267
中圖分類號:TN919.81
文獻標識碼:A
文章編號:1009-5896(2016)02-0294-09
Foundation Items:The National Natural Science Foundation of China(U1301257,61171163,61271270,61271021,61311140262),Natural Science Foundation of Ningbo(2013A610113)