朱 奧, 王曉彬, 李曉鶴, 丁 新, 王家潤(rùn), 張 丹*
(1. 清華大學(xué)心理學(xué)系,北京,100084;2. 中國(guó)電子科技集團(tuán)公司第十五研究所,北京,100080)
現(xiàn)代化戰(zhàn)爭(zhēng)中的海量戰(zhàn)場(chǎng)信息通過(guò)可視化的方式呈現(xiàn),戰(zhàn)場(chǎng)態(tài)勢(shì)感知界面也趨于復(fù)雜,其承載的信息容量已經(jīng)嚴(yán)重超過(guò)了決策人員的認(rèn)知負(fù)荷[1],如何提升復(fù)雜界面下的信息搜索效能成為需要解決的關(guān)鍵問(wèn)題[2]。面對(duì)復(fù)雜戰(zhàn)場(chǎng)視覺(jué)信息情境,人類(lèi)視覺(jué)系統(tǒng)通過(guò)初級(jí)處理過(guò)程篩選接收到的信息,進(jìn)而通過(guò)中高級(jí)處理過(guò)程進(jìn)一步加工,這被稱(chēng)為選擇性注意機(jī)制,其中視覺(jué)顯著性(visualsaliency)起到關(guān)鍵作用。
視覺(jué)顯著性指場(chǎng)景中某個(gè)特定突出的物體在預(yù)注視處理階段得到注意,并在視覺(jué)系統(tǒng)處理流程的早期階段引起即時(shí)視覺(jué)喚醒。視覺(jué)顯著性屬于自下而上的視覺(jué)注意機(jī)制,可以粗略描述為場(chǎng)景中的元素吸引個(gè)體視覺(jué)注意力的能力,但本質(zhì)上是物體帶來(lái)的視覺(jué)刺激與人工視覺(jué)系統(tǒng)之間相互作用的結(jié)果[3]。在較早的研究中,有研究者用視覺(jué)“凸顯”(pop-out)形容這一過(guò)程,并探索了能夠引起視覺(jué)“凸顯”的視覺(jué)刺激特征[4]。有研究者認(rèn)為物體在某些特征上的特殊性會(huì)讓它“凸顯”,比如Julesz提出的紋理理論(texton theory)認(rèn)為主要是紋理上的差異會(huì)引起我們更多的視覺(jué)注意[5]。文獻(xiàn)[6] 認(rèn)為有大量研究證據(jù)可以表明大腦中存在一種注意力轉(zhuǎn)移“地圖”模型:在每個(gè)地圖中,視覺(jué)場(chǎng)景中所有點(diǎn)的顯著性都是并行編碼的,通過(guò)每個(gè)地圖內(nèi)的競(jìng)爭(zhēng)和地圖合并的過(guò)程選擇下一個(gè)注意目標(biāo),其中一種類(lèi)型的地圖是“顯著性地圖”,它根據(jù)低層次的視覺(jué)特征(如明度、顏色、定向邊緣和運(yùn)動(dòng))計(jì)算視覺(jué)上的顯著點(diǎn)[6]。越顯著的物理刺激,越容易被注意選擇,即發(fā)生注意捕獲;但也有研究者認(rèn)為,盡管顯著性可能有正面作用但也可能阻礙正確知覺(jué),這取決于使用的環(huán)境、場(chǎng)景、任務(wù)等 。
受顯著性地圖啟發(fā),具備良好可應(yīng)用性的視覺(jué)顯著性模型應(yīng)該具備以下特點(diǎn):①模型輸入?yún)?shù)應(yīng)貼近人眼感知能力,同時(shí)人類(lèi)對(duì)視覺(jué)顯著目標(biāo)的反應(yīng)過(guò)程是快速的,所以模型也需要具備實(shí)時(shí)性;②模型應(yīng)從低層視覺(jué)特征出發(fā),同時(shí)也要防止過(guò)度擬合,應(yīng)用盡量少的參數(shù)覆蓋低層視覺(jué)特征;③模型不僅考慮視覺(jué)場(chǎng)景中前景因素(目標(biāo)區(qū)域),也需要考慮背景因素;④最重要的一點(diǎn),模型應(yīng)能直接反映人眼搜索效能,如與響應(yīng)時(shí)等指標(biāo)直接關(guān)聯(lián)。
隨著視覺(jué)顯著性理論的積累,研究者們?cè)谝曈X(jué)顯著性的量化計(jì)算方法方面不斷取得重要進(jìn)展,在20世紀(jì)末Itti基于Koch等人的視覺(jué)理論模型提出ITTI算法,其思路是在多尺度空間中以顏色、強(qiáng)度和方向特征進(jìn)行顯著性檢測(cè),然后根據(jù)各組特征圖像中心-周?chē)袼夭町愋垣@取各尺度特征圖,并進(jìn)行合并和歸一化處理得到最終結(jié)果;其優(yōu)勢(shì)是可以高效地計(jì)算出最具顯著性的第一個(gè)目標(biāo),但在后續(xù)過(guò)程中需要在多個(gè)空域基本特征上進(jìn)行操作,導(dǎo)致算法運(yùn)算速度較慢,難以滿足實(shí)時(shí)檢測(cè)要求,以及對(duì)后續(xù)目標(biāo)區(qū)域計(jì)算不精確[7-8]。
針對(duì)ITTI方法的不足,Achanta 等提出了全分辨率算法(AC算法),該算法強(qiáng)調(diào)快捷性,僅考慮輸入圖像的顏色和亮度特征,而沒(méi)有考慮梯度等特征[9]。Cheng等人提出了基于色彩直方圖(HC算法)和局部對(duì)比度(RC算法)的圖像視覺(jué)顯著性計(jì)算方法[10]。其中,RC算法考慮了空間關(guān)系在人類(lèi)視覺(jué)注意方面的顯著影響,將輸入圖像分為若干子區(qū)域,然后計(jì)算每個(gè)區(qū)域的顏色對(duì)比度與其他區(qū)域?qū)Ρ榷燃訖?quán)和以定義其顯著值,加權(quán)的權(quán)值由區(qū)域空間距離決定,距離與權(quán)值成正比,從而使與相鄰區(qū)域存在高對(duì)比度關(guān)系的區(qū)域能獲得更高的顯著值。
研究者進(jìn)一步通過(guò)分析頻譜找到其與顯著性特征的關(guān)系,把圖像從空間域變換到頻率域,從而更高效地完成顯著性檢測(cè),比如Hou和Zhang 提出的譜殘余算法(SR算法)方法[11]。但因?yàn)橄嚓P(guān)方法缺乏生理基礎(chǔ)的支持,所以本文不深入討論[12]。
在顯著性計(jì)算技術(shù)發(fā)展的同時(shí),研究者們也將其運(yùn)用于預(yù)測(cè)人類(lèi)視覺(jué)搜索過(guò)程,比如Foulsham和Underwood使用Itti的顯著性模型預(yù)測(cè)人眼動(dòng)態(tài)軌跡,發(fā)現(xiàn)預(yù)測(cè)準(zhǔn)確率高于隨機(jī)模型[13];Ehinger等人使用顯著性等模型在眼動(dòng)實(shí)驗(yàn)中預(yù)測(cè)人類(lèi)注意力變化,最好的模型的AUC能達(dá)到0.9[14];還有研究者使用顯著性模型用于預(yù)測(cè)視盲變化的檢測(cè)[15]。但現(xiàn)有的主流圖像評(píng)估模式存在以下不足:
1)當(dāng)前主流技術(shù)主要從計(jì)算機(jī)角度出發(fā)采用RGB等模型,忽視了人眼的感覺(jué)能力和對(duì)圖像紋理的識(shí)別能力。在HSV空間中,H表示一幅圖像的色調(diào),S表示圖像的飽和度,V表示圖像的明度。相對(duì)于傳統(tǒng)RGB模型,HSV模型更接近人類(lèi)視覺(jué)系統(tǒng)的感知。RGB彩色空間在綜合的色彩呈現(xiàn)上具有優(yōu)勢(shì),因而被廣泛應(yīng)用于數(shù)字圖像的合成中,但不能直觀地表現(xiàn)圖像的明度和色彩飽和度等人眼可直觀獲取的信息[16]。
2)人眼對(duì)于梯度信息十分敏感,圖像梯度描述的是圖像局部灰度變化的快慢與方向,是區(qū)分不同物體的最重要特征[17]。圖像像素與像素之間的變化程度能夠自下而上的影響個(gè)體對(duì)圖像信息的搜索,梯度特征能夠傳遞重要的視覺(jué)信息,具有強(qiáng)大地捕捉結(jié)構(gòu)信息和對(duì)比度變化的能力,因此被廣泛用于圖像質(zhì)量評(píng)價(jià)等任務(wù)中。梯度特征是人眼進(jìn)行識(shí)別的重要依據(jù),而很多模型忽略了這一特性[9,16]。
3)復(fù)雜信息搜索過(guò)程中不僅受目標(biāo)屬性影響,也受背景屬性的影響,而部分相關(guān)技術(shù)僅考慮了單一方面因素,比如RC算法過(guò)分放大局部因素的影響。
4)現(xiàn)有模型較難以直接應(yīng)用[3]。目前大部分相關(guān)技術(shù)方案是為了利用計(jì)算機(jī)來(lái)模擬人類(lèi)視覺(jué),而沒(méi)有聯(lián)系到人類(lèi)的真實(shí)行為(如響應(yīng)時(shí)等),面向應(yīng)用的外部效度有限。已有的少量結(jié)合人類(lèi)真實(shí)行為的研究,比如Hou等人的機(jī)器視覺(jué)模型對(duì)比研究[18],僅考慮了視覺(jué)注視點(diǎn)、變化盲視等相對(duì)經(jīng)典的心理學(xué)實(shí)驗(yàn)范式下的人類(lèi)行為數(shù)據(jù),更多面向理論機(jī)制探索,相關(guān)研究結(jié)論不能直接遷移到有更明確應(yīng)用價(jià)值的復(fù)雜信息視覺(jué)搜索任務(wù)中。
根據(jù)國(guó)內(nèi)外研究文獻(xiàn)綜述,我們結(jié)合顏色空間和圖像梯度來(lái)對(duì)圖像進(jìn)行量化處理,并建立其與人類(lèi)響應(yīng)時(shí)的聯(lián)系。在顏色空間方面,采用更符合人眼感知的HSV模型。在圖像梯度方面,目前主流的圖像梯度計(jì)算方法包括Canny、LoG等,其中LoG(Laplacian of Gaussian)邊緣檢測(cè)算子是Marr和Hildreth共同提出的經(jīng)典方法,也稱(chēng)為Marr & Hildreth算子,它根據(jù)圖像的信噪比來(lái)求檢測(cè)邊緣的最優(yōu)濾波器[19]。相較于Canny的梯度極大值方法,LoG引入二階導(dǎo)數(shù)的Laplace算子,并在此之前為圖像進(jìn)行了高斯卷積濾波,消除高頻噪聲的干擾;由于對(duì)高頻噪聲的處理與引入二階導(dǎo)數(shù)以計(jì)算梯度變化的快慢,LoG被認(rèn)為是較為接近人眼視覺(jué)生理的數(shù)學(xué)模型[19],所以本研究將采用LoG方法進(jìn)行圖像梯度量化。
綜上所述,我們將從人類(lèi)心理學(xué)和認(rèn)知生理學(xué)的角度建立復(fù)雜信息下視覺(jué)搜索模型,為復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)認(rèn)知提供模型基礎(chǔ)支撐。
基于上述討論,我們基于視覺(jué)顯著性計(jì)算技術(shù)中經(jīng)典的Itti模型[6,8],突破前人研究中眼動(dòng)態(tài)軌跡等指標(biāo)與行為績(jī)效關(guān)系不夠緊密的局限[13-14],創(chuàng)新地提出以面向復(fù)雜信息界面視覺(jué)搜索行為響應(yīng)時(shí)為因變量的多元模型。具體而言,我們構(gòu)建以影像地圖為代表的復(fù)雜信息界面,讓被試開(kāi)展影像地圖中的特定圖標(biāo)視覺(jué)搜索,以視覺(jué)搜索的行為響應(yīng)時(shí)為目標(biāo),通過(guò)心理學(xué)行為實(shí)驗(yàn),建立視覺(jué)搜索效能的量化評(píng)估模型。模型假設(shè)如下:
搜索響應(yīng)時(shí)=
β1×目標(biāo)區(qū)域色調(diào)+β2×目標(biāo)區(qū)域飽和度+
β3×目標(biāo)區(qū)域明度+β4×目標(biāo)區(qū)域圖像梯度+
β5×背景色調(diào)+β6×背景飽和度+
β7×背景明度+β8×背景圖像梯度+β0
模型中,βi(i= 1,2,…,8)為使用多元線性模型與最小二乘法擬合后各變量的回歸系數(shù),它的大小與正負(fù)表示在該模型下此變量對(duì)搜索響應(yīng)時(shí)的貢獻(xiàn)大小與方向,β0表示回歸方程的常數(shù)偏置量。整體模型構(gòu)建的流程見(jiàn)圖1。

圖1 模型建立流程圖
本文所提取的復(fù)雜信息界面顏色特征基于HSV模型框架。考慮到實(shí)際圖像數(shù)據(jù)往往以RGB形式存儲(chǔ),色調(diào)(H)、飽和度(S)和明度(V)與RGB的轉(zhuǎn)換公式為:
(1)
(2)
V= max(R,G,B)
(3)
LoG方法見(jiàn)式(4),先通過(guò)平滑預(yù)處理,G(x,y)表示標(biāo)準(zhǔn)高斯函數(shù),σ表示標(biāo)準(zhǔn)差:
(4)
在圖像輸入后,將背景和目標(biāo)區(qū)域分為RGB3通道并依次計(jì)算所有像素點(diǎn)的H、S、V值,并求其平均值得到圖像背景和目標(biāo)區(qū)域H、S、V均值;之后,利用LoG方法計(jì)算背景和目標(biāo)區(qū)域的平均梯度。
本研究視覺(jué)界面所用影像地圖包括來(lái)自城市、海洋、高原地貌的衛(wèi)星影像素材圖片各一張,圖片尺寸為2 100×2 100像素。標(biāo)識(shí)素材圖片為14個(gè)軍事地圖常用標(biāo)識(shí)圖片,分為紅藍(lán)兩色,共28個(gè)標(biāo)識(shí),圖標(biāo)尺寸為160×160像素。定義目標(biāo)區(qū)域即圖標(biāo)覆蓋在背景圖上的區(qū)域,見(jiàn)圖2。

圖2 背景圖片與目標(biāo)
為了提升所考察的視覺(jué)界面豐富性和全面性,本研究通過(guò)點(diǎn)操作法對(duì)選定的影像地圖進(jìn)行亮度與對(duì)比度的量化變換[20]。具體來(lái)說(shuō),圖像亮度表示色彩本身因?yàn)楣舛取⒎瓷涑潭炔煌a(chǎn)生的明暗差別。對(duì)基于RGB色彩空間的數(shù)字圖像而言,R,G,B 3個(gè)通道均被定義為0~255的一個(gè)值,通過(guò)同時(shí)增加或減少3個(gè)通道的值即可調(diào)整亮度。圖像的對(duì)比度用來(lái)描述圖像不同像素之間屬性的差異程度,對(duì)比度的增加,表示圖像中亮處越亮、暗處越暗。在點(diǎn)操作法中,常人為地設(shè)置一個(gè)閾值來(lái)實(shí)現(xiàn)圖片明暗分明的高對(duì)比度的效果[20]。本文基于以下公式對(duì)原始圖像進(jìn)行變換:
(5)
式中:L0為原圖像當(dāng)前像素點(diǎn)在RGB通道下的值;iCon、iBrt表示圖像對(duì)比度、亮度的調(diào)整值。在本研究中,將原圖像的對(duì)比度與亮度值的原始值均定義為50,通過(guò)調(diào)整iCon與iBrt,對(duì)應(yīng)地對(duì)圖像的3個(gè)通道同時(shí)進(jìn)行線性拉伸,得到當(dāng)前像素點(diǎn)的值L'。式中,系數(shù)-127表示本實(shí)驗(yàn)中將對(duì)比度的閾值定義為0.5(即0.5×255)。如式(5)所示,圖像的點(diǎn)操作法基于圖像的RGB空間定義圖像的亮度與對(duì)比度,由于其在數(shù)字圖像處理中較為方便的優(yōu)勢(shì),適合規(guī)模化操作,本研究采用該圖像特征調(diào)整方案。
對(duì)3個(gè)地貌的環(huán)境影像地圖的對(duì)比度與亮度在普遍適用可視化參數(shù)范圍內(nèi)進(jìn)行逐步調(diào)整。本研究將普遍適用定義為基于經(jīng)驗(yàn)的,每張影像地圖按不同亮度(iBrt在50~70范圍)與對(duì)比度(iCon在40~60范圍)生成441張圖片作為背景圖片素材,在該參數(shù)范圍下,圖片不會(huì)因過(guò)暗、過(guò)亮或?qū)Ρ榷炔町愡^(guò)大導(dǎo)致圖片失真。同時(shí),為了盡可能提升計(jì)算效率,對(duì)目標(biāo)位置采取了隨機(jī)取樣策略以減少取樣總數(shù):將每張圖片均等劃分為5×5=25個(gè)區(qū)域(420×420像素),并在每個(gè)區(qū)域中隨機(jī)取3個(gè)位置,將28個(gè)作為視覺(jué)目標(biāo)的軍事地圖常用標(biāo)識(shí)依次置入抽取中的位置并計(jì)算此時(shí)圖標(biāo)區(qū)域的HSV值與圖像梯度數(shù)據(jù),共得到441(參數(shù)化影像地圖)×25(區(qū)域/參數(shù)化影像地圖)×3(目標(biāo)位點(diǎn)/區(qū)域)×28(圖標(biāo))=926 100個(gè)不同復(fù)雜信息界面條件。進(jìn)一步采用K均值(K-means)聚類(lèi)方法,得到24個(gè)有代表性的復(fù)雜信息界面條件聚類(lèi)。從每個(gè)聚類(lèi)中隨機(jī)抽取50個(gè)具體復(fù)雜信息界面條件,形成包含24(聚類(lèi))×50 = 1 200個(gè)復(fù)雜信息界面條件(其中以城市、海洋、高原為背景的界面條件數(shù)分別為385、452、363)用于后續(xù)行為學(xué)實(shí)驗(yàn)。K-means算法所得聚類(lèi)結(jié)果使用 t-SNE算法映射到低維空間的可視化展示及代表性聚類(lèi)結(jié)果見(jiàn)圖3。

圖3 訓(xùn)練集聚類(lèi)圖
根據(jù)t-SNE圖可見(jiàn),這樣基于特定影像地圖參數(shù)化生成的視覺(jué)界面較為分布均勻、特征豐富,可以有效表征我們?cè)诂F(xiàn)實(shí)生活中所感知到的視覺(jué)界面情況,同時(shí)便于有效控制視覺(jué)界面復(fù)雜性帶來(lái)的可能額外影響,有利于構(gòu)建穩(wěn)健的量化模型。
實(shí)驗(yàn)設(shè)備包括實(shí)驗(yàn)電腦一臺(tái)(用于實(shí)驗(yàn)程序執(zhí)行和數(shù)據(jù)收集),型號(hào)為聯(lián)想ThinkPad S1(4th Gen)筆記本電腦;電腦屏幕為華碩ROGPG248Q型號(hào)24英寸顯示器,屏幕刷新率180 Hz,亮度350 cd/m2。實(shí)驗(yàn)程序?yàn)镻EBL Version 2.1[21]。
實(shí)驗(yàn)采用經(jīng)典的視覺(jué)搜索范式任務(wù),要求被試在不同復(fù)雜信息界面中進(jìn)行視覺(jué)目標(biāo)(圖標(biāo))搜索。視覺(jué)搜索任務(wù)包括上述聚類(lèi)所得1 200個(gè)復(fù)雜信息界面條件,并按照隨機(jī)的方式呈現(xiàn);單個(gè)試次中,被試被要求盡可能準(zhǔn)確且快速地找到視覺(jué)目標(biāo),當(dāng)發(fā)現(xiàn)并認(rèn)清目標(biāo)后按F鍵報(bào)告,從復(fù)雜信息界面圖像出現(xiàn)到被試按下F鍵的時(shí)間記為該試次的響應(yīng)時(shí);之后被試需從4個(gè)不同圖標(biāo)中選擇剛才看到的圖標(biāo),以確認(rèn)被試認(rèn)清目標(biāo)而非虛報(bào)。選擇后程序會(huì)反饋被試的選擇結(jié)果正誤,并在500 ms間隔時(shí)間后進(jìn)入到下一個(gè)試次,單試次的實(shí)驗(yàn)流程見(jiàn)圖4。

圖4 單試次實(shí)驗(yàn)流程圖
在遵循自愿原則了解實(shí)驗(yàn)內(nèi)容并簽署知情同意書(shū)、登記基本個(gè)人信息后,被試首先閱讀實(shí)驗(yàn)說(shuō)明詳細(xì)了解實(shí)驗(yàn)任務(wù)內(nèi)容,并通過(guò)10個(gè)試次的練習(xí)訓(xùn)練以確認(rèn)熟悉了解實(shí)驗(yàn)任務(wù)執(zhí)行方式,進(jìn)入正式實(shí)驗(yàn)后,被試總共需要完成1 200試次實(shí)驗(yàn)任務(wù)。其中,每完成200個(gè)試次后有20 s的額外休息時(shí)間。完成全部試次后實(shí)驗(yàn)結(jié)束,總時(shí)長(zhǎng)約50 min。
本研究總共招募了13名大學(xué)生被試,排除一名被試超時(shí)次數(shù)情況過(guò)多(超過(guò)10%)后,有效數(shù)據(jù)被試為5名男性,7名女性,平均年齡24.00歲(SD= 0.72歲)。所有被試均報(bào)告無(wú)色盲、色弱等情況,均為右利手,且實(shí)驗(yàn)前24小時(shí)內(nèi)無(wú)飲酒或興奮飲料的行為。12名被試均完成全部1 200個(gè)試次,共獲得14 400條數(shù)據(jù);排除3個(gè)標(biāo)準(zhǔn)差外的異常值和圖標(biāo)識(shí)別結(jié)果錯(cuò)誤的試次數(shù)據(jù)后,剩余13 688條,有效數(shù)據(jù)占比為95.06%。
對(duì)于實(shí)驗(yàn)中所用1 200個(gè)復(fù)雜信息界面條件,我們基于2.1節(jié)中的模型框架計(jì)算得到1 200組關(guān)鍵視覺(jué)信息感知特征(背景圖像H、S、V均值與圖像梯度、目標(biāo)區(qū)域背景H、S、V均值與圖像梯度,總共8個(gè)特征變量)作為自變量,以12名被試在相應(yīng)條件下的行為響應(yīng)時(shí)平均值為因變量,構(gòu)建多元線性回歸模型,實(shí)現(xiàn)對(duì)某給定復(fù)雜信息界面條件下視覺(jué)搜索效能的可靠群體趨勢(shì)估計(jì)。通過(guò)實(shí)驗(yàn)數(shù)據(jù)擬合該回歸模型,預(yù)期實(shí)現(xiàn)根據(jù)客觀視覺(jué)信息的視覺(jué)搜索效能的量化估計(jì),回歸模型的擬合優(yōu)度R2數(shù)值及其統(tǒng)計(jì)顯著性可以有效表達(dá)模型的量化估計(jì)能力。
為進(jìn)一步評(píng)估所得模型的外部效度,本研究采用留一法交叉驗(yàn)證(leave-one-out cross-validation)。具體來(lái)說(shuō),對(duì)于每一個(gè)復(fù)雜信息界面條件,基于剩余1 199個(gè)條件的關(guān)鍵視覺(jué)信息感知特征和對(duì)應(yīng)的行為學(xué)數(shù)據(jù)構(gòu)建回歸模型,計(jì)算該條件下關(guān)鍵視覺(jué)信息感知特征的模型預(yù)測(cè)響應(yīng)時(shí)并與實(shí)際實(shí)驗(yàn)所得響應(yīng)時(shí)進(jìn)行對(duì)比。遍歷所有1 200個(gè)條件后,根據(jù)交叉驗(yàn)證所得模型預(yù)測(cè)結(jié)果與實(shí)際響應(yīng)時(shí)得到交叉驗(yàn)證的R2數(shù)值及其相關(guān)系數(shù)統(tǒng)計(jì)顯著性,實(shí)現(xiàn)對(duì)模型推廣應(yīng)用能力的估計(jì)[22]。
在此基礎(chǔ)上,為探索所得模型跨地貌環(huán)境信息的預(yù)測(cè)性能,運(yùn)用上述方法分別對(duì)3種地貌下的數(shù)據(jù)開(kāi)展回歸分析,所用數(shù)據(jù)量分別對(duì)應(yīng)為城市、海洋、高原為背景界面條件數(shù)(385、452、363)。同時(shí)包括3種地貌影像地圖的綜合模型與分別獨(dú)立運(yùn)用單一地貌數(shù)據(jù)的模型結(jié)果對(duì)比可以為深入評(píng)估綜合模型的性能提供依據(jù)。
最后,為避免上述關(guān)鍵視覺(jué)信息感知特征的共線性問(wèn)題,上述模型實(shí)際所用因變量為關(guān)鍵視覺(jué)信息感知特征的主成分,本研究提取了8個(gè)關(guān)鍵視覺(jué)信息感知特征變量集合所得的5個(gè)主成分作為因變量,這5個(gè)主成分可表達(dá)原始數(shù)據(jù)98.14%的方差。
對(duì)8個(gè)關(guān)鍵視覺(jué)信息感知特征變量進(jìn)行主成分分析,提取得到的5個(gè)主成分(F1~F5)的表達(dá)式如下所示,其中T代表目標(biāo)區(qū)域,B代表背景區(qū)域;h、s、v、g代表該色調(diào)、飽和度、明度和圖像梯度的均值:
F1=0.189Th-0.175Ts+0.025Tv+0.166Tg+0.192Bh-0.175Bs+0.057Bv+0.191Bg
(7)
F2=-0.038Th+0.167Ts+0.467Tv+0.070Tg-
0.042Bh+0.171Bs+0.475Bv+0.130Bg
(8)
F3=0.073Th+0.206Ts-0.710Tv+0.920Tg-0.189Bh+0.510Bs+0.301Bv-0.023Bg
(9)
F4=0.846Th+1.085Ts+0.167Tv-0.134Tg+0.709Bh+0.599Bs-0.692Bv+0.296Bg
(10)
F5=-1.087Th+0.655Ts-1.204Tv-0.902Tg+
1.034Bh-0.251Bs+0.884Bv+1.079Bg
(11)
根據(jù)各主成分系數(shù)可以觀察到:F1中目標(biāo)區(qū)域的圖像梯度較高的載荷,而目標(biāo)與背景區(qū)域的明度載荷較低,其可能主要反映的是圖像梯度均值;F2中目標(biāo)與背景的明度均值載荷較高,而色調(diào)均值占比較低,其可能主要反映明度均值;F3中目標(biāo)與背景飽和度載荷都較高,同時(shí)目標(biāo)的明度與圖像梯度載荷較高,而背景的圖像梯度載荷較低,其主要反映目標(biāo)區(qū)域相關(guān)物理屬性;F4中目標(biāo)與背景色調(diào)和飽和度占比較高,其主要反映的是色調(diào)與飽和度均值;F5體現(xiàn)的是除飽和度外的全局物理屬性。
基于上述主成分做回歸分析,結(jié)果見(jiàn)表1。

表1 主成分回歸分析結(jié)果
多元線性回歸分析結(jié)果顯示R2為0.232,F(xiàn)(5, 119 4) = 73.281,p< 0.001;留一法交叉驗(yàn)證結(jié)果R2= 0.230,p<0 .001。留一法結(jié)果可視化見(jiàn)圖5,圖中虛線表示y=x的參考線,模型R2數(shù)值對(duì)應(yīng)的相關(guān)系數(shù)R= 0.480。可以看到模型對(duì)實(shí)際響應(yīng)時(shí)的總體擬合情況良好,模型預(yù)測(cè)響應(yīng)時(shí)相比實(shí)際響應(yīng)時(shí)略偏保守,特別是在實(shí)際響應(yīng)時(shí)較大時(shí)。根據(jù)F1~F5表達(dá)式,還原系數(shù)為原始系數(shù)得方程為:
Y=504.682-0.915Th-0.027Ts-0.997Tv+0.115Tg+0.281Bh-0.155Bs+2.358Bv+0.520Bg
(12)

圖5 模型擬合情況
基于所有地貌數(shù)據(jù)所得主成分對(duì)3種地貌進(jìn)行回歸分析,結(jié)果顯示:城市地貌模型R2為0.205,F(xiàn)(5, 379) = 20.727,p<0 .001;海洋地貌模型R2為0.140,F(xiàn)(5, 446) = 15.705,p< 0.001;高原地貌模型R2為0.548,F(xiàn)(5, 357) = 88.888,p<0 .001。考慮到主成分分析對(duì)數(shù)據(jù)的可能依賴(lài)性,本研究還基于單一地貌數(shù)據(jù)分別進(jìn)行了主成分分析,基于單一地貌主成分的回歸分析結(jié)果顯示:城市地貌模型R2為0.137,F(xiàn)(5, 379) = 13.149,p< 0.001.;海洋地貌模型R2為0.077,F(xiàn)(5, 446) = 8.546,p< 0.001;高原地貌模型R2為0.506,F(xiàn)(5, 357) = 75.234,p< 0.001。
HSV模型方面來(lái)看,首先目標(biāo)區(qū)域的色調(diào)均值系數(shù)均為負(fù)數(shù),而背景區(qū)域的色調(diào)、明度均值系數(shù)為正數(shù),這說(shuō)明目標(biāo)與背景區(qū)域的色調(diào)和明度均值差異越大搜索響應(yīng)時(shí)越短,這與前人的研究中認(rèn)為顏色差異度是顯著性計(jì)算中重要因素相呼應(yīng)[8,23]。其次,目標(biāo)區(qū)域與背景區(qū)域的飽和度均值系數(shù)均為負(fù)數(shù),但絕對(duì)值較小,說(shuō)明在一定范圍內(nèi)人眼對(duì)高飽和度的圖像差異更敏銳。圖像梯度方面,本研究發(fā)現(xiàn)目標(biāo)區(qū)域和背景區(qū)域的圖像梯度均值系數(shù)均為正數(shù),也就是說(shuō)無(wú)論目標(biāo)還是背景區(qū)域的圖像越復(fù)雜,就越不利于視覺(jué)搜索,由于前人研究多數(shù)關(guān)注顏色特征而忽視梯度特征[3],本研究結(jié)果拓展了相關(guān)研究發(fā)現(xiàn)。
在應(yīng)用性方面,本研究提出了基于視覺(jué)顯著性量化計(jì)算方案的應(yīng)用思路,使其不僅可用于視覺(jué)搜索效能的評(píng)估,還可以作為優(yōu)化視覺(jué)界面參數(shù)的工具。前人研究側(cè)重于理論摸索,比如預(yù)測(cè)人眼在真實(shí)環(huán)境中的觀察能力,盡管部分研究已經(jīng)達(dá)到較高的擬合水平,但距離實(shí)際運(yùn)用較遠(yuǎn)[15-16];本研究依托反應(yīng)時(shí)指標(biāo)進(jìn)行搜索效能預(yù)測(cè),具有明確的應(yīng)用價(jià)值。在視覺(jué)搜索效能評(píng)估方面,根據(jù)已有的模型公式預(yù)測(cè)不同目標(biāo)物在每張圖像不同位置時(shí)的響應(yīng)時(shí),并通過(guò)計(jì)算平均值得到評(píng)估此圖像人眼搜索能力的圖像視覺(jué)搜索效能;在視覺(jué)界面參數(shù)優(yōu)化方面,通過(guò)對(duì)不同對(duì)比度與亮度組合下的視覺(jué)界面參數(shù)進(jìn)行模型預(yù)測(cè)可以得到多個(gè)組合上的圖像視覺(jué)搜索效能,從而評(píng)估出能達(dá)到最優(yōu)視覺(jué)搜索效能的對(duì)比度與亮度組合并應(yīng)用于當(dāng)前圖像。
值得指出的是,本文基于所有地貌數(shù)據(jù)所得綜合模型結(jié)果(R2= 0.232)表現(xiàn)出較好的跨地貌推廣應(yīng)用潛力。綜合模型結(jié)果優(yōu)于基于城市和海洋單一地貌所得模型結(jié)果(R2= 0.137,0.077),低于高原單一地貌模型結(jié)果(R2= 0.506)。
本研究面向復(fù)雜信息界面視覺(jué)搜索效能的量化評(píng)估應(yīng)用需求,基于心理學(xué)理論與實(shí)驗(yàn)方法構(gòu)建了可以良好擬合行為響應(yīng)時(shí)的量化模型。探討了HSV顏色空間和圖像梯度對(duì)人眼視覺(jué)搜索的影響,驗(yàn)證了構(gòu)建視覺(jué)效能模型的可行性。在方法上,本研究結(jié)合了心理學(xué)與信息學(xué)方法,基于圖像處理的方法建立了訓(xùn)練數(shù)據(jù)集,通過(guò)行為學(xué)實(shí)驗(yàn)的方式,采用視覺(jué)搜索任務(wù)的范式采集了人眼搜索數(shù)據(jù)并建立模型。研究結(jié)果發(fā)現(xiàn),模型預(yù)測(cè)擬合結(jié)果良好,擬合優(yōu)度R2為0.232。使用整體主成分對(duì)不同地貌進(jìn)行預(yù)測(cè)的結(jié)果也優(yōu)于3種地貌獨(dú)立主成分預(yù)測(cè)的結(jié)果,這說(shuō)明了根據(jù)符合人類(lèi)視覺(jué)認(rèn)知的HSV顏色空間和圖像梯度建立的模型能在一定程度上有效預(yù)測(cè)搜索響應(yīng)時(shí),并具有一定的適用性,證明了基于人類(lèi)視覺(jué)加工機(jī)理去構(gòu)建人機(jī)協(xié)同方案的可行性與有效性。本研究成果不僅可應(yīng)用于軍事背景下的視覺(jué)搜索,也可以應(yīng)用到其他民用場(chǎng)景中,如界面交互設(shè)計(jì)、復(fù)雜網(wǎng)頁(yè)設(shè)計(jì)等,通過(guò)對(duì)特定應(yīng)用情景界面視覺(jué)信息特征的定量計(jì)算和相關(guān)心理學(xué)行為數(shù)據(jù)分析,即可建立特定情境視覺(jué)搜索效能的量化評(píng)估模型。由于高原地貌相對(duì)視覺(jué)信息復(fù)雜度較低,本文所得綜合模型結(jié)果優(yōu)于復(fù)雜度較高的城市和海洋地貌結(jié)果說(shuō)明,綜合模型具有較好的跨地貌應(yīng)用價(jià)值。將來(lái)可以考慮引入更多地貌影像數(shù)據(jù)開(kāi)展更大規(guī)模的心理學(xué)實(shí)驗(yàn),探索更具有普遍性應(yīng)用價(jià)值的視覺(jué)搜索效能量化模型。