趙子涵
(內蒙古工業大學 內蒙古自治區呼和浩特市 010051)
在經濟水平日益提升的背景下,數碼相機、智能手機等成像設備愈加普及,進而很大程度擴大了數字圖像規模,在此種情況下,用戶要想實現檢索的高效及海量存儲,具有較大的難度。同時,伴隨進入到云計算時代,更多企業及用戶在處理和存儲數據時,習慣采用外包大量數據到云端。但借助此種方式后,圖像數據就可能得不到良好保護,進而出現圖像數據濫用或是隱私數據泄露的情況。只出于對隱私的有效保護,在外包之前圖像擁有者會加密圖像數據,以發生泄露風險,但如此也會影響到后續的檢索操作。所以,為了如何更好管理及檢索海量的圖像數據,就顯得至關重要。現如今,明文域圖像檢索方法主要分為CBIR和TBIR,TBIR技術雖然較為成熟,擁有實現簡單、速度快等優勢,但存在人工標注效率低的影響[1]。在捕捉語義信息方面CBIR的優勢更為明顯,這也是為何其是目前圖像檢索重點研究領域。但CBIR檢索精度會受特征有效性的影響較大,若只借助形狀、紋理或顏色等單一特征展開檢索,則不易保證檢索結果的準確性以及效率。所以,怎樣借助圖像的多特征展開圖像檢索,依舊是當前學術界的一個研究重點。
圖像查詢系統與數據庫生成系統構成了融合多特征的圖像檢索技術系統,其中數據庫生成系統的實現依托數據的收集和傳輸,同時該系統重點是處理圖像特征和圖像的收集,包含了圖像格式、色彩空間的處理及調整分析圖像比例;而圖像查詢系統的查詢及檢索是依托圖像的特征進行[2]。文章收集和處理圖像內容,均在收集圖像特征的基礎上,同時這也是融合多特征的圖像檢索技術的根本,特征包含了圖像的形狀、圖像的紋理及圖像的顏色等。
在圖像特征收集處理系統基礎上,完成圖像檢索系統的建立,組成部分為結果瀏覽、檢索及查詢引擎。通常關于圖像的檢索,共分如下步驟:第一,借助圖像數據庫,然后由用戶結合圖像特征、圖像類型、圖像數目等實際需求,借助系統搜索相關圖像。系統接收用戶提交的檢索需求后,搜索引擎開始處理用戶的數據,并于數據庫內展開查找,計算圖像的特征后,找出用戶所需的圖像,然后結合用戶需求和圖像的相似程度、達標程度排列圖像,最終顯示圖像。
當前,國內外針對圖像檢索展開了較多研究,但多數研究都是將焦點放在文本基礎上或單一特征的圖像檢索。本文筆者基于多特征融合的圖像檢索系統,借助圖像的紋理、顏色特征,結合圖像中內容提出的圖像特征,并計算圖像的相似性,圖1為具體的檢索流程。實際上,怎樣提取圖像的特征,是基于內容圖像檢索技術的重點所在,結合圖像特征展開用戶計算和交互,并對圖像展開分析,完成相似性計算,最終按用戶的具體需求完成相似圖像的選取及輸出[3]。

圖1:圖像檢索流程圖

圖2:隨機抽取的目標圖像

圖3:ZuBuD圖像庫檢索結果
紋理是事物表面特有的一個特性,為圖像檢索提供了重要依據。當前,灰度共生矩陣與馬爾科夫分析法是當前描述圖像紋理特征的主要方法。紋理對應了圖像內的規則,是圖像特征的一種體現。借助Gabor濾波器提取圖像紋理,就是常見的紋理頻譜法[4]。下面為紋理分析中的二維模式變換公式:

w代表了高斯函數的復調制動頻率,母波為g,根據g選擇與變換合適的尺寸,也就是改變n值和m值,完成一組實際尺寸和方向的獲取,與以往的相似濾波器不同。

公式內,大體圖像的方向與尺度,用n, m表示,圖像像素總數為N,針對固定的某一圖像,Gabor小波的具體變換如下:

通過w(x, y)的方差和均值,能得到的特征向量是:

提取特征向量,就能實現該圖像特征向量的獲取,為圖像檢索提供評判依據。
在借助顏色特征展開具體檢索時,要先著手顏色空間模型的構建,如此才能保證圖像檢索效果和人類視覺系統更為相符。如今應用最為廣泛的圖像顏色模型,即為RBG,這是因為其操作簡便,但不夠符合人類的直觀視覺系統,就此點而言,HSV顏色空間模型優勢更為明顯。所以,文章選取了HSV顏色空間模型,以使之能夠和RGB顏色空間模型更良好的互相轉化,以下為具體的轉換模式:

表1:圖像查詢試驗統計表

結合人類如今的視覺分辨能力,按照不同色彩量化各個分量,把圖像的亮度和飽和度劃為4個等分,把H色調劃為16個等分,如下為圖像亮度(V)、飽和度(S)及色調(H)的計算:

經過轉化,要合并各分量為維度相同的特征向量,為計算更為方便有效轉化以上分量為一維特征,本文采用顏色直方圖作為表示圖像顏色特征的方法。以直方圖的縱軸和橫縱,完成圖像內顏色占比和顏色量化等級的表示。
圖像一類特征向量內,各特征分量代表的取值范圍和物理意義具有差異,并且,在圖像檢索中的作用也不一致。所以,在多特征基礎上展開檢索,要統一一類特征內的不同特征分量和不同分量,先統一處理圖像特征內部,再統一特征向量外部。
也就是計算一類圖像特征內不同分量的相似度,使之權重相同,文章在具體處理時應用了高斯歸一法。先假設一維特征向量標記為若圖像庫內的圖像用i表示,則為某圖像中i的特征向量記,多個特征融合就能完成一個特征矩陣的獲取,進而展開矩陣出均值和標準差的計算,得到歸一的圖像特征。
紋理和顏色特征向量含義不同,因此,應歸一處理不同特征向量,保證在計算相似度的過程中,不同類型圖像特征擁有一致性。以下為本文所采用的方法:對圖像內紋理與顏色對應的特征向量Fy、Fx中相似數值進行計算;將相似數值計算出來后,特征向量的均值和標準差借助線性代數完成計算。然后進行檢索時,能依托圖像間的相似距離,進行適當圖像的選取作為最終結果。融合多個特征展開檢索的過程中,用戶能自主設定圖像檢索的紋理標準與顏色標準,然后對比紋理與顏色特征,完成圖像相似性距離差的獲取,如此就能表示此圖像內紋理與顏色的占比,從而展開相應圖像檢索。
文章實驗數據集選擇了Corel標準圖像庫和ZuBuD圖像庫。其中ZuBuD圖像庫的組成為兩部分,一部分包含115張查詢圖像,一部分包含1005張圖像,每4張為相似圖像。Corel標準圖像庫則是由500張類別不同的圖像組成,每種類型圖像各100張,共包含花、人像、建筑等類型。先在ZuBuD圖像庫運用文本方法展開檢索,隨機從圖像庫查詢部分抽取一張為目標圖像(如圖2),根據文章所提的檢索流程,得到圖3(最終的輸出結果)。
圖3內的4張圖像,就是根據文章所提方法檢索所得,與圖2目標圖像的相似度最高,通過比較能發現,在該圖像庫內本文方法有著較為良好的表現。并且,為檢驗該方法的魯棒性,于Corel標準圖像庫分類別展開檢索,對算法查準率與查全率做綜合考慮,具體見表1。
實驗結果表明,本文所提出在多特征基礎上展開的圖像檢索有著較為良好的性能,因為融合了圖像的多個特征,所能展示的圖像內容也更良好,就查全率和準確性而言,都要明顯優于單一特征的圖像檢索,明顯提高了檢索的性能。
文章融合多特征圖像檢索技術的實現關鍵,包含了提取圖像特征、選擇圖像特征,與多特征的加權融合。就圖像自身視角來講,因為圖像有著較多屬性,每種特征能反映圖像的多種特征屬性,所以,為更好表示圖像的內容,可通過對圖像多個特征的提取和融合來實現。歸一化處理圖像的多特征,然后在融合多特征的基礎上展開檢索,能使圖像檢索性能得到顯著提升,與用戶需求更為相符。但需要承認的是,融合多個特征的圖像檢索法,需改進的地方仍然較多。雖然本文提出檢索方法能一定提升檢索性能,但在今后的研究中,為了實現圖像檢索的更為高效,可對更深層次的卷積神經網絡模型進行研究,將CNN網絡的學習能力更多發揮出來。