王 敬,趙紅東,朱勝銀,楊志明
(河北工業大學 電子信息工程學院,天津 300401)
近年來,隨著衛星技術和高分辨率對地觀測系統的快速發展,傳回地面工作站的高分辨率多光譜圖像數據量急劇增加。面對海量遙感圖像數據,快速有效地檢索已成為急需解決的問題[1]。
當今主流的遙感圖像檢索是基于內容特征的,基于圖像內容特征(如紋理、形狀、顏色等)或特征組合順序檢索的內容式遙感圖像檢索得到了迅速發展[2-4]。目前,主要的遙感圖像檢索研究分為兩類:一類是提高檢索的準確率,文獻[5]提出了基于聯合稀疏表示算法與形態學特征的高光譜圖像分類,提高稀疏分類的能力,提高分類精度;董安國提出的基于譜聚類和稀疏表示的高光譜圖像分類算法[6];文獻[7]提出了基于顏色矩和灰度共生矩陣的遙感圖像檢索原型系統;綜合利用小波變換、LTRP和ANFIS的遙感圖像檢索技術,檢索精度有所提高[8];文獻[9]對圖像RGB值的稀疏表達的相似性度量方法進行檢索,能夠有效進行圖像檢索,但計算復雜度高;改進圖像檢索中相關反饋,使得檢索精度提高,但是由于選取的圖像特征多,相似性度量準則復雜使得檢索效率較低[10]。另一類是提高檢索的效率,包含降維方法進行圖像檢索:聚合特征進行檢索,提高檢索的精確度[11];對多光譜遙感圖像降維以提高檢索效率,減少圖像存儲空間[12];另一方面,利用分類方法進行圖像檢索成為研究的方向,樊利恒等提出基于分類器集成的高光譜遙感圖像分類方法[13];張洪群提出深度學習的半監督遙感圖像檢索方法,與不分類相比檢索效率有明顯提高[14]。由我國2013年發射的GF-1遙感衛星拍攝的高分辨率圖像,更能切實反映我國國情,目前對其研究報道較少。為了提高檢索效率,本文對河北陽原地區的GF-1圖像進行研究,對比不同圖像特征在三類圖像中的分辨能力,選出最具分辨能力的特征,并提出了基于貢獻值的特征選擇及其分類檢索方法。
實驗所用遙感圖像共包含3個類別,分別是山脊、水體和村落。GF-1號三類遙感圖像樣本如圖1所示,圖像分辨率為8 m,大小為50像素×50像素。

圖1 GF-1三類遙感圖像樣本
矩不變量分析圖像某個區域或者邊界的灰度變化情況。Hu矩的7個矩不變量M1~M7具有平移、旋轉和尺度不變性[15]。圖1中3個遙感圖像樣本Hu矩特征值如表1所示。

表1 典型三個遙感圖像樣本的Hu矩特征值
表1為利用sobel算子得到遙感圖像邊緣圖,對其提取的Hu矩特征值。表1中的圖像特征值即是圖2中三幅圖像的Hu矩特征值。
小波變換是指將信號分解為一系列的基本函數,這些基本函數均是通過對母函數變形得到,在時域和頻域兩個域表示信號的局部特征的能力。表2為利用小波Haar進行小波分解提取的3個遙感圖像樣本的特征值。其中,圖像在水平和垂直方向上的低頻分量LL、水平方向上的低頻和垂直方向上的高頻LH、水平方向上的高頻和垂直方向上的低頻HL以及水平和垂直方向上的的高頻分量 HH。

表2 3個遙感圖像樣本的小波分解特征值
灰度共生矩陣(GLCM)描述了圖像中從灰度為i的像素出發,到距離為(dx,dy)的像素灰度為j的概率(或次數)。本文以0°、45°、90°和135° 4個方向上,灰度共生矩陣的能量ASM、熵ENT、慣性矩CON及相關性COR的均值和標準差作為8維紋理特征[16],如表3所示。

表3 3個遙感圖像樣本的灰度共生矩陣特征值
分別計算3類圖像的3種圖像特征值,將同類遙感圖像特征值的均值作為類別特征值。采用不同的特征分別進行分類實驗,可得分類正確率如表4所示。由表1—3可見,發現Hu矩的村落圖像與另外兩類圖像的差值差距較大,能夠準確判別村落圖像,而另兩種圖像的類別特征值之差較小,不能作為圖像特征用于分類檢索。多光譜圖像的G通道能夠對山脊和水體進行良好區分。引入顏色特征即圖像的G通道圖像的值,與Hu矩共同構成遙感圖像分類檢索的特征空間。根據地物分布情況得到200幅山脊、136幅水體和216幅村落圖像。以部分樣本,50幅山脊、34幅水體和54幅村落圖像,進行分類正確率測試,實驗分類正確率,如表4所示。
圖像檢索以歐式距離度量特征相似度。若直接對Hu矩和顏色特征組合檢索,相似度計算的復雜度較高。本文將特征的各分量的重要性納入考慮,通過計算Hu 矩特征各分量在分類檢索中的貢獻值,發現部分分量的貢獻值較小。貢獻值即各分量在相似性度量中距離的差值中所占的比重。只選取貢獻量大的特征分量,在保證檢索質量的情況下,有效提升檢索效率。區分不同圖像類別時,Hu矩各個不同分量的貢獻值,如表5所示。Hu矩的M1和M2貢獻值之和達到99%以上,故選擇M1和M2代表整個Hu矩分量,而忽略其它分量。

表4 選取不同特征的遙感圖像分類正確率 %

表5 山脊、水體及村莊圖像Hu矩各分量差值的貢獻值
分類檢索在檢索圖像前進行,判斷其所屬類別。然后,在檢索圖像庫的同類別圖像庫中檢索。圖像分類的各個類別中的圖像越多,分類檢索方式越能提高檢索的效率。本文計算已知分類的遙感圖像樣本特征值,并存入特征空間。同一類別的樣本特征均值作為類別特征值。本文中Hu矩判定遙感圖像是否屬于村落類別?若是,則在村落類別的圖像中檢索;若不是,則通過顏色特征判定待檢索的遙感圖像所屬類別。最后,只在檢索圖像庫中同類別圖像中查找相似圖像。
采用圖像特征向量的歐式距離進行不同遙感圖像的相似性計算,設兩幅遙感圖像的特征向量分別為s=(s1,s2,…,sm)和t=(t1,t2,…,tm),特征向量為m維,則這兩幅圖像的特征距離d(s,t)為:
(1)
式中:si和ti分別為特征向量s和t的第i個分量。d(s,t)越大,相似性越小;d(s,t)越小,相似性越大。
本文提出的基于貢獻值的有效特征選擇及其分類檢索算法,其計算過程如下:
第一步:對訓練圖像庫中的圖像提取特征,得到訓練圖像特征集。然后利用遙感圖像進行特征分類,并得到不同類別的圖像類別特征值;
第二步:對檢索圖像庫中的圖像提取與第一步相同的特征,利用第一步得到的圖像類別特征值,判斷檢索圖像庫中每幅圖像的類別;
第三步:對待檢索圖像提取與第一步相同的特征,利用第一步得到的圖像類別特征值,判斷待檢索圖像的類別;
第四步:根據待檢索圖像的類別,利用圖像相似性度量準則進行,在檢索圖像庫中的同類別圖像中查找與待檢索圖像相似的圖像,得到檢索結果。
目前,在遙感圖像檢索中最常用的性能評估準則是查全率和查準率,查準率P和查全率Q計算式為:
P=n/N,
(2)
Q=n/S.
(3)
其中,n為一次檢索返回的檢索結果中正確圖像的數目,N為一次檢索返回的檢索結果中圖像的總數目,S為檢索圖像庫中包含正確圖像的數目。
本文每次檢索返回最相似的10幅圖像,采用查準率對檢索系統性能進行評估。
構建并實現基于GF-1遙感圖像特征的遙感圖像檢索系統。實驗圖像均從原始GF-1遙感圖像中截取的。根據地物分布情況得到200幅山脊、136幅水體和216幅村落圖像,截取子圖大小為50像素×50像素。從每類圖像中隨機取100幅圖像作為訓練樣本,其余為測試樣本。檢索系統結果如圖2所示。

圖2 檢索系統檢索結果
其中,查詢圖像即待檢索圖像,圖2中圖像與查詢圖像相似度按從大到小排列的檢索結果。
為驗證本文算法的有效性,對山脊、水體和村落三類遙感圖像分別隨機選取10次進行測試,查準率取10次測試的均值。其中,一次遙感圖像檢索結果如圖2所示。采用查準率和查全率對本文方法檢索性能評估,其查準率可達到94%,查全率可達到88%。各類別圖像查準率如表6所示,查全率如表7所示。

表6 本文方法各類圖像查準率 %

表7 本文方法各類圖像查全率 %
表6為本文方法下的各類圖像查準率。將各類圖像綜合起來,本文算法的總查準率為92%。由此可見,本文方法的檢索準確率很高。
表7為本文方法下的各類圖像查全率。將各類圖像綜合起來,本文算法的總查全率為88%。由此可見,本文方法達到很好的識別效果。
為了驗證本文方法在檢索效率上的性能是否有所提升,對傳統順序檢索方法和本文方法所搭建的系統各進行20次實驗。使用傳統方法遙感圖像檢索的時間均值為0.28 s;使用本文方法遙感圖像檢索的時間均值為0.07 s。實驗結果表明:與順序檢索相比,利用分類決策的檢索技術能夠大大提高檢索效率。本文算法與深度學習的半監督遙感圖像檢索方法[14]得到的實驗結果進行對比,本文方法檢索時間為0.07 s,而深度學習半監督方法檢索時間為1.88 s,本文算法在檢索效率上有很大提高。此外,由于深度學習中神經網絡需要對數據進行訓練,比本文的分類方法消耗更長時間。在對特征進行降維時,文獻[11]采用主成分分析法方法,這需要對所有圖像特征數據計算協方差矩陣、協方差矩陣的特征值和特征向量、比較特征值大小等,計算復雜度高于本文算法。
基于有效值分類檢索的方法,對GF-1遙感圖像中的不同類別圖像的3種圖像特征的計算,表明Hu矩具有識別圖像能力的特征,將其應用到遙感圖像分類檢索模型中進行實驗。并證明了本文提出的方法用于遙感圖像的檢索和分類能夠成功的將不同類別的圖像區分開,對不同類別圖像的檢索識別結果達到較高的正確率。相比神經網絡、深度學習算法,本文提出方法簡便,不需要神經網絡的多次訓練,因此檢索效率高,其檢索速度在毫秒量級。該方法對我國GF-1的其他圖像的山脊、水體、村落的分布和面積測量等地理勘測領域以及目標檢索識別和定位具有參考價值,也為目標識別的進一步分析提供重要依據。