栗 業 周汝良 王云飛 蘆 珊
(1.西南林業大學,云南 昆明 650224;2.中國林業科學研究院 資源信息研究所,中國 北京 100091)
Edison采用的是基于均值漂移原理的影像分割,如果影像維數為p,當空間位置向量與顏色向量一起合為“空間-顏色”域時,維數為p+2,作為防輻射對稱核和歐幾里德多元核表示為:

式中,xs為特征矢量的空間部分;xr為特征矢量的顏色部分;k[x]在空間和顏色域中都是用相同的核;hs、hr分別為空間帶寬與色度帶寬;C為相應的歸一化常數。因此,帶寬參數(hs,hr)就成為均值漂移分割過程中的重要參數。
對于基于均值漂移的影像分割過程,設xi為d維輸入影像,zi(i=1,...,n)為其濾波影像,Li為分割影像的第i個像元,則分割過程為:①進行均值濾波,存儲d維濾波數據zi=yi,c;②對所有空間域小于hs且范圍域小于 hr的 zi進行聚類{Cp},p=1,...,m;③對于每個 i=1,2...,n,計算Li={p|zi∈Cp};④瓷都合并過程,將連續空間域小于合并尺度M個像元的區域進行進一步合并。
首先,均值漂移分割算法需要將RGB色度空間轉換到LUV特征空間,以更好地實現其特征空間的分離,這是因為RGB空間為非線性,不具有較好地空間統計性及尺度對應關系,而LUV可以更好地應用分割過程中的影像不同像元的光譜信息并進行統計。對于彩色影像來說,假設彩色圖像的特征空間為L,則圖像中不同顏色的物體,就對應特征空間上不同的聚類。彩色圖像映射到特征空間L后,再結合像素在圖像中的位置,即空間信息(X,Y),就能得到每個像素在5維特征空間中的值,即(X,Y,L*,U*,V*)。其中,L*表示圖像的亮度,U*和V*分別表示色差。在此基礎上采用聚類算法,就可以吧空間和顏色歐式距離相近的點歸為一類,從而實現彩色圖像的分割。
確定算法的和函數及帶寬后就可進行基于空間與顏色域的均值濾波過程,即均值漂移書案發的主題部分。對于算法的多尺度實現方法,有效確定不同尺度的算法合并位置,并對前期處理的中間結果進行存儲,建立或更新影像的尺度層次關系,可有效避免同一影像、同一參數在不同分割時的重復性工作,達到提高分割效率的目的。多尺度分割的實現過程中,確定不同尺度的合并序列{M1,M2,...,Mn},并在濾波結果的基礎上進行迭代,通過對濾波結果的存儲能夠達到多尺度分割過程的尺度M。[1]
在Matlab中通過函數實現圖像區域中灰度值小于閾值的點的合并。
首先設置與影像像元個數相同的區域結點,根據像元個數與影像維數建立各個區域的模式。將影像的類別標記矩陣的初始值設定為-1,并建立判別像元是否已經被訪問過的邏輯型標記矩陣。
為方便處理,將圖像波段鄰域轉化為由中心位置與周圍相鄰的八個位置共同組成的九維矩陣,從而建立判別圖像位置關系的鄰域矩陣,同時建立與之相對應的位置索引矩陣。
將LUV小于指定閾值的像元標記為同一區域來獲得非連通圖的極大連通分量。順序掃描所有頂點,利用判別矩陣判斷該點是否已經被訪問,如果沒有,則訪問這個連通分量。
確定連通區域的過程中,對每一定點采用廣度優先搜索方法,建立訪問標記矩陣,將當前點取進隊列,獲得當前處理點對應的行列坐標,從隊列中退出頂點,獲得連通的鄰域位置索引集合,如果當前點未訪問過且未被其他區域標記,則當前點進入隊列。搜索的同時更新訪問判別矩陣的標記和類別標記矩陣,并完成對區域的編號。
依據區域標記矩陣,獲得每個結點的邊。統計計算當前點的標號與右、下、右下、左下的標號是否相同來確定區域鄰接關系,判定完畢后進行排序,將重復的區域消除。最后完成對鄰域信息的更新。
DNVI是植被影像解譯的重要參考,其計算方法如下:

其中NIR代表近紅外波段,R代表紅波段。

表1 TM影像DNVI值Tab.1 DNVI of TM image
使用Matlab中的regionprops函數提取由分割影像構建的標記矩陣所標記的各個區域的面積 (Area)、存儲區域像素的索引下標(PixelIdxList)等屬性特征。
將DNVI值與源影像一起構造線索特征集合,并計算區域光譜及NDVI均值集合和區域光譜及NDVI方差集合。
最后選擇所有特征,包括波段區域的光譜均值、NDVI均值、光譜方差、NDVI均方差、面積記性數據范圍歸一化。
對預先生成的訓練樣本影像和測試樣本影像生成訓練樣本矩陣和測試樣本矩陣,以用于分類和結果檢驗。其分類的依據是根據各類別樣本在影像中所對應的亮度值不同。

圖1 樣本影像及其樣本矩陣Fig.1 Sample Image and Sample Matrix
讀取訓練樣本矩陣,對各類樣本建立對應的訓練區域標號和區域特征,獲得每個類別所有訓練樣本的區域編號。遍歷樣本點,考察其類別是否為空,若為空則添加類別,同時比較源影像與訓練樣本之間的相似程度,為影像分類做準備。
采用最小距離分類器對源影像進行分類,先計算每個類別的均值,再調用分類函數,獲得每個區域的類別變換。最小距離分類器的原理很簡單,即計算每個區域到訓練樣本各類別的距離,然后取其最小值為區域分類。計算距離的實現方法為:

其中d為所求距離;M為與模式矩陣x列數相同的矩陣,其行為類別均值向量的集合;x為模式矩陣;W為樣本個數。
讀取測試樣本的樣本矩陣,提取測試樣本的個數,遍歷樣本,查找標記類型為u而測試類型為v的樣本個數,從而建立混淆矩陣。

表2 混淆矩陣Tab.2 confusion matrix
混淆矩陣對角線位置的元素代表判別正確的對象個數,將其求和后與總體測試樣本個數相比,得到總體精度。
把測試樣本總數乘以混淆矩陣對角線的和,再減去某一類中測試樣本總數與該類中被分類樣本總數之積對所有類別求和的結果,再除以樣本總數的平方減去某一類中測試樣本總數與該類中被分類像元總數之積對所有類別求和的結果所得到的。其公式如下:

其中^K是Kappa系數,r是混淆矩陣的行數,xii對角線上的值,xi+和x+i分別是第i行的和與第i列的和,N是樣本總數。
生產者(制圖)精度:指假定地表真實為A類,分類器能將一幅圖像的像元歸為A的概率,即混淆矩陣對角線元素與其所在行元素和的比;用戶精度:指假定分類器將像元歸到A類時,相應的地表真實類別是A的概率,即混淆矩陣對角線元素與其所在列元素和的比。
[1]沈占鋒,駱劍承,胡曉東,孫衛國.高分辨率遙感影像多尺度均值漂移分割算法研究[J].計算機研究與發展,2012,35(3):313-316.Shen Z F,Luo J C,Hu X D,Sun W G.Researchof Multiple Dimensioned Mean Shift Segmentation Algorithm for High Resolution Remote Sensing Image[J].Geomatics and Information Science of Wuhan University,2012,35(3):313-316.
[2][美]Rafael C.Gonzalez,Richard E.Woods,Steven L.Eddins.岡薩雷斯數字圖像處理(MATLAB 版)[M].阮秋琦,等,譯.北京:電子工業出版社,2005:367-36.