于基業,張新利,李 珊
(1.長安大學地質工程與測繪學院,陜西西安710054;2.國家測繪地理信息局第一航測遙感院,陜西西安710054)
遙感對地觀測具有快速、覆蓋范圍廣、周期性等特點,成為最重要的地理國情監測數據獲取手段[1]。監督分類是遙感分類的重要方法,是模式識別技術在遙感技術領域的具體應用[2-3],過程主要包括影像預處理、分類判別和分類后處理三大步驟[4-5],其核心在于模式(樣本)的選取,樣本的選擇受作業人員對待分類目標的認知程度、目視判讀傾向性和影像上像素值及像素分布等多重因素影響。對于大范圍地表數據的提取,其分類結果受當地的地形、氣候等條件的影響,精度不高[6],一般采用裁切影像、單景影像分類的方法。在具體工程中,為實現多景影像接邊,一般是在影像重疊區選擇若干成對樣本點。但該方法具有以下局限性:當多景影像在重疊位置的像素差距較大時,難以為相鄰景影像選擇成對的樣本點;當影像裁剪不規則,需要與周圍多景影像進行接邊時,重疊區樣本位置的確定具有盲目性;工作流程繁瑣,不利于管理,為保證接邊一致性可能導致多次樣本選取及重分類工作;在重疊區域選取的樣本只能被單幅影像使用,利用率不高。
本文基于“多景影像重疊區域的像素代表的必是同一類地物”的思想對傳統方法進行擴展,使影像公用邊的樣本只采集一次,利用接邊樣本數據庫的管理手段,使這些公共的樣本點為多幅相鄰影像共用,其優點是:對于重疊部分像素差異大的多景影像,只在其中一景影像處找到典型的、可以明確判斷地物類型的區域,建立樣本,其他與之相接的影像只需拷貝這些樣本即可,這樣不僅降低了樣本選取的難度,并且提高了樣本選擇的精度;對于幾何邊界復雜,與多景影像接邊的情況,這種樣本的建立方式提高了樣本的重用性,降低了樣本采集的工作量;利用采樣樣本數據庫,有利于重疊區域的樣本管理,滿足數據工程的管理要求。
影像樣本重用的依據是:多景影像重疊區域所表示的地物對于每一景影像是一致的,具有相同的波譜特征;在統一的坐標參考下,若某些樣本的坐標包含在若干景影像的坐標范圍內,則這些樣本是這些影像的公共樣本。如式(1)所示,其中p代表樣本點,A、B、C 代表影像。

如圖1所示,圖中的灰色區域是影像A與影像C的重疊區域,該區域中所有的像素表示的地物在影像A與C中是一致的;對于樣本p,有p∈A,p∈B,因此,p點是影像A和B的共用樣本;對于樣本q,有 q∈A,q∈B,q∈C,因此,q 點是影像 A、B 和C的共用樣本。
基于此,可以擴展傳統的接邊采樣辦法,即在多景影像的公共坐標位置,為每一景影像建立一類地物的樣本。

圖1 樣本重用原理示意圖
本文以ENVI軟件為工具進行研究,在ENVI中,傳統監督分類作業流程是:根據影像的像素判斷地物類型,建立樣本文件(region of interest,ROI),為了促進多景影像接邊,需要打開一景或多景相鄰影像(接邊規則通常是沿著一個方向的,例如,接邊方向是西北接東南,只需打開東南方向的相鄰影像即可),建立地理關聯(geographic link),在影像重疊的位置,結合相鄰影像的影像情況或已分類的結果情況,為待分類影像建立樣本文件,最后執行監督分類。
多景影像樣本重用分類方法的流程如圖2所示。

圖2 多景影像樣本重用分類流程圖
首先將待分類的影像圖號信息輸入影像信息庫,獲得該影像的外輪廓SHP文件,遍歷樣本數據庫中的所有樣本點,判斷這些點是否在待分類影像范圍內,將存在于該范圍的樣本點作為結果,輸出成ENVI指定的 ASCII格式,利用 ENVI的“Input Points from ASCll”功能導入樣本點,以此為基礎,在影像的其他區域進行采樣。最后將最終的采樣結果導出ASCII文件,再次存入到樣本數據庫。
核心技術主要包括接邊ROI的獲取、接邊樣本數據庫的建立、影像信息庫的建立等。
在ENVI中,ROI可以在ROI Tool中導出ASCII碼,用TXT文檔打開這個文件,其文件結果如圖3所示。

圖3 ENVI中ROI的ASCII文件格式
圖3中,以“;”起始的信息是說明信息,分別標識了ENVI產品版本、分類總數、文件像素的范圍;空一行依次是ROI分類的名稱、RGB值、該分類中選取的樣本總像素個數,同樣以空行區分每一個分類的信息;以“;ID”為起始的數據部分就是各個分類中的具體像素信息,其中X、Y表示該像素的像素坐標,MapX、MapY代表經過變換后的坐標,Lat、Lon代表經緯度,B1—B6代表各個波段值,同樣,不同類別的樣本通過空行的方法進行區分。
根據樣本重用的原理,能被公用的樣本應在各張影像上具有相同的坐標,唯一不同的是像素坐標和波段值,這意味著如果影像A和影像B的范圍包含樣本點像素p的坐標,p是來自影像A的樣本,只需要將像素點p的像素坐標進行平移變換到B相應的像素上即可,p導入到B中以后會自動獲取B影像該像素位置的波段值,作為以后分類的基礎。
建立公共接邊處的樣本數據庫,一方面將這些可能會重用的ROI文件管理起來;另一方面加快影像獲得所需ROI數據的速度,提高數據的使用效率,這一點與空間數據工程的要求是一致的[7]。接邊樣本數據庫設計見表1。

表1 接邊數據庫字段設計
在數據庫檢索過程中,輸入影像的范圍信息,查找包含在該影像范圍內的點,獲得屬于該影像的像素信息;再按照“Class”的類型生成ENVI ROI文本的規定格式,即可作為該影像的分類樣本并參與之后的分類。
在對影像進行裁剪等相關操作時,一般使用ArcGIS制作影像的外輪廓SHP文件,這些SHP文件與影像的實際范圍是一致的,將這些影像SHP文件進行統一存儲,以影像景號作為SHP文件檢索的主碼,并作為判別公共樣本點的依據。
土地覆蓋變化研究是全球環境變化研究的重要組成部分[8-10],本試驗是對某區域植被信息提取,采用監督分類。在分類的樣本選擇過程中,應用傳統方式和多景影像樣本重用方法進行對比試驗,對其接邊情況進行對比分析。
試驗數據采用某區域的TM影像,空間分辨率為30 m。經過大氣校正、幾何校正、裁剪等處理,相鄰影像之間具有幾十像素的重疊區域。
參考數據:USGS 2001全球地表覆蓋成果,Google Earth影像。輔助數據:SHP格式的掩膜文件,包括耕地、人造覆蓋、水體和冰川等。軟件環境:ENVI 4.7 ,ArcGIS 9.3。
1)數據準備:對影像進行批量像素值值域轉換,并進行水系、人造覆蓋批量掩膜,得到待分類的影像數據。
2)監督分類:監督分類的樣本采集過程采用對比試驗的方法。第一種是傳統的接邊樣本選取方法,即在影像的重疊區域選取成對的樣本點,作為控制組;第二種方法采用多景影像樣本重用的方法進行采樣。在非重疊區域,兩種方式的影像采樣點保持一致,每一類3型樣本點數量為40左右。樣本選取完畢后,用SVM方法進行分類。
3)分類后處理:濾波像元大小設定為5像素×5像素,處理后,對比兩種樣本選擇方式的處理結果。
以兩幅相鄰的像素值差異較大的影像為例,將原始影像(掩膜后)和分類后的成果在ArcMap中打開,結果如圖4所示。

圖4 兩種采樣方式分類結果對比
圖4中,(a)為兩張原始影像,其接邊處像素顏色差異較大(如(b)所示),(c)為控制組采樣方法的分類結果,(d)是采用多景影像樣本重用方法的分類結果。從圖4中可以看出,采用樣本重用方法的接邊效果優于傳統方法。導致這種結果的原因是對于顏色差異較大的影像,很難在顏色復雜的影像上找到確定的地物樣本;而樣本重用的方法可以將已知的確定的樣本復制到接邊影像,這有利于促進影像接邊的一致性,同時減少了樣本的采集量。
本文針對傳統監督分類影像重疊區域接邊存在的問題,優化、改進了重疊區域的樣本選取策略和作業流程,提出了“多景影像監督分類的樣本重用”方法,利用樣本庫對重用的樣本進行管理。實際分類結果證明這一方案可行,有利于保證多張影像的接邊一致性和正確性;同時,對于大區域、多人參與的分類工作,該方法提供的接邊樣本降低了采樣工作量,對于應用監督分類進行地理國情監測、大區域地表覆蓋研究等大型項目的效率提高具有重要意義。
[1]李德仁,眭海剛,單杰.論地理國情監測的技術支撐[J].武漢大學學報:信息科學版,2012,37(5):505-512.
[2]王圓圓,李京.遙感影像土地利用/覆蓋分類方法研究綜述[J].遙感信息,2004(1):53-59.
[3]劉仁釗,廖文峰.遙感圖像分類應用研究綜述[J].地理空間信息,2005,3(5):11-13.
[4]張銀輝,趙庚星.土地利用/土地覆蓋遙感分類方法的研究綜述[J].中國農業資源與區劃,2002,23(3):21-25.
[5]蔣艷凰.遙感圖像高精度并行監督分類技術研究[D].長沙:國防科技大學,2004.
[6]郭艷芬,劉志紅,謝明元.基于知識與監督分類的青南高原植被信息提取[C]∥中國氣象學會.北京:[s.n.],2008:277-282.
[7]劉瑜,張毅,鄔倫.空間數據工程理論框架研究[J].地理與地理信息科學,2003,19(1):12-15.
[8]王素敏,翟輝琴.遙感技術在我國土地利用/覆蓋變化中的應用[J].地理空間信息,2004,2(2):31-32.
[9]楊立君,馬明棟,唐立軍.基于TM影像的崇明東灘濕地植被分類研究[J].水土保持研究,2013,20(1):126-130.
[10]喬朝飛.國外地理國情監測概況與啟示[J].測繪通報,2011(11):81-83.