劉揚,王彬,韓雷
(1.中國海洋大學信息科學與工程學院,山東青島266100;2.國家氣象信息中心計算機室,北京100081)
各種類型云的輻射特性以及其分布情況,很大程度上影響著天氣預報的準確性、氣候監測的有效性和全球氣候變化等。但由于云的復雜多樣性,如何準確地對衛星云圖進行自動分類,仍是目前研究的熱點問題。
利用衛星提供的圖像數據進行云分類一般都要經過3個步驟:數據預處理、特征提取和選擇、分類。早期簡單的云分類方法是基于圖像的閾值方法[1],而隨著衛星相關技術以及云圖質量的提高,采用聚類的分類方法得以廣泛研究和應用,到80年代中后期結合神經網絡方法[2-3]進行云分類的研究也開始興起。近些年的云分類研究則是在現有成熟理論基礎上加以改進,針對具體衛星云圖,將多種方法的優點相結合[4],使分類的結果更準確合理。
本文結合近幾十年國內外的衛星云圖云分類研究的發展情況,主要關注兩個方面:一是特征提取和選擇的方法;二是分類的方法。并簡要介紹了對分類結果的評價方法。
最常用的特征是光譜特征和紋理特征。光譜特征提取的是云在不同波段的輻射信息,如云頂亮溫、可見光反照率等。這對區分不同高度的云至關重要,在可見光圖像上亮度低的為低薄云,亮度高的是高冷云,而紅外圖像則相反。但是只用光譜特征的分類結果正確率并不高,因此也要結合云圖的紋理特征進行分析。紋理特征是指圖像某個區域相關的灰度級空間分布特征。一般通過灰度共生矩陣、灰度級差矩陣以及和差直方圖得到的統計數據組成紋理特征。
衛星資料所含的數據相當龐大,且含有一定冗余信息。采用適當的特征提取和選擇的方法可以從復雜的云系統特征空間中選擇出最有效的幾個特征,從而可以提高分類的運算速度。常用的統計特征提取選擇算法有奇異值分解(Singular Value Decomposition,SVD)、小波包、獨立成分分析(Independent Component Analysis,ICA)等等。
SVD提供圖像的能量信息,并且提供圖像子空間上能量分布的信息Tian等人在中使用奇異值分解進行云類的特征提取[3]。如圖1所示,分別對四種類型的云截取8×8像素的塊圖(左),各自進行奇異值分解(右)。最大奇異值表示圖像均值,其基本體現圖像的光譜特征,其余的奇異值表示圖像的細節信息。Rashpal等人利用SVD方法[5]提取可見光和紅外圖像雪與云數據引起的顯著光譜和紋理特征。而Azimi-Sadjadi則介紹了一種運動奇異值分解(MSVD)方法[6],用來確保時域更新算法分類的準確性。

圖1 一些典型8×8像素云塊圖(左)以及各自SVD取對數后的值分布(右)Fig.1Some typical 8×8 blocks(left)and their corresponding SDV values in log domain(right)
二維小波分解能很好地反應圖像的時頻特征,分解的子圖像能提供原圖像在不同頻帶信息。分解的層數越高,頻率分辨率越高,相應時間分辨率降低。Tian等人同樣也采用二維Haar小波包對衛星云圖進行3層分解來提取特征[3]。在都使用概率神經網絡分類方法的條件下,對比了SVD和小波包(Wavelet Packets,WP)2種特征提取方法。使用WP進行特征提取在整體分類準確率上不如奇異值分解,而從具體類別來看,特征值分解對于提取高層云、卷層云、層積云和非云區的特征較好,而WP對提取卷云特征較好。
常用的無監督云分類方法可分為閾值法、直方圖法、聚類法等。聚類方法是目前最常用的無監督云分類方法,具有以下3個特點:1)選定某種距離度量作為樣本間的相似性度量。2)確定某個評價聚類結果質量的準則函數。3)給定某個初始分類,然后用迭代算法找出使準則函數取極值的最好分類結果。Z.Ameur等人使用C-均值聚類方法進行云分類[7],分別從Meteosat衛星圖像的0°、45°、90°、135°4個方向獲得紋理特征,利用K-均值聚類進行圖像分割。Ameur等人則采用所謂的標準差限的適應聚類(Standard Deviation Limited Adaptive Clustering,SDLAC)算法[8],對GOES-12、MSG-SEVIRI和MODIS衛星圖像進行分類。SDLAC是在迭代過程中對標準差閾值和聚類中心的調節,當聚類中心和閾值滿足要求時,就產生新的類別。王繼光等人則是對傳統單一分類方法的改進,該方法綜合了遺傳算法(Genetic Algorithm,GA)、模糊C-均值聚類和模糊減法聚類[4]。GA最大的特點是基于全局的隨機搜索,迭代過程能避免陷入局部最優,因此和聚類方法優缺點互補。
常用的有監督云分類方法有近鄰法、最大似然估計法(Maximum Likelihood Estimate,MLE)、支持向量機(Support Vector Machines,SVM)等。Azimi-Sadjadi等人運用一種等級結構的SVM云分類方法,對GOES8衛星的紅外通道數據用SVD方法提取特征,將圖像劃分為10類[9]。整個分類系統由9個兩類SVM分類器構成,分類結構圖如圖2所示。其中對暖陸地、冷陸地和暖水域分類準確率達90%以上;對于高云如密卷云和卷層云以及低云中的層積云分類結果較為理想,整個系統的分類準確率在78.5%左右,如果更好地利用可見光信息,準確率會有所提高。

圖2 衛星云圖分類結構圖Fig.2Structure chart of cloud classification
隨著人工神經網絡技術的發展,使用神經網絡對衛星圖像云分類的研究也有不少進展。常用于云分類的神經網絡主要有BP神經網絡、概率神經網絡(Probabilistic Neural Network,PNN)和自組織映射(Self Organizing Feature Maps,SOM)網絡。
2.3.1 BP神經網絡
BP神經網絡即反饋神經網絡,一般由輸入層、隱含層和輸出層構成。輸入層輸入的是樣本特征矩陣,輸出層輸出的是樣本分類類別。網絡訓練經過兩個過程。前向傳播是信號由輸入層單元傳到隱層單元,經隱層單元逐層處理后再送到輸出層單元,由輸出層單元處理后產生一個輸出模式,這是一個逐層狀態更新的過程。若輸出與期望輸出模式有誤差且誤差不滿足要求時,誤差轉入后向傳播過程,將誤差值沿連接通路逐層傳送并修正各層連接權值。
Welch等人用BP神經網絡將AVHRR-LAC數據圖像分成10類[2]。網絡結果是20-55-55-10,其中20表示輸入的特征空間的維數。采用bootstrap方法獲得分類的整體正確率為87.6%。師春香等人介紹了利用BP神經網絡對NOAAAVHRR衛星圖像進行云分類[10]。網絡采用20-40-15-4結構的BP神經網絡,其中輸入層神經元個數是特征空間的維數,輸出層神經元個數表示看了8種類別。對大量樣本進行訓練和驗證后,分類的整體正確率有78%以上。
2.3.2 概率神經網絡(PNN)
PNN網絡也是由3層組成,其中輸入層也是輸入樣本特征空間矩陣,隱含層主要有兩個作用,一個是根據樣本構成概率密度函數p(cj|x|)估計,二是根據概率密度函數構成貝葉斯風險函數,輸出層根據貝葉斯估計準側,做出判別。
Tian等人也利用PNN網絡對GOES-8數據進行分類[3],分類整體準確率有83.4%—83.8%,但是對于中層云與底層云的分類準確率不高。Bankert等人采用PNN網絡對AVHRR數據按16×16像素的塊處理[11],將圖像劃分為10類,分別采用hold-one-out和bootstrap方法來獲得分類器理論準確率分別是79.8%和77.1%。
2.3.3 SOM網絡
SOM網絡主要算法是一種無監督的聚類方法,將任意輸入模式在輸入層映射成一維或二維離散圖形,并保持其拓撲結構不變。在競爭層對輸入模式的反復自組織學習,得到分類結果表示出來。
LIU Yu等人認為相比FY-2C目前使用的窗口聚類算法,SOM方法用于分類效果更好[12]。FY-2C現有的云分類產品是利用紅外通道的數據檢測云,使用水汽通道的亮溫梯度區分出高層云,使用32×32像素塊作為分類基本單元并使用聚類方法分類。分類結果表明,SOM方法不僅從像素級別上極大地改進分類結果,也能夠準確的將云團分類成積雨云、卷云和高層云。
云分類研究因應用目的的不同而有很大差異,對于各種分類結果的評判主要有兩種手段:一種是根據氣象專家人工評判分類結果;另一種則是根據統計的方法來計算分類的理論準確率,如交叉驗證hold-one-out[11]和bootstrap[2,11]方法。前者是通過對比專家標記過的云圖來進行評判,后者則是通過對訓練樣本采用一定的方法重采樣構成樣本子集,對形成的分類器再次進行測試,得出最優結果的分類準確率。這種方法由于不能包括所有云類型情況并且計算量大,所以存在一定誤差,因此對分類結果的評價目前仍多以人工評價為主[13-14]。由于運用不同的衛星數據、不同的特征、不同種類和數量的類型原因等,很難定量比較分類方法的優劣,但是對各種分類方法進行定性比較不僅有利于方法的改進,還有助于在遙感業務上的應用。現有的云分類研究中,有對一些分類方法進行比較的工作,得出了各方法的特點。文獻[3]是通過驗證GOES-8數據,比較了PNN和SOM這兩種神經網絡的分類方法。如圖3所示,(a)是作為分類結果的參照標準,(b)是同一場景使用PNN訓練樣本所得的分類結果,(c)是使用SOM網絡訓練得到的分類結果,文獻中指出使用PNN分類的統計正確率相對使用SOM網絡分類的正確率要高,但是SOM的網絡訓練時間相對要短很多,而且分類后的云團邊界要比使用PNN分類的云邊緣更光滑。

圖3 使用PNN和SOM分類結果圖Fig.3Classification comparison chart using PNN and SOM
綜上所述,使用衛星圖像進行云分類識別,是遙感圖像領域的熱點和難點。對衛星云圖進行分類核心問題是特征提取和選擇,以及分類器的設計。前者是影響分類結果的關鍵因素,后者是決定最終分類性能的重要環節。
現有的云分類研究,是針對某個地區或一些特定的云型設計的,由于各方法所用的衛星數據、提取和選擇的特征、涉及云的類型不同等原因,各分類器有各自的特點。而今后多種分類方法的結合、多種衛星資料的結合也是這一研究領域的發展方向。
[1]Desbois M,Seze G,Szejwach G.Automatic classification of cloudsonMETEOSATimagery[J].JournalofApplied Meteorology,1981,3(21):401-412.
[2]WelchRM,Sengupta SK,GorochAK.Polarcloud and surface classification using AVHRR imagery:an intercomparison of methods[J].Journal of Applied Meteorology,1992,5(31):405-421.
[3]Tian B,Shaikh M A,Azimi-Sadjadi M R,et al.A study of cloud classi cation with neural networks using spectral and textural features[J].IEEE transactions on neural networks,1999,1(10):138-151.
[4]王繼光,張韌,洪梅,等.衛星云圖云分類的一種綜合優化聚類方法[J].解放軍理工大學學報:自然科學版,2005,6(6):585-590.WANG Ji-guang,ZHANG Ren,HONG Mei,et al.Synthetical optimization clustering method for classifying cloud from satellite images[J].Journal of PLA University of Science and Technology:natural science edition,2005,6(6):585-590.
[5]Rashpal K,Ganju A.Cloud classification in NOAA/AVHRR imageries using spectral and textural features[J].Journal of The Indian Society of Remote Sensing,2008,36(2):167-174.
[6]Azimi-Sadjadi M R,GAO Wen-feng,Haar T V,etc.Temporal updating scheme for PNN with application to satellite cloud classification-further results[J].IEEE transactions on neural networks,2001(12):1196-1203.
[7]Ameur Z,Ameur S,Adane A,et al.Cloud classi cation using the textural features of Meteosat images[J].Remote Sensing,2004,25(4):4491-4503.
[8]Berendes T A,Mecikalski J R,MacKenzie Jr.W M,et al.Convective cloud identification and classification in daytime satellite imagery using standard deviation limited adaptive clustering[J].Journal of Geophysical Research,2008,113(20):1-9.
[9]Azimi-Sadjadi M R,Zekavat S R.Cloud Classification Using Support Vector Machines[C]//Geosicience and Remote Sensing Symposium,USA:IEEE,2000(2):669-671.
[10]師春香,瞿建華.用神經網絡方法對NOAA-AVHRR資料進行云客觀分類[J].氣象學報,2002,60(2):250-255.SHI Chun-xiang,QU Jian-hua.Cloud classification for NOAA-AVHRR data by using a neural network[J].Acta Meteorologica Sinica,2002,60(2):250-255.
[11]Bankert R L.Cloud classification of AVHRR imagery in maritime regions using a probabilistic neural network[J].Journal of Applied Meteorology,1994,33(8):909-918.
[12]LIU Yu,XIA Jun,SHI Chun-xiang,et al.An improved cloudclassificationalgorithmforchinaFY-2Cmultichannel images using artificial neural network[J].Sensors,2009,9(7):5558-5579.
[13]Berendes T A,Kuo K S,Logar A M,et al.A comparison of paired histogram,maximum likelihood,class elimination,and neural network approaches for daylight global cloud classificationusingAVHRR imagery[J].Journal of Geophysical Research,1999,104(6):6199-6213.
[14]師春香,吳蓉璋,項續康.多閾值和神經網絡衛星云圖云系自動分割試驗[J].應用氣象學報,2001,12(1):70-78.SHI Chun-xiang,WU Rong-zhang,XIANG Xu-kang.Automatic segmentation of satellite image using hierarchical threshold and beural network[J].Quarterly Journal of Applied Meteorology,2001,12(1):70-78.