文 | 郝伊一 唐偉 周勇 王喆
1.中國氣象局氣象干部培訓學院 2.中國氣象局發展研究中心
衛星在氣象預報、生態監測、水利資源及開發等方面的應用非常廣泛。衛星資料有圖像資料(衛星云圖)和探測資料(定量數字資料)兩大類。以衛星云圖為例,它是由氣象衛星(或個別陸地衛星)自上而下觀測到的云層覆蓋和地表面特征的圖像,利用衛星云圖可以彌補常規探測資料的不足,為天氣分析和天氣預報提供依據,對提高預報準確率起了重要作用。對于衛星資料的處理,傳統以閾值法、聚類法為主,21世紀以來由于人工智能的迅速發展,基于機器學習的方法陸續被提出。
機器學習是指通過計算機學習數據中的內在規律性信息,獲得新的經驗和知識,以提高計算機的智能性,使計算機能夠像人那樣去決策[1]。作為人工智能的技術基礎,與傳統的統計方法相比,機器學習不僅擁有通過算法對計算機數據進行快速處理的能力,還擁有統計模型所具有的對問題進行預測、分類的能力[2],并且準確率較傳統方法有明顯提高。在當前的“大數據”時代,機器學習在海量的衛星資料中有著巨大的應用潛力。本文簡要梳理了國內外機器學習算法在衛星資料的云識別、降水估計等相關領域的主要應用情況。
利用氣象衛星云圖進行云的檢測和分類是基于“在衛星觀測視角內,地表和云有不同的特征”這一假設的基礎上進行的,云檢測和云分類是氣象衛星云圖最基本也是最重要的研究內容之一。
云檢測是利用云和晴空像元在不同光譜段上輻射特性的不同,采用多通道輻射信息,將衛星觀測像元分為有云像元和晴空像元。已有研究利用神經網絡、支持向量機、遷移學習、卷積神經網絡等方法,成功地對衛星圖像進行云檢測。師春香等人采用多閾值和人工神經網絡相結合的方法,對日本靜止氣象衛星GMS紅外云圖進行自動分割,輸出分割出的每一個云區,同時還包括云區的邊界鏈碼、起始點、周長、面積,并保留了原始圖像數據,結果顯示云檢測正確率達到90%以上[3]。宋小寧等人利用一種基于空間結構分析和神經網絡的云自動檢測算法,對美國極軌氣象衛星Terra和Aqua上搭載的中分辨率成像光譜儀(MODIS)圖像進行了云檢測研究,研究表明利用MODIS圖像可成功地檢測云點像元[4]。胡根生等人提出一種云量自動評估和加權支持向量機相結合的云檢測算法對美國陸地衛星(Landsat)圖像進行云檢測。結果表明,該方法既具有云量自動評估算法的云檢測優勢,還對云量自動評估算法難以識別的半透明云有較好的檢測效果。[5]胡凱等人利用遷移學習中的多源加權(Tradaboost)算法(內部采用極限學習機作為分類器)對我國環境與災害監測預報小衛星星座(HJ-1A/B)的衛星圖像進行云的檢測,利用多人(多源)標注的大量厚云的樣本構成多源輔助樣本集,利用少量標注的薄云樣本構成目標樣本集。結果表明遷移學習可以充分利用容易獲得的大樣本厚云輔助樣本知識,對同類型有關聯的小樣本薄云分類器進行識別提高。[6]夏旻等人利用卷積神經網絡方法,針對HJ-1A/B衛星圖像進行云的檢測,并利用空間相關法計算總云量,結果表明,通過對卷積網絡結構及參數的優化,卷積神經網絡可以很好地提取云圖的特征,云分類時厚云和薄云之間的過渡區域清晰,云的識別率以及云量計算的準確率都比傳統閾值法、動態閾值法以及極限學習機模型的結果要好。[7]
云分類是利用可見光和紅外通道觀測數據對云進行分類,從宏觀角度一般可將云分為:積雨云、厚卷云、薄卷云、雨層云、中云、低云和層云(霧);根據云頂特性,可以從云的相態將云分為冰云、水云和混合相態云。已有研究利用神經網絡、遺傳算法、支持向量機方法,成功地對衛星圖像進行云分類。白慧卿識別了日本靜止氣象衛星GMS云圖中的四類云系,并與傳統的統計識別方法進行了對比,結果表明神經網絡方法更適合于云系的特征識別。[8]洪梅等人提出一種結合了遺傳算法全局尋優、模糊C均值聚類算法局部尋優、模糊減法聚類算法客觀估算聚類數三種方法的綜合方法(FSC-GA-FCM),對GMS-5衛星云圖進行云分類判別。試驗結果表明,綜合方法的云分類效果明顯優于單一的模糊C均值聚類算法和遺傳算法,可運用于實況云圖的云分類客觀、自動判別。[9]黃兵等人建立了自組織神經網絡(SOFM)和概率神經網絡(PNN)的綜合云分類器優化方法,對GMS-5衛星云圖多光譜云類樣本進行云分類,試驗結果表明,該方法可有效提高云類判別效果,分類結果的總正確率達到92.4%,Kappa系數為90.82,明顯優于單一的統計分類器判別效果。[10]張振華等人采用兩層嵌套的BP人工神經網絡模型,基于我國靜止氣象衛星風云二號C星(FY-2C)可見光和紅外、水汽亮溫資料進行云分類研究,結果表明,嵌套模型的分類結果比傳統模型的分類結果更合理,特別是在中低云和薄卷云的云量和位置分辨能力上有了較大提高。[11]Lee Y等人應用多參數支持向量機方法全局優化分類(MSVM)來模擬MODIS數據進行云的分類,取得很好的分類效果。[12]嚴衛等人構建了聯合美國云-氣溶膠激光雷達和紅外探路者衛星(CALIPSO)和云探測衛星(CloudSat)資料的云相態識別模型,并和溫度閾值法進行比較,結果表明支持向量機云相態識別技術具有較高的識別精度,能夠更為準確地反演云相態的垂直分布信息。[13]
氣象衛星的降水估計(降水分類)是指根據天氣學云的知識,利用云圖識別原理來估計一些天氣系統的降水分布(或是識別出產生降水的主要云類),具有重要的應用價值。[14]已有研究人員利用人工神經網絡、支持向量機、隨機森林等方法,成功地利用衛星資料進行降水估計。
利用日本GMS衛星紅外圖像和地面資料估計降雨率,Kou-Lin Hsu等人提出一種基于自適應人工神經網絡的降水估計算法,結果顯著提高了對不同地理區域、不同時間降水特征的估計性能。[15]熊秋芬等人采用人工神經網絡方法對GMS衛星多通道資料進行地面降水估計,結果表明,該方法提供的客觀定量的降水量估算平均相關系數為0.57,較使用單通道紅外云圖資料和簡單閾值和函數方法更佳。[16]夏雙等人基于三層前向型反向傳播神經網絡的衛星降水估算模型,利用我國FY-2C數據對藏北高原進行了降水估計研究。結果表明,人工神經網絡能較好地刻畫該地域衛星降水特征的非線性規律,三層前向型反向傳播神經網絡衛星降水估算模型的估算結果與雨量計實測值間的相關性可以達到0.57。[17]劉建朝等人利用支持向量機方法,基于FY-2C/D資料和我國氣象部門預報業務系統Micaps 1小時雨量資料,建立預測降水與非降水的分類模型。結果表明,降水類的預測準確率在40%~60%,非降水類的預測準確率在90%以上。[18]Bellerby T等人結合美國靜止氣象衛星GOES衛星圖像和熱帶降雨測量任務衛星(TRMM)降水雷達數據,生成巴西某地區0.12°的空間分辨率、半小時的降水估計,將相應的降水雷達觀測值與四波段GOES圖像數據進行匹配,形成人工神經網絡訓練數據集,將多個GOES像素的統計信息與每次降水觀測進行匹配,將云紋理和變化速率的信息納入到估計過程中。結果表明降水雷達和GOES數據的組合可以用來生成大尺度長時間序列的高時空分辨率降水估計。[19]Grimes D I F等人將歐洲靜止氣象衛星Meteosat的熱紅外圖像中獲得的冷云期(CCD)圖像與數值天氣模式分析數據一起作為人工神經網絡輸入,得到非洲地區的降水估計,結果比標準CCD方法有一定改進,特別是對較大降雨量的改進很明顯。[20]
除了云識別和降水估計以外,衛星資料在氣象資料反演、災害性天氣識別、生態監測等方面也有很多成功應用,在防災減災救災和生態文明建設中可以發揮重要作用。
氣象衛星資料反演是指將衛星探測的原始數據經一定的變換、訂正與計算, 反求出表征衛星探測對象某種特性狀態的演算過程。在地面觀測數據不足時,氣象衛星資料反演得到的均勻的、高時空分辨率的氣象要素資料具有很高的價值。胡文東等人利用BP人工神經網絡和最優擬合回歸方法,基于日本GMS-5衛星紅外資料,建立了反演大氣相對濕度場的數學模型。[21]鮑艷松等人利用人工神經網絡方法,研究了我國靜止氣象衛星風云四號的高光譜紅外載荷大氣溫度廓線反演方法。[22]涂滿紅等人研究了基于中國北斗導航衛星反射信號的支持向量機海面風速反演方法。[23]
災害性天氣識別是對人民生命財產有嚴重威脅、對工農業和交通運輸會造成重大損失的天氣進行歸類和定性。[24]利用我國極軌氣象衛星風云一號D星(FY-1D)遙感數據,劉年慶等人提出了一種基于支持向量機的大霧判別方法。[25]Lakshmanan V等人基于美國GOES衛星和多普勒天氣雷達(WSR-88D)獲得的反射率數據和云頂紅外溫度資料,研究了一種用于識別不同尺度風暴的天氣圖像的分層K均值聚類方法。[26]周康輝等人利用模糊邏輯算法,結合風云氣象衛星的紅外亮溫和地面氣象觀測、雷達等多源數據,實現了雷暴大風與非雷暴大風的有效識別和實時監測。[27]
衛星生態監測是利用衛星監測天氣、農作物生長狀況、森林病蟲害、空氣和地表水的污染情況等,其最大的優點是覆蓋面寬,可以獲得人工難以到達的高山、叢林資料。楊俊濤等人利用決策樹分類方法,基于美國靜止氣象衛星GOES數據生成了雪蓋產品,同時融合被動微波輻射計(AMSR-E)雪水當量產品進行雪蓋聯合監測。[28]梁益同等人利用神經網絡方法實現了基于美國極軌氣象衛星NOAA的森林火點自動識別。[29]樓琇林等人利用美國NOAA衛星可見光和熱紅外波段遙感數據,研究了基于人工神經網絡的赤潮監測方法。[30]Roberts D A等人基于光譜混合分析和決策樹分類方法,利用1975年至1999年期間在三個相鄰地區獲得的33個Landsat場景,描述了巴西隆多尼亞中部超過80000km土地覆蓋的時空變化。[31]彭靜等人對美國Landsat影像資料進行決策樹分類,得到土地利用/覆蓋分類圖像,來研究背景城市熱島的時空變化;[32]李建楠等人采用監督分類支持向量機方法,利用美國Landsat衛星遙感影像進行了呼和浩特地區地表覆蓋類型的識別。[33]何文莉等人基于我國環境與災害監測預報衛星HJ-1A/B數據對濕地地表類型進行識別,提取了鄱陽湖自然濕地的湖泊濕地類型變化數據。[34]
目前,我國有8顆風云氣象衛星在軌業務運行,為全球93個國家和地區提供服務,是世界氣象組織全球業務應用氣象衛星序列的重要成員。風云衛星數據逐日遞增,僅2018年的數據服務總量就達到近5PB,如何認識、理解和用好衛星數據是當前的一個重大課題。未來應加強機器學習的應用,提高風云衛星資料中云識別、降水估計、災害性天氣識別等信息提取和判別的準確性,同時在生態監測中發揮重要作用,為國家防災減災、經濟建設、生態文明建設等提供科技支撐。