王華 楊乾鵬
【摘 要】隨著模式識別和氣象探測技術的發展,模式識別在氣象探測和氣象信息數據處理中應用較為廣泛。本文主要總結了在氣象領域內應用的一些方法,包括在基于聚類算法的雷電數據應用、神經網絡系統在暴雨預報中的應用以及基于多普勒天氣雷達探測資料中低空急流、龍卷、下擊暴流和陣風鋒四種天氣現象的分類識別。
【關鍵詞】模式識別;氣象探測;聚類;神經網絡
模式識別是20世紀60年代初迅速發展起來的一門科學,經過幾十年的研究,取的了豐碩的成果,已經形成了一個比較完善的理論體系,主要包括統計模式識別、結構模式識別、模糊模式識別、神經網絡模式識別和分類器融合等研究內容。模式識別系統由信息獲取、預處理、特征提取和選擇、分類判決等4個部分組成。模式識別主要是應用在其它學科,尤其是在一些文本分類、語音識別、圖像識別、視頻識別,在本文主要是介紹模式識別在氣象探測和氣象信息處理中的應用,從而提高天氣的預報預測能力和氣象資料的分析處理能力。
一、基于聚類算法的雷電數據的應用
(一)研究雷電的背景和意義
本文分析了一種新的雷電數據應用方法。在這個方法中將會運用一種聚類算法——K-MEANS算法。氣象觀測活動中獲得的雷電數據通過該方法進行聚類分析,得出理想的雷暴體聚類中心,這些聚類中心是最佳的雷暴體參數信息的反應。通過對這一聚類結果的研究與分析,可以掌握雷暴活動中雷暴單體的生命演變過程,并可以預測雷暴的發展動向。
(二)雷電數據應用的現狀
雷電與災害性天氣(如龍卷、冰雹、超級單體和大風)的關系非常密切,這方面已經有許多研究。觀測數據表明,云地閃的總數、閃電總數以及這些因素的綜合指數與災害性天氣有最直接的關系。天氣預報人員可以使用云地閃電數據進行大范圍天氣監測和對流天氣短時預報。因為閃電演變特征能較好地指示對流的存在、產生、移動、消散、結構、范圍、強度和再發展等重要信息。雷電資料對雷達低仰角探測被地物遮擋的地區和國家邊界周圍以及沿海地區的作用尤為突出。對于因山地和大面積水域產生的局地強對流天氣,雷電數據對其演變的監測和識別也具有重要意義。研究表明,一定情形下的云地閃與洪水、冰雹、暴雨、龍卷以及微暴流是密切關聯的。但這種關聯需要對不同的地區和不同的季節分別進行研究分析。這一課題的廣泛研究必須建立在對雷電網絡數據進一步分析的基礎上。
雷電探測網可以24小時連續監測閃電的活動,跟其它探測設備相比,雷電探測系統還具有以下特點:
(1)雷電數據能夠有效地在大面積的雨區內區分出發展中的對流云。
(2)當衛星云圖、氣象雷達或其它氣象資料缺乏時,雷電數據可作補充。
(3)實時的閃電數據可在數秒內報告雷暴的監測結果,這是雷達和衛星所不能企及的。
(4)雷電數據可以瞬間刷新,以幫助識別強對流天氣的區域和發展趨勢。
2.3 K-均值法聚類和實現處理的大概步驟
1967年,MacQueen首次提出了K均值聚類算法(K-means算法)。迄今為止,很多聚類任務都選擇該經典算法。該算法的核心思想是找出K個聚類中心 ,使得每一個數據點和與其最近的聚類中心的平方距離和被最小化(該平方距離和被稱為偏差 D)。
K均值(K-means)聚類算法(對n個樣本進行聚類)
(1)[初始化]:隨機指定K個聚類中心();
(2)[分配]:對每一個樣本,找到離它最近的聚類中心,并將其分配到所標明類;
(3)[修正]:將每一個移動到其標明的類的中心;
(4)[計算偏差]: ; (2-1)
(5)[D判斷收斂]:如果D值收斂,則return()并終止本算法;否則,返回步驟(2)。
K-means 算法的優點與不足。優點:能對大型數據集進行高效分類,其計算復雜性為 O(tKmn),其中,t為迭代次數,K為聚類數,m為特征屬性數,n為待分類的對象數,通常,K,m,t< 實現的大概步驟: 輸入:聚類個數k,包含n個數據對象的數據集。 輸出:k個聚類。 (1)從n個數據中任意選擇k個數據作為初始的聚類中心。 (2)計算每個數據點到聚類中心的距離,把數據點歸類到最近的聚類中心的簇。 (3)所有數據點分配完成后,再計算其聚類新的中心。 (4)將新的中心和前一次的聚類中心作比較,如果有變化則轉到步驟2,否則,轉到步驟5。 (5)輸出聚類結果。 二、神經網絡系統在暴雨預報中的應用 (一)研究暴雨的背景和意義 暴雨是我國夏季常見的一種影響嚴重的災害性天氣。某一地區連降暴雨或出現大暴雨、特大暴雨,常導致山洪爆發,水庫垮壩,江河橫溢,房屋被沖塌,農田被淹沒,交通和電訊中斷,會給國民經濟和人民的生命財產帶來嚴重危害。暴雨尤其是大范圍持續性暴雨和集中的特大暴雨,不僅影響工農業生產,而且可能危害人民的生命,造成嚴重的經濟損失。暴雨的研究和預報,對提高防災減災能力有著重大的意義。 (二)神經網絡技術在暴雨中的應用 神經元網絡原理模擬人腦的學習、記憶、思維、推理機能,主要是利用其網絡模擬預報員從大尺度環境場中捕捉暴雨信息的能力。神經網絡專家系統與傳統規則型專家系統亦不相同,傳統型專家系統的規則基于預報員長期的工作經驗,規則之間要滿足嚴格的合諧性和完備性條件才能保證推理的正確性,而這兩點實際是很難達到的。神經元網絡專家系統利用人工神經元來模擬大腦的記憶和思維能力,用網絡權系矩陣隱式地表示知識,通過隱單元和節點作用函數實現非線性。通過訓練獲取知識,利用網絡對初值的響應實現推理功能。 大概步驟:依據在一段時間內暴雨的資料,將分布在一定區域的暴雨資料按照經緯度網格化,組成神經元網絡待選的感應神經元輸入神經元。利用具有一層隱結點的BP網絡,設定隱單元的數目為輸入神經元數據量的一半,目的是使網絡具有良好的性能,通過BP網絡建立模式資料與發生暴雨發生所在地的站點降水資料的映射關系,通過網絡的學習功能,確定網絡權系矩陣,由此對大到暴雨以上的降水進行預報。 三、總結 本文簡單的從基于聚類算法的雷電數據應用;神經網絡系統在暴雨預報中的應用;上述方法參考了大量前輩的資料,這里只是一些總結及設想,有一些簡單的嘗試,還沒有大范圍的應用。目前模式識別技術在氣象領域的應用較為廣泛,隨著模式識別技術的快速發展,將模式識別技術應用到其中將會推動氣象技術的更加快速發展,會更充分利用好氣象資料,提高識別精度和處理效率。 參考文獻: [1] 李弼成,邵美珍,等. 模式識別原理與應用. 西安:西安電子科技大學出版社, 2008 [2] 王耀生.人工智能、模式識別在氣象領域應用的現狀與展望.北京:氣象,1987 [3] 孫吉貴,劉杰,趙連宇. 聚類算法研究. 2008 Journal of Software, Vol.19, No.1,