賈志明,王東峰,程 智
(中國人民解放軍93381部隊,黑龍江 五常 150223)
氣象預報學是現代基礎科學中難度最高、挑戰性最強的一門綜合性學科,作為一種預測性質的學科,氣象預報極易受到天氣系統變化、天氣因素干擾、天氣狀況作用等要素的影響,會讓天氣現象在一定程度上不按照常規演變生成,使氣象預報的不確定性進一步加大。目前,國際上已經借助先進的電子計算機高速算法和數據挖掘技術來改進天氣預報的算法模型,進而提高天氣預報的預測能力。從目前數據挖掘技術在氣象研究領域的發展來看,主要集中在兩個方面:一是包括統計分析、關聯度分析和回歸分析在內的統計學數理統計方法,二是包括數學建模、空間數據研究和氣象模式分析等在內的機器學習和軟計算方法。
數據挖掘技術主要應用于商業數據的統計領域,是一種新型的挖掘操作技術,主要是從海量、無序、隨機和無價值的數據中挖掘出對自我需求有意義、有價值和特定的知識信息,這是一個連續查找有用知識的過程。最終被查找到的數據信息一定是客戶所需要且樂于接受和易于理解的知識信息。但這些知識信息并不是在任何范圍內都被需要,只是在特定的場合被需要的用戶所利用。
一個數據的挖掘項目會有一個數據信息被挖掘的過程,而這個過程主要由六個環節組成。第一。需求提供。對一個數據挖掘的項目而言,要從業務的角度去理解客戶的需求,同時將數據挖掘的技術問題轉化為一個有具體特征的知識信息,進而完成項目目標的初步計劃。第二,采集分析數據。采集數據主要體現在對數據信息的理解方面,通過處理和識別等手段對采集到的數據質量進行評估和分析能夠了解采集到的數據的各種屬性。第三,數據預處理。在采集分析完數據后應進行數據預處理,對無用數據進行清理,記錄及歸納客戶所感興趣的數據。第四,建模。在這一階段應選擇應用各種模型技術對數據進行重新整理和分配,使之成為相應技術所需要的數據格式。第五,模型評估。對建立的模型要用科學的方法進行評估,以確保建造模型的可行性,進而完成數據挖掘的最終目標。第六,實施。建造完模型后需要繼續發揮模型清理數據的作用,找到有用的知識信息,滿足客戶的連續需求,及時提供報告以供操作人員及客戶使用。
基于問題預測理論有兩種表現形式,一個是分類,另一個是數值預測。預測分類能夠識別出描述內容中所確定的數據類別,然后檢索出客戶所需要的數據集合。預測分類是一個可以監控連續不斷數據內容的過程,可以用連續的數據集合來區分和識別出有描述意義的數據信息。
聚類分析就是通過物理和數據集合的形式對研究對象進行細致分組,然后針對這些分組信息進行類似與相似性分析。聚類分析主要是通過相似性原則查找出想要的和有價值的數據信息,然后將其進行區分和提取。聚類分析可以把與目標數據相關的類別數據全部提取出來,所以被廣泛應用在氣象、統計、醫學、營銷、心理學等領域。
遺傳計算法是一種全新的搜索算法,主要按照生物遺傳的方式進行計算。遺傳計算法被廣泛應用在氣象預報之中,能有效提升預報的準確率,并得到相關的集成性結果。但這種算法也有一定缺陷,就是搜索數據信息的能力不強,只能通過局部搜索的方式進行,搜索數據信息所需的時間較長。
這種方法的主要原理是對以往的數據信息進行分析研究,可以在大范圍和大領域內獲得客戶需要的數據信息資料。此方法可以對以往的天氣數據信息進行有效分析,能夠達到精準預測氣象變化的要求,提升了氣象預報的準確度。此方法也有缺點,在面對眾多候選集時,可能發生數據庫重復掃描的問題,如果解決不好這個問題,在氣象預報中就無法應用這種方法,也就預測不到相對準確的氣象信息。
向量機方法具有精確度高、運行速度快等實際特點,對較小規模的數據信息處理具有一定優勢。對于復雜氣象條件下的氣象預報工作,通過這種方法能獲得更多準確度較高的數據信息,所以向量機方法被廣泛在氣象預報工作中應用。但向量機方法也存在一些缺陷和不足,在處理數據規模較大和種類較多的問題過程中,其處理速度和反映能力變差,無法在全領域應用。
在數據挖掘時,要利用數據信息庫對原始數據信息進行分類和整理,可以用數據庫技術來實現數據集合的目標。數據信息庫主要從事務型數據庫中采集數據,并用采集到的數據信息形成數據集合。在氣象預報中,世界各地的氣象信息數據是完全共享的,通過這個龐大的數據信息資源可以獲得世界上任何一個地方的天氣預報數據,能夠為氣象預報的預測提供氣象服務資料依據。數據信息庫可以為各個氣象預報平臺提供原始的天氣數據資料,也可在氣象預報的分析決策中為客戶提供綜合分析的變量和結果,更能為氣象預報員提供具體的氣象信息數據分析方法,使氣象預報員在天氣預報分析中的操作更為簡單和快捷,能夠充分滿足客戶在氣象信息資料和氣象預報信息分析方法上的需要。
在氣象預報分析過程中,氣象預報的準確程度并不能保證百分百有效,其預測結果具有不可測屬性。要想提高氣象預報的準確度,就必須選用適當的氣象預報分析模型。氣象決策服務模型的建立大多具有技術標準高、時空變化快捷和決策提供科學等特點。氣象決策服務過程主要包括:第一,問題的提出。了解區域內的天氣變化規律,實現氣象保障的需求目標。第二,數據預處理。對大數據信息進行區分和加工,檢驗數據信息的完整性和信息度,用科學方法進行評估預測,并將數據信息處理結果用客戶能夠快速理解掌握的方式進行呈現,以便解讀。同時,在數據挖掘過程中要不斷對數據信息進行優化處理,以滿足客戶對時空氣象變化的要求。