王穎+高云鵬+趙成磊+章程
摘 要:數據挖掘是一門新興的信息處理技術,在信息的利用和提取中發揮著重要的作用。文章在論述數據挖掘技術的基礎上,提出了數據挖掘在閃電定位資料分析中應用的可行性,并具體論述了數據挖掘在雷電預警、雷暴分析、雷災分析方面的應用。
關鍵詞:數據挖掘 閃電定位資料 雷電預警 雷暴特征 雷電災害
中圖分類號:TM863 文獻標識碼:A 文章編號:1674-098X(2017)04(c)-0145-02
Abstract:Data mining is a new information processing technology,that plays an important role in the information utilization and extraction .Under the technology of data mining ,this paper puts forward the feasibility of the application of data mining in the analysis of lightning positioning data, and discusses the application of data mining in Lightning warning and analysis of thunderstorm Characteristics and lightning disaster.
Key Words:Data mining Lightning Location Information Lightning warning Thunderstorm Characteristics Lightning disaster
閃電定位儀作為一種監測雷電發生的氣象探測儀器,可以探測閃電發生的時間、位置、強度、極性等參數。隨著閃電定位儀分布的日趨完善,收集到的閃電定位資料越來越多,采用傳統方法處理,不易對其進行深層次分析,從中提取有價值的信息,不利于防災減災管理水平的提高;同時,雖明知這些數據中蘊藏著重要信息,但由于缺乏從數據庫中提取有價值信息的方法,許多決策缺乏直觀數據的支撐,只是憑借工作經驗的總結。數據和信息之間的鴻溝要求我們必須找到對數據分析、分類、匯總的方法,在多種需求的驅動下,數據挖掘應運而生。
通過對閃電定位資料以及每年雷災分布資料的挖掘分析,可以發現隱含其中的潛在信息,提前做好防御準備,減少因雷擊而造成的人員傷亡以及財產損失。
1 數據挖掘技術及其功能介紹
數據挖掘是數據庫研究、開發和應用最活躍的分支之一,是在數據庫、人工智能、數理統計以及數據可視化等多學科基礎上發展起來的一門新興交叉學科。它利用機器學習的方法從數據庫中發現知識,揭示事件之間的關系,預測未來趨勢并為決策提供依據。
傳統的數據庫技術實現了對數據的收集和管理工作,基本滿足了數據的一致性、準確性等要求。數據挖掘是對傳統數據庫技術進行研究和開發的結果,它是從現實世界中存在的具體數據中識別出有效的、新穎的、潛在有效的以及最終可理解模式的非平常過程。它不僅能對歷史數據進行查詢,并且能夠找出歷史數據之間的潛在聯系,從數據中發現與建立模式,從而找到內在的未被發現的知識,讓數據真正成為對生產、生活有價值、有用的信息。
2 數據挖掘技術在閃電定位資料分析中的應用
2.1 數據挖掘技術應用的必要性
目前,閃電定位儀監測到的雷電信息數據量很大,一個雷暴過程就有上千條甚至上萬條的數據,根據這些海量數據獲得有效數據項之間的關聯規則和隱藏信息,對提升防災減災管理水平和優化業務運作提供了重要的科學支撐。可見采用數據挖掘技術來研究閃電定位儀記錄的實時數據, 揭示其中蘊藏的深層次信息,必將獲得良好的經濟效益和社會效益。
2.2 在雷電預警決策方面的應用
隨著信息化技術的發展,雷電災害對社會生產、生活造成的損害日益凸顯,提前做好防御工作可極大的減輕災害損失,雷電預警工作的重要性不言而喻。通過對閃電監測數據(如經緯度、強度、陡度、時間)進行處理,結合雷雨云的運動趨勢,建立模型,預測未來閃電發生的方位,及時向用戶發布雷電預警信息。預測方式的數據挖掘在研究雷電預警中具有重要的實用價值。
2.3 在雷暴特征分析方面的應用
雷暴特征分析主要研究雷電活動的時空分布規律。在數據挖掘技術的各項功能中,采用關聯分析,在海量閃電定位資料中,以小范圍(例如2平方公里)為取值域,尋找經緯度數據的相似值,對出現概率較高值,建立其關聯規則,分析高雷暴區域與其周圍地理、地質、土壤、水文等因素的隱性關聯;采用聚類方式,將每個取值域作為一個類,數據相似的為同一類,數據相異的為不同類,建立數據的分布模式圖,尋找不同域雷暴屬性的相互關系;采用時序模式,搜索出重復出現概率較高的域,可以實時判斷雷暴的未來運動趨勢,也可以用于研究雷暴發生域的日變化、月變化、年變化的特征,為防災減災的決策提供資料。
2.4 在雷電災害分析方面的應用
據目前不完全統計, 我國平均每年因雷電災害造成的人員傷亡近千人,財產損失上百億元。閃電定位資料為雷電災害分析提供了包括雷電災害發生的時間、位置、強度、極性等資料,采用關聯分析法,根據記錄到的閃電發生的時間、經緯度是否與災害發生地位置吻合,并結合現場的損失特征,直接判斷是否因雷擊遭受損害,或者根據閃電定位資料、雷電流的特征以及發生地的環境特征,判斷該地遭受雷擊的概率,并結合其他調查手段,分析雷災成因。
此外,數據挖掘技術對區域時間內的雷電災害歷史分析有著重要的意義,結合使用關聯分析以及聚類的方法,剔除偏差數據,尋找雷暴、雷災、地理環境之間的聯系,并且針對有防雷裝置的建筑,分析其受災原因,有助于雷電災害風險區劃的研究。
3 結語
數據挖掘在雷電預警、雷暴特征分析、雷災分析方面具有重要的應用價值,采用先進的數據處理技術,分析閃電定位資料,可為雷電防災減災的管理以及決策提供科學數據。目前,數據挖掘在雷電防災減災的應用還處于初級階段,隨著計算機技術的發展,數據挖掘技術勢必在今后的防災減災發展中發揮重要作用。
參考文獻
[1] 田陽光,張世忠,白山,等.數據挖掘在環境信息管理中的應用[J].環境科學動態,2005(1):1-2.
[2] 張愛國,高鶴,王麗維.數據挖掘技術在現代農業上的應用[J].湖北農業科學,2011,50(21):4532-4533.
[3] 邱潔,過仲陽,蘇君毅,等.關聯規則及其在災害天氣預測中的應用[J].華東師范大學學報(自然科學版),2005,12(5):165-169.
[4] 劉麗娜,楊東方,趙羚云.應用在圖書館中的數據挖掘技術[J].制造業自動化,2011,30(10):4-5.
[5] 張家愛.數據挖掘技術在農業決策支持系統中的應用[J].吉林農業科技學院學報,2010,19(1):56-57.
[6] 楊世剛.我國雷電災害時空分布特征及預警[J].自然災害學報,2010,19(6):153-159.
[7] 吳孟恒,張彥勇.雷電災害調查與鑒定[J].氣象科技,2010,38(6):788-789.
[8] 程向陽,謝五三,王凱,等.雷電災害風險區劃方法研究及其在安徽省的應用[J].氣象科學,2012,32(1):80-85.