方錫惠
(池州市國土資源規劃勘測院,安徽 池州 247000)
當前階段我國大力發展數據資源庫,人們采用先進的技術手段和方法獲得更多的數據資源,這使得數據的挖掘工作更加的高效準確。由此數據挖據這一概念應運而生,數據挖據技術是一種科學化利用的分析技術手段,以某種規律化的形式將巨大的數據資源進行分析處理,讓使用者更快速實現自己的需求。數據挖掘技術將多種學科理論知識進行了結合,相互關聯的分析了數據庫中的信息,只要通過一個關鍵詞的搜索就能夠關聯出與關鍵詞相關的一系列相關的概念,這使得相關數據的挖掘更加的快捷高效。近年來,數據挖掘技術在我國的發展的已經初見成效,并且經歷了從理論到實踐的整個過程,有效化的數據挖掘通過運用科學技術得以實現。
常見的數據挖掘方法主要有以下幾種,分類分析、回歸數據挖掘,在國土資源信息化中應用數據挖掘技術需要建立龐大的數據庫作為前提的,并且分析方法要采用專業的技術進行分析挖掘數據。在龐大的數據庫中,有非常多的隱藏重要數據概念和規律,這就需要對這些數據進行研究總結。進行國土資源信息化需要有更龐大的數據庫的支撐,將相關的國土信息領域從大型的數據庫中挖掘出來。主要的分析方法有分析模型、分析時間、分析聚類、分析關聯和分析序列。這些分析方法都是有嚴謹的科學理論知識進行指導的,總結歸納出來具體的數據挖掘情況。分類分析法是找出大量數據本身具有的共同屬性進行分類,表現形式通常可以通過結構圖和決策樹進行表現。回歸模型分析以分類分析方法為基礎,通過提供的連續預測值進行分析數據。時間序列模式是按照時間的先后順序來進行數據分類,根據生成數據的時間進行排列,通過對過去連續的數據進行科學分析,能夠更加科學的推測出未來發展的數據。聚類分析是按照固定的模式把豐富的數據進行聚類,形成科學的數據組,并且保證每組數據都是進行理論劃分的,從而幫助使用者更有效的獲取數據。
關于國土資源數據化綜合分析與決策系統(簡稱決策系統) 的主要設計內容由需求分析系統、設計系統、開發實現系統、集成與測試系統等部分組成。 每一個部分都有各自相應工作內容。
系統分析:系統的需求分析必須要將相關部門對現有資源的管理充分的考慮進去以及通過本系統的應用。在充分調研系統用戶需求的基礎上,再對系統進行需求分析。具體的系統分析主要包括以下幾個方面:l) 分析管理用戶業務;2)用戶對系統功能的需求;3) 調查與分析數據源;4) 對業務流程進行分析與建模;5) 分析系統界面。
設計系統架構和網絡結構:整個信息系統的骨架就稱作為系統架構, 系統架構決定了系統中各個邏輯組成部分,而其中的重要部分是網絡結構。設計系統架構要以系統組織的層次與組成部分的關系為基礎, 系統的架構要具備實用、靈活、可擴展性。
子系統功能的設計:系統的特點功能較多,必須深入分析各個部分的具體功能、并進行規范與分類,將功能子系統進行建立, 在各個功能子系統中融入具體功能點,才能使用戶使用起來方便快捷。
整合數據與集成設計:由于國土資源數據的特點是多源性、多格式,因此,在系統建設中整合和集成這些大數量、多樣、同時具備定量和定性特點的數據是十分重要的內容。在將數據庫的概念體系結構進行確定之后, 整合和集成數據的設計過程成為了大型數據庫構建中最難的內容。在具體設計過程中會遇到諸多的技術難點,必須將這些問題通過科學的集成方法和技術解決好。
組織數據與設計管理:國土資源數據的特點是非常復雜十分龐大數據,因此,國土資源數據倉庫的建設是非常有必要的。通過建設的流程與方法,針對國土資源數據倉庫的特點采用設計概念、設計邏輯和物理設計共同完成設計數據倉庫。
可視化分析表達設計:利用最新的可視化表達技術,針對數據七個主題中的特點,進行可視化分析和表達方式的設計,最終展現給用戶的是以文字、圖表、地圖、報表等多種形式的內容,從而更好的為管理決策部門提供科學的決策功能。
通過系統分析國土資源數據,從整體上對國土資源的有效性及數據挖掘的程度進行把握,從總體角度出發進行系統需求分析,通過對數據進行不同流程設計以及綜合歸納將系統設計出來。由于國土資源系統的數據比較龐大,就需要將子系統建立起來,將數據的分類進行細化,從而更有效的利用數據系統。國土資源數據需要進行綜合性的整合分析,在分析有規律數據的基礎上,才能將數據資源從綜合形態上利用好,將有效資源挖掘出來,進而建立綜合性強的國土資源信息化系統。要從不同的應用形式進行綜合分析,提供的系統要有每一種形式對應的數據,才能將國土資源信息化有效發展起來。
綜上所述,歷經了數十年數據挖掘技術的發展,主要技術涉及到數據、人工智能、決策樹、統計分析等,在大型數據倉庫和OLAP 系統中已經集成了這些技術。未來還要繼續在國土資源信息化中應用數據倉庫和數據挖掘技術, 這樣才能更加深入的推進國土資源信息化發展。