劉蓉國
摘要:地理國情監測是一種通過多項技術手段來向社會、政府等方面提供地理國情信息的任務總稱。隨著大數據時代的到來,地理國情監測作為我國地理信息事業發展的重要方向也被提出了新的挑戰。該文主要分析了基于當今大數據環境下,地理國情監測的數據來源以及地理國情監測的分析方法,并針對地理國情監測的數據挖掘與處理方式進行了探究。
關鍵詞:地理國情監測;大數據;數據挖掘
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2018)03-0020-02
地理國情監測是我國于2010年底提出的一項重要地理監測任務,其主要目的是為了使我國國情更加可視化、空間化,并經過這些年的發展,逐漸成為了我國一項戰略工程。目前,地理國情監測已經為我國的經濟、社會發展提供了大量的可靠依據。而伴隨著我國大數據時代逐步降臨,地理國情監測在這種新時期下也被提出了新的技術要求,因此,基于當今大數據環境下,對我國地理國情監測任務的現狀進行分析使其效益得到有效提升就成了當下的重要課題。
1 地理國情監測大數據來源
根據目前我國的技術水平,地理國情監測大數據來源主要包括三種類型,從低至高依次是基礎地理信息數據、地理國情監測時空數據以及地理國情實時監測數據。這三種數據介紹如下:
1) 基礎地理信息數據。這種數據是基底數據,是地理國情監測的基礎數據,是由我國的各個級別測繪地理信息部門通過長時間基礎測繪業務的開展與積累最終得出的成果,具有較強的現實意義,一方面符合我國對于地理國情監測數據的技術要求,另一方面是形成一個較完備的基礎地理信息數據庫。現今我國的國家基礎地理信息數據庫正作為地理國情監測的基底數據庫為地理國情監測貢獻著大量數據信息,而在省級單位中,其監測的基底數據庫則是以同級別的基礎地理信息數據庫為主體構成的。在不同的省級單位中,省級地理信息數據庫的構成也有所不同。
2) 地理國情監測時空數據。在地理國情檢測中,地理國情監測時空數據主要針對的是不同時間在同一地理空間中,各項地理信息之間進行比對,進而得出的變化監測結果。地理國情監測時空數據的監測方法大致有三種,分別是遙感影像變化監測圖斑、地形變化數據以及屬性變化數據。這三種數據監測方法分別針對地理環境的不同情況,并在各自擅長的領域中為地理國情監測做貢獻。
3) 地理國情實時監測數據。地理國情實時監測數據的檢測方法一般可以根據傳感器類型、監測時效性以及監測范圍大小進行分類。而目前我國一般根據傳感器類型將地理國情實時監測數據方法分為實時監測數據、準實時監測數據與實時監測數據三種。
2 地理國情監測大數據空間分析和挖掘
地理國情監測大數據空間分析。目前我國的地理國情監測現狀使數據具有來源較廣、數量較大等特點。因此,在進行地理國情監測數據分析和挖掘過程中,應當將基礎地理信息數據庫作為基礎,并結合一些地理信息數據收集手段摳門西歐美國老婆蠻好看哦按統計分析,進而對我國的水域環境、陸域環境以及海岸線等數據進行統計與變化檢測分析。地理國情監測大數據空間分析主要包括地理國情監測數據基本空間分析、地理國情監測地表覆蓋及地理單元空間分布分析以及地理國情監測數據相關性分析三方面。
地理國情監測大數據挖掘。目前我國地理國情監測技術已經有了較大的進步,并且隨著這種技術的發展,我國地理國情監測大數據已經具有了越來越強的空間特征、屬性特征與時效特征,因此,在我國的地理國情監測大數據挖掘過程中,可以將專業數據庫與空間數據挖掘結合起來,借此從其中挖掘出更加具有規律性的時空信息,并以此作為我國重大地理國情決策的基礎與輔助。
目前地理國情大數據挖掘的方式一般分為三種:
地理國情聚類挖掘:這種挖掘方式的對象是指與我國國情相關的地理要素以及一些社會經濟要素,將這些要素數據收集起來進行空間聚類分析,并通過分析進而挖掘出空間聚類模式。一般需要先對我國地理國情要素數據與社會經濟要素進行收集并整理,然后選擇合適的空間聚類挖掘算法,并設置好空間聚類參數,再開始進行空間聚類挖掘,最后將挖掘的結果進行表達,也就是將挖掘結果進行可視化展示。
地理國情空間關聯規則挖掘:這種挖掘方法主要研究對象是地理國情空間以及演化模式,因而在我國的地理國情監測過程中,可以根據研究對象的選擇,利用空間關聯規則對地理國情變量的空間關系進行定量描述,然后將空間關聯模型進行建模分析,進而得出地理國情空間以及演化過程。目前地理國情空間關聯規則挖掘的方式一般有三種,分別是基于空間事物的挖掘方法、基于聚類的圖層覆蓋法以及無空間事物的挖掘方法。
地理國情空間離群點挖掘:這種挖掘方法的主要目的是為了挖掘出國家與地理國情相關的要素與社會經濟要素這二者在發展中存在的異化現象,過程一般為先對地理國情空間要素數據以及社會經濟要素進行收集與整理,然后選擇適用的空間離群點挖掘算法,對空間離群點的挖掘參數進行設置,并將挖掘結果進行表達,并利用可視化的展示方式展現出來。
由此可以看出地理國情空間離群點挖掘與地理國情聚類挖掘存在一定的共通之處,這二者均需要對地理國情空間要素與社會經濟要素進行收集并整理,但總的來說,二者的數據挖掘與分析過程和目的均有所不同,因此還是應當注意區分。
3 大數據環境下,地理國情監測面臨的新挑戰
高效存儲需求。隨著我國地理國情監測數據的數量越來越大,大數據環境下,我國地理國情監測數據需要更加高效的存儲效率。而隨著我國計算機事業的發展,存儲設備的成本正在逐漸降低,因此,海量的地理國情監測數據存儲已經不再是一個亟待解決的問題。但由于我國地理國情監測的發展速度正在不斷提升,由此導致我國對于地理國情監測數據的收集、整理與儲存提出了更高的要求——高效存儲。高效存儲也是目前我國地理國情監測數據挖掘與分析過程中面臨的最重要的問題之一,它對我國地理國情監測數據存儲提出了更高的要求,同時也對地理國情監測數據信息的共享、數據的安全、重復數據解決等問題提出了新的要求。
大數據環境下的數據處理。由于我國的地理國情監測數據信息越來越多,并且這些信息正在通過不同的挖掘與分析方法最后匯總在一起,因此,原有的數據分析處理方式已經越來越難應對這種巨量數據。針對一些少量的數據進行整理時,我們還可以采用人工整理的方式,但針對目前大數據環境下海量的地理國情監測數據信息,我們就需要存儲更多的原始非結構化數據,或是通過一些來源有所不同的非同一結構數據進行數據庫構建,這就要求當下的數據庫應當需要能對更多類型以及非結構化的數據有良好的支撐作用。
易于擴展。地理國情監測大數據的匯聚已經成為了我國地理信息數據收集上面對的一項新情況,針對這種新情況,我們應當選擇更加適合的方式對現有數據庫進行改造,例如硬件擴展、數據非規范化改造以及數據庫分割等,使我國地理國情監測數據庫具有更加良好的擴展性。
4 總結
綜上所述,大數據環境下,我國地理國情監測已經被提出了更高的技術要求,因此,我們應當針對我國的國情設計出更多的符合我國地理國情數據信息收集、挖掘與整理的方法,并將這些方法應用到我國的地理國情監測中去,達成促進國家地理國情監測發展的目的,并通過地理國情監測的發展,帶動我國社會經濟發展,使我國實現地理信息相關產業的跨越式發展。
參考文獻:
[1] 張繼賢,顧海燕,魯學軍,等. 地理國情大數據研究框架[J].遙感學報,2016,20(05):1017-1026.
[2] 李德仁,丁霖,邵振峰.關于地理國情監測若干問題的思考[J].武漢大學學報:信息科學版,2016,41(02):143-147.
[3] 馬萬鐘,杜清運.地理國情監測的體系框架研究[J].國土資源科技管理,2011,28(6):104-111.