黃英
(湖南省城鄉建設勘測院 湖南衡陽 421000 湖南省地質礦產勘查開發局417隊 湖南衡陽 421000)
大數據為地理信息行業發展帶來了新的機遇。伴隨大數據技術的發展,地理信息采用的各種新技術也在不斷涌現。大數據表現出體量大、變化速度快、模態多樣、真偽難辨等特征,但背后隱藏的價值巨大。從目前的實際角度來說,大數據時代下的地理信息系統的應用研究已經成為了當代地理學術方面重要的研究應用,人們最關心的是如何從大數據中挖掘出巨大的自身能夠受惠的價值。
大數據又稱為Big Data或稱巨量資料,最早源于美國科學家的研究理論,后來在全世界大范圍盛行是由于麥肯錫研究院發表的研究報告,指的是所涉及的數據量規模龐大到無法通過目前主流軟件工具,在可以容忍的時間內對其進行抓取、管理、處理的數據集合。它的數據規模和轉輸速度要求都很高,一般單個數據集在10TB左右,其結構不適合原本的數據庫系統。大數據同過去的海量數據有所區別,其基本特征可以用4個V來總結:Volume、Variety、Value和Velocity即數據規模大、種類繁多、價值密度低、處理速度快。①數據規模大,數據量從TB級別躍升到PB級別。②數據類型繁多,現在的數據不僅是文本形式,更多的是視頻、音頻、圖片、地理位置信息多類型的數據。③價值密度低,價值密度高低與數據總量成反比。以網絡視頻為例,1小時的視頻,可能其中只有一分鐘甚至幾秒鐘的數據有價值。④處理速度快,數據處理遵循“1秒定律”,可以從各類型數據中快速獲得高價值信息,這是大數據區分于傳統數據挖掘最顯著的特征。
在目前社會經濟、科技不斷的發展的大環境下,大數據時代已經悄然到來,從某種意義上來說,地理信息的測繪部門和相應的技術在某方面來說受到了重大的影響和挑戰,如果我們可以合理的對大數據技術進行應用,那么就可以起到一個推進器的作用,推動地理測繪信息部門和機構的發展,但同時,我們要注意一點,從目前階段我國的測繪地理信息機構已經開始重視大數據技術,逐步的研究推廣把大數據技術運用到地理信息系統的數據的獲取、管理與更新上。逐步的探索,如果地理信息系統部門和機構可以在工作中加入大數據系統,那么大數據會讓地理信息部門和機構的工作變得更加便捷。大數據技術讓地理信息行業發生了天翻地覆的變化:①許多專家和學者都希望在大數據技術的環境下對地理信息系統大展拳腳;②大數據有效的促進了企業的發展和變革;③大數據時代下,他的商業價值無法估量,他的潛力無疑是巨大的,我們應該進行具體的探究和思考,完成一系列的轉型,讓技術和管理之間聯系密切,把握住商機,獲得足夠的發展空間,為地理信息行業取得良好發展做出一定程度上的探索。
(1)地理空間數據為什么一直在持續的增加?因為從目前來看,我國的地理空間數據處理在速度方面在不斷的增加,在這個不斷加快的過程中,地理空間數據的結構化特點就會凸顯出來,所以這個情況我們要及時的針對好,利用地理空間數據整體的特點,來進行大數據空間存取技術的大范圍普及和使用,經過我們反復的實踐和分析,可以得出一個結論,那就是當前地理信息系統在目前的大數據技術時代下面臨著嚴峻的挑戰,其中最大的問題是在于是否我們可以有效的實現數據信息存儲,以至我們可以完成大數據文件管理和大數據文件的保護,同時可以在面對眾多文件和重復數據的情況下,進行科學有效的整理,保證自身的效率和存儲質量。
(2)我們還有一個數據整理的問題要進行分析,眾所周知,大量的地理信息數據,地理信息數據可以用傳統的辦法進行數據收集或者別的途徑來進行信息上的獲取,但是目前傳統的組織方法和處理方法等不能適應現在的大數據結技術的走向,在這樣的背景下,我們要最大限度的提高自身的基礎性數據的收集整理效率,我們要最大程度的提升基礎性數據更新效率,從而有效的滿足用戶需求,從而逐漸在這個大時代背景下被人們所重視。
(3)大數據是一個海量數據,價值密度低。以網絡視頻為例,1h的視頻,可能其中只有一分鐘甚至幾秒鐘的數據有價值。對于不同的用戶,如何從海量數據中提取對自身有價值的數據,這是個值得深刻研討的問題。不同的用戶,它的需求不同。如何在海量數據中慧眼識珠,在哪個特定的區域,運用什么樣的方式方法提取到對自身有價值的數據,這是每個用戶所要面臨的問題,也是我們的地理信息系統人員研究方向。
(4)如何把大數據刷選出來的基礎數據加工成以圖片、視頻等用戶喜聞樂見的形式展現出來的數據,讓用戶可以直接使用,讓數據增值,這也是地理信息系統人員所要解決的問題。
(1)首先大數據在地理信息系統的應用,完美的提高了地理信息系統的高效存儲能力。隨著目前科技的飛速發展,計算機的硬件設備已經呈現出了頹勢,已經不能和以往相比了,對于計算機的存儲也已經變的更加的簡單。特別要注意的是,計算機標配硬盤的容量一般都符合原定的標準要求,單體磁盤的服務器標準容量可以達到30TB,但是在客觀世界的影響下,我們通常所說的地理信息系統經常在應急保障方面和實時導航上已經獲得了社會等廣泛的應用,所以這就要求了數據的存儲量變得越來越高,相反,如果儲存量越來越低,那么地理信息系統會受到打擊,所以這樣說來數據庫就要多個類型的數據支持和結構化的數據支持才行。
(2)在大數據的時代背景下,我們要進行數據庫的擴展和升級,因為從目前來看,大數據背景下基礎性的數據量已經發展的速度越來越快,如果不升級就導致了無法進行信息的及時更新容納。從目前來看,現階段的數據庫使用,關系類型的數據庫比較常用而且硬件的升級也是十分重要,他在一定程度上,有利于數據庫進行采分割擴展和非規范擴展等。升級硬件設備會花費大量的資金,同時,數據庫的服務器性能和容量提升的空間也很小,而數據庫分割不適合非結構化數據,我們要進行進一步的程序修改,這就導致了程序和模型的獨立性受到了破壞,然而非規范化的處理,可以增加大量冗余的同時來實現一致性的難度大幅度增加,由此可見,我們必須要爭取與理信息系統的數據庫進行水平發展,才能保證他有足夠的伸縮性和擴展性。
地理信息系統的工作是大量存取數據等任務,在我國的科技在不斷的發展和生活水平不斷提高的大前提下,我們應該對地理信息系統進行重視,眾所周知,大數據是地理信息系統中最重要的組成部分,(其內容為遙感技術、地理信息采集等)所以在大數據的前提背景下,地理信息系統的未來有著廣闊的前景,在未來的發展中地理信息系統會出現質的飛躍。
未來,數據可能成為最大的交易商品,就如同現在的基礎設施一樣,有數據的提供方、數據管理部門、監管部門,數據的交叉重復會用將大數據變成一大產業。而這種產業實現盈利的關鍵,就在于提高對數據的“加工能力”,通過“加工”實現數據的增值,基于數據交易就能產生很好的效益。到那時,得數據者則得天下!