薛文義
【摘 要】本文首先介紹了什么是數據和科學數據,在此基礎上解釋了一下什么是地球科學數據。緊接著,對地球科學數據共享的鑰匙——網格進行了進一步探究。然后,對數據網格與地學數據共享相關問題進行了探究。最后,對地理科學中地學數據網格技術應用的關鍵問題進行一下簡單的探究。
【關鍵詞】數據 科學數據 地球科學數據 網格 地理科學
中圖分類號:G4 文獻標識碼:A DOI:10.3969/j.issn.1672-0407.2014.04.090
隨著信息技術一日千里的迅速發展,我們的生活中出現了許多新的名詞,比如:網格、網格計算以及數據網格等等。這些新名詞,也是地學數據相關科技人員關注的新方向。下面,本文就開始對地球科學數據網格及其對地理科學的影響展開進一步分析和探究。
一、數據以及科學數據簡介
數據是一種反映的時間、地點或者事件等量的信息,表現形式多種多樣,如:數字、代碼、圖形、圖像以及表格等。而科學數據,就是指科學實驗、檢驗等所獲得的和用于技術設計、科學研究以及查證與決策等的數值??茖W數據,主要以數值數據、圖形數據、空間數據和文本數據為主,包括范圍甚廣,例如:調查和試驗工作所獲得的長期積累和整編的海量數據集、原始性基本數據以及科研工作者長年累月積累的科學數據等等。
科學數據有著以下的特點:客觀性、長效性、公益性、增值性、共享性、資源性、不對稱性、非排他性以及長期積累性等等。21世紀,是一個信息化的社會,信息資源已經成為了現在生活中競爭的重要戰略資源。作為信息的基礎——數據,逐漸向系統化、科學化以及標準化發展。目前,從某一種角度上來看,科學數據的積累和開發應用程度體現了一個國家的綜合國力。然而,我國的科學數據建設依然存在許多問題,科學數據的共享程度比較低以及開發利用水平也有待提高。
二、地球科學數據
地球科學數據,以數據中的記錄為最小單位,對地理特征和地理過程進行相關的描述,是科學數據的一種類型,主要是反映了地學過程或地理特征的時空特征和屬性。它的名稱有很多,比如:地理數據、GIS 數據、地理空間數據或地球空間數據等等。地球科學數據,有著分布式的特征,具有空間定位的特點,比如分布式地球科學數據庫。另外,地球科學數據采集有明顯的區域性,而地球科學數據的存貯、維護和更新主要是由分散的地球科學數據庫或專業部門機構共同完成的。另外,多尺度和空間拓撲也是地球數據的特征。地球科學數據,為人類認識自然和改造自然做出了極大的貢獻。
三、地球科學數據共享的鑰匙——網格
什么是網格?這就涉及到了Internet的發展史,Internet經歷了三個發展階段。第一階段,將計算機連起來,可以收發一些e-mail;第二階段,通過Internet 將網頁連起來,構成 Web 網;第三階段,Internet將所有網絡資源連起來,形成了網格。由此可知,網格,實際上是繼傳統因特網以及萬維網之后的第三代因特網的應用,是下一代 Internet的發展方向。網格是通過高速互連網絡將地理上分布、系統異構的各種高性能計算機、數據服務器以及虛擬現實系統等連接并集成起來,形成一種的高性能計算環境,這個計算環境對用戶相對來說具有一定透明性和虛擬性,是一個廣域范圍內的無縫集成和協同計算環境。網格計算,就是計算供應網,著眼于一些大型的應用項目。目前,開放源碼以及公開合作的模式是國際上的網格研究主要采取的方式。對網格技術的研究,我國起步比較晚一些,與外國相比還有不小的差距,中科院計算所、清華大學、江南計算所、國防科大等是我國網格技術研究地,而就全世界的角度來講,關于網格的研究主要是在美國和歐洲進行。
四、數據網格與地學數據共享
1.中國地學數據共享現狀。
地球科學數據,主要是針對地球形成演化、減輕自然災害以及人類生態環境及其變遷等等一些重要科學數據進行研究,對人類實際生活中合理開發資源和社會可持續發展有著重要的意義。近幾年來,隨著數據資源的積累越來越多,社會各個層面也越來越渴望能夠使用到一些有用的數據,有的需要付出巨額才能從數據擁有者獲得。另外,由于科學數據本身一些特性或者我國的一些政策的限制,有的無法使用到數據。近幾年來,中國地學數據共享上面臨著物理或技術層面上的一些障礙,科學數據十分臃腫,大多都是無用的數據垃圾??傊袊貙W數據共享現狀不容樂觀。
2.數據網格在地學數據共享中的應用。
數據網格,就是為了打破信息孤島和知識孤島的不良困境,實現信息共享。人們可以經過網格計算,從數據網格中輕松獲取所用戶各自需要的數據和數據格式,不再受那些對數據封閉或者一些苛刻的限制,實現在動態變化環境中有靈活控制的協作式信息資源共享。
3.中國地學數據資源共享網格系統建設。
美國的Globus項目,是著名的數據網格研究,該項目的研究目標主要兩個,那就是:網格技術的研究以及相應軟件的開發和標準的制定。為了建設和完善一個地學數據資源共享網格體系,我們首先要對它的結構進行了解,它的結構主要分為四個組成部分:數據網格結構層、數據網格服務層、數據網格應用工具層以及應用層。
五、地理科學中地學數據網格技術應用的關鍵探究
關于在未來的地理科學研究中,如何采用數據網格技術,我們需要面臨的有三大技術難題。第一,網絡安全性。如何保障安全性,是信息時代面臨的首要難題,我們可以借助因特網實現數據共享,但是同時也面臨著一些罪犯進行一些黑客活動,攻擊系統漏洞。因此,網絡安全性問題,一直以來是我們面臨的技術關鍵。第二,硬件和軟件的設備。由于信息全球化,而數據的使用和供給兩方都是處于一個動態的過程中,因此在未來網格技術應用過程中對服務器的響應時間、網絡的帶寬以及網格管理軟件的復雜性與靈活性及網絡上各種設備的互操作性,都有著極高和全新的要求。第三,網格使用模式。如果從現有的操作系統環境轉化為網格環境,那么就需要一個適應網格操作系統的新操作方式。
參考文獻
[1]王旻燕,臧海佳,鄧莉.NASA地球科學數據分布式數據存檔中心的數據和數據管理[A].中國氣象學會氣象通信與信息技術委員會、國家氣象信息中心.2011年中國氣象學會氣象通信與信息技術委員會暨國家氣象信息中心科技年會論文摘要[C].中國氣象學會氣象通信與信息技術委員會、國家氣象信息中心,2011:8.
[2]苗立志,李振龍,李晶,楊超偉.基于OPeNDAP的地球科學數據共享原型系統與應用[J].南京郵電大學學報(自然科學版),2012,01:84-88.
[3]杜瑞慶.深部鐵礦勘探的地球物理找礦模式研究[D].中國地質大學(北京),2013.
[4]劉威.復雜地學G-4I系統數據集成與云計算關鍵技術研究[D].吉林大學,2013.