董國平
摘 要:氣象科學數據是國家基礎信息資源的重要組成部分,不僅在國家宏觀決策、國民經濟發展、國家安全保障中發揮著不可替代的作用,而且還是支撐大氣、海洋、農業、生態等諸多領域科技創新的基礎數據資源。充分重視和共享氣象科學數據,不僅可以減少國家的重復投資,推動科學研究的進步,而且還將為業務部門提高預測與預報的準確性提供科學的方法和依據。
關鍵詞:數據集;元數據;共享
1 氣象科學數據的重要概念
氣象科學數據是指使用各種觀(探、遙)測手段直接獲取的大氣狀態和現象及其變化過程的記錄,以及由這些記錄加工所獲得的各種統計值。它是大氣科學中不可缺少的重要的數據資源,由氣象科學數據加工、分析而產生了氣象信息,如各種天氣、氣候分析、預報產品,氣象服務產品等。
氣象科學數據集是氣象資料按照一定規則組織起來的一系列數據文件和描述數據相關信息文件的集合體。數據集由數據集實體、元數據和數據集說明文檔三部分組成。氣象數據集實體是由一系列數據文件組成,是數據或圖形的集合,也是數據集的主體。元數據是關于數據與信息資源的數據,即關于數據與數據集的內容、質量、狀況和其他特性的信息。元數據為我們實現數據的實時在線、可擴展的共享管理提供了一種強有力的手段。
2 實施發布策略
依據氣象科學數據的加工形態,省級氣象科學數據分為原始數據、基礎數據、加工統計數據三種類型:
原始數據:指通過觀測、探測、遙感、試驗、實驗、調查、考察等技術手段直接獲取并且未作任何處理的原始記錄;
基礎數據:在原始數據基礎上進行質量控制和初步加工處理形成可以直接應用的數據;
加工統計數據:對基礎數據進行進一步加工處理和統計的數據。
依據氣象科學數據的公開和保密特性,省級氣象科學數據分為公開數據、國家內部數據、部門內部數據、保密數據四種類型:
公開數據:指可以向國內外提供、進行國際交換的氣象數據;
國家內部數據:指可以在國內進行發布和交換的氣象數據;
部門內部數據:指可以在氣象部門內部進行發布和交換的氣象數據;
保密數據:指涉及國家一般秘密、重要秘密或國家核心機密的氣象數據(參照國家保密規定)。
從氣象科學數據發布策略的角度,綜合氣象科學數據的特點、社會需求、安全保障、數據管理狀況等因素,對氣象科學數據的共享范圍進行等級劃分,共分為四級。
零級數據:是指基本氣象資料中的當前數據。
一級數據:是指基本氣象資料中的歷史數據。
二級數據:國家內部數據。
三級數據:限制性協議使用的氣象數據。
依據用戶對氣象科學數據使用的不同需要,氣象科學數據服務針對的用戶有:普通用戶、會員用戶、核心用戶、內部用戶、特別用戶。
2.1 普通用戶
國內外公眾通過上網,需要進行注冊,均可以成為氣象資料共享服務的普通用戶。普通用戶可在氣象資料共享網站上無償下載、瀏覽、查詢網上發布的氣象資料共享零級數據以及國內外數據資源動態,數據集產品介紹等相關信息。可獲得零級科學數據;
2.2 會員用戶
國內公眾通過網絡在線方式申請,均可成為氣象資料共享服務的會員用戶。會員用戶在網上與數據發布單位簽定數據使用協議,為數據的終端用戶。會員用戶可以在氣象資料共享網站下載、瀏覽和查詢氣象資料共享零級、一級數據。以其他離線方式(光盤拷貝、復印等)獲得氣象資料共享零級、一級數據。
2.3 核心用戶
國內從事非盈利性氣象工作的個人、國內從事省部級以上非盈利性科研項目的研究人員等均可申請成為氣象資料共享服務核心用戶。核心用戶以離線方式與數據發布單位簽定數據使用協議,為數據的終端用戶。核心用戶可以在氣象資料共享網站下載、瀏覽和查詢氣象資料共享零級、一級、二級數據。以其他離線方式(光盤拷貝、復印等)獲得氣象資料共享零級、一級、二級數據。
2.4 內部用戶
政府部門和氣象部門內部工作人員,因工作需要都可以申請成為氣象科學數據共享服務氣象部門內部用戶,可以獲得零級、一級、二級、三級氣象科學數據。
2.5 特別用戶
公務用戶,以及參與氣象資料共享建設而與負責氣象資料共享發布工作的單位達成特定資料交換或共享服務協議的機構和組織,或其他有特殊需求的個人或機構,可以通過簽訂特別協議而成為氣象科學數據的特別用戶。公務用戶,按用戶需求和指定的方式在線或離線獲得氣象資料各級數據。公務用戶之外的用戶按協議提供氣象資料各級數據。
其中:
無條件共享指用戶使用數據不受任何條件限制,可以轉讓。
有條件共享指用戶只能作為終端用戶使用數據,除另有協議規定的以外,不能以任何方式轉讓給第三方、或發布該數據。
協議共享指數據發布者與用戶通過簽訂特別的數據提供使用協議,來明確雙方的權利和義務。
如需保密數據須經有關上級主管部門批準。
3 后續工作
目前完成各類數據集16個,網站訪問量近22萬人次。氣象數據的用戶來自全國各地,分布在不同行業、從事不同的工作,許多用戶索取氣象資料的用途是未曾預料到的,不僅有自然科學領域的用戶,還有社會科學領域的用戶,這充分說明了氣象資料應用的廣泛性及其在科學研究和國民經濟建設中的基礎性地位。
首先,當用戶獲取到基本的氣象資料后,又對氣象資料的質量提出了越來越高的需求,主要表現在:一是對氣象資料在時間上要求長序列,在空間上要求高分辨率;二是需求幾乎涉及到氣象資料的各種類型,除了常規的地面、高空氣象觀測資料外,氣象災害資料、衛星和雷達氣象探測資料、大氣成分資料也是用戶經常提出要求的資料;三是在共享方式上,希望以網絡在線檢索和下載資料為主,以節省獲取資料的時間。
其次,共享數據的加工水平和質量是影響數據共享質量的重要因素。氣象科學數據共享不僅要提供廣泛、詳細的氣象資料,更重要的是要對資料進行一定的深加工,制作各類用戶可以直接使用的數據集產品,同時要確保所提供資料的質量,即資料的完整性和正確性。
總之,氣象數據的加工和質量控制是具有相當難度的科學問題,數據的綜合集成、數據挖掘、數據的質量控制、歷史氣象序列的均一性檢驗訂正等均是數據分析處理方面的前沿科學問題。
參考文獻:
[1]賴志斌,程承旗.元數據和數據集一體化管理模型及應用研究[J].測繪通報,2001(05).
[2]劉愛容.氣象信息共享平臺的開發技巧[J].氣象與環境科學,2007(S1).
[3]趙文濤,郭曉利.元數據技術研究[J].艦船科學技術,2011(S1).