999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代科學數據元數據的開放與共享

2016-03-05 21:58:53滿
現代情報 2016年3期
關鍵詞:科學

滿 芮 王 健

(中國農業科學院農業信息研究所,北京 100081)

?

·理論探索·

大數據時代科學數據元數據的開放與共享

滿 芮 王 健

(中國農業科學院農業信息研究所,北京 100081)

在當今大數據的時代背景下,數據已經成為各個科研領域不可缺少的元素之一,而科學數據元數據是信息資源的核心。科學數據元數據的開放與共享是各個領域都急需面對的問題,關乎國家的發展,社會經濟的進步,關乎科技領域的深度。本文就大數據時代科學數據元數據的開放共享問題進行探究,為我國科學數據元數據相關的工作提供進一步的參考。

大數據;科學數據;元數據;開放與共享

隨著計算機信息技術的空前發展以及科學研究對象的復雜化,產生了數以兆計的數據,可以說任何一個學科領域的數據量都可以達到上千兆。在當今大數據環境下,如何整理、儲存、傳遞通訊以及長時間的保存這些科學數據,實現其開放共享應用,僅僅以幾套先進的計算機設備是遠遠不夠的,真正需要的,是有利于開放共享的標準規范描述科學數據元數據,合理的組織體系用以數據的使用,存儲靈活方便,通信機制穩定可靠,共享機制恰當合理[1]。在此過程中,元數據的產生發揮了極其重要的作用,為越來越多的用戶發掘以及再利用數據提供了可靠的依據。本文就大數據時代科學數據元數據的開放共享問題進行探究,為我國科學數據元數據的相關工作提供進一步的參考。

1 概 述

1.1 當前信息資源概述

如今已然全面進入信息時代,核心即數據。電子商務的普及,社交網絡的全面興起,信息資源從各式各樣的終端不停地涌現,一個大規模的應用數據時代已經產生于我們生活中。“大數據”3個字已經漸漸植入,大數據在各領域的重要性已得到認可,但是關于其定義卻是各有見解。“大數據”實則是一個抽象的概念,眾所周知的特性是數據海量。通常狀態下,大數據是指那些無法在固定時間內用計算機技術進行感知、獲取、管理、處理和服務的數據。由于不同領域的專家對其關注點不同,所以對于大數據有著不同的定義方向。但恰恰是各個方向的定義幫助我們更好地理解大數據的深刻含義。

2010年Apache Hadoop組織將大數據定義為,普通的計算機軟件無法在可接受的時間范圍內捕捉、管理、處理的規模龐大的數據集合。在此基礎上的2011年5月,世界級著名咨詢機構麥肯錫公司發布了“大數據:下一個創新、競爭和生產力的前沿”,報告中對大數據的定義進行了擴充:大數據是指其大小超出了典型數據庫軟件的采集、存儲、管理和分析等能力的數據集[2]。

2013年,IBM公司在中國北京召開的技術峰會,Viktor Mayer-Sch?nberger博士[3]提出了他所理解的大數據特征:“全體”、“混雜”、“相關”。全體的意義是需要去研究與特定對象的所有數據;混雜的意義是滿足于某一明確的主干方向,而不去深究精確性;相關的意義是對數據的認識從因果轉為相關的關系再去研究。

1.2 概念解析

1.2.1 科學數據

科學數據并不一定是完全正確或精準。舉例來說,關于相關數據的質量,其中具有誤差的數據作為對相關測試工具偏差的校準試驗同樣具有重要意義,所以說在某些方面,具有誤差的數據同樣是科學數據的一部分。另外,科學數據范圍很廣,一切具有科學性的數據都可以歸屬于。可隨時更新,數據根據變化而變化,當其科學性消失,隨之也不屬于科學數據。傳統的文獻信息更新頻次相對慢很多,目前數據量的增長,內容的變化也跟信息時代的生產和傳達方式的提高達到了前所未有的水準。因為科學數據的屬性具有動態性、周期性、廣博性以及嚴密性。那究竟什么是科學數據[4]?數據是用于載荷情報的物理符號,是對客觀事物的數學表示,而“科學數據”目前尚無嚴格定義。從科研體制來看,科學數據主要產生于假設科學中生成并與其他部分整合而成的數據。數據與科學數據的區別在于對“科學”二字的強調,也就是可以稱之為科學數據的一定是有相關價值的。科學數據是人類在科技活動之中所需要的原始觀測數據、實驗數據、調查數據、統計研究數據以及相關聯的元數據和按照需求加工的數據,具有使用價值以及科學價值。它在當今高速發展的信息時代有難以估量的潛在價值以及可開發價值。而科學數據正是大數據的內容之一,反之大數據這一寬泛的概念也必然包括科學數據以及元數據。

1.2.2 元數據

元數據還不是一個成熟且并不含有表意功能的數據。依據英文METADATA的前綴META-可知,意義在于“與…一起”。因此可以理解元數據的意義是一種信息的資源,或者是得到某種信息的一類途徑。它是對數據的說明,提供的是準確理解和精確解釋數據所需的信息。學者們認為“元數據是關于數據的數據”或者說“描述數據的數據”。這個概念廣泛地存在于各個領域中對數據的描述現象。

1.2.3 科學數據元數據

根據科學數據為研究對象的元數據,實際上對科學數據來說是一個工具,負責去形容、描述、組織、整理。科學數據目前已成為繼文獻資源之后一項十分重要的資源。科學數據元數據對于數據的存儲起著前所未有至關重要的意義。2012年下半年,美國國家信息標準組織(National Information Standard Organization,NISO)聯合都柏林核心元數據組織(Dublin Core Metadata Initiative,DCMI)一起召開研討會議[6]。科學數據元數據如何日常維護、長久存儲以及備受矚目的開放與共享問題已成為當今數據研究核心問題之一。

2 基于大數據,科學數據元數據的開放共享需求

2.1 戰略領域

隨著大數據環境的全方位降臨,數據已經成為一種資產,與物質資源、人力資源同等重要,而科學數據與元數據更具有戰略性和前所未有的意義。國家、社會的發展進步很大程度決定于科技創新技術水平,而深入發展科學數據元數據是實現科技創新與進步的重要途徑之一。從信息資源的開發到目前各類高新技術的高速發展,都是以科學數據的累積發展為根本,從實驗室到實地數據,無一不與科學數據元數據息息相關。當今在以信息為基礎的社會中,愈來愈多的信息產品推動著社會的發展,尤其是以數據管理、再加工為主的產業正慢慢引領著“大數據經濟”。我國雖然科學數據資源豐富,但大多數仍未經歷系統的整合建庫,數字化的程度還處于初級水平。而大量的數據使用者局限于個人、本處室、本單位,使得科技資源浪費嚴重,開放與共享機制幾乎沒有建立。所以要想突破科學數據元數據的壁壘,實施開放共享,是國家發展的戰略需求。2012年3月29日,美國政府奧巴馬宣布啟動《大數據研究和發展計劃》,同時組建“大數據高級指導小組”,涉及美國國家科學基金、國家衛生研究院、能源部、國防部等6個聯邦政府部門,宣布將啟動2億美元的投資計劃,提高從大量數據中訪問、組織、收集發現信息的工具和技術水平。這使得美國成為首個將大數據從商業行為上升到國家意志和國家戰略的國家。

2.2 科研領域

現如今在全國乃至全世界的科研領域很少有單一學科,多數為交叉領域的科研。事實上,科學研究的根本所在實則是科學數據的產生與應用的過程。在研究成果方面,科學數據以及元數據本身就是成果,它既是科研成果,也是進一步創新的原始資源。大數據時代的科學數據猛烈增長,所以對穩定的基礎科學數據分析系統的需求愈發強烈。2010年以來,全球有關科學數據以及元數據的科研活動不斷增加,重大科研工程的興起,交叉而又復雜的跨學科研究層出不窮,因此使得大范圍合作的局面逐漸形成,全世界范圍內對信息資源、科學數據互通需要達到了從未有過的高度。綜上,搭建平臺,實現數據的開放共享,任何對數據的需求都無須再受限于其來源。

2.3 公眾領域

在大數據的蓬勃發展中,從政府到高等學府、科研院所、企事業單位到社會大眾對科學數據元數據的需求日益增加,已不是專業數據人員要面對的知識領域了。平板電腦、智能手機大眾化的普及,在互聯網深入到千家萬戶之后,使得各類人群對科學數據的需求尤為明顯。例如,在圖書銷售網站,依據以往讀者的購買記錄,網站可以給讀者推薦相關學科新出版圖書;購物網站的使用者,可以根據購買習慣以及收貨地點被推薦喜歡的并且發貨地在同省市的店鋪;司機可以使用智能手機裝載的GPS隨時查看交通狀況,也可利用大數據的特點提前預知某些路段每日何時容易車流量大以便提前繞路,可以提前查看附近停車場的空余車位情況。可見在大數據時代,科研人員深入研究科學數據的應用、架構等,而普羅大眾對科學數據的發布渠道、終端形式等也有越來越高的需求。

3 大數據背景下科學數據元數據的開放共享模式

3.1 關于國家政策介入模式

學習發達國家的成功經驗,以美國為例。回望20世紀90年代初,美國便頒布了“全球變化研究數據管理政策”,核心內容為要完全打開科學數據的開放與共享。他們依據數據投資資源來源不同,嚴格的將數據開放共享加以區分。國有數據但凡涉及侵害國家安全以及國家、個人隱私的數據不予公開,其他都進行開放處理。私有數據歸入市場競爭。這兩種不同的機制中,美國政府起到了主導、推動的作用,其中的方式方法完全不同,但兩種機制完全互補,有效提升了科學數據元數據的全面應用,打開了開放共享數據的新局面。國家統一規劃的制度與體系為科學數據的發展提供了堅固的保障,同時與之配套的法律法規也隨之完善。科學數據有序而又規范的開放共享體制,使得信息資源從開發到應用迅速發展起來,涉及領域氣象科學、生物科學、作物科學等各個學科,同時也促進了美國經濟的快速發展。大數據發展的社會環境下,數據的開放共享問題已經是必然趨勢。2009年,DATA.GOV網絡平臺在美國上線,3年時間,直至2012年開放數據388 529項,匯集了1 264個應用軟件,103個手機應用插件。歐盟開放數據戰略(OPEN DATA STRATEGY)于2010年11月由歐盟委員會第一次提出,與2011年11月底被歐盟數字議程采納,其中科學數據的全面開放是其政策的重要組成部分[7]。

3.2 相關單位之間交換模式

科學數據的開放共享,第一步可以從生產科學數據的相關單位之間開始。高等院校、科研院所之間在保證知識產權的前提下,應積極地做到開放共享數據的第一環節。當今可以說沒有一項研究,一個獨立的單位、部門可以完全利用自己的數據資源開展乃至完結。涉及內容必定廣泛,跨學科領域、跨時期,對于數據的開放、共享有著巨大的需求,而相對容易便捷的實現,就是相關單位內對科學數據的互相開放與共享。例如氣象信息部門已擁有了全國各地氣象的長時間內的科學數據,而環境規劃的相關單位為了各地環境的治理、改善開展工作,勢必需要氣象部門的數據,這都屬于開放與共享范疇。

3.3 跨界合作模式

當今任何企業的發展難以脫離信息資源和各類數據的支撐,同時也具有相互促進的功能,一些企業的發展一定是需要以科學數據為基礎的產品來進一步研發。大數據環境下,科學數據元數據的累積、分析必然決定相關企業發展的命脈。如此情形,企業為了獲取對自身發展有用的信息,可以出資科學合作開發項目,參與信息資源開放共享平臺的搭建,以及建立商業性質的數據庫,學術與商業產業價值相結合,也是多元發展科學數據的應用價值的一條線索。學術領域與經濟產業領域的出發點不同,但找到其共性是可行的。跨界合作并非新型模式,科研領域可以繼續致力于研究,盈利的相關分析操作由企業去實現。同時科研、學術領域在其交集形成良性競爭模式,而有能力的企業也可對行業領先的前沿技術和數據分析進行追蹤,得到最新的科研成果,實際上科研領域也在推進經濟產業的發展。

3.4 國際合作模式

隨著科學數據開放、共享的需求日益增加,越來越多國際化合作模式已開展起來,國際的交流也頻繁起來。由國際科學理事會(International Council for Science,ICSU)發起,1957年早已成立了世界數據中心(World Data Centre,WDC),當時主要面對地球與環境領域的科學數據的采納收集、分析整理,之后也負責組織交流國際性的研討會,為國際性科學數據事業的發展起到了至關重要的作用。1988年,中國加入了世界數據中心,并建立世界數據中心——中國中心(World Data Center D,WDC-D)。WDC-D組織機構包括:中國國家協調委員會、科學委員會、中國中心協調辦公室、科學委員會秘書處及九個學科數據中心:海洋學科數據中心、國家海洋信息中心、地震學科數據中心、中國地震局分析預報中心、地質學科數據中心、中國地質科學院信息中心、空間學科數據中心、中科院空間中心、天文學科數據中心。1966年成立了國際科技數據委員會(Committee on Data for Science and Technology,CODATA),屬ICSU下一級學術機構,是全球最大的科技數據國際學術組織,專門服務于科學數據的各項國際性研究與活動,在全球互聯網與大數據的并行快速發展下,搭建標準格式用以數據的共享與開放,有計劃有目的的按期舉辦國際性科學數據學術型研究會議,對科學數據深入多元化的發展提供平臺。我國于1984年成為CODATA正式會員國,并建立了CODATA中國委員會,其秘書處安設在中科院計算機網絡信息中心。1992年和2006年,我國曾先后申請成功并主辦第13屆和第20屆CODATA大會。2010年在南非開普敦舉行的第27屆國際科技數據委員會(CODATA)大會暨第22屆CODATA全會上,中國科學院對地觀測與數字地球科學中心研究員郭華東當選該國際組織主席,這也是CODATA成立44年來我國科學家首次任職主席。

4 對我國科學數據元數據發展的思考

伴隨著大數據的發展,我國的科學數據元數據的資源越來越豐富,國家先后成立了信息中心,國家互聯網信息中心、國家旅游信息中心、國家金融信息中心,以及國家基礎地理信息中心等等,目前信息中心已經成為我國政府向社會提供具有服務性、公益性的窗口。為了保證我國科學數據元數據開放共享工作的開展,需從有序的管理、規范的技術以及法律法規幾個方面著手。

(1)科學數據元數據的開放與共享離不開國家法律法規的政策性保障。相比于發展較早的歐美國家,我國出臺的政策一方面是較慢,另一方面是程度淺顯。面對大數據的壓力與挑戰,國家應盡早出臺與科學數據元數據開放、共享的相關法律,科學數據元數據應歸屬國家戰略性問題,否則將成為進一步發展的最大障礙。這些年,國家各類科研項目都沒有實現數據開放與共享,一些非常有科學價值的數據大多分散在高等院校、科研院所內部,這對于國家數據信息的發展來說是一項嚴重的浪費。因此,只有國家領導層面有這個能力盡快將相關法律法規納入科學數據元數據共享機制中。我國已經編制了:《科學數據共享工程建設規劃》,制定了《科學數據共享條例》、《國家科技計劃項目科學數據匯交辦法》、《科學數據共享工程管理辦法》、《科學數據共享工程試點遴選和檢查評估辦法》和《科學數據分類分級共享及其發布策略》等一系列數據共享的政策法規[8]。

(2)知識產權的保護問題在我國科學數據元數據的開放共享工作是一道障礙。在我國科學數據元數據的多年科研工作中,產權的歸屬以及開放、共享問題始終存在,責任的歸屬、權益的分配羈絆著其發展。無形中科學數據以及元數據的資源成了私有財產,既阻礙了自己的發展又耽誤了其他人的進度,這種現象的普遍存在并不是一個人、一個部門甚至一個單位的問題,從中央到地方都有,嚴重地阻礙了我國科學數據元數據的發展。因此,只有國家的介入針對不同歸屬的科學數據以及元數據明確產權問題,既維護了投資者又保護了創造者的利益,嚴肅規整產權交易,全面推進科學數據元數據的應用、傳播以及各項功能。

(3)相比于科學數據元數據發展較早的歐美國家,我們起步晚,發展相對緩慢,而實踐能力相差甚遠,其開放共享技術、設施均落后于發達國家,目前無論是共享水平還是范圍都亟需加強。所以,高等院校、科研院所等各類科研機構應積極參加國際合作項目,全面學習數據信息發達國家的成功經驗,揚長避短,取其精華,找到最適合我國國情的方法來提升我國科學數據元數據的開放共享水平。為此,我們豐富的科學數據元數據才能打開塵封已久的實驗室大門,面向全社會各階層領域,從高端科研機構到社會大眾,才能進一步與世界接軌。

5 結 論

如今看來,大數據已不是一個概念了,漸漸深入到科研以及生活領域,在此環境中,科學數據元數據的發展勢必成為趨勢,而對于科學數據元數據的開放共享問題也自然賦予了時代的意義。任何領域數據的開放與共享都是急需面對的,這關乎國家的發展,社會經濟的進步,關乎科技領域的深度。國際上對于科學數據元數據開放共享的研究已有數年,我國雖然起步晚,但是已經意識到了科學數據元數據的意義所在,相關科研已全面展開,恰好可以很好地借鑒學習發達國家的方法,少走彎路,結合自身特點深入開展科學數據元數據的研究。科研大環境的改變使得對科學數據元數據的認知程度和實踐程度逐漸提高,為國際合作、國內各科研機構的合作以及科研人員都提供了很好的契機,同時對科學數據元數據開放共享的研究也起到了推動的作用。

[1]周波.我國科學數據元數據研究綜述[J].圖書館學研究,2013,(2):7-10.

[2]張引.大數據應用的現狀與展望[J].計算機研究與發展,2013,(S2):216-233.

[3]Viktor Mayer-Sch?nberger[EB/OL].https:∥en.wikipedia.org/wiki/ViktorMayer-Sch%C3%B6nberger.

[4]黃如花.國外科學數據共享研究綜述[J].情報資料工作,2013,(4):24-30.

[5]Metadata for Managing Scientific Research Data[EB/OL].http:∥www.niso.org/news/events/2012/dcmi/scientificdata/,2013-12-20.

[6]左建安.基于大數據環境的科學數據共享模式研究[J].情報雜志,2015,32(12):151-154.

[7]鄔賀銓.大數據時代的機遇與挑戰[J].求是,2013,(4):47-49.

[8]左建安.基于大數據環境的科學數據共享模式研究[J].情報雜志,2015,32(12):151-154.

(本文責任編輯:孫國雷)

Research Openness and Sharing of Scientific Metadata under the Big Data Environment

Man Rui Wang Jian

(Institute of Agricultural Information,Chinese Academy of Agricultural Sciences,Beijing 100081,China)

Under the background of big data,data has become one of the various research fields indispensable element,and scientific metadata is the core of information resources.Openness and sharing of scientific data metadata is all areas urgent issue,relating to the country’s development,socio-economic progress,and the depth of science and technology.This paper conducted a research on openness and sharing of scientific metadata under the big data,and provided further reference for further research.

big data;scientific data;metadata;openness and sharing

2015-12-22

滿 芮(1985-),女,助理研究員,研究方向:科學數據管理與共享。

10.3969/j.issn.1008-0821.2016.03.006

G322

A

1008-0821(2016)03-0038-04

猜你喜歡
科學
點擊科學
走進科學
走進科學
點擊科學
點擊科學
點擊科學
走進科學
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
科學
科學怪咖
主站蜘蛛池模板: 黄色在线不卡| 免费国产高清精品一区在线| 国产精品无码影视久久久久久久 | 欧美色图久久| a色毛片免费视频| 亚洲日韩精品伊甸| 亚洲成a人在线播放www| 国产资源站| 国产九九精品视频| 久久青草视频| 亚洲日韩精品伊甸| 亚洲成人精品在线| 午夜视频日本| 69视频国产| 美臀人妻中出中文字幕在线| 欧美午夜一区| 午夜国产在线观看| 99热这里都是国产精品| 久久国产精品娇妻素人| 人人91人人澡人人妻人人爽| 亚洲欧洲自拍拍偷午夜色无码| 无套av在线| 日本在线亚洲| 99视频只有精品| 国产一级在线播放| 国产一区二区网站| 伊人91视频| 亚洲愉拍一区二区精品| 99热国产这里只有精品9九| 国产精品白浆在线播放| 久久人妻xunleige无码| 国产福利在线免费观看| 亚洲第一天堂无码专区| 老司机久久精品视频| 国产色婷婷| 2021国产精品自产拍在线观看| 97亚洲色综久久精品| 成人字幕网视频在线观看| 久久91精品牛牛| 伊人网址在线| 99久久精品视香蕉蕉| 91丨九色丨首页在线播放| 亚洲AV无码久久天堂| 五月天丁香婷婷综合久久| 国产成人精品亚洲77美色| 免费jizz在线播放| 国产日本欧美在线观看| 婷婷中文在线| 亚洲第七页| 日韩精品亚洲一区中文字幕| 国产一线在线| 高清大学生毛片一级| 这里只有精品在线| 国产精品视频白浆免费视频| 一本二本三本不卡无码| 福利小视频在线播放| 亚洲成人在线免费观看| 免费无码AV片在线观看中文| 91日本在线观看亚洲精品| 成人在线第一页| 色成人亚洲| 成人福利在线视频| 久久国产亚洲欧美日韩精品| 日本黄色不卡视频| 茄子视频毛片免费观看| 国产人成乱码视频免费观看| 国产成人高清精品免费软件| 色悠久久久| A级毛片高清免费视频就| 热久久国产| 国产AV无码专区亚洲A∨毛片| 99久久精品免费看国产电影| 精品精品国产高清A毛片| 黄色福利在线| 欧美va亚洲va香蕉在线| 黄色片中文字幕| 国产成人乱无码视频| 亚洲九九视频| 伊人狠狠丁香婷婷综合色| 午夜老司机永久免费看片| 白浆视频在线观看| 国产小视频在线高清播放|