自21世紀以來,國外相繼制定了科學數據開放共享政策。有關科學數據開放共享政策[1]及其內容[2]與特點[3]引起了我國的關注,但國內的研究并未對國外科學數據開放共享政策進行全面描述與分析,甚至有論文誤把科學數據共享政策當作科學數據開放共享政策[4]。事實上,兩者有著顯著差異。科學數據開放共享政策是指某一機構或組織關于如何有效實施科學數據開放共享的相關規定或制度安排,它與傳統的科學數據共享政策的主要差異是:它明確規定科學數據共享對所有人而言都是完全開放的、免費的和無限制的;而一般的科學數據共享政策往往要求在特定領域或有限范圍內且遵循某些條件來實行科學數據共享,僅適用于特定范圍內的用戶,對其他用戶而言是無法利用的。在我國大力“推動實施國家大數據戰略,推進數據資源整合和開放共享”的過程中,有必要梳理國外科學數據開放共享政策,以便為制定我國科學數據開放共享政策提供參考。本文分別對國際組織、英國、美國和其他國家的科學數據開放共享政策進行述評。
國際組織制定的科學數據開放共享政策見表1。經合組織在《關于公共資助的研究數據獲取的原則與指南》[5]中提出,研究數據開放利用應該遵循開放、靈活、透明、遵守法律、保護知識產權、承擔責任、專業化、互操作、質量、安全、效率、責任、可持續等13條原則,彰顯其在推動科學數據開放共享上的表率作用。國際地球觀測組織(GEO)在《全球地球觀測系統數據共享原則實施指南》[6]中提出指導GEO成員和全球地球觀測系統用戶實施科學數據開放共享的6點建議。《LERU開放研究數據聲明》[7]強調研究數據應及時和免費地提供公開利用,通過明確研究人員、高層管理者、機構、圖書館、圖書館員、信息技術和數據科學家在開放研究數據中的責任來引導科學數據開放共享的實施。《北極數據管理原則與實踐聲明》[8]支持所有科學數據的開放獲取,要求數據長期保存和可持續利用,要求數據提供者和用戶遵守極地信息共享倫理和數據共享規范,由此確立北極數據管理與開放共享的基本原則。《G8科學部長倫敦聲明》[9]強調最大程度、最少約束地開放公共資助項目的科學數據,使科學數據更易被發現、訪問、評估、理解和利用,并具有互操作性,從而確立G8科學數據開放共享的基本準則,并引導其他國家科學數據的開放共享。《發展中國家數據共享原則》[10]強調所有公共資助項目的數據和信息應得到持續的開放共享,為發展中國家制定具體的科學數據開放共享政策提供了基本準則。《WDS數據共享原則》[11]要求依據國家或國際法律和政策,“完全與開放”地共享數據、元數據和其他相關信息,指導數據生產者和數據用戶實施科學數據的開放共享。《大數據世界中的開放數據》[12]確立公共資助項目的研究成果必須實施數據開放利用的價值規范,明確研究人員、大學和研究機構、研究資助者、行業協會、圖書情報機構、國際科學組織、出版商在科學數據開放共享中的責任以及科學數據開放共享的邊界和諸多有利于科學數據開放共享的做法。《ERC資助研究成果開放獲取指南》[13]要求由ERC完全或部分資助的研究出版物在出版時即存儲在一個合適的知識庫中,并在出版6個月(人文社科領域為12個月)內實施開放獲取,同時建議受資助者保留所有研究數據,并與其他研究者分享這些數據。《開放獲取科學出版物和研究數據的實施指南》[14]要求受資助者制定數據管理計劃,把經過驗證的研究數據與相關元數據存儲在知識庫中,并通過知識庫提供驗證結果所需工具信息,以促進第三方開放共享研究數據,從而在歐盟范圍內確立科學出版物和研究數據的開放獲取原則,也為受ERC資助的學者提供研究數據開放共享的行動指南,促進“水平線2020”項目研究成果的開放共享。

表1 國際組織科學數據開放共享政策
上述國際組織科學數據開放共享政策文本往往包含科學數據開放獲取重要性聲明、利益相關者責任、數據質量、數據互操作、數據評估、知識產權保護等主題,一些政策文本也對數據安全、開放獲取方式、開放數據范圍、出版時滯、費用資助、支持環境、可持續發展等作了規定。這些政策的共性是注重科學數據開放共享的價值,注重科學數據的知識產權及其保護,注重科學數據的質量、評估與互操作,也強調利益相關者的責任擔當。這些政策對于在世界范圍內促進科學數據的開放共享,克服科學數據開放共享的政治、經濟、倫理、法律、社會、機構、技術等障礙,具有至關重要的作用。
英國在科學數據共享領域一直走在世界前列。早在2005年6月,英國研究理事會(Research Council UK,RCUK)發布《RCUK對獲取研究結果的立場聲明》,明確由公共基金支持的研究結果(包括研究數據)應能夠被研究團體和其他人訪問和利用[15]。2011年4月RCUK頒布的《RCUK數據政策通用原則》強調,公共資助項目的研究數據應該以最少的限制,及時全面地得到公開利用[16]。黃國彬等[17]論述了英國科研資助機構的科學數據共享政策,但這些政策并不是針對科學數據開放共享而言的。在英國,盡管有多個機構制定了科學數據共享政策,但只有部分機構率先頒布科學數據開放共享政策,包括英國國際發展部(DFID)、英國氣象局(UKMO)、RCUK、英格蘭高等教育資助理事會(Higher Education Funding Council for England,HEFCE)、英國大學聯合會(Universities UK)、惠康基金會(Wellcome Trust)、英國醫學研究理事會(Medical Research Council,MRC)以及一些英國大學、其他研究機構、出版機構(見表2)。

表2 英國科學數據開放共享政策
從政策主要內容與影響來看,《DFID開放和增強的研究獲取政策》[18]和《DFID開放和增強的研究獲取政策實施指南》[19]要求DFID資助的研究成果,包括數據集和其他資料,通過開放獲取出版或自存儲方式實施開放共享,打破以往政府開放數據政策僅僅覆蓋政府數據而不涉及科學數據的傳統,為英國政府部門樹立了科學數據開放共享的典范。《開放數據政策》[20]要求公共氣象服務資助項目形成的數據必須實行開放共享,并確立氣象科學數據開放共享的8個評估標準,從而奠定英國氣象局科學數據開放共享的基礎。《開放研究數據協議》[21]頒布了適用于所有科學研究領域的10條開放研究數據原則,要求支持研究結論的數據應該在成果出版日就能被訪問和引用,成為其他科研資助機構制定專門科學數據開放共享政策的基準和研究人員實施科學數據開放共享的行動指南。《MRC關于臨床試驗和公共健康干預研究的開放數據政策》[22]把英國醫學研究理事會(MRC)資助的臨床試驗和臨床干預研究數據、公共健康干預研究數據、觀察性研究數據納入開放共享范疇,要求研究人員遵循《分享個人參與公共資助臨床試驗數據的良好實踐原則》指南,使研究協議、分析計劃和所有相關的統計分析得到開放利用,充分體現了《開放研究數據協議》的要求,成為7個RCUK分支理事會中成功實施科學數據開放共享的先鋒,為研究人員開放共享相關研究數據提供有效指導。《開放獲取研究與研究數據管理政策》[23]確立了埃克塞特大學研究數據開放共享的10條原則,規范了大學與研究人員在研究數據開放共享中的責任,要求研究人員把相關研究數據存儲在埃克塞特大學機構知識庫中以實現數據的開放共享。《研究數據管理與開放數據政策》[24]明確了研究數據開放共享的7項原則,規定研究者(包括所有大學職員和研究生)和布里斯托大學在研究數據管理和開放共享中的責任,為布里斯托大學研究數據的開放共享提供有效指導。《金史密斯學院開放獲取聲明》[25]要求研究成果和數據能通過金史密斯學院在線研究知識庫和金史密斯學院在線數據知識庫實現開放獲取與共享,且規定了倫敦大學金史密斯學院與研究群體在研究成果開放獲取中各自的責任,有效促進倫敦大學金史密斯學院研究數據開放共享的實施。《開放獲取研究與研究數據管理政策》[26]要求研究人員把研究數據存儲在法爾茅斯大學研究知識庫(FURR),并使之實現開放共享,同時明確了法爾茅斯大學研究人員和大學本身在研究數據開放共享中的責任,指導法爾茅斯大學研究人員實施研究數據開放共享。《研究數據政策》[27]強調研究數據應是開放共享的,明確了施普林格·自然出版集團轄下期刊對4類研究數據開放共享的不同要求與做法,在英國出版界樹立了研究數據開放共享的典范。
上述政策構成了宏觀(主要是政府部門)、中觀(主要是科研資助機構)、微觀(主要是高校和研究機構、出版機構)三個層面的英國科學數據開放共享政策體系。雖然不同政策文本內容各異,但是這些文本往往包含政策聲明、利益相關者責任、知識產權保護、數據存儲、開放數據范圍、數據發布、數據再利用、數據知識庫、元數據、費用或資助、開放許可協議、數據管理計劃、出版時滯等主題。開放獲取方式、數據評估、數據質量、數據安全、支持環境等也至少出現在2個政策文本中。從整體看,英國科學數據開放共享政策通過明確利益相關者在科學數據開放共享中的責任、知識產權保護、關鍵的科學數據開放共享活動(如數據存儲、數據發布、數據再利用、數據評估、數據監護)及相關的開放許可協議、開放獲取方式、元數據、數據質量、數據管理計劃、數據互操作、出版時滯、費用等事項,大力支持與保障英國科學數據開放共享的快速發展,彰顯出英國在開放科學運動中的主導地位。
美國是世界上科學數據擁有量最多且介入科學數據共享管理最早的國家[28]。1991年7月,美國總統行政辦公廳科技政策辦公室發布《全球變化研究數據管理政策聲明》,要求實行“完全與開放”的科學數據共享。隨著開放獲取、開放科學運動在美國的崛起與快速發展,一些美國政府部門、研究資助機構、研究機構與出版機構開始制定相關科學數據開放共享政策(見表3)。
從政策主要內容與影響來看,《全球變化研究數據管理政策聲明》[29]承諾促進全球變化研究數據的“完全與開放”共享,以最低成本向全球變化研究人員提供開放獲取數據。《提高聯邦資助科學研究成果獲取》[30]要求每個聯邦機構制定聯邦資助科學研究成果公共獲取計劃,使聯邦資金資助而形成的科學數據能被大眾最大化地免費獲取,并提供機構科學數據保存評估,指導科學數據開放共享。《提高NIH資助的科學研究出版物和數字科學數據獲取的計劃》[31]明確提出美國國立衛生研究院(NIH)資助的科學研究數據必須實施開放獲取與共享。《PLOS數據可利用性》[32]把科學數據開放共享作為期刊論文發表的前提條件,要求將與指定PLOS期刊論文相關的數據和元數據都存儲在適當的公共知識庫中以實現開放共享,從而確保PLOS期刊上發表的論文所依據的數據和資料都可得到開放利用,使PLOS成為美國出版界開放共享科學數據的領頭羊。《NASA提高獲取科學研究成果的計劃》[33]確立了NASA科學數據公共獲取的原則、范圍、條件和實施步驟,顯著提高了NASA內部研究人員和受資助者的科學數據開放共享;而《數據與信息政策》[34]確立了NASA科學數據開放共享的政策框架,使來自NASA地球觀測衛星、亞軌道平臺和實地調查獲得的地球科學數據能夠及時得到開放共享,使所有NASA生產的標準產品及其算法軟件源代碼、系數和輔助數據得到開放利用。《AHA資助研究的開放科學政策聲明》[35]要求AHA資助而產生的期刊論文在出版后的12個月內通過公共醫學中心得到免費利用,并通過AHA批準的知識庫把驗證研究結果所需的事實數據在資助期滿后的12個月內實現免費與公開利用,從而提高AHA資助研究成果的使用效率。《NOAA提高研究成果公共獲取的計劃》[36]確立了科學數據公共獲取的范圍、條件和任務,要求那些獲得資金資助的出版物和環境數據應及時公開,以供利用,為公共獲取NOAA科學數據提供指導。《NSF公共獲取計劃》[37]要求把NSF資助的研究成果(包括研究數據),在首次發表后12個月內通過自存儲方式保存下來,并實現開放共享與利用。NSTC的《促進訪問聯邦政府支持的國際科學合作中的科學數據和研究成果的原則》[38],明確科學數據應實現開放獲取,強調政府支持的科學數據應免費提供利用,鼓勵使用開源數據格式、開放數據標準來促進科學數據的開放共享。

表3 美國科學數據開放共享政策
上述政策初步組成美國科學數據開放共享政策體系的雛形,覆蓋宏觀、中觀、微觀三個層次。這些政策雖然內容各異,但是從以下幾方面規范了科學數據的開放共享:(1)強調公共資助的科學數據應以合法合理的方式實現開放獲取與共享;(2)要求制定科學數據管理計劃,對科學數據的開放獲取進行明確規劃;(3)要求利用開放獲取機構知識庫實現科學數據的長期保存;(4)要求評估科學數據的保存與利用績效;(5)要求提高科學數據的訪問和互操作性;(6)明確科學數據開放獲取的時間安排或時滯。正是由于得到上述科學數據開放共享政策的支持,美國科學數據的開放共享也如同英國一樣,走在世界前列。不斷豐富的美國科學數據開放共享政策,將保障美國在開放科學與開放研究領域獲得更大的競爭優勢。
加拿大、愛爾蘭、澳大利亞的許多機構或組織也制定了相關科學數據開放共享政策(見表4)。
從政策主要內容與影響來看,《加拿大地球空間觀測數據政策》[44]要求加拿大所有地球空間觀測數據在最短的時間內得到開放共享,以實現數據價值的最大化。《加拿大基因組數據發布與共享政策》[45]要求加拿大基因組資助項目必須及時和無限制地共享數據和資源,由此顯著提高相關研究數據的開放共享。《三機構出版物開放獲取政策》[46]確立了加拿大衛生研究院、自然科學與工程研究理事會、社會科學與人文研究理事會三機構促進科學出版物開放獲取的7條原則,明確科學數據開放共享的途徑和時間要求,有助于實現三機構資助研究成果和數據的開放共享。5個愛爾蘭機構制定的開放獲取政策都堅持一項共同的原則——要求把受資助產生的研究成果在出版后盡快存儲到開放獲取知識庫中,通過知識庫實現相關研究數據和元數據的開放共享。《開放獲取悉尼大學研究政策》規定,大學將提供開放出版平臺和機構知識庫,研究成果在出版后12個月內須連同其收集的學術成果和相關元數據在外部可訪問的知識庫上開放共享,同時要求研究數據實現開放利用。
開放數據的發展在世界范圍內仍處于起步階段,英國和美國以外其他國家頒布的科學數據開放共享政策并不多見。上述三國科學數據開放共享政策(悉尼大學除外)的一個顯著共性是,要求受資助或所在機構產生的科學數據必須及時和免費地得到開放共享。

表4 其他國家科學數據開放共享政策
國外許多機構或組織制定了科學數據開放共享政策,主要目標是為研究加速、支持新發現、促進合作、提升研究責任、提高研究效率與創新能力。雖然國外科學數據開放共享政策內容各異,但主要包含三類要素:(1)政策要求,包括對數據質量與標準、數據獲取與共享、數據保護與保存、數據管理計劃的要求;(2)政策規定,包括對隱私、傳統知識、敏感數據、知識產權或數據所有權的規定;(3)其它說明,包括對科學數據開放共享目的、原則、范圍、角色與責任、監管和實施的描述。
我國科學數據的開放共享尚處于初始階段,未制定國家或行業層次的科學數據開放共享政策,是制約我國科學數據開放共享的障礙之一。國外科學數據開放共享政策為我國提供以下啟示:
(1)應站在國家戰略高度來認識科學數據開放共享的重要價值與意義,廣泛推廣科學數據開放共享的理念與思想。這不僅因為科學數據開放共享具有十分重要的經濟、政治、社會、技術與經營利益,如促進經濟增長,促進新產品和服務開發,獲取公共投資的更大回報,獲得更大的透明性和決策支持,實現市民參與,改進政策制定流程,驗證以前的結果,測試新的研究假設和方法,提升跨學科、跨部門和跨機構研究,提高科技論文的引用率,避免昂貴的重復工作,幫助了解重要的科學發現和參與公眾討論,而且因為我國已制定實施國家大數據戰略,《促進大數據發展行動綱要》要求在依法加強安全保障和隱私保護的前提下,穩步推動公共數據資源開放共享。
(2)應逐步建立健全包括國家層次、行業層次、機構或企業層次的科學數據開放共享政策體系,以便為利益相關者(含政府、大學、研究機構、資助機構、圖書情報機構、出版商、軟件開發者、研究者個人、數據管理者等)參與科學數據開放共享提供有效指導,并確保科學數據開放共享實踐有序高效展開。
(3)每項科學數據開放共享政策應規范利益相關者在科學數據開放共享活動中的權利與義務,明確科學數據開放共享方式、時間安排、數據質量要求以及知識產權保護條款,從而指導科學數據開放共享實踐,提高我國科學數據開放共享水平。