姜 鑫
(黑龍江大學信息管理學院,黑龍江哈爾濱150080)
科學數據開放政策研究現狀分析及未來研究動向評判
姜 鑫
(黑龍江大學信息管理學院,黑龍江哈爾濱150080)
本文通過梳理國內外科學數據開放政策的相關研究成果,對國內外科學數據開放政策的研究現狀進行了比較分析,在此基礎上探討了國內外相關研究的特點以及我國現有研究的不足,并對我國科學數據開放政策的未來研究動向進行了評判,為我國更好地開展科學數據開放政策研究提供參考。
科學數據;開放數據政策;數據共享;研究動向
科學數據(Scientific Data),也稱科研數據(Research Data),與科學論文一樣也被視為重要的科研產出,也是一種具有潛在經濟價值的戰略資源。開放科學數據對數據驅動科學研究起到了關鍵作用,越來越多的研究是建立在對已有科學數據重用的基礎之上的。因此,完整保存并開放獲取先前研究的科學數據,對于順利開展后續研究、推動科學進步具有重要意義。開放科學數據在國家科技創新中的戰略地位不斷提升,目前在開放規模和開放程度上均達到了前所未有的水平。通過開放科學數據改善社會生活受到眾多投資者、出版商、科學家和其他利益相關者的高度關注,歐洲、美國以及眾多國際組織與研究機構都積極建立開放科學數據的政策保障與管理機制。如美國已經形成了以“完全與開放”為基本國策的科學數據開放共享法規體系;經濟合作與發展組織(OECD)頒布了《公共資金資助的科學數據獲取原則與指南》,以指導成員國制定與完善科學數據開放共享政策;歐盟“地平線2020計劃”將科學數據新增為開放存取的對象并要求逐步達到開放性可獲取,并啟動了旨在促進科學數據獲取和再利用的“科學數據開放先導性計劃”[1]。
我國早在2002年就已正式啟動科學數據共享工程,并先后在六大領域共計24個部門開展了科學數據共享工作。2006年以來,中國科學院國家科學圖書館提出并開展了科學數據與科技文獻跨界集成服務、數據融合技術的研究和開發。目前,我國在科學數據開放政策的制定和完善方面,與美國、英國、澳大利亞、日本、韓國、臺灣等國家和地區相比仍顯滯后。本文針對國內外科學數據開放政策的研究現狀進行了比較分析,在此基礎上探討了國內外相關研究的特點以及我國現有研究的不足,并對我國科學數據開放政策的未來研究動向進行了評判。
對從CNKI和萬方數據兩大中文數據庫檢索到的相關文獻進行閱讀和梳理發現,我國針對科學數據開放政策的相關研究可以概括為以下5個方面:
1.1 建立開放科學數據政策保障機制的理論性研究
目前已有較多成果是針對建立和完善科學數據開放共享政策法規的頂層設計展開論證,如劉細文(2009)指出,美國、英國以及眾多國際組織與研究機構都就科學數據開放獲取問題,積極建立政策保障與管理機制并廣泛推行相關服務與實踐,其政策舉措主要圍繞科學數據交流渠道各環節,集中體現在數據開放資助、數據質量控制、數據合法保護、數據保存以及數據共享利用五大方面[2]。王晴(2014)指出:國內外20余個組織相繼制定或實施了30余條旨在促進科學數據開放共享的政策法規,根據制定主體和效力范圍可以分為宏觀、中觀和微觀3個層面,共同形成了一個較為完備并在不斷完善的制度體系[3]。
1.2 針對國內外各類科學數據開放共享政策的調查研究
目前已有部分成果針對多種政策主體(如高等院校、科研資助機構、信息服務機構等)發布的有關開放科學數據的聲明、指南以及政策法規等各類政策文本展開了調查分析,如司莉等(2013)考察了美國、英國、澳大利亞3個國家的科研管理機構、高校制定的數據管理政策以及政府制定的數據公開政策,并指出:發達國家的政府部門都制定了科學數據開放共享政策,對科學數據的保存與管理等均作了明確具體的規定。我國政府也應制定完善的科學數據開放共享政策,從政策層面對科學數據的開放共享進行指導和規范[4]。司莉等(2014)針對英美10所高校的科學數據開放共享政策,從一般政策、數據標準、數據訪問與保存、數據共享、數據安全與保護以及數據產權6個方面進行了調查與比較,揭示了英美兩國大學科學數據開放共享政策的特點與差異,指出通過借鑒國外大學科學數據開放共享政策的良好實踐,推動我國大學相關政策法規的制定和發布[5]。唐源等(2015)針對國外典型醫學相關機構的科學數據開放共享政策從科學數據開放資助、科學數據匯交、科學數據保存、數據共享利用4個方面的政策內容進行文獻調研和網站調研,指出國外政策制定者從政府到機構自身以及期刊等具有多重身份,政策內容集中于數據匯交和共享計劃。
1.3 科學數據開放政策利益主體的開放共享行為研究
由于開放科學數據的利益主體一般要受到相關政策法規的制約,因此也可視為科學數據開放政策的利益主體。國內的相關研究成果主要包括:①單一利益主體的開放共享行為的共享意愿及影響因素分析,如張晉朝(2013)通過問卷調查方法和結構方程模型,分析了我國高校科研人員科學數據共享意愿的影響因素,指出科學數據開放共享工作的順利開展不僅要關注技術維度,還要關注社會環境因素、內在激勵、人際信任等人文維度[7]。②針對單一利益主體的開放共享行為的演化博弈分析,如莊倩等(2015)建立了參與科學數據開放共享的科研人員之間的演化博弈模型,揭示了科學數據開放共享博弈中存在的”公共品困境”及其原因,指出為促進我國科學數據開放共享健康有序發展,不能僅從國家層面制定和完善相關的戰略規劃,還要從政策法規層面建立相應的激勵機制[8]。
1.4 制定開放科學數據相關知識產權政策法律問題的研究
雖然目前科學數據具有著作權已經成為共識,但其使用存在著作權界定不清及其利益分配不當等問題,尤其是科學數據二次研發過程中的著作權分配問題。司莉等(2015)從科學數據開放共享中的授權方式、數據出版及引用、技術措施、制度與法規、科學數據二次利用5個方面分別探討了科學數據著作權保護存在的問題及對策,指出我國應結合知識產權保護法、著作權法、專利法和中華人民共和國政府信息公開條例等已有法規條例,盡快建立完善的科學數據著作權保護體系[9]。
1.5 基于政策文本分析的科學數據開放政策實證研究
目前國內的相關研究成果非常有限,主要是通過內容分析法進行政策文本分析,如裴雷(2013)通過內容分析法構建了基于政策文本的上下位政策概念一致性的測算框架,并對我國12個領域的科學數據開放共享政策文本進行內容編碼和實證分析,探討了當前我國科學數據開放共享政策在吸收、擴散和創新過程中的政策文本質量[10]。
對從Springer、Emerald和Elsevier三大外文數據庫檢索到的相關文獻進行閱讀和梳理,可以發現國外科學數據開放政策研究所涉及的研究主題更為廣泛,可以大致概括為以下5個方面:
2.1 制定科學數據開放政策的理論探討與實踐研究
國外學者針對這一研究主題的研究成果也比較豐富,如Childs S等(2014)探討了作為實現開放科學數據的機制——科研數據管理(RDM)的作用以及它帶給記錄管理者的機遇,并指出開放科學數據議程的前提是盡可能公開可用的數據,在開放科學數據的背景下仍然存在方法、倫理、政策和實踐等層面的問題[11]。Higman R等(2015)借鑒行動者網絡理論(Actor Network Theory)并結合政策分析過程和案例研究方法,考察了在英國高等教育機構中建立科學數據管理(RDM)政策與實踐的驅動因素,以及科學數據開放共享在科學數據管理過程中的關鍵作用[12]。
2.2 科學數據開放政策利益主體的開放共享行為研究
國外學者針對科研人員的開放共享行為的共享意愿及其影響因素展開了較為系統的實證研究,如Wicherts J M等(2011)對心理學期刊中的統計結果顯著與數據共享意愿的相關性進行了實證研究,發現科研人員不愿意共享數據的主要原因在于:統計結果不構成充分的證據以及更有可能存在明顯的錯誤,并強調了建立科學數據的強制性歸檔政策的重要性[13]。Sayogo D S等(2013)指出科學數據開放共享存在多重障礙與挑戰:①技術上的障礙;②社會、組織和經濟上的障礙;③法律和政策上的障礙,并通過問卷調查得出影響科研人員開放共享意愿的幾個關鍵因素:數據管理技能、組織參與、法律與政策需求、向數據集提供者致謝[14]。
2.3 面向科學數據開放政策利益主體的開放共享服務研究
國外學者針對高校圖書館、研究型圖書館、信息服務機構的科學數據開放共享服務實踐展開了廣泛的研究,國內的相關研究主要是對國外科學數據服務實踐的案例研究及調查分析,如Nielsen H J等(2014)認為科學數據管理(RDM)是圖書館員和信息專業人員的潛在職責,研究型圖書館是選擇、保護、組織與利用科學數據的最佳場所,并應積極參與到其所在學科領域的特定領域的分析研究[15]。Tenopir C等(2014)指出數據密集型科學的出現和數據管理規范的制定,驅動高校圖書館為其教師和學生開展數據管理服務(RDS),并通過調查研究建立了圖書館員、圖書館、信息服務機構參與數據管理服務的評價基準[16]。
2.4 針對專業領域科學數據開放政策的政策分析研究
國外學者針對天文、氣象、地球、生物、醫學等自然科學以及心理學、倫理學等社會科學專業領域的科學數據開放共享政策進行了政策分析研究,如Harris R等(2015)考察了參與開放地球觀測數據的八國集團、歐盟和國際組織發布的21個政策文本和法律文書——八國集團(G8)開放數據憲章、全球綜合地球觀測系統(GEOSS)數據共享原則、經濟合作與發展組織(OECD)科學數據原則與指南、歐洲環境信息指令等,指出地球觀測領域開放數據政策應更加明確、完整地說明開放獲取的條件,以期充分實現開放地球觀測數據的潛在利益[17]。
2.5 基于政策文本分析的科學數據開放政策實證研究
國外學者進行政策文本分析時除了運用常規的內容分析法以外,還創新性地引入了語義網分析、社會網絡分析等研究方法,如Jung K等(2015)對韓國《開放公共數據指令》(OPDD)的政策文本進行了語義網分析,并指出:利用語義網的概念模型及分析過程有助于確定各類公共政策針對的主要問題及解決視角的一致性[18]。
對國內外科學數據開放政策的相關研究進行對比,可以發現具有以下幾個特點:①總體來看,我國學者針對科學數據開放政策各研究主題的相關研究,目前大多處于對國外先進政策實踐的案例研究與調查分析階段。②國內外針對科學數據開放政策的相關研究目前主要以英美兩國的政策實踐為主,原因在于英美兩國已經建立起相對完善的科學數據開放政策法規體系,如經濟合作與發展組織(OECD)于2007年頒布了《公共資助科學數據開放獲取的原則和指南》,提倡所有的獲公共資金支持得到的科學數據都應能被公眾獲取、共享。美國、英國等一些重要基金機構也提出了科學數據開放政策指南,如美國國家科學基金會(NSF)、美國國立衛生研究院(NIH)、美國國家航空航天局(NASA)、英國研究理事會(RCUK)等,要求所有獲得資助的項目提交科學數據的開放共享計劃。美國科技政策辦公室(OSTP)于2013年簽署了關于“提高聯邦政府資助的科學研究結果的訪問”的備忘錄,要求由聯邦資金資助所產生的非保密的科學數據,應該存儲并為公眾提供免費的最大化訪問[19]。③國內外對于具體專業領域的科學數據開放政策的研究相對較多,但對于國家統一綜合層面的科學數據開放政策研究十分有限。
對比國內外開放數據政策研究的現狀不難看出,國內相關研究主要存在以下不足:①目前的研究成果主要是針對國外高等院校、信息服務機構和科研資助機構的科學數據開放共享政策的調查研究與比較分析,但從整體來看這類研究成果的研究內容比較分散、系統性不強;②已有研究針對參與科學數據開放的單一利益主體(如研究人員)的開放共享行為進行了演化博弈分析,尚未發現針對參與科學數據開放的多個利益主體之間的演化博弈分析的相關研究;③針對科學數據開放政策的政策文本分析目前主要采用內容分析法,尚未展開借鑒多學科理論與方法的政策文本分析方法的探索性研究;④尚未展開針對科學數據開放政策群的政策協同研究,已有學者針對政府數據的開放數據政策與數據安全政策的協同關系展開研究[20],如黃道麗等(2015)分析了美國政府發布的開放數據政策與網絡安全政策之間的沖突與協調[21],但尚未發現有針對科學數據展開的類似研究;⑤尚未從政策科學的研究視角展開系統性的科學數據開放政策評估研究。
通過以上的比較分析,筆者認為,我國圖書情報及相關學科領域研究者應展開協作研究,并從以下5個方面強化和拓展這一重要的跨學科研究領域。
4.1 各類科學數據開放政策的調查與比較分析
針對主要發達國家的政府部門、高等院校與科研機構以及各類國際組織發布的有關開放科學數據的聲明、指南以及政策法規等各類政策文本展開廣泛的調查分析,比較和分析各類政策文本中有關一般政策、數據標準、數據共享、數據保存、數據安全和數據產權等方面內容的特點與差異,合理借鑒發達國家在政策的系統性、一致性、完善性方面的經驗,為推進我國科學數據開放政策的制定與完善提供必要的參考借鑒。
4.2 科學數據開放政策多個利益主體的博弈分析
現有的研究成果主要是針對參與科學數據開放的單一利益主體(如研究人員)的博弈分析,在后續研究中可針對參與科學數據開放的多個利益主體(研究人員、科研機構、數據中心、資助者、出版者、第三方用戶等)之間的利益訴求關系展開研究,建立參與科學數據開放的多個利益主體之間的演化博弈模型,探索促進多個利益主體開放科學數據的激勵機制,為從微觀層面制定和完善科學數據開放政策提供演化博弈的理論框架。
4.3 基于多學科方法的科學數據開放政策文本分析
值得關注的研究方向包括:①借鑒多學科理論與方法對政策文本進行內容分析,如借鑒扎根理論的“信息提取-歸納-概念化-重組”思想,對各類科學數據開放政策文本進行解構、分類和比較,提取科學數據開放政策的區分要素,確定政策文本結構化編碼體系和分類標準,將政策文本轉化為半結構化數據,建立類定量化的政策文本分析框架。②基于知識單元的政策文本分析方法的探索性研究,如借助于語義網分析和社會網絡分析方法,探索政策文本的詞匯分析單元之間的語義關聯關系,并可通過軟件工具進行網絡結構分析及可視化展示。
4.4 各類科學數據開放政策的政策協同研究
值得關注的研究方向包括:①科學數據開放政策群內部的政策協同研究。通過內容分析法對各類科學數據開放政策進行政策文本分析,從政策連續性、政策互補性、政策交叉性、政策缺失性及政策矛盾性等多個維度考察科學數據開放政策群內部的政策協同。②科學數據開放政策群與數據安全政策群的政策協同研究。借鑒協同論思想和政策協同理論及工具,設計科學數據開放政策群與《中華人民共和國保守國家秘密法》、《中華人民共和國科學技術保密規定》以及其他相關部門頒布的保密規定等數據安全政策群的政策協同機制,制定科學數據開放政策群與數據安全政策群的政策協同策略。
4.5 科學數據開放政策的政策分析與評估研究
將側重于定性分析的政策分析研究與側重于定量分析的政策評估研究相結合,針對科學數據開放政策,從政策科學的學科視角進行多角度的政策分析與評估研究,如針對科學數據開放政策完整的生命周期中的每一環節——政策提案、政策制定、政策實施、政策反饋和政策調整,綜合運用多種政策科學相關理論、方法與工具進行系統性的政策評估研究;運用層次分析法、模糊綜合評判法、數據包絡分析法和灰色關聯度法等政策評估方法,建立科學數據開放政策評估指標體系并進行指標權重分析,采用數學模型及軟件工具構建科學數據開放政策評估模型并進行模擬實驗。
通過CNKI和萬方數據兩大中文數據庫以及Springer、Emerald和Elsevier三大外文數據庫,筆者對國內外現有的科學數據開放政策的相關研究成果進行了比較研究,并在此基礎上探討了國內外相關研究的特點:目前國內的相關研究基本處于對國外先進政策實踐的案例研究與調查分析階段,國內外針對科學數據開放政策的相關研究目前主要以英美兩國的政策實踐為主。結合科學數據開放政策相關領域的學術研究與實踐進展,我國在這一跨學科研究領域未來可能出現五大研究動向:①各類科學數據開放政策的調查與比較分析;②科學數據開放政策多個利益主體的博弈分析;③基于多學科方法的科學數據開放政策文本分析;④各類科學數據開放政策的政策協同研究;⑤科學數據開放政策的政策分析與評估研究。從而推動我國開放科學數據的政策保障與管理機制的建立。
[1]韓纓.歐盟“地平線2020計劃”相關知識產權規則與開放獲取政策研究[J].知識產權,2015,(3):92-96.
[2]劉細文,熊瑞.國外科學數據開放獲取政策特點分析[J].情報理論與實踐,2009,32(9):5-9.
[3]王晴.論科學數據開放共享的運行模式、保障機制及優化策略[J].國家圖書館學刊,2014,(1):3-9.
[4]司莉,邢文明.國外科學數據管理與共享政策調查及對我國的啟示[J].情報資料工作,2013,(1):61-66.
[5]司莉,辛娟娟.英美高校科學數據管理與共享政策的調查分析[J].圖書館論壇,2014,(9):80-85,65.[6]唐源,吳丹.國外醫學科學數據共享政策調查及對我國的啟示[J].圖書情報工作,2015,59(18):6-13.
[7]張晉朝.我國高校科研人員科學數據共享意愿研究[J].情報理論與實踐,2013,36(10):25-30.
[8]莊倩,何琳.科學數據共享中科研人員共享行為的演化博弈分析[J].情報雜志,2015,34(8):152-157.
[9]司莉,賈歡,邢文明.科學數據著作權保護問題與對策研究[J].圖書與情報,2015,(4):118-122.
[10]裴雷.我國科學數據共享政策概念一致性與政策質量評估[J].情報理論與實踐,2013,36(9):28-31.
[11]Childs S,McLeod J,Lomas E,et al.Opening research data:issues and opportunities[J].Records Management Journal,2014,24(2):142-162.
[12]Higman R,Pinfield S.Research data management and openness:The role of data sharing in developing institutional policies and practices[J].Program:Electronic library and information systems,2015,49(4):364-381.
[13]Wicherts J M,Bakker M,Molenaar D.Willingness to share research data is related to the strength of the evidence and the quality of reporting of statistical results[J].PLoS ONE,2011,6(11):1-7.
[14]Sayogo D S,Pardo T A.Exploring the determinants of scientific data sharing:Understanding the motivation to publish research data[J].Government Information Quarterly,2013,30(S1):19-31.
[15]Nielsen H J,Hj?rland B.Curating research data:the potential roles of libraries and information professionals[J].Journal of Documentation,2014,70(2):221-240.
[16]Tenopir C,Sandusky R J,Allard S,et al.Research data management services in academic research libraries and perceptions of librarians[J].Library&Information Science Research,2014,36:84-90.
[17]Harris R,Baumann I.Open data policies and satellite Earth observation[J].Space Policy,2015,32:44-53.
[18]Jung K,Park H W.A semantic(TRIZ)network analysis of South Korea's“Open Public Data”policy[J].Government Information Quarterly,2015,32(3):353-358.
[19]黃永文,張建勇,黃金霞,等.國外開放科學數據研究綜述[J].現代圖書情報技術,2013,(5):21-27.
[20]馬海群,蒲攀.國內外開放數據政策研究現狀分析及我國研究動向研判[J].中國圖書館學報,2015,41(5):76-86.
[21]黃道麗,原浩.開放數據與網絡安全立法和政策的沖突與暗合——以美國政府行政令為視角[J].信息安全與通信保密,2015,(6):78-81.
(本文責任編輯:馬 卓)
A Literature Review on Research Status and Developing Trend of Open Research Data Policy
Jiang Xin
(College of Information Management,Heilongjiang University,Harbin 150080,China)
This paper systematically studied relevant research outputs and compared respective research status on open research data policy home and abroad.In order to provide references for promoting relevant research,this paper discussed the characteristics of relevant research home and abroad,pointed out the shortages of current research in China,and finally evaluated the future research trends on open research data policy in China.
research data;open data policy;research status;research trend
10.3969/j.issn.1008-0821.2016.02.031
G201
A
1008-0821(2016)02-0167-04
2016-01-12
國家社會科學基金重點項目“開放數據與數據安全的政策協同研究”(項目編號:15ATQ008);黑龍江省哲學社會科學研究規劃專項項目“我國圖書情報學科知識結構及動態演化的可視化研究”(項目編號:15TQD03)。
姜 鑫(1980-),女,副教授,博士研究生,研究方向:信息計量與科學評價、科技政策分析與評估。