(西安交通大學圖書館 陜西西安 710061)
歐盟“地平線2020”(Horizon 2020,以下簡稱H2020)是創新聯盟(IU)系列活動之一,以公開征集、評選后注資的形式推動科研成果走向市場。H2020于2014年1月31日在英國正式啟動,其包含7個板塊分別為優秀科學、行業領導者、社會挑戰、歐洲原子能、傳播前言和擴大參與規模、科學與社會以及歐洲創新科技學院。其中,優秀科學板塊旨在加強和擴大優秀科學原理的影響力,并借此打破國家間交流的屏障,提高歐盟內的研究與創新在全球的競爭力[1]。H2020提出所有資助的出版物和研究數據開放獲取,其主要目的是為了:①提高研究質量;②鼓勵合作,避免重復(更加高效);③加快創新(更開放的市場進步意味著更快的增長);④提高科學過程的透明性。本文考察了歐洲研究委員會(European Research Council,簡稱ERC)對研究出版物和研究數據的管理和開放獲取制度(見圖1),并從政策范圍、政策規定、提供支持3個方面對比分析了歐盟最為重要的10個研究委員會制定的政策及提供的支持。

圖1 歐洲研究委員會開放獲取模式圖
H2020規定ERC資助的研究課題,課題團隊必須保證所有與課題研究相關的同行評審的科學出版物開放獲取。其中資助條款29.2設置了詳細的開放獲取法律要求,每個受資助項目必須采用知識庫使課題的同行評審科學出版物開放獲取,這些出版物包括期刊論文、會議論文、專著等。同時對出版物的版本作了一定的要求,即必須提供已出版的版本或者出版物接受后的同行評審版本(后印本)。此外,還必須保證這些出版物允許任何用戶免費在線閱讀、下載和打印。ERC鼓勵受資助者提供更多的出版物使用權利,如復制、分發、搜索、鏈接、爬取和挖掘等。
首先,在知識庫中儲存出版物。要求受資助課題在一個合適的知識庫存儲出版物的電子復本。ERC推薦使用學科知識庫存儲出版物:生命科學推薦使用歐洲PubMed中心,物理科學推薦使用arXiv,專著、書的章節使用OAPEN Library,如果沒有合適的學科知識庫,研究者可使用機構知識庫或集中式知識庫,如Zenodo、ResearchGate和Academia等。電子版必須是機器可讀的版本,如文本文檔或其他標準化的格式,其他用戶能夠開發新的工具處理這些文檔,不能提交印刷版的掃描版本。無論采取哪種開放獲取模型,必須在出版后盡可能快地存儲電子版。存儲出版物的同時,也鼓勵在數據知識庫中存儲出版物中驗證結果的研究數據。
其次,選擇開放獲取路線。可以選擇綠色OA或金色OA。綠色OA指自存檔,作者將出版物的最終版本或同行評審后的草稿存儲在知識庫中,一些出版社要求一定的延遲后開放獲取;金色OA也叫出版開放獲取,出版物在出版后立即開放獲取,金色OA花費來源于ERC資助費用。
最后,提供存儲出版物的開放獲取。受資助者必須保證出版物的存儲版本通過知識庫開放獲取。開放獲取應該盡可能地快速,最多不超過出版后6個月。人文社會科學領域最多延遲至出版后12個月。對于金色OA的出版物,必須在出版后立即提供開放存取。對于課題結束后的出版物,如果受資助者不能在最大延遲期提供開放獲取,而且沒有產生額外的金色OA費用,可以采用延遲期更長的綠色OA。為了保證存儲出版物的發現,也必須保證出版物的書目元數據開放獲取。元數據必須包括一個持久的標識,如DOI。
H2020定義的研究數據包括統計資料、實驗結果、測量值、實地觀測結果、調查結果、采訪錄音和圖像。受資助者必須在數據知識庫中存儲研究數據,其他人員能夠通過知識庫訪問、挖掘、利用、復制和傳播科研數據。ERC于2016年的資助協議建議資助項目參與研究數據開放獲取,而2017年的新版資助協議明確規定資助項目必須參與研究數據開放獲取。
數據管理計劃(DMP)是數據管理的關鍵要素。DMP描述了數據收集、處理等數據管理生命周期。H2020要求所有的資助項目在項目開始時必須制定詳細的DMP,內容包括項目將產生和處理哪些數據集,這些數據怎樣獲取,怎么儲存、保存和管理,敏感數據的保護等。除了上述內容外還必須保證數據發現、獲取、互操作、重用和數據安全5項內容。如果某些數據集不提供訪問,應該說明具體原因(如數據開放獲取將危及項目的目標等)。另外,H2020規定一旦項目受到資助并且開始執行,必須在6個月內提交第一版DMP,在項目進展過程中如果出現新的數據、政策改變(如決定申請專利)等情況,必須及時更新DMP。
首先,在機構庫中儲存科學出版物證實結果的研究數據和相關元數據,也包括其他數據(如不直接歸屬于出版物的數據或原始數據)。其次,必須采取措施保障第三方訪問、挖掘、利用、復制和傳播這些研究數據。一些專業軟件、軟件代碼、算法和分析方案,在可能的情況下也應公開。
數據密集型科學一個最大的挑戰是幫助人們發現、獲取、整合和分析研究數據以及相關的算法和工作流[2]。管理研究數據以及研究數據發現、訪問、互操作和重用的最終目的都是為了知識發現和創新以及后續的數據知識整合和重用。ERC進行的開放研究數據計劃就是為了提高H2020項目產生的研究數據的訪問和重用,為此制定了促使研究數據可發現(Findable)、可訪問(Accessible)、互操作(Interoperable)和重用(Re-usable)的數據管理原則,簡稱FAIR數據原則。表1列出了FAIR的各項要求,其中包含了研究數據的FAIR要求,以及研究數據元數據的FAIR要求。在25條原則中,元數據占13條,研究數據占12條,說明在研究數據管理過程中,研究數據和元數據處于同等重要的地位。由于研究數據有實驗數據、觀測數據等不同種類,所以指南沒有具體規范數據標準,只是列出了各項應該滿足的規范。AI條款指出了通訊協議規范,進一步通過A1.1和A1.2對協議要求進行了詳細說明。R3指的是研究數據必須和研究出版物關聯,既能夠通過出版物鏈接到研究數據,同時也能通過研究數據鏈接到出版物。

表1 FAIR數據原則的各項要求
FAIR數據原則僅僅提供了高層次的實施指導原則,沒有任何技術細節、標準和解決方案。原則本身不是一個標準或說明書,僅僅為數據出版商和數據管理者提供具體實現指南。許多知識庫通過不同的技術實現了FAIR數據原則[3],下面列出了幾個主要實現FAIR原則的知識庫以及其實現方法(見表2)。

表2 數據知識庫實現FAIR數據原則的方法
不同于出版物的強制開放獲取,ERC不強制資助項目必須公開所有研究數據,原則為“根據情況盡可能公開”,推薦資助的研究課題保留全部研究數據,并在版權限制、保密和合約條款允許下,和其他研究人員共享這些數據。受資助項目可以在任何時期退出研究數據開放獲取計劃(如申請階段、資助協議準備期、簽署資助協議后),相應的條款也會從資助協議中刪除。無論是出版物還是研究數據,其開放獲取的相關花費都符合H2020資助協議。
AHRC(人文研究委員會)、BBSRC(生物技術和生物科學委員會)、EPSRC(英國工程與自然科學研究理事會)、ESRC(英國國家經濟和社會研究委員會)、MRC(醫學研究委員會)、NERC(北美電力可靠性委員會)、STFC(技術設備委員會)、Cancer Research(癌癥研究)、European Commission(歐洲委員會)、Wellcome Trust(惠康基金會)是歐盟組織最重要的研究資助委員會。表3從3個大方面、11個小方面對比分析了其對出版物和研究數據管理制度的差異。

表3 不同基金資助的出版物和研究數據管理制度差異
出版物、研究數據的管理及開放獲取需要基金資助機構、出版社、圖書館等單位的大力合作,才能真正實現出版物的綠色開放,研究數據的可訪問、可重用。目前國內對出版物開放獲取認識和研究有較大的提高,但對研究數據管理和開放獲取還處在起步階段。相對于國外科研資助機構對研究數據管理和開放獲取的要求,我國無論是國家級還是省級的資助機構,還沒有制定相應的制度,應該借鑒國外的先進經驗,提高我國出版物、研究數據的開放獲取。
首先,對于出版物的開放獲取,歐盟11個主要的資助機構都制定了相應的政策并提供開放獲取的支持。國內中國科學院也在這方面作了大量的工作,一方面試驗推進中國科學院學術論文的開放出版;另一方面率先啟動中國科學院學術論文從出版社向中國科學院機構知識庫的自動推送服務。英國物理學會出版社(IOPP)在2015年已經同意支持將中國科學院作者在其期刊上發表的論文自動推送至中國科學院機構知識庫,并于論文發表后的12個月后開放獲取[4]。我國基金資助機構不但要制定出版物的開放獲取,而且要提供相應的支持,如提供學科庫或機構庫。同時在基金支持方面,也要支持開放獲取,如明確將論文處理費用(APC)納入資助范圍。
其次,DMP是實現數據管理非常重要的因素,因此國內資助項目必須制定詳細的DMP,注意以下幾個問題:項目將產生哪些類型和格式的數據,是否將重用存在的數據,數據的來源是什么,預期的數據大小,誰可能用這些數據,應用什么樣的標準,數據怎樣被利用、共享、重用,怎樣管理和保存數據等。
最后,數據管理不是最終目的,而是支持知識發現和創新的先決條件。e-science要求數據被發現、訪問、互操作和重用。在數據管理過程中,不僅要重視數據本身,更要重視元數據,有了規范的元數據才能提供良好的數據發現和訪問。對于數據的開放獲取,首先要厘清哪些數據可以開放獲取,清晰分開法律、合約原因和自愿限制。對于受到多個資助的項目,數據開放獲取應符合所有資助條款,總之在可能的條件下,應盡可能開放研究數據。
[1]韓纓.歐盟“地平線2020計劃”相關知識產權規則與開放獲取政策研究[J].知識產權,2015(3):92-96.
[2]崔宇紅.E-Science環境中研究圖書館的新角色:科學數據管理[J].圖書館雜志,2012(10):20-23.
[3]覃丹.英美社會科學數據管理與共享服務平臺調查分析[J].圖書情報工作,2014(16):67-75.
[4]張閃閃,顧立平,蓋曉良.國外信息服務機構的數據管理政策調研與分析[J].圖書情報知識,2015(5):99-109.