柏 雪,鄭 聰,呂艷娥
(桂林理工大學圖書館,廣西 桂林 541004)
在數字時代,記錄、分享科學數據作為科學研究過程不可分割的一部分,正變得越來越重要。通過對科學數據進行有效管理,不僅能夠確保數據的可發現性、可訪問性和可理解性以實現數據的長期重用,還可以為研究人員帶來更高質量的研究、更高的可見性以及引用率的提高。政府、基金資助機構、期刊、研究機構逐漸意識到科學數據管理(RDM)和共享的重要性與必要性,開始鼓勵研究人員對數據進行規范化管理,甚至要求提交和共享科學數據。社會和技術因素驅動著科學數據快速增長,科學研究正向協作性、數據密集性和計算性研究方向發展。數據量大、數據可復制性、數據可共享是密集型科研范式的重要特征。在此背景下,RDM將變得更加重要,但也更難掌握。RDM所需的技能、資源和知識的復雜多樣性為研究者帶來了巨大挑戰。不論是科研人員還是從事RDM服務的支持人員對RDM培訓需求都日益增長。開展RDM培訓可以提升用戶的數據素養和管理技能,有助于推動RDM和開放科學的發展。
當前,我國的科學數據共享處于初級探索階段,RDM水平有待提高,RDM培訓機制和體系尚未形成。需要開展RDM培訓來提升科研人員和科研支持人員的數據素養與RDM能力。國內的RDM培訓實踐案例較少,目前僅有中國科學院文獻情報中心和國家科技圖書文獻中心舉辦過RDM相關培訓。英國是世界上最早開展電子科研(e-Science)的國家之一,其RDM服務與培訓均走在世界前列,取得了非常顯著的成效,積累了豐富的實踐經驗。本研究調研了英國的RDM培訓體系,分析其成功經驗,并針對我國建立RDM培訓體系提出相關建議。
筆者通過網絡調研和文獻調研,調查了英國提供RDM培訓的機構。經過梳理發現,英國提供RDM培訓的機構主要包括科研資助和監管機構、高校等研究機構、信息技術部門、圖書館等研究支持機構以及一些跨組織機構。這些來自不同層面的機構的培訓形成了一個立體化的RDM培訓體系,為英國的RDM培訓持續提供政策、技術、基礎設施、資源和平臺支持。
從組織視角來看,經過多年的發展,英國已經自上而下建立起一套較為全面的RDM政策和法規體系(見圖1)。英國的RDM政策體系主要包括政府、研究資助機構和研究機構三個層面的政策。政府的RDM政策主要偏向宏觀的統籌規劃;研究資助機構的RDM政策偏向引導和指導;研究機構的RDM政策偏向于具體執行實施。

圖1 英國研究數據管理政策體系調查
2.1.1 政府的數據管理法律和政策。英國政府對開放科學非常重視,已將其提升到國家發展的戰略高度。英國政府于2005年開始實施《信息自由法》,2012年頒布《開放數據白皮書》,2017年重新修訂《新數據保護法案》等數據法律,2017年頒布《數字經濟法》。這不僅為英國的開放數據和開放科學提供了法律依據和保障,為英國的數據驅動創新保駕護航,還引導和創造了良好的數據開放、共享和管理的社會氛圍。政府的法律和政策為RDM培訓的發展提供了法律保障。
2.1.2 資助機構的RDM政策。英國的大多數資助機構和研究委員會,非常重視其資助的項目對公共投資的價值,86%的英國研究委員會要求RDM計劃與資助申請一起提交。為了促進資助項目成果的最大化利用,英國的研究資助機構制訂了一系列RDM政策。英國超過80%的科研經費由英國研究理事會(RCUK)提供。RCUK成立于2002年5月,2009年6月重組為英國研究與創新部(UKRI)。2011年,UKRI發布《關于數據政策通用原則》《研究數據管理最佳實踐指南》,提出研究數據管理與共享的7條原則。隨后,UKRI下屬的7個理事會根據這套共同原則制訂了各自領域的RDM政策。包括:1)藝術與人文科學研究理事會(AHRC)的《研究資助指南》;2)生物技術與生物科學研究理事會(BBSRC)的《數據共享政策》;3)工程與自然科學研究理事會(EPSRC)的《研究數據政策框架》;4)經濟與社會科學研究理事會(ESRC)的《研究數據政策》;5)醫學研究理事會(MRC)的《數據共享政策》;6)自然環境研究理事會(NERC)的《數據政策》;7)科學與技術設施理事會(STFC)的《科學數據政策》。
另外,一些非UKRI資助機構也出臺了相關的RDM政策,如英國癌癥研究中心(CRUK)的《數據共享和保存政策》、歐洲委員會(EC)的《地平線2020公平數據指南》、惠康信托基金的《數據、軟件和材料管理與共享政策》等。
2.1.3 研究機構的RDM政策。英國現在的大多數研究資助機構都要求研究人員提交RDM計劃,作為撥款申請過程的一部分,并指出研究人員有義務將相關研究數據存入合適的存儲庫。研究數據的有效管理對研究人員本身以及其他用戶,如決策者、商業組織和非營利性機構都是有益的,因為它有助于促進有價值的數據的發現和再利用。為了確保符合資助方要求并遵守良好的RDM實踐,英國許多高校在遵循政府相關數據法律和政策的基礎上,在資助機構的數據共享和管理政策指導下,結合本校科研實際需求,提出本機構的RDM政策,以確保數據得到有效處理并符合資助機構要求,如劍橋大學的《研究數據管理政策框架》、牛津大學的《研究數據和記錄管理政策》、圣安德魯大學的《研究數據管理政策》、開放大學的《研究數據管理政策》、華威大學的《研究數據管理政策》等。
在英國,UKRI在RDM中所扮演的角色是宏觀的統籌、管理與協調,其下屬的7個研究理事會負責具體的政策實施和推進。研究信息網絡(RIN)、英國數據監管中心(DCC)、英國數據檔案館(UKDA)和聯合信息系統委員會(JISC)在確定和提高RDM技能方面發揮了主導作用。在研究機構的培訓合作中,JISC側重于提供培訓資金和網絡、技術等基礎設施建設,DCC則側重于負責具體的培訓項目實施以及政策制訂和數據管理規劃等問題的咨詢。這些機構之間均有不同程度的指導和合作關系,這些資助機構為英國的RDM培訓提供了良好的培訓平臺、培訓資源以及資金支持。
2.2.1 JISC提供的RDM培訓。JISC是一個非政府性質的公共機構,為英國高等教育和技術部門提供非營利性數字服務和解決方案,致力于將英國打造成世界上數字技術最先進的高等教育、繼續教育和研究的國家。JISC開展和資助了一大批RDM培訓項目。JISC和RIN共同資助了RDM技能支持計劃(DaMSSI-ABC),旨在探索英國研究生課程中的RDM技能和技能發展路徑、確定并推廣RDM培訓的基準,并與包括專業機構在內的其他利益相關者合作。DaMSSI-ABC是JICS資助的RDM項目中的一部分,旨在支持和提高JISC的RDMTrain項目中RDM培訓材料的開發、傳播和重用的一致性。DaMSSI-ABC包含5個RDM培訓項目,涉及服裝和表演藝術、社會和政治科學及社會人類學、心理學及臨床心理學、地球科學、考古學、健康科學6個學科。該項目商定并確定學習成果的基準和評估方法,以便能夠有效地比較各種培訓機構提供的課程。DaMSSI-ABC取得的成就包括將RDM技能培訓納入研究人員職業發展框架中,確立了一般和特定學科的RDM技能價值,改善了RDMTrain項目所代表的社區與專業機構和其他利益相關者之間的溝通。
JISC資助的其他比較具有代表性的RDM培訓項目包括:1)南安普頓大學的研究人員支持課程;2)埃克塞特大學的The Holistic Librarain項目;3)東倫敦大學開發的TraD項目以及SupportDM課程;4)愛丁堡大學為所有從事研究數據管理的人員開設的MANTRA課程。
2.2.2 DCC提供的RDM培訓。另一個提供RDM培訓的典型機構是DCC。DCC成立于2004年3月1日,最初是為響應JISC的第6/038號通知而成立的。2010年3月,DCC重組為由愛丁堡大學領導、主要合作伙伴為格拉斯哥大學人文高級技術與信息研究所(HATII)和巴斯大學數字信息管理專業中心(UKOLN)的機構。DCC與英國、美國、澳大利亞等國的數據機構如澳大利亞的ANDS、CNI、DataOne和美國的數據保護以及BioSharing組織建立合作關系。DCC現在已經發展成為國際公認的數據監管專業技術中心,專注于RDM的能力和技能建設。
DCC的課程是專門為滿足一系列受眾的需求而設計的,其目標群體是在英國和世界各地高等教育與繼續教育中從事數據保存和監管活動的群體,包括RDM專業人員、圖書館員、IT專家和研究人員。DCC有超過10年的RDM培訓經驗,其培訓師擁有豐富的技能發展經驗和深入的學科知識。DCC有全年的培訓計劃,培訓內容涵蓋數據管理與共享簡介、數據管理規劃(包括DMPonline)、數據倫理、開放科學與開放數據、公平原則、數據引用和許可、數據選擇和保存、數據共享和存儲庫、RDM服務、RDM成本核算與業務規劃、出資人要求(包括“地平線2020”、交付和構建RDM服務)。培訓形式包括面對面授課、網絡研討會、慕課、RDM論壇、國際數字監管會議等。DCC為用戶提供了大量的培訓資源,如操作指南和清單、案例研究和政策概述、制訂數據政策的步驟等。DCC還與機構密切合作,根據用戶需求提供RDM定制培訓服務。
2.2.3 UKDA提供的RDM培訓。UKDA成立于1967年,成立的初衷是為科研數據的分析和再利用提供高質量的研究數據。UKDA是英國唯一由國家資助的研究基礎設施,目前已成為英國數據基礎設施的重要組成部分。UKDA是國際公認的獲取、策劃和提供社會科學和人文數據訪問的專業中心,是英國數據服務的牽頭組織。通過UKDA可以統一訪問英國最大的社會、經濟和人口數據,所以,UKDA被認可為英國學術界內社會科學研究人員獲取數據和相關資源的第一站。其數據安全訪問和數據管理方面的實踐在全球范圍內都具有較大影響力。
在RDM培訓方面,UKDA提供研究數據使用技能的指導和培訓。UKDA的RDM培訓方式主要包括網絡課程、研討會和出版物。培訓內容包括許可證、組織基礎設施、數據儲存程序、數據保存、數據發現和重用、數據評估和記錄、數據保密和道德等。UKDA在RDM方面的培訓課程一直非常受歡迎,并已在歐洲、美國、中國、印度等地提供培訓。另外,UKDA提供數據使用和管理方面的出版物,UKDA開發的《研究數據管理手冊》已在大量網站和指導文件中重復使用,得到了一系列研究資助者、數據服務者和大英圖書館的認可。UKDA出版的《管理和共享研究數據實踐指南》受到研究人員和知識庫管理人員的廣泛歡迎。
英國的RDM活動由政府、資助機構、數據監管中心、研究機構、信息技術部門、圖書館等多部門共同參與。研究機構、信息技術部門和圖書館之間良好的培訓合作機制是英國的RDM培訓取得成功重要因素。英國很多較為成功的RDM培訓項目都是由多個部門聯合開展的。聯合開展培訓不僅能夠發揮各個機構的優勢,確保RDM培訓質量,還能夠充分整合資源,避免重復開發,降低課程的開發成本。
埃克塞特大學的Open Exeter項目就是一個典型的多機構合作項目。它由JISC資助,由埃克塞特大學圖書館、信息技術部門、研究及知識轉移人員、研究人員和研究生等利益相關人員共同合作完成。該項目由Follow the Data、Exeter Embeds和Technical Enabling三個主要部分組成:1)Follow the Data部分涉及與不同學科領域的博士研究人員團隊合作,評估埃克塞特大學RDM的現狀。參與該項目的研究生被要求在2012年1月到2012年7月初的時間段內每周完成一次對RDM涵蓋數據創建、存儲和共享的不同元素的審查,審查結果由數據監管干事上傳到圖書館的N:Drive中存儲。在此期間,數據監管干事與研究生每隔一周舉行“一對一”會議。審查結束后,數據監管干事根據審查數據和會議反饋結果撰寫分析報告初稿。在審查報告的基礎上,采用DAF調查的改編版本來全面調查埃克塞特大學的RDM實踐情況。2)Exeter Embeds部分的主要內容是開發一個RDM倡導、治理和培訓的框架,以將RDM政策充分嵌入埃克塞特大學的研究和教學中。其中,一個重點領域是為研究人員、項目管理人員和包括學科館員在內的研究支持人員編寫培訓材料。該部分由各學院、IT部門、RKT和圖書館共同完成。3)Technical Enabling部分主要由IT部門負責,致力于開發一個功能完善的研究數據庫。該數據庫是在Follow the Data部分的調查結果和Exeter Embeds部分制訂出的框架基礎之上進行開發的。另外,為了開發設計良好、內容適當的RDM培訓課程,Open Exeter項目從研究者的需求和視角出發,在開發課程時還與6名研究生合作,創建了一個RDM生存指南。Open Exeter項目開展各種不同的培訓課程,包括DCC101培訓的2個單獨實例(一個針對研究生,另一個針對圖書館、信息技術、研究辦公室專業服務的工作人員)、在開放獲取周期間的一系列活動以及在各自學院為新研究生舉辦的RDM上崗培訓。
其他具有代表性的案例包括:1)RDMRose項目。由JISC資助,利茲大學圖書館、謝菲爾德和約克圖書館與謝菲爾德信息學院合作開發,為從事RDM的信息專業人員提供RDM開放培訓資源。2)數據管理DIY培訓包試點課程。由愛丁堡大學的EDINA和數據圖書館與UKDA,DCC及普渡大學圖書館的分布式數據監管中心聯合開設。3)圖書館員RDM入門課程。由北安普敦大學與DCC合作開發。4)Research360項目。由DCC與巴斯大學可持續化學技術博士培訓中心合作開展。
當前,我國在開展研究數據管理和服務方面起步明顯晚于歐美國家,提供的RDM培訓更是乏善可陳。建立RDM培訓體系是提升RDM能力的重要途徑。通過對英國RDM培訓體系的剖析發現,建立RDM培訓體系,需要政府、資助機構、高校、圖書館、信息技術中心、學院和其他利益相關者從多層面共同努力。
(1)制訂和完善RDM的相關法律和政策,為RDM培訓提供政策保障
國務院辦公廳在2018年3月17日印發《科學數據管理辦法》(以下簡稱《辦法》)。《辦法》對RDM的工作體制、管理原則、責任主體等進行統籌規劃,并對科學數據的采集、保存、共享和安全作出相關規定,另外還擬組建科學數據中心。中國科學院在《辦法》的指導下于2019年2月19日發布《中國科學院科學數據管理與共享辦法》,明確科研項目數據匯總要求,建立論文關聯數據匯交機制,明確包括院屬法人單位、重大科技基礎設施、野外臺站、科學數據中心等科學數據開放共享主體的責任,規劃中國科學院數據中心體系包括中心、學科中心、所級中心。這表明,我國政府和監管機構已經開始意識到科學數據管理和共享的重要性。我們應該抓住這一契機,積極貫徹落實和擴展RDM政策體系。主管部門根據《辦法》,加強對數據生命周期各環節的政策研究,制訂詳細的RDM政策和規章制度,科研院所、高校等責任主體在遵循《辦法》和主管部門RDM政策的基礎上,借鑒國外政策經驗,制訂更為詳細的適合本機構的RDM政策、實施細則、評價標準,作為指導方針和服務設計的框架。各機構自上而下建立起一套立體完善的RDM法律和規章制度,為我國的RDM培訓的發展提供政策土壤和法律保障。
(2)建立RDM考核激勵機制,調動培訓對象參與培訓的積極性
按照《辦法》規定,RDM的主管部門是國務院相關部門和省級人民政府相關部門。主管部門可以制訂一套詳細可行的RDM考核評價體系,通過以下途徑來激勵研究人員和研究支持人員提升自身RDM能力:1)鼓勵研究者在申請基金時提交相應的數據管理計劃,并將數據管理計劃是否規范作為考核指標,利用政策法規的約束性引起研究人員對RDM的重視;2)對數據中心或機構庫研究數據的搜集、存儲和備份、共享、道德規范等進行考核評價,促使研究支持機構參與RDM培訓,提升RDM能力;3)RDM主管部門制訂一系列宣傳方案,向科研人員、研究機構、研究支持人員宣傳RDM的重要意義,提高其對數據共享的認可度和RDM意識,營造良好的RDM氛圍;4)建立一套面向RDM支持人員的長效培訓激勵機制,促使其RDM服務能力提升,使其具備幫助研究人員完成機構和資助人RDM任務的專業能力和技能。
(3)開發培訓課程,整合培訓資源,提供RDM培訓
英國的RDM培訓大多由資助機構提供,我們可以借鑒此經驗,由數據中心牽頭組織開發RDM培訓課程:1)圍繞科學數據生命周期開發內容豐富的RDM培訓課程,課程設計應兼具實用性、互動性、協作性和系統性,課程模式可包含RDM課程的通識教育模式和針對學科領域的RDM課程教育模式,培訓內容應涵蓋RDM政策、基礎理論知識、案例模板、實踐技能等;2)編寫培訓材料、指南、操作手冊等指導性資料或者為用戶提供閱讀清單,可以以在線電子閱讀材料和紙質出版物的形式提供給用戶,方便用戶自學和重復使用;3)搜集并充分整合已有的培訓資源,避免重復開發造成的人力和物力浪費;4)考慮研究支持人員和研究人員等不同群體需求的區別,及時評估不同用戶的培訓需求和用戶不斷變化的需求,根據評估結果制訂相應的培訓方案;5)嘗試采用多種培訓方式如演示、在線學習模塊、活動、小組討論、案例研究、實踐操作等向用戶提供RDM培訓,還可以探索將RDM培訓課程嵌入圖書館學或信息科學等研究生課程中;6)建立培訓評估和效果反饋機制,采取問卷調查、定期組織RDM培訓研討會、舉辦年會等方式搜集培訓效果反饋信息,對當前的培訓方法、實踐方案、培訓效果等問題進行探討,總結經驗教訓,對存在的問題和不足及時調整和優化。
(4)研究機構和圖書館等責任主體加強機構合作,積極參與交流培訓
研究機構、圖書館等責任主體可以積極合作,探索將RDM培訓嵌入到繼續教育、高等教育中:1)高校等研究機構應重視RDM,引導本機構的研究人員、研究支持人員、信息管理人員等積極參與RDM培訓,提升其RDM意識和接受度;2)圖書館等RDM服務機構應充分認識自己在RDM中的角色和責任,提升本機構RDM整體服務能力,構建RDM服務人才培養機制,設立數據館員崗位,并為其制訂系統的培訓方案,提供培訓資源和業務交流機會,提升數據館員RDM專業素養和實踐技能;3)學院與圖書館積極合作,構建數據素養課程體系,面向研究生開設通識和學科化的數據素養教育課程或將RDM培訓嵌入科研項目,通過項目教育提升研究人員的RDM實踐能力;4)學院與圖書情報學院合作,設立數據管理專業,精心設計課程,培養數據專業人才;5)高校與數據中心等機構合作,以實踐為導向,設立RDM教育認證項目;6)RDM利益相關機構積極主動參與國際RDM合作與交流,學習國外先進培訓經驗。