許麗麗
(黑龍江大學圖書館 黑龍江哈爾濱 150080)
數據密集型科研新范式的發展,使科研數據管理成為科學研究與學術交流的重要部分。英國是最早實施E-Science計劃的國家,眾多學科數據中心擁有良好的數據管理傳統,在一系列資助機構政策和政府項目投資推動下,近年來英國高校的科研數據管理成效顯著。本文通過文獻調研和網絡調查,考察了英國高校科研數據管理的發展狀況,并在典型案例分析中,探討了其發展特點和路徑。
2001年,英國政府投資啟動了為期六年的“EScience 核心計劃”(E-Science Core Programme),旨在通過基礎設施和工具的建立,促進E-Science的廣泛應用。盡管數據管理并非“E-Science核心計劃”一期重點解決的問題,但在大型E-Science項目中數據管理的意義很快顯現。2003年,英國聯合信息系統委員會(Joint Information Systems Committee,JISC)發布了一項關于E-Science數據管理的報告,該報告指出 “英國尚缺乏政府層面的數據管理和數據基礎設施的全面戰略”,并提出了一系列發展國家數據能力的建議,重點是由JISC和“E-Science核心計劃”共同資助成立英國數據管理中心 (Digital Curation Centre,DCC),為英國高校的數據管理提供專門知識和建議。
英國對科研項目產出的數據管理已有多年歷史,只是數字化科研數據的增長進一步強化了數據管理與長期保存的需求。英國的多個研究理事會都投資建立了特定學科的數據中心,收集和保存資助項目的科研數據,使其能為后續研究所利用。如經濟與社會研究理事會 (ESRC)建立了英國數據存檔(UKDA)中心,藝術與人文研究理事會(AHRC)建立了虛擬藝術數據服務和歷史數據服務中心,自然環境研究理事會(NERC)建立了國家地理科學數據中心、大氣數據中心等多個數據中心。
NERC、ESRC和AHRC等設有數據中心的機構早在1996年至2000年間就相繼發布數據管理與共享政策。2004年,經濟合作與發展組織(OECD)成員國簽署《開放獲取公共資助科研數據的宣言》,并于2007年發布《開放獲取公共資助科研數據的原則和指南》。英國作為成員國之一,為響應OECD的政策,英國主要科研資助機構,包括惠康基金(Wellcome Trust)、研究信息網絡(RIN)及英國研究理事會的其他4個專業理事會均發布了數據管理政策。這些政策對其資助項目科研數據的管理、保存和獲取做出了明確要求,并將受資助者實際遵守情況作為今后是否給予資助的依據。
E-Science計劃的實施、國家數據管理機構的成立及科研資助機構數據管理與共享政策的發布,推動了英國高??蒲袛祿芾韺嵺`的迅速發展。英國相關機構基于高??蒲袛祿芾聿煌瑢用嫱顿Y啟動了多個項目,很多高校也結合自身特點就科研數據管理的實施進行了積極探索。
JISC作為英國非政府部門公共機構,為英國高等教育領域信息與通信技術的創新應用提供戰略指導、咨詢建議和資金支持。JISC資助了很多高??蒲袛祿芾淼南嚓P項目,本文選擇三個有代表性的項目加以介紹。
2.1.1 DISC-UK數據分享項目
DISC-UK數據分享項目 (DISC-UK DataShare project)于2007~2009年獲得JISC資助,由JISC投資建立在愛丁堡大學的EDINA國家學術數據中心,愛丁堡大學數據圖書館牽頭,與牛津大學和南安培大學共同建設。DISC-UK(Data Information Specialists Committee,英國數據信息專家委員會)是由英國數據館員和數據管理者所組成的聯盟,如英國高校圖書館和院系的數據支持專業人員,該項目是在這些數據專業人員的現有合作基礎上建立的。
DISC-UK數據分享項目的總體目標是在EScience技術應用、科研資助機構的政策要求、開放獲取運動發展等變化的信息環境下,探索高??蒲袛祿蚕淼男履J?、新流程與新工具。項目旨在通過高校數據支持人員和機構倉儲管理者的合作與知識交流,發展英國高校的分布式機構數據倉儲模式。三所大學分別基于不同的倉儲平臺,建立了機構數據倉儲及相關服務。其中,愛丁堡大學采取獨立的數據倉儲系統,并設計與該校的科研出版物倉儲實現互操作;而牛津大學和南安培大學則選擇與各自的科研出版物倉儲同一系統的建設方式。
2.1.2 數據審核框架項目
數據審核框架項目 (Data Audit Framework projects)于2008年獲得JISC資助,其目的是為英國高校掌握其擁有的數據及實際管理情況提供必要的審核工具,以推動高??蒲袛祿芾碚吲c實踐的發展。該項目共包括五個子項目,其中一個為總體的框架發展項目,由格拉斯哥大學人文先進技術與信息協會 (Humanities Advanced Technology and Information Institute,HATII)與DCC共同承擔,負責創建數據審核框架和在線工具;其余四個是框架實施項目,由愛丁堡大學、倫敦大學學院、帝國學院及皇家學院分別承擔,作為具體應用案例,檢測數據審核框架的有效性并促進其利用。該項目的主要產出是為高校核實所擁有的數據及評估其管理情況提供了一整套的方法、工具和實施指南,涉及前期規劃、數據識別與分類、數據管理評估、調查結果與建議等各個階段。
2.1.3 管理科研數據計劃
管理科研數據計劃 (Managing Research Data programme)是JISC資助的大型項目,共分兩期,分別包含若干子項目,旨在通過發展和支持科研數據管理來推進英國高校教學與科研。其中,一期項目為2009~2011年,包括科研數據管理基礎設施、科研數據管理計劃及其支持工具、科研數據引用、鏈接、整合與出版,以及科研數據管理培訓資料等多個項目系列。一期項目產生了很多重要的工具、技術和服務,并且針對若干學科領域發展了相應數據管理培訓材料。二期項目為2011~2013年,在一期項目成果基礎上,進一步提升英國高??蒲袛祿芾淼哪芰?。其核心是17個科研數據管理基礎設施項目,幫助高校建立或進一步發展數據管理基礎設施及支持服務,涉及發展本校的數據管理政策和實施路線、數據管理指導材料和培訓活動、項目進程中動態數據的管理和存儲系統、數據倉儲平臺及數據目錄等多個方面。
作為數字保存和數據管理的國家機構,DCC經歷了三個發展階段:一期活動主要是參與公眾和商業部門的項目活動,與國際組織、標準組織合作,開發數據管理工具;二期活動則更多地直接參與研究社區的相關活動;從第三期開始,DCC轉為針對高等教育機構開展專門服務,加強高等教育系統的數據管理能力和技能建設。
2011年,DCC由英國高等教育撥款委員會(HEFCE)的高?,F代化基金(Universities Modernisation Fund,UMF)資助,實施了為期兩年的機構參與計劃(Institutional Engagement programme)。該計劃通過與21所英國高校的密切合作,為其提供量身定制的服務和支持,以提高科研數據管理能力。DCC針對各參與機構的特定需求和重點,協助其開展一系列數據管理活動,從需求評估、制定政策和方案、提供培訓到開始實施一系列的數據管理服務。這21所參與機構涵蓋了各種高校類型,從而為英國各類高校的數據管理提供了最佳實踐案例。
愛丁堡大學科研數據管理的負責部門是其信息服務部。信息服務部包括愛丁堡大學數據圖書館和EDINA國家學術數據中心。愛丁堡大學通過DISCUK數據分享項目和數據審核框架實施項目建立了科研數據倉儲,并調查了本校研究人員的數據管理狀況和需求。在此基礎上,信息服務部于2009年建立數據管理指南網頁;數據圖書館嘗試為地理科學學院的博士生提供數據管理培訓課程,隨后又為研究生發展了通用的數據管理培訓。2011年制定并發布了英國高校第一科研數據管理政策,確認了研究人員和大學在數據管理中的責任。
為貫徹學校的科研數據管理政策,信息服務部的一個重要舉措是制定數據管理實施路線。該路線分為數據管理計劃、動態數據管理設施、數據管理工具與服務、數據管理支持4方面。其中,數據管理計劃部分是對科研數據收集之前的計劃制定提供支持和服務;動態數據管理設施是為科研活動使用中的數據提供存儲平臺和數據處理工具;數據管理工具與服務是對項目結束后數據產出的描述、存儲和提供獲取;數據管理支持就整個科研全程提供咨詢與支持服務,重點是為研究團體和專業人員提供定制化的培訓及嘗試深度數據管理咨詢服務。該路線對各個階段數據管理的目標、負責單位和行動措施都予以詳細規定,從而確保了該??蒲袛祿芾淼挠行崿F。
牛津大學依托于各類項目,發展了一系列數據管理設施和服務。在DISC-UK數據分享項目中,牛津大學圖書館利用Fedora平臺建立了Databank數據倉儲。2009年,牛津大學承擔了JISC管理科研數據計劃一期項目SUDAMIH (Supporting Data Management Infrastructure for the Humanities,支持人文學科數據管理基礎設施),發展了協助人文研究人員管理數據的軟件工具、培訓材料和課程。
為整合已有的數據管理基礎設施,牛津大學在2011年實施了Damaro(Data Management Roll-out at Oxford,牛津大學數據管理推出)項目,獲得JISC管理科研數據計劃二期項目資助。牛津大學實踐的重點是發展該??蒲袛祿a出的元數據目錄——Datafinder。Datafinder記錄牛津大學的所有科研數據,提供其所在位置(本地或大學外的系統)信息,并與該校的研究論文倉儲 (Oxford Research Archive,ORA)整合,ORA中的研究論文與Datafinder中對應的科研數據相互提供鏈接。牛津大學還為研究人員開發了在線科研數據庫服務(Online Research Database Service,ORDS)等數據處理和協作工具,研究項目結束或數據出版時,ORDS收集的元數據能自動在Datafinder創建記錄,使大學可以跟蹤研究人員的數據產出。
2011年,英國工程與物理科學研究理事會(EPSRC)發布了其科研數據政策框架,并對受資助機構提出了涉及數據管理和提供獲取的各個方面的9點預期。與之前其他資助機構政策不同,EPSRC將政策遵守的責任主體限定為機構而不只是研究者。EPSRC要求受資助機構制定明確的政策實施路線,2012年5月1日開始執行,2015年5月1日以前應完全符合預期要求,不遵守的機構將不再具備受資助資格。
應用科學和工程研究一直是巴斯大學的重點研究領域,EPSRC是其最主要的資助者。因此,巴斯大學科研數據管理的首要目標是確保滿足EPSRC關于科研數據的政策要求。巴斯大學科研數據工作組2011年獲得JISC二期管理科研數據計劃資助,實施了Research360項目。該項目的中心就是制定一個完全符合EPSRC預期的科研數據管理實施路線,并發展具體運作案例來支持其執行。工作組在調查巴斯大學科研數據現狀基礎上,對應EPSRC的9點預期,制定了包括22個目標和舉措的數據管理實施路線,規定了各目標實施和監督管理的責任單位。為確保這些目標的實現,工作組與查理比格里(Charles Beagrie)公司合作發展實際案例,借鑒其數據管理和數字保存成本/效益分析的豐富經驗,探討通過合理投資實現數據管理的可持續運作。
資助機構政策對英國高校的科研數據管理發揮了重要的驅動作用。英國研究理事會的七個專業理事會均要求在申請資助時要提交數據管理計劃,因而英國高校數據管理實踐的重點之一,就是根據本校需求發展數據管理計劃支持工具和相關指南。由于EPSRC的數據管理政策將政策遵守的責任限定到機構層面,且取得了更好的實施效果,包括巴斯大學在內的多所高校都積極發展數據管理路線和措施以符合EPSRC的要求。而這些政策得以有效貫徹實施,有賴于英國在科研數據管理基礎設施和服務上的大量公共投資。除JISC在科研數據管理項目上進行的重大投資外,英國研究理事會也支持將項目基金用于科研數據的管理和共享。
數據管理的最終目標是確保具有長期價值的數據能被獲取和重用。從機構層面上看,英國高校通過其科研數據倉儲和科研出版物倉儲的整合,以及科研數據元數據目錄的建設,實現科研數據與對應出版物的鏈接,促進科研數據的發現和獲取。從國家層面上看,英國擁有眾多的學科數據中心和不斷增長的機構數據倉儲,這些數據倉儲采用了不同的系統平臺和元數據標準,因而需要建立全國性的通用搜索網關,增加科研數據的可見度。為此,DCC在2013至2014年與英國數據存檔合作,完成了科研數據注冊(Research Data Registry,RDR)實驗項目。 RDR建立了英國高校和學科數據中心的科研數據注冊模型,并利用該模型測試收獲來自英國九個數據中心和九所大學數據倉儲的元數據記錄,從而提供統一的英國科研數據注冊和發現服務。
英國皇家學會在2012年發布的《科學是一個開放性的事業》報告中指出:“轉變將數據視為私人領域的研究文化對于實現科研開拓是非常必要的,這種變革需要大學、科研資助者、政府機構及學會等眾多利益相關者的參與合作”。英國高校在開展科研數據管理時,不僅實現了圖書館、IT部門、科研管理部門之間的內部合作,還積極與DCC等國家機構合作,尤其是與學科數據中心進行密切合作。例如,英國數據存檔作為英國最大的社會科學數據收藏機構,至今已有數十年歷史,在數據管理與共享方面積累了豐富經驗。英國數據存檔利用其專業知識和經驗,協助埃塞克斯大學建立數據倉儲和相關服務,實現了數據中心和機構數據倉儲的知識交流和共同發展。
英國高校在科研數據管理實踐中非常注重吸取國際經驗。巴斯大學等高校在發展數據管理實施路線時都參照了澳大利亞莫納什大學制定的科研數據管理戰略規劃。為促進全球范圍的科研數據共享與交流,推動數據驅動的科學創新和發現,歐盟、美國和澳大利亞等國的相關組織在2013年成立了科研數據聯盟 (Research Data Alliance,RDA),DCC和英國一些高校也積極參與該聯盟的活動。RDA致力于消除國際數據共享的障礙,加強科研數據的標準化。2014年,RDA元數據標準目錄工作組著手建立各學科科研數據的元數據標準目錄,以促進這些標準的應用,減少標準的重復研制。該項工作以DCC之前建設的學科元數據標準目錄為基礎,DCC和RDA圍繞標準目錄建設展開密切合作。
英國高校的科研數據管理,是在資助機構政策和政府項目投資的推動下,由DCC作為指導機構提供業務支持,在制定明確的機構數據管理政策和實施路線基礎上,以發展數據倉儲、數據管理規劃工具、數據管理培訓和指南為重點,實現科研數據管理的可持續運作。英國的實踐表明,高校要實現完善的科研數據管理,不僅僅依靠高校自身,更需要機構之間乃至國際之間的通力合作。
[1] McKnight S.Envisioning Future Academic Library Services[M].London:Facet Publishing,2010:145-168.
[2] Lord,P.,Macdonald A.E-Science Curation Report-Data Curation for e-Science in the UK:An Audit to Establish Requirements for Future Curation and Provision[R/OL].[2015-02-28].http://www.jisc.ac.uk/publications/reports/2003/escienc efinalreport.aspx.
[3] Ball A.,Ashley K.Show Me The Data:The Pilot UK Research Data Registry [J].International Journal of Digital Curation,2014,9(1):132–141.
[4] Jones S.Developments in research funder data policy[J].International Journal of Digital Curation,2012,7(1):114-125.
[5] DISC-UK DataShare project[EB/OL].[2015-02-28].http://www.disc-uk.org/datashare.html.
[6] Data Audit Framework project background[EB/OL].[2015-02-28].http://www.data-audit.eu/background.html.
[7] Data Audit Framework:Four steps to effective data management[EB/OL].[2015-02-28].http://www.data-audit.eu/methodology.html.
[8] JISCManaging Research Data Programme 2009-2011[EB/OL].[2015-02-28].http://www.jisc.ac.uk/whatwedo/programmes/mrd.aspx.
[9] JISCManaging Research Data Programme 2011-2013[EB/OL].[2015-02-28].http://www.jisc.ac.uk/whatwedo/programmes/di_researchmanagement/managingresearchdata.aspx.
[10] History of the DCC[EB/OL].[2015-02-28].http://www.dcc.ac.uk/about-us/history-dcc/history-dcc.
[11] DCCInstitutional Engagements[EB/OL].[2015-02-28].http://www.dcc.ac.uk/community/institutional-engagements.
[13] Macdonald S.,Martinez-Uribe L.Collaboration to Data Curation:Harnessing Institutional Expertise [J].New Review of Academic Librarianship,2010,16(S1):4-16.
[13] University of Edinburgh.Research Data Management Policy[EB/OL].[2015-02-28].http://www.ed.ac.uk/is/research-data-policy.
[14] University of Edinburgh.Research Data Management Roadmap [EB/OL].[2015-02-28].http://www.ed.ac.uk/schools-departments/information-services/about/strategy-planning/rdm-roadmap.
[15] Wilson J.SUDAMIH final report[R/OL].[2015-02-28].http://sudamih.oucs.ox.ac.uk/docs/Sudamih_FinalReport_v1.0.pdf.
[16] Wilson J.,Jeffreys P.Towards a Unified University Infrastructure:The Data Management Roll-Out at the University of Oxford[J].International Journal of Digital Curation,2013,8(2):235-246.
[17] EPSRCPolicy framework on research data[EB/OL].[2015-02-28].http://www.epsrc.ac.uk/about/standards/researchdata/.
[18] EPSRC’s expectations[EB/OL].[2015-02-28].http://www.epsrc.ac.uk/about/standards/researchdata/expectations/.
[19] Pink C.Meeting the Data Management Compliance Challenge:Funder Expectations&Institutional Reality[J].International Journal of Digital Curation,2013,8(2):157-171.
[20] Royal Society.Science as an open enterprise[R/OL].[2015-02-28].http://royalsociety.org/policy/projects/science-publicenterprise/report/.
[21] Ensom T.Harnessing Data Centre Expertise to Drive Forward Institutional Research Data Management:A Case Study from the University of Essex[EB/OL].[2015-02-28].http://ukdataservice.ac.uk/media/212749/te_rde_iassist2013.pdf.
[22] Research Data Alliance[EB/OL].[2015-02-28].https://rd-alliance.org/about.html.
[23] Ball A.,Chen S.Building a Disciplinary Metadata Standards Directory[J].International Journal of Digital Curation,2014,9(1):142-151.