999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

全球科研范式變革下的圖書館科學數據管理服務創新——基于數據管理生命周期的視角

2019-06-14 08:00:42張培風張連分河海大學公共管理學院石家莊郵電職業技術學院圖書館
圖書館理論與實踐 2019年5期
關鍵詞:科學圖書館服務

張培風,張連分(.河海大學公共管理學院;.石家莊郵電職業技術學院圖書館)

21世紀以來,許多大學、圖書館組織、科學數據中心和科研資助機構聯合起來,深入開展了科研數據生命周期研究,建立了多種數據生命周期描述模型,如OAIS功能模型(Reference Model for an Open Archive Information System)、DDI(Data Documentation Initiative)數據生命周期模型、DataONE(Data Observation NetworkforEarth)數據生命周期模型。這些模型在國際上得到了廣泛應用,已經成為開展數據管理服務的國際標準或規范。

1 全球科研范式變革對科學數據管理的迫切要求

1.1 全球科研范式變革的特點和要求

幾千年來,人類科學研究經歷了經驗范式、理論歸納范式、計算模擬范式三大階段,近年來正在形成數據密集型范式,又稱第四范式。[1]19第四范式的首要特點是科研數據量大、數據處理成本高。幾個世紀以來的科學史表明,世界科研產出量呈加速增長的趨勢。從17世紀中期到18世紀中期,世界科研產出量每年增加不到1%;18世紀中期到二戰前,每年增加約2-3%;二戰后至2012年,每年增加約8-9%,大概每9年就會翻一番。[2]特別是天文觀測、實驗物理、基因測序這樣的“大數據”學科,科學數據大約每年翻一番。[3]2016年,歐洲核子研究組織的大型粒子對撞機所產生的數據量甚至比2015年翻了5倍。[4]科研人員撞到了強大的數據墻,數據處理和分析占據了科研人員很大精力,一般占到實驗成本的1/4到1/2。科研人員在獲得原始數據之后,往往需要成千上萬人編寫幾百萬行代碼用于處理數據,耗費了大量人力物力。[1]20第四范式的第二個重要特點是要求科研成果具備基于數據的可復制性。可復制性是現代科研的重要特征,好的數據管理是實現成果可復制的關鍵。研究人員應當在整個研究周期內做好數據管理,收集好研究數據,并詳細記錄數據生成的流程和細節,使他人能夠按照研究流程重新得到結果,提高科研的公信力。第四范式的第三個重要特點是科研數據可共享。數據是現在研究的終點也是將來研究的起點。保存好數據,保證數據可分享,能夠幫助研究人員獲得新的發現,推動研究不斷深入,這樣才會提高科研成果的社會價值,提升科研的效率和效益。

1.2 國家科研資助機構的政策要求

近年來,為適應數據密集型科研范式的時代要求,許多國家的科研資助機構都制定了學術數據管理政策,將數據管理計劃和數據共享作為申請科研資助的必要條件。美國國家科學基金、國家醫學基金、國家人文科學基金都對數據管理提出了明確的政策要求。美國國家科學基金會(National Science Foundation,NSF)規定,基金申請人必須提供數據管理計劃,說明如何保存和管理科研數據,必須遵守相關數據分享政策;美國國家醫學科學院(National Institute of Health,NIH)規定,申請50萬美元以上的研究項目要提供數據分享計劃,產生大量數據的基因研究項目無論資助額大小都要向后續項目開放分享數據;美國國家人文科學基金會(National Endowment for the Humanities,NEH)要求立項申請書中必須包括數據管理計劃,獲獎申請書中也必須包括數據管理計劃。[5]英國研究理事會(Research Councils UK,RCUK)和英國威康信托基金會(Wellcome Trust)已經出臺了多項數據管理政策,鼓勵研究人員盡可能快地以盡可能小的限制公開他們的科研數據。英國研究理事會下設的工程和物理科學研究理事會(The Engineering and Physical Sciences Research Council,EPSRC)著重對研究機構提出了數據分享責任,要求它們在全部數據生命周期上至少提供十年的數據管理服務。[6]加拿大也針對聯邦資助的科研項目制定了數據管理政策。2015年,加拿大衛生研究院(Canadian Institutes of Health Research,CIHR)、加拿大自然科學和工程研究理事會(Natural Sciences and Engineering Research Council of Canada,NSERC)、加拿大社會人文科學研究理事會(Social Sciences and Humanities Research Council of Canada,SSHRC)三大國家科研資助機構,出臺了關于數據管理原則的草案。該草案明確了研究者、研究機構、資助者的相關責任,支持最大限度地開放政府資助項目數據,要求制定數據管理計劃,實現數據公開分享。[7]2018年3月,我國政府順應數據密集科學潮流,汲取國外開展科學數據管理的經驗,為了進一步加強和規范科學數據管理、保障科學數據安全、提高開放共享水平,更好地支撐國家科技創新、經濟社會發展和國家安全,頒布了《科學數據管理辦法》(以下簡稱《辦法》)?!掇k法》按照分級管理、安全可控、充分利用的原則,明確了主管部門、法人單位、科學數據中心三級責任主體,制定了科學數據采集、匯交與保存的管理流程及分級分類共享利用科學數據的方式,提出了加強科學數據全生命周期安全管理的要求。從此,我國有了國家層面的科學數據管理的政策制度。[8]

1.3 學術期刊對數據管理的要求

除了科研資助機構對數據管理的要求之外,學術期刊也對論文作者提出了數據管理要求。[9]其主要目的有3個:① 保證論文成果的可復制性,可復制性是科研的重要特征,而數據是實現科研成果可復制的基礎;② 對研究數據進行更嚴格的審查,防止有問題的論文的發表,并確保隨后的任何撤回更容易識別和解決,從而提高期刊的質量和聲譽;③ 促進科研成果交流和數據共享,保證科技創新的連續性。學術期刊數據共享的要求主要有兩類。一種是將數據開放共享作為論文發表的必要條件,科學數據以附錄等形式與論文一同發表。如,《美國政治科學評論》()雜志要求作者提供數據文檔,充分詳細地描述研究分析流程,便于讀者了解評價科研成果的來龍去脈。另一種只要求作者提供科學數據,用于同行評審,但不要求隨同論文發表數據,《科學》《自然》等國際期刊則屬于這種情況。學術期刊數據開放共享的方式主要有兩種:一是僅要求標明數據的出處,使讀者能夠訪問相關數據;二是要求將數據存儲到特定的數據存儲庫。如,英國倫敦動物學會出版的期刊《動物保護》( )規定,在該刊發布的DNA數據必須存儲到EMBL、Gen-Bank、DDBJ三大核苷酸數據庫之一,作者必須在論文中公布基因序列號,允許公開查詢。[10]

2 國內外理論研究和實踐概述

2.1 國內外理論研究概述

國外發達國家的圖書館、圖書館協會和國際性圖書館組織,對圖書館在數據管理服務中的地位和作用、圖書館數據管理服務與數據生命周期的關系、圖書館數據管理能力建設等方面進行了深入系統研究。① 圖書館在科研數據管理中的地位。2013年,聯機計算機圖書館中心(Online ComputerLibrary Center,OCLC)發表報告,2015年美國圖書館與信息資源理事會 (Council on Library and Information Resources,CLIR)發布報告,都對圖書館在科研數據管理中的地位進行了系統研究,認為圖書館是科研數據管理的重要相關方和關鍵角色,能夠發揮協調和領導作用。這是因為圖書館在科研數據管理體系中居于一個獨特位置。其他相關方包括大學管理者、研究者、科研資助者都有自己機構的利益訴求,唯獨圖書館不但沒有特殊利益訴求,而且擁有與其他各相關方的同等密切聯系,長期以來為用戶服務,積累了豐富的信息管理的專業知識和經驗,從而處于一個十分有利的核心位置。[11-12]② 圖書館數據管理服務與數據生命周期的關系。2013年,美國博物館和圖書館服務研究所 (Institute of Museum and Library Services,IMLS)發布報告,對全球主要的十種數據管理生命周期模型進行了歸納總結,用于指導圖書館數據管理服務。[13]按照美國大學與研究圖書館協會(AssociationofCollege&Research Libraries,ACRL)所發布的白皮書,圖書館等機構提供的科研數據管理服務是處理完整數據生命周期的服務。[14]科學家只能計劃、收集、分析他們的數據,而圖書館則要基于生命周期開展服務,包括利用元數據描述數據、實現長久和安全的數據存儲、組織數據以便于發現、支持數據整合和再利用等。[15]③ 圖書館數據管理能力建設。數據管理服務是一項前所未有的創新,將推動圖書館建立新的信息基礎設施,形成新的業務模式,產生新的能力素質和人才需求。國際圖書館界對圖書館的數據管理能力建設進行了不斷研究探索,其中,美國研究圖書館協會 (Association of Research Library,ARL)、加拿大研究圖書館協會(Canadian Association of Research Libraries,CARL)、歐洲研究圖書館協會(Association of European Research Libraries,LIBER)以及國際開放存取庫聯盟(Confederation of Open Access Repositories,COAR)四大組織聯合開展的研究項目最具代表性。2013年8月,這四大組織建立了一個聯合工作組,研究數據密集型科研范式下圖書館職能的拓展,以及職能變化對館員能力的新要求。該工作組于2016年發布了研究報告,針對圖書館在數據管理服務領域的三大職能,提出了相應的能力素質框架,[16]成為國際圖書館界開展數據管理能力建設的指南。

近年來,我國學者從數據生命周期的視角開展了一些關于科學數據管理的研究,其側重點包括數據生命周期模型的比較研究、數據共享政策研究、圖書館的角色定位研究等方面。楊林等對7個科學數據管理生命周期模型的研制機構、適用范圍、結構特點、構成要素、應用實踐等方面進行了分析與比較。[17]丁寧等按照不同維度對科學數據生命周期模型的類型進行了劃分,并總結了高??茖W數據生命周期管理框架。[18]魏悅等對美、英、澳等國高校的科學數據管理政策進行了深入分析,總結出數據訪問、數據組織、數據保存、數據共享和數據安全五個方面的政策內容,并以此為基礎,提出了我國高??茖W數據管理政策內容框架。[19]史艷芬等認為圖書館應將“科學數據管理生命周期”過程嵌入服務,承擔科學數據管理協調者、元數據組織和管理機構、科學數據長期保存機構、數據質量監控者、數據信息素養培訓機構五大角色。[20]吳建中認為大學圖書館正在向數字化和合作交流轉型,以藏書為核心的傳統圖書館已經逐漸被以知識和數據為核心的現代圖書館所取代;現代圖書館是知識連接器,圍繞“數據”開展各種服務,將大學與區域、與世界連接起來。[21]顧立平認為圖書館應當基于公益服務屬性,扮演居中協調的角色,與各方利益相關者合作,建立良好的數據治理生態體系,管理好各學科不同載體的知識內容,確保數據重用以及長期保存,促進數據加值,保障數據獲取和數據重用的公益性質。[22]

2.2 國內外圖書館數據管理服務實踐活動概述

數據密集型科研范式的興起和公共科研資助機構的政策要求,激勵圖書館開展數據管理服務,以適應深刻變化的科研需求。全球開展數據管理業務的圖書館越來越多,圖書館的業務重點逐漸從傳統業務轉移到數據業務,并從文獻計量服務向數據管理服務深化。ARL于2010年面向57家會員館做了一項調查,發現其中有21家圖書館已經建立了信息基礎設施并面向數據密集型科研提供服務,約占37%。[23]2013年,邢文明等對世界排名前50的高校圖書館進行了網上調查,發現其中26所高校圖書館開展了科研數據服務,約占52%。[24]2015年,ARL面向124家會員館進行調查,發現其中70%以上的圖書館擁有數字資源庫等信息基礎設施,并提供數據存儲、數據管理計劃、信息傳送咨詢、最佳實踐咨詢等服務。[9]由此看來,圖書館正在加速從以圖書為主體向以科研數據管理和知識發現為中心轉型。

國內學者重點對國外高校圖書館開展科學數據管理服務的實踐進行了研究,總結了國外高校圖書館開展科學數據管理服務的基礎設施、服務內容、工作機構等方面的實踐經驗。尹春曉對英國、美國、澳大利亞三國高??茖W數據管理服務進行調研發現,國外高校科學地建立了信息基礎設施,依據數據管理政策、基于科學數據生命周期提供全程式服務,普遍提供科學數據管理教育培訓服務、數據參考咨詢服務。在開展科學數據管理服務過程中,圖書館與校內不同部門開展了合作,圖書館內部設置了數據管理部門和崗位。[25]張新興開展了大量的文獻調研發現,國外高??茖W數據管理平臺均為開放獲取平臺,訪問不受時間和IP限制,并且資源豐富、功能完善。國內平臺數量很少,功能相對簡單,有些平臺還需要通過申請方能使用數據。[26]國外高校的科學數據服務是一種廣義的科學數據服務,是圍繞科學數據實施的一系列的數據管理、研究、利用活動,還有待向更高層次的數據分析、知識組織和知識發現服務躍升。胡雪環、陳麗君、司莉、王娟等國內學者對美國普渡大學、霍普金斯大學等高校的科學數據管理實踐進行了多方面研究發現,這些高校建立了科學數據中心,根據本校學科專長開發了具體的服務項目,所提供的科學數據管理內容主要包括數據收集、數據保存、數據使用、數據管理與維護等,并為用戶提供數據管理計劃、數據管理教育培訓、數據管理政策等服務。[27-30]

2.3 需要進一步研究的問題

在理論研究方面,目前國內外學者的研究主要集中在對生命周期模型的對比分析方面,比較系統地闡述了模型的分類、結構、構成要素等,但是尚未深入提煉出全生命周期科學數據管理的基本要求;在實踐研究方面,目前國內學者側重于對國外高??茖W數據管理實踐經驗的總結提煉,但是對成功實踐背后的原因揭示不夠深刻,尚未給出全生命周期科學數據管理的實現方式。因此,還需要從以下兩個方面加強研究:一是要進一步研究全生命周期科學數據管理的基本流程和要求,明確圖書館開展科學數據管理服務的著力點;二是要進一步研究圖書館開展科學數據管理服務的方式,理清圖書館開展全生命周期科學數據管理服務的技術平臺和協作方式。

3 全生命周期科學數據管理服務流程和要求

3.1 全生命周期科學數據管理服務流程

地球觀測衛星委員會(Committee on Earth Observation Satellites,CEOS)的信息系統與服務工作小組(Working Group on Information Systems and Services,WGISS)于2012年4月發布了調研報告,梳理出55個科學數據管理生命周期模型。從研制主體的維度來看,最高層次為國際標準模型,其次為國家科學數據中心的模型,再次為高校等法人單位的工作模型。經過多年的應用和發展,OAIS功能模型、DDI數據管理生命周期模型、DataONE數據管理生命周期模型等已經成為國際標準或規范,它們反映了數據運行的基本規律,在國際上得到了廣泛應用,是其他層次的數據管理生命周期模型的編制依據和重要參考。本文主要以這三大模型為研究對象,分析其特點、異同點、適用性,揭示全生命周期科學數據管理的基本流程和要求。

3.1.1 適用于數字資源庫的OAIS功能模型

為了解決數字信息長期保存問題,國際標準化組織授權國際空間數據系統咨詢委員會開發空間領域的數字信息歸檔標準。該委員會采取開放方式創建標準,吸引了政府、企業和學術界眾多機構的參與。2003年,國際空間數據系統咨詢委員會開發的OAIS參考模型正式發布為國際標準(ISO14721)。[31]此后,在OAIS參考模型的基礎上,研究圖書館集團(Research Library Group,RLG)和 OCLC合作研制了《支持數字對象保存的元數據框架》,對OAIS的信息模型作了進一步拓展,提供了描述性信息的結構體系。RLG還和美國國家檔案記錄管理局合作,以OAIS參考模型為依據,開展數字資源庫認證規范的研究,于2013年發布ISO國際標準《可信性數字資源庫審核與認證》極大地提高了OAIS參考模型的適用性和影響力。[32]OAIS參考模型主要由功能模型、信息模型、信息包轉換三部分組成,其中功能模型對數據生命周期進行了系統描述,分為保存計劃、數據收集、數據保存、數據管理、訪問管理、行政管理6個功能模塊。

3.1.2 適用于社會科學的DDI數據生命周期模型

DDI是為描述社會科學研究數據而建立的國際元數據標準。它由美國校際政治及社會研究聯盟發起,獲得了NSF的資助,于2000年首次發布DDI標準,現在已經形成了DDI系列標準。2003年建立DDI聯盟,至2016年在全球擁有40個成員機構,包括世界銀行發展數據中心、歐盟統計局、諸多世界一流大學,以及國家級有影響力的數據資源管理機構。[33-34]DDI把數據生命周期分為研究概念、數據收集、數據處理、數據存儲、數據發送、數據公布、數據分析、數據再利用8個階段。DDI數據生命周期不是一個線性模型,而是一個循環模型。在研究概念、數據收集、數據處理這三個步驟中,建立和遵循一套初始概念體系,據此所創建的數據集直接傳送給用戶或者通過數據資源庫間接傳送給用戶;而數據再利用階段則根據新的應用場景調整了變量、關聯關系等要素,形成新的數據概念框架,創建新的數據集,再傳送給用戶。[35]

3.1.3 適用于“大數據”學科的DataONE數據生命周期模型

DataONE是由新墨西哥州大學主持開發的,項目獲得了NSF的資助,其使命是通過廣泛存取地球生態和環境科學數據促進新的科學知識的創造。這是由于地球生態和環境科學具有跨學科特征,涉及地理學、天文學、生物學、生態學、環境科學等多種學科領域,具有開展廣泛數據管理協作的迫切需要。[36]2009年,DataONE在NSF等機構資助下開始建設,2014年又獲得了二期資助,目前已經形成向全球用戶提供服務的數據協作網絡。其組織架構分為兩個層次:一是協作節點,由核心信息基礎設施團隊直接管理,負責全網管理,維護全網健康運行;二是會員節點,由當地組織機構負責管理,負責當地的數據存儲、數據檢索、訪問控制、元數據質量控制、本節點與其他節點之間的數據復制、用戶主界面維護等業務。[37]地球觀測數據網基于NSF所提供的數據生命周期模型而構建,是其開發工具、提供服務、開展培訓的基本架構。DataONE數據生命周期模型包括8個階段,分別是數據管理計劃、數據收集、數據核查、數據描述、數據保存、數據發現、數據整合、數據分析。數據沿著生命周期的8個步驟運行,以編制數據管理計劃為起點,從而創造新的科學知識。但并不是所有的研究活動都經過全部周期,許多只是經歷周期的部分階段。如,對以往不同研究成果的數據進行綜合分析的元分析項目,只側重于數據發現、整合、分析等步驟。

以上三種模型除結構差別外,在構成要素上也有異同。其共同要素包括數據管理計劃、數據收集、數據處理、數據保存、數據發送、數據分析、數據發現等。但是每種模型相應流程要素的涵義不盡相同:OAIS功能模型突出了數據庫管理功能,這是和數據存儲庫服務相適應的;DDI數據管理生命周期則突出了概念框架設計,這是為了適應社會調查及其數據管理特點,同時還建立具有自身特色的數據再利用環節,體現了利用科學數據發現新知識的目的和要求;而DataONE數據生命周期模型則特別加強了數據處理環節,將這個環節拓展為數據核查、數據整合、數據標引等操作,使大規模數據處理能力得到加強。

3.2 全生命周期科學數據管理服務基本要求

通過對各類數據管理模型的深入研究發現,全生命周期科學數據管理是全體系、全流程、全要素的管理,需要各相關方密切協同,使數據規范一致和安全合規,從而實現數據可用性高、可回溯性強、交換方便、檢索便利的管理目標。

3.2.1 全部相關方密切協作

科學數據管理涉及數據生產者、消費者、管理者等相關方。按照研制主體又分為多個層次,一般包括法人單位、科學數據中心、國際數據管理網。其中,法人單位主要指科研院所、高等院校、企業等從事數據密集科研的單位,其內部又要求各二級單位的協同。內部各相關方密切協作開展數據管理服務,保證服務順利通達、系統正常運轉、數據安全保密、管理規范有序。在法人單位內部協作網之上,還有國際數據管理網。如,DataONE目前已經形成向全球用戶提供服務的數據協作網絡。

3.2.2 全體系協同

科學數據管理是一個完整體系,包括數據管理政策、數據存儲庫系統、數據管理活動等。其中,數據管理政策包括國家科研資助機構政策、科技期刊政策、法人單位政策等,主要對數據開放共享、知識產權授權、隱私保護等方面做出要求和規定。數據存儲庫系統是科學數據管理的信息基礎設施,主要提供唯一數據標識碼、元數據創建和轉換、數據存儲等方面的技術支持功能,并實現分布式數據管理協同。數據管理活動依據科研過程而開展,貫穿全生命周期,主要包括科學數據采集生產、加工整理、開放共享和管理使用等活動。數據管理政策是科學數據管理的頂層設計和運行規則,數據存儲庫是科學數據管理的技術平臺,各項科學數據管理活動按照政策要求在數據存儲庫平臺上有序運作。

3.2.3 數據運行全程留痕

基于全生命周期的管理方式對數據轉化全程留痕,完整保存生產者的初始數據文件、管理者的存檔文件、消費者的分發文件,記錄各類數據文件之間的關系,可以實現不同數據版本的回溯和重用,[38]從而保證數據的完整性和可靠性。這是全生命周期科學數據管理的重要特征,針對數據管理的不同階段,建立相應的數據文檔。不同階段的文檔采用特定的描述元數據和封裝方法,數據屬性、數據差別、數據關聯等一目了然,數據進化路徑清晰可見。

3.2.4 全生命周期安全管理

① 數據安全是全流程的安全。要在數據管理計劃中詳細設計各項安全要求和措施,再按照計劃安排和要求,在數據輸入、數據處理、數據訪問等環節一一落實。② 數據安全是全體系的安全。要明確各方面的安全責任,建立互相監督和制約機制,全部數據管理相關方都要嚴格遵守規定、履行安全職責。③數據安全是全要素的安全。需要綜合考慮數據內容、硬件設備、管理規范、法律法規等多個方面的安全問題,既要采取數據加密、電源備份、數據備份、病毒防護和入侵者防護等有效技術措施,也要落實各項保護數據安全的法律措施,制定安全管理規范,從而有效保護數據完整、數據機密、知識產權和隱私權。

3.2.5 全生命周期數據交換

① 結構一致的數據便于數據交換。如,OAIS參考模型的提交信息包、存檔信息包、分發信息包3種數據集具有規范的數據結構,能夠在不同系統、平臺之間交換和遷移,可以被不同用戶、多種終端訪問。② 標準化的元數據能夠提高數據可用性。如,DDI標準用可擴展標記語言(Extensible Markup Language,XML)來標記數據內容,以ASCII碼為內核,提供開放格式而非私有格式數據,能夠一直保持可用性。[39]標準化的元數據集可以在數據生命周期內重復使用,能夠有效降低數據管理成本。③ 按照生命周期模型創建的多種數據存儲庫產品,能夠共享元數據要素、識別數據結構,便利于同一標準下不同存儲庫之間的數據交換和共享,實現分布式網絡化數據管理協作。[40]

3.3 圖書館開展全生命周期科學數據管理服務的著力點

面對數據密集型科研范式的興起,研究人員在數據管理計劃、數據保存、數據共享等數據生命周期的重要階段面臨著越來越多、越來越復雜的困難和問題,急需專業人員提供幫助,實現與新的科研范式的對接,以便提高科研效率和效益,并滿足國家、機構、出版者等層面對科研數據管理的規定和要求。在科研數據生命周期諸多階段中,數據管理計劃、數據存儲、數據分享這三個階段是圖書館提供數據管理服務的著力點。圖書館可以在其中發揮聯系和服務用戶的作用,成為數據資源的富集地、數據服務和技術支持的聯系點、數據管理培訓和指導服務的提供者。

3.3.1 提供數據管理計劃服務

提供數據管理計劃相關服務是圖書館的第一個著力點。數據管理計劃是一份正式文檔,用以說明研究者在項目研究過程中和項目完成之后如何處理科研數據。它為科研數據管理工作提供了藍圖,明確了數據管理流程和要點,改變了數據管理的無計劃狀態,可以有效避免數據丟失、混亂等問題,實現數據管理的規范化、流程化,保證數據質量和可復用性。同時,數據管理計劃還是一份動態文件。由于科研是一種創造性活動,有時需要改變路徑、調整進度,數據管理計劃也應當隨著科研節奏和方向的調整而調整,只有這樣才能保證數據管理計劃的科學性和實用性,真正發揮作用。根據一些國家的實踐,圖書館可以在四個方面為用戶提供數據管理計劃服務。① 在線提供本國政策指導。不同國家的科研資助機構都有自己的數據管理計劃編制要求,美國、澳大利亞、英國等國家的諸多學術圖書館都在線列舉和詳細說明了本國國家科研基金和相關科研協作機構的數據管理計劃政策,供本單位研究人員了解遵循。② 在線提供外部參考資源。主要是收集整理國外的科研資助機構、大學和研究機構的資料,提供國外的數據管理計劃要求和數據管理計劃制作資料,供本單位的研究者參考。③在線提供模版工具。收集整理各級各類公共科研基金、各類學會、本機構、其他研究機構的數據管理計劃模版,供本單位的研究者參考。④ 線下開展培訓和指導。圖書館員與研究人員成立開放式的研習會,共同針對相關主題的數據管理計劃進行溝通研討,就數據管理計劃提供針對性的培訓指導。

3.3.2 提供數據存儲服務

數據存儲是圖書館開展數據管理服務的第二個著力點。這項工作由圖書館與本機構的科研管理部門、信息技術中心等協作開發和運作。數據存儲服務主要包括保存、備份、長期保存三項重要內容。① 保存數據。這項功能既能實現數據存儲,也能做到數據備份,還可以開展數據共享。② 備份數據。主要防止因電腦損壞、重裝系統等原因導致數據丟失,保證數據安全,但是不能共享數據。③ 長期保存數據。這項服務為研究人員提供永久賬號,能夠實現不同時期數據版本的永久保存和安全備份,克服短期保存和備份的缺陷。所有這些數據存儲服務都要依賴數據存儲系統來提供,一般有以下四種存儲系統。① 高校和研究機構自主運行的系統。一些高?;蜓芯繖C構自主開發數據管理系統來提供長久保存服務,服務范圍往往限于單位內部。如,斯坦福大學圖書館開發的數據資源庫系統不會因為員工離職等原因而注銷賬號,可以永久訪問賬號的研究數據,能夠實現數據的長久保存、共享和分析。② 高?;蜓芯繖C構統一購買存儲服務,免費提供給二級部門、員工和學生使用。③ 高校師生或研究機構的員工自費購買商業存儲服務。④ 資助機構和期刊社等規定存儲的數據庫。

3.3.3 提供數據分享服務

數據分享是圖書館開展數據管理服務的第三個著力點??蒲谐晒麛祿茄芯空邔ι鐣莫毺刎暙I,只有通過一定方式與他人分享才能發揮作用并得到社會的認可。數據分享有助于推動將來的科學研究和獲得新的科學發現。在數據分享方面圖書館可以為研究者提供以下服務。① 作為數據管理服務的綜合聯系點,圖書館為用戶提供各類數據資源庫的入口,搭建數據生產者和消費者之間的橋梁,實現數據資源傳送和再利用。② 在線提供數據分享政策。國家科研資助機構對所支持項目的科研成果有分享政策,要求項目成果出版物和電子化數據必須在國內分享,以促進本國企業和實體提高創新能力和競爭力,推動國家經濟發展。圖書館可以比較全面地收集整理國家科研資助機構對數據分享的政策要求,在線提供給研究者遵循,有利于提高科研項目的社會效益。③ 幫助用戶理清數據訪問限制。圖書館可以在線提供國家關于知識產權保護、隱私保護、科研倫理等方面的法規和政策,了解用戶的知識產權和隱私保護要求,幫助用戶對敏感數據實行限制存取控制,從而保護科研數據安全和個人隱私。④ 在線提供元數據工具。元數據是用以揭示科研數據屬性的描述性信息,有利于數據生產者和使用者對科研數據達成一致性認知,是實現科研數據準確檢索和有效利用的重要基礎。圖書館的工作重點是收集提供各種元數據工具,幫助研究者選擇控制詞用于生成各種結構化的元數據,以揭示內容數據的屬性。⑤ 提供人工咨詢和培訓。圖書館的數據館員可以根據用戶需求提供比較集中的培訓和研習,幫助用戶掌握數據分享政策、數據保護要求以及數據發現方法等知識和技能。

4 全生命周期科學數據管理服務的實現方式

為了探索全生命周期科學數據管理服務的實現路徑和方式,需要對國內外的實踐經驗進行深入研究,以便獲得有價值的信息。本文甄別選取了麻省理工大學、哈佛大學、斯坦福大學、牛津大學、劍橋大學五所大學圖書館作為研究對象;同時,選取北京大學圖書館、復旦大學圖書館[41]作為研究對象,它們是國內正式開展科學數據管理服務的大學圖書館,其實踐經驗也具有較大的參考價值。通過對國內外一流大學圖書館的深入研究發現,構建數據平臺、建立組織體系、參加國際協作、提升人力資源等是實現全生命周期科學數據管理的關鍵問題。其中,數據平臺從技術上將資源整合起來,有效的組織體系把各部門協同起來,加入國際數據網絡促進了國際合作,人力資源發展提供了人才保障。通過技術保障、組織保障、人才保障和國際協作,實現了全體系、全要素、全流程、國際化的科學數據管理協同,使高校圖書館具備全生命周期科學數據管理能力,從而能夠為科研人員提供高質量的數據管理服務和數據產品。

4.1 建立數據管理服務綜合平臺

本文調研的7所大學圖書館都開辦了專門的數據管理服務網站,擁有數據存儲庫系統(見下表)。其中,國外的5所大學圖書館建成了數據管理綜合平臺,按照全生命周期科學數據管理的要求,提供數據管理計劃、數據收集、數據處理、數據保存、數據發送、數據分析、數據發現等全流程服務,提供數據管理教育、專家咨詢等延伸服務。不僅擁有自己的數據存儲庫系統和數據備份存儲系統,還提供第三方云存儲、云計算服務接口;不僅提供本單位的數據管理政策,還提供國家科研資助機構的政策要求和數據管理計劃模板。總的來看,技術支持有力、功能全面、服務內容豐富。從國內來看,北京大學圖書館和復旦大學圖書館都引進了麻省理工大學和哈佛大學聯合開發的 DataVerse數據存儲庫系統,主要提供數據收集、數據處理、數據存儲、數據發現等服務,服務功能比較單一,許多重要的數據管理服務尚未提供。通過對比,筆者認為國內高校應當建立科學數據管理服務綜合平臺,提供全生命周期服務,這是我國科學數據管理服務的發展方向。

表 一流大學圖書館開展科學數據管理服務的技術平臺

4.2 構建科學數據管理協作組織體系

為了做好全生命周期科學數據管理工作,必須加強各部門協同,發揮各自專業特長,明確職責分工,形成全面服務能力。為了實現各部門的相互協同,需要建立相應的組織體系,實現各部門的信息溝通、任務分配和工作落實。實現部門協同的方法路徑主要有兩條,一是整合各相關部門的功能和資源,建立矩陣型數據管理小組;二是以圖書館為主導,建立數據管理服務協同網絡,各部門協力提供數據管理服務。

(1)建立矩陣型數據管理小組。矩陣型數據管理小組是在一個大學垂直式職能組織形態下,為開展數據管理服務,另外成立的橫向聯合的專案小組。此專案小組與原組織配合,呈現行列交叉的形式,所以稱為矩陣型組織。[42]牛津大學是建立矩陣型數據管理小組的代表。牛津大學成立科學數據管理服務組來提供數據管理服務,其成員來自牛津大學博德利圖書館、電子化科研中心、信息技術服務中心、科研服務中心等相關部門??茖W數據管理服務組每月開一次會,共同研究處理科學數據管理相關問題,重點是發展運行牛津大學科學數據管理服務網站??茖W數據管理服務組著眼于為研究者提供全程的支持和服務,幫助他們在科研項目申請階段編制數據管理計劃,在科研項目的整個生命周期內處理數據,在項目完成后實現數據長久保存。

(2)構建圖書館主導的數據管理服務協同網絡。全生命周期的數據管理服務是一項極其復雜的工程,需要大學內部各相關部門大力協同,組建數據管理服務協同網絡。這是一個基于任務分解的組織協同網絡。其主要任務是提供全生命周期的科學數據管理服務。協同網絡包括核心組織和協同組織,圖書館通過數據管理平臺分發工作任務,協同組織基于自身的專業優勢和職責要求,響應用戶需求,完成相應的科學數據管理任務。[43]哈佛大學圖書館是校內研究者尋求數據服務和技術支持的綜合聯系點,它與負責科研的副教務長辦公室、負責信息安全的信息技術學院、負責數據存儲庫開發和運維的定量社會科學研究所、負責教育培訓和專家咨詢的哈佛大學文理學院等密切協作,支持研究者進行數據組織、處理、存儲、分享等活動,滿足科研基金、出版社、哈佛大學等層面對數據管理的政策要求。

4.3 開展國際科學數據管理合作

科學數據管理國際化合作的重點有兩個,一是與國際標準接軌,二是申請加入相應的國際網絡。目前,世界范圍內已經形成了OAIS功能模型、DDI數據生命周期模型、DataONE數據生命周期模型等具有國際影響力的規范。這些國際規范的形成過程持續了十年以上,經歷了機構規范、國內規范到國際規范的發展進化,得到了國家科研資助機構的支持,調動了世界范圍內圖書館組織、大學、研究機構、國家信息中心、各類相關國際組織的參與,最后成為國際通行規范,也建立了自己的常設機構和標準聯盟。領導和參與數據管理國際規范制定的國家和組織都在聯盟中居于重要地位,享有相應的權益,能夠主導國際規范和國際合作的發展方向。得標準者得天下,這是非常重要的國際經驗。我國圖書館界、數據科學界和公共科研資助機構應加強國際合作,主動支持和參與數據管理國際規范的研制,申請加入相應的國際網絡,謀求我國應有的地位,分享國際科學數據資源。同時,在發展我國的數據管理服務過程中,要與國際標準接軌,站在世界的制高點上,建立開放的數據管理體系,與世界各國廣泛開展交流和合作。

4.4 加強數據管理人力資源建設

面向數據密集型科研開展數據管理服務是一項前所未有的創新,將推動圖書館建立新的信息基礎設施,形成新的業務模式,產生新的能力素質和人才需求。傳統圖書館圍繞藏書管理所生成的人力資源結構,存在信息技能缺乏、信息化人才匱乏等問題,必須認真分析開展數據管理服務的能力素質要求,彌補圖書館員能力素質短板,引進信息技術人才,促使圖書館形成較強的數據管理服務能力。全球諸多圖書館組織和研究機構已經對圖書館數據管理素質能力進行了深入研究,提供了比較系統的能力發展框架。我國應當吸收世界先進成果和國外圖書館的成功經驗,結合自身實際情況,開展圖書館數據管理人力資源建設,逐步建立自己的數據管理崗位職能規范,培養數據管理人才隊伍,形成可以勝任數據管理服務的人力資源體系。

猜你喜歡
科學圖書館服務
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
飛躍圖書館
科學
圖書館里的是是非非
科學拔牙
主站蜘蛛池模板: 99人妻碰碰碰久久久久禁片| 91精品啪在线观看国产60岁| 午夜爽爽视频| 亚洲欧美精品一中文字幕| 亚洲精品动漫| 中文字幕亚洲另类天堂| 亚洲美女一区二区三区| 2020久久国产综合精品swag| 怡红院美国分院一区二区| 国产精品理论片| 欧美日韩导航| 久久午夜影院| 国产美女丝袜高潮| 国内精品久久久久久久久久影视| 香蕉eeww99国产精选播放| 一本无码在线观看| vvvv98国产成人综合青青| 国产99热| 中文无码伦av中文字幕| 久久久久久久蜜桃| 99精品视频在线观看免费播放| 色欲不卡无码一区二区| 免费xxxxx在线观看网站| 亚洲精品成人福利在线电影| 九色在线观看视频| 午夜视频免费一区二区在线看| 国产精品性| 国产欧美视频在线观看| 日韩无码黄色网站| 国产黄色片在线看| 亚洲最黄视频| 波多野一区| 成人毛片免费观看| 国产麻豆另类AV| 亚洲一欧洲中文字幕在线| 久久久久亚洲精品成人网| 中文字幕不卡免费高清视频| 亚洲成人福利网站| 亚洲国产AV无码综合原创| 亚洲永久免费网站| 久久性视频| 欧美成人影院亚洲综合图| 精品91自产拍在线| 国产精品亚洲天堂| 精品少妇人妻无码久久| 国产aaaaa一级毛片| 日韩人妻少妇一区二区| 亚洲综合18p| 有专无码视频| 中文字幕无码中文字幕有码在线| 天天躁夜夜躁狠狠躁躁88| 成人免费一级片| 伊人久久婷婷五月综合97色| 中国特黄美女一级视频| 欧美成a人片在线观看| 国产一二三区视频| 国产精品久久久久久搜索| 久久精品午夜视频| 这里只有精品在线| 亚洲侵犯无码网址在线观看| 91视频免费观看网站| 99热国产这里只有精品9九| 欧美性天天| 2020精品极品国产色在线观看 | www成人国产在线观看网站| 国产十八禁在线观看免费| 欧美成人午夜视频| 女人天堂av免费| 国产视频自拍一区| 国产一区在线观看无码| 亚洲精品男人天堂| 国产正在播放| 草逼视频国产| 日本国产精品一区久久久| 四虎亚洲国产成人久久精品| 国产二级毛片| 国产亚洲精久久久久久无码AV| 欧美a在线看| 色综合手机在线| 国产Av无码精品色午夜| 国产精品七七在线播放| 91毛片网|