董蘭軍(中國科學院文獻情報中心)
科學數據產生于科研活動當中,它是一種既能反映科研活動特征,又能展示事物間規律的數據集。[1]E-science開放環境下,數據密集型(Data Intensive)科研的興起對科學數據的管理與共享提出更高的要求。當前科研活動中產生的科學數據大多為個人或團隊所擁有,通常缺乏專人管理,加之缺乏完善的數據共享政策、數據管理標準不統一等問題,使科學數據傳播與共享工作變得更加艱難,嚴重阻礙數字科研的進步。高校圖書館作為科研活動的重要參與者與服務者,一直通過其豐富的館藏資源助力科研活動,在科研創新中發揮著不可替代的作用。美國圖書館協會在《2015美國圖書館狀態報告》中指出,圖書館在專注館藏資源之余要致力于提供數據服務。[2]約翰霍普金斯大學圖書館、劍橋大學圖書館、維也納大學圖書館、斯坦福大學圖書館分別建立了專屬的知識庫JHU Data Archive、DSpace平臺、U:Scholar、SDR數字倉儲,用來管理并共享科學數據。[3]第十六屆數字圖書館理論和實踐國際會議上,科學數據管理(Data Curation)被列入重要議題之一。
圖書館參與科學數據管理與服務,其人才隊伍建設問題直接影響圖書館提供科學數據服務的質量和效率。其中,高層次信息管理人才建設是重中之重。黃如花等研究者指出,培養科學數據管理人才對提高我國科學數據共享水平有重要的促進作用。[4]然而,科學數據管理人才匱乏正是我國高校圖書館當前面臨的問題。
國外高校在數據管理理論和實踐方面有較為豐富的經驗,并已形成成熟的體系。與之相比,我國對該領域的理論研究和實踐較少,特別是在高校圖書館科學數據管理人才建設的問題上缺乏相關研究,加之我國對數據管理人才前期培養不足,因此對該領域高級專業人才需求更為迫切。國內圖書館應積極借鑒國外先進經驗,嘗試設置各類館員崗位,建立成熟的人才培養模式,加快人才隊伍建設,為圖書館參與科學數據管理服務提供人才保障。
國外一些著名的高校圖書館率先意識到科學數據管理人才建設的重要性,并取得顯著成效。如,加利福尼亞大學伯克利分校在科學數據管理方面有不俗的水平,其中,最主要的原因在于該校非常重視人才教育并擁有強大的科學數據管理人才隊伍。其下屬的數據科學研究所 (Berkeley Institution for Data Science,BIDS)人才社區在開展服務時,會根據服務人員的學科優勢進行分組,通過組與組之間的協調合作,BIDS可以更好地把握時下的科研熱點和實踐應用現狀,為后續的科研項目服務奠定良好的基礎。[5]同時,該校圖書館設有Data Lab,專門培訓數據管理人才,從數據管理理論知識的灌輸到實踐技能傳授,已形成較為成熟的人才培養體系。
新墨西哥大學圖書館主持的地球觀測數據網(Data Observation Network for Earth,Data ONE) 項目指出了科學數據管理人才的職責,[6]即借助數據管理計劃 (Data Management Planning Tool,DMP Tool) 幫助科研人員制定項目管理規劃,確定和應用相關元數據模式,幫助科研人員確定相應的存儲庫。
2008年,牛津大學成立圖書館數據管理工作組,并啟動“研究數據存儲服務”(ScopingDigitalRepositoryServices for Research Data Management,SDRSRDM) 合作研究項目。[7]該項目以“圍繞科研人員的發展為建設核心”的原則開展工作,對數據館員進行實時數據管理培訓與技能訓練,建立了完善的培訓體系。英國皇家學會在2012年發表的《科學是開放事業報告》中指出,政府應支持相關數據管理軟件的開發和人員技能的培訓等。
另外,美國麻省理工大學、約翰霍普金斯大學,澳大利亞的悉尼大學、墨爾本大學等也都建立了相對完善的人才培訓體系。[8]
對科學數據產生、收集、處理、利用等環節進行管理的過程,即是對科學數據生命周期進行管理的過程。這個過程不僅需要對科學數據本身進行管理,還需要對科學數據產生的過程、內外部環境、使用的技術、對象等進行管理。[9]結合上述科學數據生命周期管理理論,按照管理主體工作性質和內容的不同,可將科學數據管理人才分為數據管理研究人才、數據分析人才、數據管理技術人才、數據監管人才和高層數據主管5大類(見下圖)。

圖 科學數據管理人才模型
(1)科學數據管理研究型人才主要指與科研團隊有緊密溝通、對目標科學數據管理有整體、全面地把握,能夠明確科研數據所有權與知識產權權益的科研工作者。其工作性質具有整體性、學術性和創造性,負責科學數據的收集與數據管理計劃的制定。俄勒崗州大學下屬機構數字學術與服務中心非常注重對科學數據管理的研究,如,該機構會依照NSF、NIH的相關規定,幫助科研人員制定合理的數據管理計劃。[10]
(2)數據分析人才是實現數據價值挖掘的重要人才,利用數據分析工具和數據管理系統,研究人員可以基于元數據進行數據挖掘。元數據是描述和管理對象數據的數據,是數據描述、集成與歸檔工作的專業基礎知識。圖書館的數據管理平臺中心每天都在產生大量的元數據,這些元數據保存在內部的超大規模服務器中,當用戶發生查詢行為時,內部調度系統將會利用元數據調度對象數據庫中的數據,為用戶提供服務。這類人才是數據管理人才的主體,在數據管理人才結構中所占的比例較大。
(3)數據管理技術人才主要負責數據的共享、利用與可視化分析與服務,通過搭建科學數據共享平臺的方式,開發科學數據的潛在價值,提供個性化數據咨詢服務。[11]技術能力屬于E-research環境下館員的“硬”技能。[12]這類人才在社會上通常被冠以初級(高級)程序員、網絡(高級)工程師、高級技術總監(Chief of Technology Officer,CTO)等稱呼。數據管理技術人才有很強的現代信息技術開發和應用能力,包括網絡安全、數據庫、知識庫的開發技術。
(4)數據監管人才主要負責科學數據的備份與存儲。規范科研數據的存儲類型、標準與期限,強調數據的安全性與保密性。科研數據的長期保存除賦予資源以相應的檔案價值外,還賦予資源可用性價值,[13]對未來的科研活動十分重要,這正是數據監管人才工作價值的真實體現。約翰·霍普金斯大學Data Conservancy、哈佛大學 DataverseNetwork、康奈爾大學 Data Staging Repository等提供了科學數據監護平臺運營經驗。[14]此外,這類人才還應對數據資源管理方面的問題有所關注,特別是在數據隱私、數據版權、數據倫理等方面。[15]
(5)高層數據主管主要負責科學數據管理的戰略規劃。作為科學數據管理層中的核心決策人員,規劃好圖書館的科學數據管理只是其中一環,該類人員還要對科研數據的發布、引用、出版進行嚴格控制,對科研數據的傳播限制、發布機制進行詳細規范。
研究圖書館科學數據管理人才素質問題,離不開對數據管理人才的基本素質、知識結構、智能結構的分析。文章從以上三個角度對未來科學數據管理人才的職業素質要求進行剖析(見下表),以期為我國高校圖書館人才教育培養提供借鑒與指導。
(1)科學數據管理人才的基本素質。數據素養是數據管理人才應具備的基本素質,這些素質主要包括系統的數據管理知識體系、專業的數據管理技能、敏銳的“數據嗅覺”、遵守數據政策、倫理規范等。國外很多高校很早就重視培養圖書館員的數據素養能力,如,2012年美國博物館和圖書館服務協會(Institute of Museum and Library Services,IMLS) 合作開展的“數據信息素養項目”,旨在提高科研人員的數據意識。此外,科學數據管理人才還應具備良好的人際交往和溝通能力,較強的奉獻精神和服務意識。
(2)科學數據管理人才的知識結構。科學數據管理人才的知識結構是在長期學習和工作實踐中形成的較為穩定的意識形態,是形成科學數據管理專業素質的基礎。科學數據管理人才的知識結構應該具有系統性,在計算機技能、數據分析技術、數據管理知識、管理學理論等方面有系統的知識儲備。
就個體而言,知識結構在不同類型的數據管理人才中各有側重點。如,科學數據管理研究型人才必須全面系統地掌握科學數據管理的基礎理論和研究方法,關注學科領域的最新進展,時刻留意科研人員的動態,并及時進行溝通,為制定良好的科學數據管理計劃做好準備;數據分析人才除掌握各種數據統計分析軟件外,還應具有對科研數據進行揭示與描述的能力,制定相應元數據標準,對數據資源進行準確描述;數據管理技術人才應側重于對其計算機專業知識的考核,良好的計算機專業背景加上主動的服務意識,是此類人員進行數據挖掘和管理的基礎;數據監管人才要掌握數據存儲的相關知識,對數據具有較強的敏感度,善于分析和組織數據;高層數據主管則應在了解基本的計算機理論和數據管理理論的基礎上,具有較強的管理能力和組織協調能力,利用豐富的管理實踐經驗對數據和人員進行管理。隨著越來越多的圖書館參與到科研數據管理中,高層數據主管的地位越來越重要,他們在數據圖書館建設中充當著總規劃師的角色,特別是在規劃圖書館數據化管理戰略方面,有著重要的作用。因此,高層數據主管不僅需要懂得計算機和數據管理相關的理論,而且需要在數據管理的實踐和戰略規劃等方面具備較深的造詣。
(3)科學數據管理人才的智能結構。科學數據管理人才的智能結構體現在其特有的思維方式、情緒心理和性格行為特征中,一般包括敏銳的觀察能力、嚴謹的思維方式、較強的學習能力、良好的組織管理水平和創新意識等方面。依據科學數據管理人才的工作性質,其智能結構也會有所側重。研究型人才在理論素養和邏輯思維方面應該更加出色,這能夠幫助他們與科研人員進行有效的溝通,讓科研數據信息流可以在整個生命周期中煥發活力。數據分析型人才在觀察和思維方面應該有出色的表現,這讓他們能夠從數據中發現問題、挖掘數據價值。除此以外,這類人員還應該具有持之以恒的工作態度和積極進取的創新意識,努力發掘數據背后隱藏的信息。數據管理技術人才應該有較強的執行力、溝通表達能力和數據服務意識,善于發現和解決數據管理的技術性問題。數據監管人才應該有良好的數據安全意識,并且能夠與時俱進,具有持續學習的能力和創造性思維。高層數據主管應該具備戰略性的眼光和項目管理能力,能從管理的上層角度對數據進行分析、判斷和策劃,用以領導科學數據管理團隊,加強圖書館的科學數據管理建設。
從指導思想的角度看,科學數據管理人才的培養要有科學的指導思想作為支持。科學的指導思想是專業素養的體現。因此,學校及其他教育培訓機構應該重視數據管理理論知識和計算機應用技能的培訓,將科學數據生命周期管理的相關理論納入到專業課程的學習當中,結合多種教學模式展開教育,為圖書館提供專業性強、適應性強的科學數據管理者做好鋪墊。
就過去的教育實踐而言,我國對于圖書情報的學科教育偏重于文獻信息管理。然而從目前的實踐來看,這些教育內容并不能充分滿足各級各類圖書館、科技情報部門的實際需要,特別是在科學數據管理和服務方面,學校缺乏科學數據管理相關的理論、技術和方法教育。

表 科學數據管理人才的構成與素質要求簡表
從培養目標的角度來看,科學數據管理人才要注重對通用型、專門型和復合型人才進行培養,以培養寬口徑應用型人才為主。“通才”與“專才”可從兩個角度去認定。一是就人才個體而言,素質上的“通”與“專”。科學數據管理人才是既掌握數據管理方面的理論知識,又具備某種專業技能的人才。二是就整個教育層次而言,指具有一定數據素養,能夠在整個科學數據管理領域中發揮作用的專業人才。寬口徑,強調人才具有龐大而完整的知識結構,掌握多門學科知識,并能融會貫通,對科學數據管理中的各個方面有很強的適應性。具體而言,高校可在開展基礎學科教育的同時,注意發掘學生在科學數據管理方面的潛能,根據圖書館的實際發展情況開展個性化教育。
在E-science環境下,如果想要更好地培養科研數據的管理人才,就要建立科學完整的科學數據管理人才培養體系。只有全面開展多層次、多類型的教育模式,才能擴大科研數據管理人才培養規模,提高人才培養的質量。歐美很多高校開展的數據管理專業都已納入碩博層次的教育體系,可見,我國在研究生培養方面必須重視數據素養教育的開展。
要培養出圖書館科學數據管理的優秀人才,需要從學生的素質和能力入手。在設置教育課程體系時,學校要充分調研圖書館科學數據管理的實踐現狀,依據目前科學數據共享服務中館員應具備的素質和能力開設課程。從該思路出發,科研數據管理人才的培養過程即是“因材施教”的過程。數據管理研究型人才的課程設置應以信息管理學、信息檢索、信息組織等課程為主;數據分析型人才的課程設置應包括數據挖掘、數據統計和分析工具的使用等;數據管理技術型人才的課程設置應以計算機網絡、數據結構、數據可視化等課程為主;數據監管人才的課程設置應圍繞數據庫系統、數據協議等專業課程來設置;高層數據主管的課程體系結構除了應包括計算機基礎、管理學基礎以外,還應包括一些跨學科領域的課程,如,教育學、心理學等。另外,學校的課程設置一定要把學科數據管理的理論課程和實踐課程結合,這樣才能構建一個科學完整的學科數據管理課程體系。
(1)跨學科培養。如,計算機與信息管理系聯合培養具有復合型結構的科研數據服務人才。蘭卡斯特大學將計算機技術、應用統計與信息管理相結合,進行跨學科培養。[16]加利福尼亞大學圣地亞哥分校數據服務主任職責之一是與圖書館學科服務項目合作,提供研究數據管理計劃支持服務。[17]
(2)提升服務技能。圖書館提供科研數據服務必定對服務人員的技能有一定的要求。對于同國外高校聯合培養科研數據管理人才,可利用國外較為成熟的理論體系和實踐條件,使學生有機會參加歐美高校圖書館的數據實踐工作,以彌補國內科學數據管理專業教育方式和課程設置上的不足。
[參考文獻]
[1]敖龍,李進華.E-science環境下的科學工作流實現及其應用研究(Ⅱ)——生命周期與應用分析[J].情報科學,2011(1):113-117.
[2]ThestateofAmerica’slibraries2015[EB/OL].[2016-12-15].http://www.ala.org/news/sites/ala.orgnews/.
[3]董坤,顧立平.若干國家科研數據開放政策框架研究[J].中國科技資源導刊,2016(3):51-57.
[4]黃如花,等.促進我國科學數據共享的對策[J].圖書館,2014(3):7-13.
[5]黃如花,林焱.加州大學伯克利分校數據管理的實踐剖析[J].圖書情報工作,2016,60(3):26-31.
[6]WMichener,etal.DataONE:DataObservationNetworkforEarth-PreservingDataandEnablingInnovation intheBiologicalandEnvironmentalSciences [EB/OL].[2012-01-10].http://www.dlib.org/dlib/january11/michener/01michener.html.
[7]Uribe L M.Finding of the scoping study interviews and the research data management workshop[EB/OL].[2016-12-15].https://ora.ox.ac.uk/objects/uuid:4e.
[8]毛玉容,許春漫.E-science環境下高校圖書館科學數據館員制度建設研究[J].圖書館學研究,2016(16):85-95.
[9]丁寧,馬浩琴.國外高校科學數據生命周期管理模型比較研究及借鑒[J].圖書情報工作,2013,57(6):18-22.
[10]OregonStateUniversity.Datamanagement[EB/OL].[2016-12-15].http://cdss.library.oregonstate.
[11]尹春曉,鄢小燕.研究型圖書館在科學數據管理中的角色問題研究[J].圖書館學研究,2014(15):48-52,64.
[12]王琦,陳文勇.E-research環境下圖書館員角色重定位及其技能研究[J].大學圖書情報學刊,2015,33(4):5-10.
[13]穆向陽,洪躍.學科館員在科研數據管理中的角色分析[J].新世紀圖書館,2015(8):17-21.
[14]宋秀芬,鄧仲華.美國高校數據監護平臺研究與借鑒 [J].圖書與情報,2015 (3):90-96.
[15]孟祥保,錢鵬.國外高校圖書館數據館員崗位設置與管理機制[J].圖書與情報,2013(4):12-17.
[16]完顏鄧鄧,高峰.國外數據管理專業人才培養調查及啟示[J].圖書館理論與實踐,2016(6):21-26.
[17]Director,research data curation services[EB/OL].[2016-12-15].http://www.iassistdata.org/.