杜建文
(池州市圖書館,安徽池州247000)
基于生命周期理論的圖書館科學數據監管體系構建研究
杜建文
(池州市圖書館,安徽池州247000)
科學研究是人類增進知識的必要手段,加強對科學數據的監管正逐漸成為圖書館領域的研究熱點。闡釋了生命周期理論與科學數據監管含義,在此基礎上分析了基于生命周期理論的圖書館科學數據監管體系構建要素,進一步提出了基于生命周期理論的圖書館科學數據監管體系構建策略,最后著重論述了基于生命周期理論的圖書館科學數據監管體系實施途徑,希望對我國圖書館生命周期理論的科學數據監管體系構建有所幫助。
生命周期圖書館科學數據監管體系
隨著信息的高速發展與數據的廣泛普及,圖書館的科學研究越來越離不開計算機和網絡技術,如何在科研過程中高效率監管和利用科學數據成為目前圖書館領域研究的重點與熱點。與此同時,生命周期理論被應用在圖書館科學數據監管體系中,圖書館應充分抓住這一契機,選擇合適的數據監管體系,借鑒國外先進的經驗,進一步提升本館的服務水平與能力。
1.1生命周期理論的提出
生命周期是指研究對象生老病死的往復過程,該理論的應用十分廣泛,經常出現在政治、經濟、環境等領域。生命周期理論最早起源于20世紀60年代的英國,當時的研究焦點是能源問題與固體廢棄物的處理方面。筆者將研究對象定位為科學數據監管,綜合生命周期理論的內涵,提出科學數據的生命周期為數據計劃——收集、管理——存儲、分析——共享、發布的周期性過程。
1.2科學數據監管體系的內涵
所謂科學數據監管,實際上是對高校科學活動過程中產生的科學數據進行管理,其包括數據收集、數據管理以及數據的儲存再利用,目的在于最大程度發揮科學數據的價值。關于科學數據監管的內涵,最具代表性的是英國聯合信息系統委員會提出的界定,即“從數據產生的初始,就要對其進行系統的管理和完善,以便于日后的發現和再次使用”。筆者認為,數據監管的價值不僅在于對數據實時的利用與儲存,還在于將科學數據監管工作貫穿于科學數據的整個生命周期過程中。
1.3圖書館科學數據的生命周期
隨著國際上對科學數據監管工作的重視與開發,高校也逐漸將生命周期與科學數據監管相結合。具體來說,高校圖書館科學數據監管生命周期可分為4個階段:①通過描述信息的內容,將其直觀地表示出來;②圖書館建立相關的儲存科學數據計劃,進行有目的儲存工作;③對數據進行觀察,參與學校科研活動和可用軟件的研發;④科學數據的監管與保存[1]。總而言之,圖書館往往根據生命周期不同階段的發展特點,進行科學數據監管的體系構建。
構建基于生命周期理論的圖書館科學數據監管體系從宏觀上看需要管理主體、管理對象與管理工具三大要素,三者是單行線性的關系。圖書館作為體系中的管理主體,對科學數據具有計劃、監控、保存等權利,科學數據作為管理對象,是高校科研活動前期、中期與后期重要的信息內容,是圖書館創新力與核心競爭力的體現,而圖書館對科學數據的具體監控行為,則要依靠不同的監控工具實現。
2.1管理主體:圖書館
圖書館是構建基于生命周期理論的圖書館科學數據監管體系的管理主體。具體而言,圖書館對科學數據具有保存與獲取功能——在大數據時代,資源的保存與獲取主要由圖書館完成,它一方面便于延長信息資源的壽命,另一方面也便于文獻內容從一個載體向另一個載體的轉變。此外,科學數據的周期再使用性也需要圖書館對這些學術資源進行管理、保存與使用,但數字資源往往具有不穩定性、易損失性等特點,這就需要在構建生命周期視角下的圖書館科學數據監管體系過程中,充分發揮圖書館的管理主體地位,通過對信息資源進行組織與管理,保障其獲取與再利用的模式。
2.2管理對象:科學數據
科學數據是構建基于生命周期理論的圖書館科學數據監管體系的管理對象,科學數據不僅包括學術信息資源,還包括圖書館獨有的特殊館藏,以及科研過程中保存的數據與數據來源。科學數據作為一種新型的學術信息資源,往往與科學文獻有密切的關聯性,并逐漸成為高校數字圖書館重要組成部分,并成為影響圖書館核心競爭力的重要因素[2]。總而言之,科學數據是生命周期理論視角下科學數據監管體系的關鍵要素,是圖書館的科學數據監管對象。
2.3管理工具:DateUp等多種工具
科學數據監管工具是連接圖書館與數據信息的橋梁,是將生命周期理論引進新體系、保障數據資源保存開發與再利用的技術保障。圖書館科學數據監管工具一般會根據科研活動的不同階段進行變換,目前較為常見的是DMP、DateUp、Merritt、eScholarship等(見表1)。

表1 基于科研活動不同階段的科學數據生命周期管理工具[3]
生命周期理論的圖書館科學數據監管涉及的要素較為廣泛,筆者主要從數據監管工具、圖書館服務人員、數據監控活動3個角度出發,結合高校科研活動的實際情況與科學數據監管的生命周期特點,提出若干構建策略。
3.1充分開發利用數據監管工具,構建集成科學工具平臺
基于生命周期理論的圖書館科學數據監管體系構建要重視數據監控工具開發利用,圖書館不僅要提供傳統的服務,還要積極投入到科研活動中。目前我國圖書館對于數據監管工作尚處于起步階段,與國外先進的科學數據監管生命周期體系存在著較大差距。因此,國內圖書館應明確自己在新體系中的定位,主動尋求科學數據監管資金的支持,進一步開發統一的科學數據監管工具,并提升科學數據的利用率[4]。筆者認為,國內圖書館可借助網絡平臺,建成集合資源采集、資源儲存與資源再利用的集成式工具平臺,簡單來說,就是在科學數據監管過程中,以科學數據生命周期為研究依據,實現平臺的嵌入服務,是一種基于生命周期理論的數據監管軟件和工具平臺。
3.2提升圖書館員工作水平,保障數據監管的實現
大數據時代,圖書館服務人員不僅承擔傳統的咨詢、借閱等服務工作,還要逐漸向專業化、研究型方向轉變。針對圖書館生命周期理論的科學數據監管體系而言,利用科學數據是科研人員的職能,而對科學數據的管理——前期計劃工作、科研中期的監控與數據收集儲存、科研后期的數據整理與篩選,則是圖書館員義不容辭的責任。筆者認為,具有科研精神的圖書館服務人員應具有提供與評價指導科研人員獲取學術信息資源的能力;協助科研數據存檔、發布與推廣的能力;協助科研人員查新、查證與查引的能力。總之,只有不斷提升圖書館服務人員的工作水平,才能為生命周期的科學數據監管體系提供切實可行的保障。
3.3將數據監控嵌入科研不同階段,提供監管服務
圖書館可以針對科研活動的不同階段開展不同的數據監管服務。具體來說,圖書館應在科研活動過程中,制定科學有效、統一的數據監管標準,并創建描述數據集合的元數據,以及制定數據管理架構和原型。總之,要將數據監控嵌入到科研活動的不同階段,它一方面可以有效地實現高校間館際互動合作,方便同一標準的科學數據間進行互通,另一方面,也可實現數據監管過程與再利用結果的高效,避免科學數據的重復與浪費,提高科學數據的使用與保存價值。
筆者立足科學數據監管的工作流程,嘗試提出圍繞不同科研活動進行不同監管操作、實行數字化合作研究政策、保持科學與數據的聯系統一關聯、實現數據保存與再利用的具體實施途徑,希望對我國圖書館科學數據監管建設起到借鑒作用。
4.1以用戶活動為中心,不同階段數據的管理
基于生命周期理論的圖書館科學數據監管體系具體實施途徑首先要以用戶活動為中心。具體來說,就是要以不同的科研活動、不同的科研產物為研究核心,對其進行不同階段的數據管理。每一階段的科研活動都具有其特點,它們可能來自同一研究課題的背景、中期或成果,幾者之間或為相互補充的關系,或為平行不干擾的情況。圖書館要“因材施教”,保證動態的、變化的科學數據監管,不僅要對數據的變化了如指掌,還要關注各類科學數據的相關聯,以便為未來的科學數據再利用提供一個系統的、整體的研究視角。
4.2以科研活動工作流為導向,實行數字化合作研究
圖書館的數字化科研實驗包括設計實驗過程——構建實驗——實行實驗——管理實驗數據——共享實驗過程與結果等流程,這就是所謂的科研活動工作流[5]。生命周期視角下的圖書館科學數據監管體系構建,可以充分利用科學流的發展軌跡,將數據監管作為一個流程嵌入其中,幫助科研人員進行數據管理。這種以科研活動工作流為導向的數字化合作研究政策,更容易采用數據描述與記錄科研活動的過程。隨著數據的大量增加,科研人員與圖書館館員的工作復雜性也不斷提高,二者之間的合作將成為未來高校科研的基本活動模式,這也是數字化科研與生命周期的科學數據監管的特征。
4.3科學與數據連續統一,從個人研究域向公開域過渡
生命周期理論的科學數據監控必須要將科學與數據連續統一起來。隨著初始數據、中間數據與結果數據的不斷推進,這些數據的產生都要被記錄與合并,這被稱為科學與數據的統一性,而不同研究階段的不同時間序列,即被稱作科學與數據的連續性,體現了科學數據監控生命周期的特性(如圖1所示)。
圖1所示,科研活動生命周期與科學數據連續統一的關聯關系中,涉及了研究領域的轉變,即從個人研究域逐漸發展到公開域,這是圖書館科研活動必經的周期。只有促進資源、過程與結果的共享,才能凸顯生命周期的科學數據監管的價值,以便更好地為后續數據再利用提供幫助。

圖1 科研活動生命周期與科學數據連續統一體的關聯[6]
4.4科學數據生命周期性,實現數據的再利用
就圖書館科研活動而言,其活動軌跡大致遵循DDI生命周期管理模型。簡單來說,首先要對知識數據進行抽取,即數據挖掘、數據建模、數據分析、數據融合等工作,然后再由圖書館工作人員對這些初步獲取的數據進行初次加工,包括數據存儲與長期保存、數據的共享、數據發現和獲取以及數據的管理與咨詢;數據初次加工后,進一步進行數據再加工,即數據的可視化處理、數據鏈接生成、數據模擬、數據注釋。圖書館通過一系列的生命周期數據監管,對數據進行匯總,保證科學數據的即時價值與再利用價值。因此,構建生命周期理論視角下的圖書館科學數據監管體系,要充分加工與分析科學數據的生命周期特性,真正實現科研數據的再利用。
生命周期視角下的科學數據監管體系的構建,為圖書館提出了前所未有的機遇與嚴峻的挑戰,只有明確生命視角理論與科學數據監管的基本概念,將二者真正有機融合起來,才能為本校科研活動提供參考與幫助。在科學數據監管體系構建過程中,圖書館應著重探究管理主體、管理客體與管理工具之間的關系,在三者之間找到協調平衡點,遵循一定的原則靈活變化三者之間的組合,以達到最好的科學數據監管效果。與此同時,要重視圖書館服務人員水平的提高、重視科學數據監管工具的開發、重視科學數據監管全程參與科研活動等,這也是促進生命周期理論下圖書館科學數據監管體系構建行之有效的策略與實施途徑。
[1]李大玲著.學術機構知識庫構建模式研究[M].上海:上海交通大學出版社,2009:122.
[2]國際科技數據委員會中國全國委員會[EB/OL][2016-08-09].http://www.codata.cn/.
[3]鐘聲.大數據驅動的圖書館數據監護研究[J].情報資料工作,2014(3):103-106.
[4]師榮華劉細文.基于數據生命周期的圖書館科學數據服務研究.[J].圖書情報工作,2011(1):39-42.
[5]解析“研究型大學”[EB/OL][2016-08-09].http://news.xin? huanet.com/st/2002-12/04/content_649306.htm.
[6]劉暢.開放獲取:實施戰略、最佳實踐與未來挑戰[J].國際學術動態,2011(2):30-32.
杜建文男,1963年生。本科學歷,館員。研究方向:公共圖書館服務。
G252.7
(2016-08-11;責編:楊新寬。)