黨洪莉 譚海兵


[摘要]隨著越來越多的圖書館參與研究數據管理,評估數據管理過程以保證其持續性與有效性是圖書館工作人員的重要議題。將數據管理能力成熟度模型(DIMM)思想引入圖書館領域,構建圖書館數據管理及服務能力成熟度模型,初步形成較完整的圖書館數據評價體系。在此基礎上,結合湖南省高校數字圖書館建設情況,介紹了該能力成熟度模型在湖南省高校數字教學資源中心的應用,以期對該項目及其他圖書館的數據管理能力評價具有積極的意義。
[關鍵詞]研究數據;數據管理;成熟度模型;服務評估
隨著以數據密集型計算為特征的“科學第四范式”的發展,學術圖書館需要為越來越多的科研項目和科研人員提供研究數據管理服務(research data management,RDM)。高校等研究單位擁有大量的數據資產,這些數據資產以各種類型和格式廣泛的存儲于各種地方。圖書館作為開展數據管理服務的重要部門之一,其關鍵活動就是規范管理各種數據資產,支持研究數據生命周期的學科實踐和規范。除了對數據進行有效管理外,高校圖書館還需借助標準化模型對數據資產管理能力進行有效評估,找出薄弱環節;針對薄弱環節進行路徑優化,從而有效提高自身的數據管理水平。本文通過對企業數據管理能力成熟度模型(DMM)的介紹,在已有研究的基礎上,提出我國高校圖書館數據管理成熟度模型,幫助高校圖書館認清制約圖書館數據管理能力發展的因素,以促進圖書館提升數據管理能力。
1數據管理能力成熟度模型DMM概述
數據管理能力成熟度模型(Data Management Maturity,DMM)源于系統工程和軟件工程的集成成熟度集成模型(Capability Maturity Model Integration,CMMI),目的是通過提供結構化和標準的實踐框架,以促進建立和完善自己的數據管理成熟度路線圖,從而評估和提升數據管理水平。
DMM包括數據管理戰略、數據治理、數據架構、數據應用、數據安全、數據質量管理、數據標準、數據生命周期8個部分,其具體描述和關鍵過程如表1。每個部分包含該過程的目的、目標,運行過程中需考慮的核心問題,并對能力實踐進行相關描述。從而將數據管理與能力成熟度評估有機的融合在一起,達到管理水平的逐步提高和持續改進過程的目的。
DMM模型采用階段表示法,按整個過程的能力成熟度分為初始級、受管理級、已定義級、量化管理級和優化級五個等級。每個等級的成熟度能力成為下一級的基礎,形成一個逐步升級的梯臺,而成熟度能力的不斷升級也是過程能力的積累。初始級表示數據管理在被動、非正式的臨時基礎上執行;受管理級表示數據管理按照已定義和文檔化的流程,在業務部門層面執行;如果數據管理與業務戰略保持一致,得到標準化和一致性實施,則表示在已定義級執行;在量化管理級,項目衡量、評估數據管理過程的有效性,以確保維持標準;在優化級,項目在反饋的基礎上得到創新和改進,實行可持續性管理。
2圖書館數據服務能力成熟度模型的構建
DMM模型是在CMMI的基礎上進一步開發的,目前國外較成熟的以能力成熟度模型(Capability Maturity Model,CMM)為基礎的數據管理能力成熟度模型有英國巴斯大學的社區成熟度模型、弗吉尼亞大學的DMBitals、澳大利亞的ANDS和雪城大學的SDM-CMM[3]。以上模型在歐美國家提出后,不斷得到改進并逐步完善,也引起了國內不少學者的重視和推廣。相比較起來,已有的模型評估方法比較適用于國外,而我國數據管理能力還處于起步階段。本文在綜合現有能力成熟度模型框架的基礎上,結合我國圖書館數據管理能力,從圖書館基礎能力、數據服務能力、數據安全能力、數據技術能力和數據環境能力五個方面來衡量圖書館數據管理能力,提出適用于我國圖書館領域的數據管理能力成熟度模型框架。
1)初始級。此階段的圖書館數據管理能力處于發展的初始階段。數據管理特點是:基礎設施齊全,但設施運作穩定性不確定;現有的技術體系能滿足用戶一些簡單需求;提供基本的數據存儲和歸檔服務;在數據安全問題上,僅依據特定業務需求開展數據安全,沒有形成明確的工作內容定義;此外圖書館內外部對數據管理都沒有重視。初始級階段的主要因素有環境的變化、基礎設施規模大小。
2)受管理級。此階段的圖書館數據管理能力處于發展的成長階段。數據管理特點是:在大數據環境的影響下,圖書館針對數據及數據管理出臺一些相關的法律和政策;服務種類也逐漸增多,在數據安全上也比初始級進一步提高,主要依賴人工執行相關工作。在受管理級階段,數據環境的改善、服務類型多樣化發展、數據安全能力提高是關鍵因素。
3)已定義級。此階段的圖書館數據管理能力處于發展的定型階段。此時數據管理的特點是:在達到成長級要求的基礎上,數據管理的內外部環境趨于穩定;基礎設施趨于穩定,監測和控制體系趨于成熟,數據安全能力正式、規范。內外部環境的穩定、數據服務的類型及不斷完善的技術對此階段起著決定性作用。
4)量化管理級。此階段的圖書館數據管理能力處于發展的規范階段。此時數據管理的特點是在上一級的基礎上,監測和控制體系趨于成熟,能實時動態處理故障;數據服務水平能很好地滿足用戶需求。影響此階段的關鍵因素是數據安全可控、技術體系穩定及有效應對數據環境的變化。
5)優化級。此階段的圖書館數據管理能力處于發展的優化階段。此時數據管理的特點是:數據管理在達到規范化后,數據服務不斷自我改進和優化,數據管理系統集成化程度不斷提高,技術上也得以不斷創新,安全過程可調整。影響此階段的關鍵因素是創新技術、提高服務質量和有效預測環境變化。
在對數據管理能力進行評估時,根據數據成熟度級別對圖書館基礎能力、數據服務能力、數據安全能力、數據技術能力和數據環境能力打出分值,形成數據成熟度記分卡,從而發現數據管理中的缺陷和弊端,以此為依據改進數據管理能力。而五個級別在關系上是遞進式的,相鄰等級具有一定的連續性。在實際使用時可根據實際情況靈活處理,根據不同的評估目標調整步驟,根據評估內容的重要程度調整評估策略、評估時間等。endprint
3應用探析
湖南省高校數字教學資源中心(http://trc.hnadl.cn)是一個面向湖南省全省高校師生提供數字教學資源的資源中心數據庫,依托湖南省高校數字圖書館建設,其前期的數據來源主要有精品課程、質量工程、課堂教學、實習基地、校企合作、特色專業等12類項目。以上述12類項目建設的數字教學資源為基礎,組建以教學資源為核心的資源中心庫,并在省內一些高校中形成一定數量的分中心或者是分站點。該項目自2012年開始建設,但是進展不快。本文以湖南省高校數字教學資源中心的數據管理服務實踐為例,根據DMM模型評估表,對該資源中心的數據保存與數據服務進行成熟度能力評估,以期有效提升和改進此項目在后期建設中所面臨和需要解決的問題。具體成熟度評估詳情如表3所示。
從上述表中可以看到,湖南省高校數字教學資源中心,在基礎能力和服務能力方面處于受管理級,主要因素是其依托湖南省高校數字圖書館已有前期信息化建設基礎及完善的建設團隊。湖南省高校數字圖書館建設已有十余年,從硬件設施到應用軟件的引入,其每年都有適當的投入,且長期注重專業人員的引進,其基本服務能力已得到一定的規范,管理人員對基本業務也已相當熟悉,故基礎能力和服務能力足已達到受管理級;在安全能力方面還停留在初始級,制定數據備份和監護政策,監測物理設備的運轉情況。目前國內絕大部分圖書館在新技術的應用上嚴重滯后于計算機技術的應用和發展,因受行業內傳統思維的影響,圖書館的管理人員對數據安全缺乏超前的意識,普遍認為圖書館的數據重要性低,直接影響在數據安全方面的研究和投入。近些年隨著圖書館的業務范圍越來越廣,數據越發復雜多樣,對于數據的安全應受到高度重視,對安全技術利用要加強實踐。湖南省高校數字教學資源中心平臺應該加強應用安全、資源的版權保護和資源的存儲安全。在技術能力和環境能力方面,中心還處于初始級,其根本原因在于圖書館的管理人員對于教學資源的利用方面了解得不夠深入,欠缺一定的一線教學經驗。與此同時,對一些的大的數據平臺,沒有一定的技術能力進行研究和開發,與教學資源相關的行業標準沒有形成,平臺雖然已經提供了相關的訪問、下載和使用等功能,但是需要進一步跟進和完善整個資源平臺。此外,缺少跨行業研究的精神,缺少跨部門跨行業的合作經驗,更缺少如何將數字資源更好地利用于教學和服務于教學的能力,業務能力的不足直接影響新技術的引進與利用。加強專業技術知識和業務知識的學習是重中之重,中心應該加強系統架構的穩定性和可擴展性,為后期的功能拓展做好基礎工作。
4結束語
研究數據管理能力成熟度模型,是圖書館如何有效管理數字資源和如何有效評價數據管理過程中所存在的問題的關鍵。依托此模型的有效關聯和比對,可以很清晰地判斷應對此類數據管理的機構和團隊所面臨的實際情況和問題,從而有針對性地解決這些問題,更好地為用戶服務。
通過對湖南省數字教學資源中心的數據管理成熟度分析與評估,認為有必要對數字資源平臺數據庫建設過程進行數據管理和成熟度進行測量和評估。從而有效改進相關平臺建設過程中所面臨的問題,有效促進此類平臺的建設和利用。為后期圖書館平臺建設和發展提供良好的參考依據,不斷完善高校數字圖書館建設的有效評估途徑。為數字圖書館的發展建設提供良好的實踐參考。endprint