馮銳
【摘 要】從背景、技術實現與決定要素三個角度,論述了高校圖書館服務延伸工作的嶄新領域——科研數據管理。提出開展該服務的幾項可操作性技術保障,并從責任、運維、協作的角度客觀評價了開展科研數據管理的決定因素,以期為實際建設此項服務提供有益的參考。
【關鍵詞】高校圖書館 數據管理 知識服務
1 科研數據管理的背景
當前,數據管理(Digital Curation)已經進入數據庫系統的發展階段。隨著高校圖書館數字化設施的全面普及,信息技術應用更加深入,在資源建設、平臺再造服務提升、管理優化、協同創新等方面拾級而上,已成為支撐和保障高校科研的基礎信息設施。國外一些研究型圖書館已經建立數據中心(Data Center),而國內這一工作是由大學科研產業處或者研究機構層面在做,圖書館參與的很少且過多的側重于科研項目和科研環境的服務,在科研數據管理上成為了高校圖書館的服務盲區,造成許多正式或非正式出版但屬于研究成果的資料,如在研究過程中產生的課件、報告、ppt、圖像等科研數據[1],分散在研究者或科研部門手中,缺少集成化的組織和管理。實際上這些數據也具有價值,高校圖書館應該提高認識,依賴多年來圖書館積累下來的信息存儲經驗,將這些資料保存起來,加強對科研數據有效組織、合理開發。
2 科研數據管理的技術實現
高校圖書館將科研數據存儲到磁盤或其他持久存儲設備,其核心內容是元數據存儲位置的映射,承載了數據對象本身歸屬、大小、校驗值等元信息,用于記賬、校對、修復和分析等輔助操作[2]。
2.1 數據運行平臺
打造開放平臺,既為科研人員提供豐富高質的服務內容,又讓他們自身研究的科研成果在平臺上得以呈現,進而更加樂于關注停留在平臺。高校圖書館可以通過建立起類似騰訊CKV(Cloud KeyValue)海量分布式存儲系統,打造特色的科研數據管理平臺,對本校科研數據進行集中管理。
2.2 數據存儲
科研數據可以采取批處理+實時數據傳輸兩種方式進行存儲,同時提供臨時數據緩存功能,創建時指定保存時間。這樣,過期的臨時數據則由系統的管理中心自動進行刪除,對于重復的數據進行及時清理,保證磁盤留有足夠的存儲空間。
2.3 數據壓縮
利用輕量級的高效壓縮技術如Delta Encoding[3],提高存儲科研數據的壓縮率,過濾一些無關數據從而減小所占內存空間,提升聚合查詢的查詢速度。
2.4 數據查詢
科研數據查詢系統主要包括存儲層與查詢層,為了滿足數據查詢的需求,需要為用戶提供統一的元數據訪問和管理接口,支持按照各種維度分層的元數據,并為異構數據源提供標準的查詢訪問接口。
2.5 數據再利用
通過科研數據存儲注冊服務,高校圖書館為社會企業生產部門、科研機構等提供數據挖掘、知識發現和知識推送服務鏈接,有效提高科研數據的再開發、再利用,使科研數據成為支撐知識服務的知識化資源。
3科研數據管理的決定要素
3.1 責任決定集中的效率
在開展科研數據管理延展服務前,高校圖書館管理者應該用更高程度的理性代替高昂的激情,集思廣益,明晰科研數據集中管理涉及法律、技術和政策等多維度因素,及需要承擔的相應責任,正所謂居安思危,有備無患。在開展服務時,注重加強知識產權保護意識,避免數據使用中的侵權風險。科研數據在一定程度上包含了科研人員的心血,必然有部分人員不舍得將科研數據放到平臺,因此圖書館應該讓他們有控制感,甚至設置私人定制密碼,加以權限保護,給予信任和依賴者以足夠的安全感,及向社會科研企業推送科研項目信息以提高合作的機率。
3.2 運維決定服務的品質
高校圖書館數據庫長期不間斷的運行,服務器突然掉電、磁盤的失效、磁道老化以及人為操作失誤等,都可能造成數據存儲對象的損壞甚至丟失,因此建立一套應急機制預案,及時應對宕機的出現,保障數據庫運行的穩定性與可維護性,保證科研數據的安全性對整個服務延伸過程顯得尤為重要。
3.3 協作決定延展的廣度
高校圖書館開展科研數據管理首先需要跨越不同功能部門的藩籬,科研生產處負責學校科研立項、科研經費管理及科研成果鑒定等,各院系部負責科研人員考核、科研任務考核等,因而在學校統一協調下,加大高校圖書館與其他部門的協同服務機制,組織上各有側重,功能上各具特色。不同部門之間相互合作,相互促進,共同推動高校科研工作數字化發展。
4結語
目前,我國高校圖書館科研數據管理不夠成熟,目前尚在孵化階段,但是正如大數據改變著世界一樣,科研數據管理將推動新一輪高校圖書館服務的進化,只要圖書館凝心聚力,從細微處著眼,發現每一個知識化服務的節點,從海量數據中實時、高效地分析和挖掘出有價值的信息,前瞻未來,也許重要的變革機遇就蘊藏在科研數據管理與數據發現中。
參考文獻:
[1] 吳建中.大學圖書館的昨天、今天和明天[J].圖書館雜志,2014(12).
[2] 莫華楓.云存儲的黑暗面:元數據保障(上)[J].程序員,2014(4):92-95.
[3] 梁堰波,楊卓犖.基于Impala構建實時大數據查詢系統實踐[J].程序員,2014(2):52-56.