熊濤
摘 要:在大數據時代中,數據已成為最重要的資源。高校圖書館開展數據監護工作,實現高效管理和妥善保存意義重大。本文對高校圖書館的主要數據做了簡單分類,并介紹了高校圖書館數據的主要內容,最后分析了高校圖書館進行數據監護的重要性,為今后高校圖書館開展數據監護工作打下理論基礎。
關鍵詞:大數據;高校圖書館;數據監護
1 高校圖書館數據分類
大數據可根據其組成結構不同分為結構化數據、半結構化數據和非結構化數據這三種類型。其中能夠用二維表結構來邏輯表示的數據稱為結構化數據,否則稱為非結構化數據;而半結構化數據是一種數據庫集成的數據模型,具有一定的結構性,但是其結構性不是統一的。大數據的最小單位為bit,依據順序從小到大還有Byte、kB、MB、GB、TB、PB等單位,1kB=1024Byte,1MB=1024kB,以此類推。圖書館的大數據是復雜多樣的,以上3種類型的數據都有,其中以結構化數據為主,如果按照這種方式對圖書館大數據進行分類并不能較好地表達圖書館的數據。根據圖書館的工作特點,應該將圖書館的大數據分為基礎數據、用戶行為數據和其他數據[1]。
1.1 基礎數據
基礎數據包括圖書館基本數據、讀者數據、紙質資源數據、電子資源數據等。圖書館基本數據包括圖書館人員、圖書館資產、辦公等方面數據。讀者數據為圖書館借閱系統中的讀者基本情況、圖書館的微信微博用戶數據和圖書館座位預約系統數據等用戶數據。以上幾類數據為結構化的,量不大,為MB級別,增長速度緩慢,易于管理。紙質資源數據包括館藏書目信息、期刊目錄信息、報紙信息等,此類數據為結構化數據,量比較大,為GB級別,增長速度一般,每年以相差不多的速度增長。電子資源數據包括圖書館購買的各種電子資源數據、特色資源數據和光盤數據等。電子資源數據為結構化數據,量非常大,為PB級別,增長速度較快,幾乎每時每刻都在變化,由于目前大部分高校購買的電子資源為遠程鏡像,所以不易管理,也不易統計。
1.2 用戶行為數據
用戶行為數據包括紙質資源利用情況、電子資源利用情況、微信利用情況、圖書館主頁訪問情況、門禁數據、空間利用情況、VPN遠程訪問數據等數據。紙質資源利用情況數據包括讀者借閱信息和圖書利用情況數據等。電子資源利用情況數據包括讀者訪問信息、檢索信息、瀏覽下載信息、文獻傳遞信息等。空間利用情況數據包括自習室座位預約系統利用數據、研修空間和研討空間利用數據等。VPN遠程訪問數據包括用戶賬號信息、訪問途徑、訪問內容、下載流量信息等。以上4類信息數據量較大,為GB級別,時間長可達到TB級別;數據結構較復雜,3種類型的數據都有,有在本地的,也有在異地的,不易管理。電子資源利用情況不易獲取,增長速度非常快。微信利用情況、圖書館主頁訪問情況和門禁數據的數據級別為GB級,類型為結構化數據,增長速度緩慢,易于管理。
1.3 其他數據
其他數據包括學科服務、閱讀推廣服務、咨詢服務、講座培訓等方面的數據。學科服務數據包括服務專業情況、服務對象數據、學科服務績效數據等。閱讀推廣服務數據包括閱讀推廣組織數據、參與群體信息和閱讀推廣效果信息等。咨詢服務為解答讀者相關問題的回復,其數據包括咨詢者信息、問題信息和解答信息等。講座培訓數據包括講座內容信息、參與者信息和講座培訓效果等數據。其他數據普遍具有數據量小(MB級別)、分布廣泛、獲取難度較大的特點,大部分為半結構化和非結構化數據,需要對數據進行深加工才能加以利用。
2 高校圖書館實施數據監護的重要性
2.1 有效促進數字資源共享
建立健全高校圖書館大數據的監護管理工作體制,可以有效促進數據資源共享,且防止數據丟失。對于要分享給他人的科研數據來說,可以省去作者本身對數據的管理監護,既節省了精力又節省了財力,只要管理得當,數據可以永久性保存,不會丟失。而對于其他的科研人員,可以通過高校圖書館的平臺搜索自己想要的信息,從已有的數據信息中查到相關的數據,給自己的工作以啟發,也很好地避免了重復性工作的出現。當前科研人員交流的內容主要是科研成果,而研究的第一手原始數據資料尚沒有合適的交流渠道。在當前數字化背景下,科研工作者的各項科研活動都可以通過計算機完成,包括實驗數據、調查記錄等,這就形成了大量的電子數據,為網絡化共享提供了可行性。而且如果研究數據丟失將會導致科研成果不完整,降低科研價值。圖書館憑借高穩定性和可信度優勢,可以建立一個由專人負責的長期運作的數據平臺,用以完整地收藏此類電子數據,符合數字化時代的信息需求。
2.2 為讀者尋找信息提供了便捷
圖書館對采集到的各類服務器監測的歷史數據和讀者的閱讀行為、社會關系、個體特征數據進行整理、分析和決策,以此來準確預測和分析讀者的閱讀需求,監控讀者閱讀活動的輿情,提升讀者行為安全和質量管理水平,為圖書館改革服務模式,創新服務舉措提供精準的數據決策支持,切實提升讀者服務水平。為此,圖書館應重點關注基于物聯網的大數據采集與管理平臺,加強以讀者服務為中心的數據感知層、平臺層和應用層的數據監護,確保基于大數據決策的準確性、科學性和前瞻性。除了數據共享方面的重要性,通過數據監護管理的整理分析及更新,高校圖書館監護管理系統能為讀者快速地尋找到想要的信息提供了便捷。
2.3 可以大大的促進圖書館自身的發展
隨著讀者需求和用戶QS標準的不斷提高,以往傳統的數字資源保存方法已不能滿足大數據時代的需求。現代圖書館大數據管理除了要保證數據資源的可用性、安全性、經濟性和易控性,還需要根據數據生命周期的規律,依據最新的大數據監護技術對數據資源進行存儲和管理,并不斷地進行完善和優化[2]。高校圖書館大數據監護管理系統的運行大大促進了圖書館自身的發展。隨著信息服務領域競爭的日益激烈,高校圖書館要想在競爭中屹立不倒,充分發揮自身的價值,就要有自己的獨特之處。大數據監護管理系統的發展運行,將科研數據有效融合到高校圖書館管理之中,既方便了讀者對科研信息的瀏覽查閱,也充分發揮了高校圖書館的價值,更有利于自身發展。
參考文獻
[1]袁梁.大數據時代高校圖書館個性化服務研究[J].圖書情報導刊,2018,3(10):19-22.
[2]李成.高校圖書館大數據監護系統的研究[J].新課程研究(中旬刊),2016(08):102-103.