葉 函 章 迪 劉思詩 周 盼
?
大數據生態系統在圖書館中的應用分析
葉 函 章 迪 劉思詩 周 盼
武漢東湖學院,湖北 武漢 430000
近年來,隨著信息技術的不斷發展,圖書館的數據信息管理面臨著越來越多的挑戰。從現狀來看,大數據問題日益成為制約圖書館進一步發揮其功能的重要問題。基于此,對大數據給圖書館帶來的挑戰進行了分析,并對大數據生態系統在圖書館中的應用進行了探討。
大數據;生態系統;圖書館
隨著大數據在全球知識服務體系中的作用越來越凸顯,大數據問題成為人類社會經濟發展的瓶頸。要進一步推動人類社會經濟的發展,就需要推動大數據的發展,解決大數據問題。在圖書館發揮其知識服務職能的過程中,隨著圖書館數字化進程的加快,大數據問題給圖書館帶來的壓力越來越大。面對大數據問題,圖書館需要建立大數據生態系統,借助大數據生態系統,實現對大數據的有效管理,以此促進圖書館職能的進一步發揮。
1.1 數據量的增多給圖書館現有的計算能力帶來挑戰
隨著圖書館數據量的不斷增長,數據類型的不斷增多,對圖書館現有的技術能力、儲存能力帶來了挑戰。首先,在圖書館的儲存能力方面,圖書館的儲存設備總量是固定的,并且圖書館儲存設備以及儲存容量的增加速度,遠落后于數據量的增加速度,這就會使得圖書館陷入儲存問題的困境。隨著數據儲存復雜度的不斷增加以及數據類型的不斷增加,現有計算機的計算能力越來越無法滿足如此多與復雜的數據計算需求。其次,隨著物聯網、互聯網等網絡信息交流的便捷程度不斷增加,圖書館的數據交換、讀取變得越來越頻繁,而數據的交換需要占用圖書館一定的儲存空間,并且大量的數據交換還需要有強大的計算能力作為支撐,這進一步提高了對圖書館計算能力的要求[1]。此外,隨著數據量的不斷提升,數據的可信度越來越難以判別,這就對圖書館的數據分析技術以及數據檢索技術提出了更高的要求。并且,隨著高校圖書館職工作用的弱化,圖書館對計算機系統的依賴程度進一步加深,這使得圖書館計算能力面臨的壓力越來越大。
1.2 給圖書館基礎設施帶來挑戰
數據量的飛速增長,給圖書館的基礎設施帶來巨大的挑戰。在許多圖書館基礎設施的建設中,對軟硬件資源的建設從高端服務設施轉向了集群化服務,并且隨著數據儲存結構的轉變,要求圖書館的硬件儲存設備以及軟件系統也需要有相應的轉變,這就給圖書館現有的硬件儲存設備與軟件系統帶來較大的壓力。圖書館需要根據實際的數據儲存需要,建設網絡基礎設施與數據儲存設施,通過分布式基礎設施的建設,建立更加高效與靈活的組網方式與信息儲存方式。大數據問題給圖書館帶來的挑戰還包括人員方面的挑戰,大數據引起的數據儲存方式的變革,以及數據處理系統上的變革,要求圖書館管理員具備信息系統以及數據管理方面的專業知識,并且還要求圖書管理員具有更廣的知識面,以及更高的專業技能水平[2]。
2.1 大數據生態系統的應用特點
圖書館的大數據生態系統具有高度的靈活性與可拓展性,可以儲存、讀取PB級的數據,可以更快速地進行數據的儲存與讀取。在大數據生態系統中,采用的是云計算技術,可以快速地將大數據轉換為單一的數據,并將這一術數據作為大數據生態系統檢索的節點,同時依據這一數據節點,可以進行數據的檢索與分析。利用大數據生態系統,可以解決傳統系統無法處理結構化數據與非結構化數據的問題,實現圖書館儲存結構的轉變以及讀取方式的轉變,從而增加圖書館數據儲存類型以及處理類型,拓展圖書館的數據處理與數據服務能力[3]。應用在圖書館中的大數據生態系統,使得結構數據與非結構數據相結合,實現了新舊系統以及新舊數據的兼容,實現了結構數據向非結構數據的轉變。并且,大數據生態系統借助云計算,可以實現可視化數據查詢。在數據查詢中,不需要使用到本地終端,節省了圖書館的數據儲存空間。
2.2 大數據生態系統軟硬件結合的解決方案
2.2.1獲取階段
在圖書館應用的大數據生態系統中,實現了圖書館軟硬件資源的結合,使得圖書館資源得到了更加高效的利用。在大數據生態系統獲取數據的階段,當前常用的數據檢索方法為:從信息資源角度獲取數據。這一數據檢索方式與當前大數據的檢索情況不符,在大數據生態系統中,是以用戶的需求進行數據獲取操作,在數據獲取中,利用云計算進行數據的檢索以及構建操作[4]。大數據生態系統可以判斷用戶的數據需求,根據用戶的數據需求,自動對數據進行檢索。同時,在用戶檢索的過程中,大數據生態系統會自動記錄用戶的信息獲取途徑以及用戶的信息獲取偏好,同時自助式的展開數據的收集以及顯示操作,在數據獲取中,也會考慮到結構數據與非結構數據的檢索,并計算用戶獲取數據突發性與易變性的可能。
2.2.2儲存與組織階段
大數據生態系統采用了低成本集群儲存方式,儲存性能高,讀取速度快,并且可拓展,成本低,實現了關系型數據庫與云儲存方式的有機結合。在大數據生態系統采用的是MapReduce并行計算模型,實現對了非結構新數據的處理,其最早適用于網絡數據處理。但是在大數據的處理過程中,MapReduce并行計算模型不需要對數據進行抓取處理,在數據處理過程中,對非結構性數據進行移動計算。大數據生態系統借助強大的數據處理能力,實現數據的橫向處理,數據處理效率相比于豎向處理有了極大的提高。
隨著大數據時代的到來,圖書館現有軟硬件設施面臨著巨大的壓力,數據量的增多也給圖書館現有的計算能力帶來挑戰。而通過大數據生態系統在圖書館中的應用,可以在很大程度上提升圖書館的數據服務效率,并且對傳統的知識服務模式也是一種創新。信息技術帶給我們的機會是轉瞬即逝的,我們需要站在更高的高度上,進行大數據系統的研發,從而推動人類社會經濟的發展。
[1]劉健,張海濤,張連峰.圖書館知識生態系統的虛擬化封裝模型構建及技術方法研究[J].情報科學,2015(2):121-125.
[2]劉小鋒.大數據環境下圖書館跨邊界知識自組織促進知識轉移方法[J].圖書館學研究,2014(13):45-52.
[3]李艷,呂鵬,李瓏.基于大數據挖掘與決策分析體系的高校圖書館個性化服務研究[J/OL].圖書情報知識,2016(2):60-68.
[4]鐘靜.讀者購借在館藏建設中的策略探討與制定——以“重慶圖書館大數據分析試驗系統”子項目為例[J/OL].農業圖書情報學刊,2016(8):18-21.
Big data analysis of application of ecological system in the
Library
College of Wuhan East Lake,Hubei Wuhan 430000
In recent years,with the continuous development of information technology,the library data information management is facing more and more challenges.From the point of view of the current situation, the problem of big data has become an important problem that restricts the further development of the library.This paper will analyze the challenges brought by the big data to the library,and discuss the application of the big data ecosystem in the library.
big data;ecosystem;library
G250.7
A
1009-6434(2017)01-0107-02