摘要:大數據時代的到來為圖書館服務提出了挑戰,圖書館的傳統業務受到沖擊和壓力,在大數據環境下使用云計算技術發展業務將成為圖書館未來的發展趨勢。本文介紹了大數據和云計算的概念和特性,闡述了現階段圖書館信息資源建設所面臨的問題,分析了云計算在未來圖書館信息資源建設中的應用,最后探討了云計算在數字圖書館中應用需注意的問題。
關鍵詞:大數據;云計算;圖書館;信息資源建設
1 大數據
1.1 \"大數據\"的含義和分類 大數據之所以被稱為大數據首先因為它的數據是海量的,而且目前隨著科技發展,隨著人們對互聯網的依賴程度不斷提高,這個海量的數據正在超速增長。其次,大數據是海量的數據被整理納入大數據倉庫里,然后對其進行分析挖掘,再利用有價值的結論進行下一步行動的決策[1]。
大數據從數據內容結構上可分為結構化數據、半結構化數據和非結構化數據。結構化數據即行數據,存儲在數據庫里,可以用二維表結構來邏輯表達實現的數據,在形式上有諸如文字、數字、符號,能夠用統一的形式加以標識。非結構化數據包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像、音頻和視頻信息等等,這些內容無法用簡單的邏輯表達實現,分析起來也需要特別的硬軟件。半結構化數據,就是介于結構化數據和非結構化數據之間的數據,它一般是自描述的,數據的結構和內容混在一起,沒有明顯的區分。
1.2 圖書館的\"大數據\" 圖書館的大數據首先包括書目數據。這些數據一般屬于圖書館穩定的結構化數據,目前這些數據的使用多用SQL工具分析。對于結構化的數據,小規模的數據,目前的分析工具足可以用了。對這些數字化書目數據做分析可以反映出一個圖書館館藏的級別、服務的對象、服務的傾向和服務的質量。
圖書館的大數據雖然以結構化數據為主,但隨著圖書館新服務的開展,圖書館與讀者的互動信息,以及讀者面對圖書館的各種信息行為都會被記錄,這些信息將成為圖書館大數據中的非結構化數據。這些動態的非結構化數據可以來自圖書館業務內容,也可以來自讀者服務體驗。
2 云計算
2.1 云計算的概念 云計算是并行計算(Parallel Computing)、分布式計算(Distributed Computing)和網格計算(Grid Computing)以及Internet 結合起來的新的網絡資源提供模式。云計算是以虛擬化技術為基礎,以網絡為載體,以提供基礎架構、軟件、平臺等服務為形式,整合大規模可擴展的計算、數據、存儲、應用等分布式計算資源,進行協同工作的超級計算模式[2]。它不僅是資源的簡單匯集,而且為我們提供了一種管理機制,讓整個體系作為一個虛擬的資源池對外提供服務,并賦予開發者透明獲取資源、使用資源的自由。
2.2 云計算的特點
2.2.1超強的計算能力 云計算由成千上萬臺服務器組成的集群能賦予用戶前所未有的能力。用戶可以擁有超大的存儲和管理空間,以及超強的計算能力。
2.2.2海量的存儲空間 云計算為數據的存儲提供了廣闊的空間,它是將大量的服務器集群共同組合在一起,形成巨大的空間,所有的數據通過云計算中心運算處理后返回給用戶。
2.2.3可靠的安全保障 云計算使用了數據多副本容錯、計算節點同構可互換等措施來保障服務,存儲在云里的數據資源丟失或硬件崩潰都不會受到影響,云計算技術存儲數據安全可靠。
2.2.4便利的資源共享 由于是將大量的信息匯聚成一個整體,對于同一資源可以供多方共同使用,從而避免了資源不必要的重復,進而提高了信息資源的共享程度。同時,云計算可以針對不同應用即時應對,規模可以動態伸縮,云計算下的資源可以根據應用和用戶規模增長的需要隨時進行動態擴展和配置。
2.2.5良好的系統兼容 對于不同的操作系統,不同的數據格式,不同的數據庫之間的數據,云計算可以通過一站式檢索不同系統中的相同信息,系統之間可以無縫連接和訪問。
3現階段圖書館信息資源建設面臨的問題
圖書館的數字資源包括圖書館引進或自建的,擁有磁、光介質或網絡使用權的數字形態的文獻資源。根據數字資源的種類可分為:電子書、電子刊、二次文獻數據庫和其他數據庫。根據數字資源的存在形式可分為:在線資源和本地鏡像資源。根據數字資源的來源可分為:購買的數據庫、自建數據庫、試用數據庫和免費數據庫[3]。現階段圖書館都是各自為政,在建設的過程中存在著很多問題。
3.1 數字資源重復建設問題 目前,館與館之間數字資源的建設都是相互獨立的,在建設過程中都是按照學校經費多少和專業的需求進行資源建設,一般都不會考慮其他館的建設情況,只埋頭建設自己的數字資源。這樣勢必造成了大量的人力、財力的浪費,從宏觀的角度看不利于高校圖書館的發展。
3.2 存儲及檢索技術問題 隨著數字圖書館的發展,圖書館的數字資源海量增加,而其數據管理、備份、存儲設備能力都十分有限。同時,數字資源的圖片檢索技術、多語言檢索、不同數據標準之間的數據交換、人機交互技術、數字圖書館所需的軟件和工具等都還有待于技術上的進一步發展[4]。
3.3 信息資源共享問題 目前,圖書館資源的共享往往局限在一些對口的、接口相同的數據資源上。由于數字圖書館平臺技術不統一,各館間有的數據無法相通,這樣就談不上共享。
4 云計算在未來圖書館信息資源建設中的應用
圖書館信息資源建設的最終目的是為了滿足用戶的需求,提高服務質量。云計算的出現使分布在互聯網中各個圖書館的資源和服務整合成為一個整體,使其服務的時間、空間、服務方式等有了無限擴大完善的可能。分析云計算的特點和它所提供的服務形式,我們可以看出,云計算的模式也適用于圖書館的數字信息資源建設。
4.1 云計算可提供圖書館海量信息資源數據存儲的能力和提升數據安全。
圖書館的基本功能之一就是存儲資源。隨著時代的發展和科技的進步,各種信息資源呈爆炸性的增長。目前圖書館通過增加存儲能力來滿足日益增長的資源空間已經力不從心。云計算采用分布式存儲的方式存儲數據,數據不再存儲在本地硬盤,而是通過網絡存儲在云計算系統中,可以容納海量數據,并且不斷更新和增加,為數字圖書館不斷增加的電子數據提供海量的存儲空間。同時,云計算采用冗余存儲的方式來保證存儲數據的可靠性,即為同一份數據存儲多個副本。在數據管理方面,云計算使資源更加高速、高效地存取,使數據的操作頻率遠大于更新頻率[5]。
4.2 云計算可實現圖書館的數字信息資源整合以及共建共享 云計算的一個核心內容就是對\"存儲內容\"的整合與應用。云計算技術為數字資源的整合鋪平了道路,它不僅為實現多種資源的全面共享創造了統一的信息資源平臺,而且屏蔽了信息資源的不同格式,解決了各類數據庫的數據標準化和接口問題。基于云計算的數字圖書館將異構分布環境下不同來源的海量數據資源進行統一整合,可以極大地提高信息資源的利用率,實現數字信息資源的共建共享[6]。
4.3 云計算可提高圖書館信息資源的利用率和信息服務的能力 云計算通過對各種資源、格式使用統一的管理平臺,共享應用和數據,實現更大的網絡效益。圖書館的電子資源將存儲在\"云\"里無數服務器中,而不是存儲在單獨的某臺計算機中。利用云計算整合跨數據庫、跨地區數據能力,實現對各類型數據庫的云整合,形成各類型信息資源服務云,提高信息資源的利用效率。同時,利用云計算,用戶可以在圖書館任意一個角落隨時隨地使用已有的\"云\"中的資源與計算服務,這樣簡化和壓縮了圖書館信息組織、信息服務以及信息獲取的過程,提高了圖書館信息資源的利用效率和社會價值。
5 數字圖書館使用云服務需注意的問題
5.1 數據安全性與保密性 圖書館中哪些數據置于云端,哪些數據需放在本地是圖書館需研究考慮的問題。圖書館書目信息、讀者個人信息、電子資源數據庫等信息資源需進行梳理,然后再研究確定如何存放。關于圖書館讀者信息等個人隱私方面信息,更多是政策層面的問題。
5.2 信息資源共享中的版權問題 \"云\"模式的數字圖書館之間通過有關協議共享彼此的信息資源,在提高信息資源共享的同時,可能因為版權問題而引發糾紛。隨著數據挖掘、系統共享、信息共享技術的不斷開發,置于公共云端的數字資源有可能成為信息資源共享使用中的對象而產生版權問題。所以,云計算環境下信息資源中的問題,既要保障信息資源的共享性,又要達到內容不受侵犯等知識產權問題,值得關注[7]。
5.3 網絡質量問題 搭建數字圖書館的云計算服務平臺時,需要考慮到網絡通信能力的好壞。由于用戶的訪問和應用都取決于圖書館的云端服務,網絡的高帶寬和流暢性至關重要。云計算是客戶端性能最小化、在云計算網絡中完成的高效信息處理,這對云計算集群服務器的性能有較高的要求,同時,網絡中通信設施也需要高性能,才能保證將云計算的服務高質量地傳給需要的用戶。
6結論
\"大數據\"是高校圖書館未來發展無法逃避的發展趨勢。云計算模式的出現,給數字圖書館的發展提供了更多的技術和服務支持,把云計算運用到圖書館中,不僅可以提高資源的利用率,節約圖書館的資源,也可以給云計算帶來一個新的應用領域。以信息服務工作為己任的高校圖書館,如何以\"大數據\"的思維重新認識高校圖書館,如何利用云計算技術將已有的數據資源進行有序組織、深入挖掘與開發,如何進一步推動數字圖書館的發展,成為高校圖書館未來發展的關鍵。
參考文獻:
[1]郝志剛,大數據、云計算與圖書館[J].新世紀圖書館,2014(6):36-39.
[2]朱勇,淺談云計算與圖書館數據中心[J].科技情報開發與經濟,2010(24):72-74.
[3]于健,云計算與圖書館未來數字資源建設[J].情報探索,2012(6):63-65.
[4]盧曉娟,云計算與未來圖書館數字信息資源建設[J].四川圖書館學報,2009(2):23-24.
[5]蔡惠霞,淺議云計算與圖書館信息資源建設[J].內蒙古科技與經濟,2012(14):36-37,39.
[6]尚武,楊涌,云計算與數字圖書館的發展[J].中華醫學圖書情報雜志,2013(1):48-49,56.
[7]高曉燕,云計算在圖書館中的應用探究[J].高校圖書情報論壇,2010(2):49-52.
編輯/許言