摘 要:大數據與云計算是近兩年IT界最為流行的兩個關鍵詞,各大IT廠商也都看到了大數據所蘊含的商業價值并展開了一定的產品研發與商業應用。在當前的大數據背景下,在處理數據以及服務方面,圖書館的變化明顯,通過數據,對其價值進行重點的挖掘與研究,為圖書館管理人員調整有關建設措施提供依據,同時這也是其關鍵業務之一,在服務的方法與方式上,圖書館也會根據其不斷變化的方案而改進。
關鍵詞:大數據;云計算;數據處理;數據分析;信息服務;圖書館服務;數據挖掘
“大數據”在IT行業中,是最近僅次于“云計算”以及“數據挖掘”的流行詞匯之一,大數據的改革正如火如荼的開展著,在此次革命中,作為商業部門的EMC、IBM以及Oracle已經關注到其商業價值,同時在云計算的基礎上,針對BigInsights開發了有關的數據收集和計算服務。在這一革命中,美國對其價值也早有關注,2013年三月底,在奧巴馬帶領下的美國提出了 “大數據的研究與發展計劃”,其目的是對政府內部的相關分析、組織以及收集數據的工具進行改進,從而推動自身在集合各種繁雜數據過程中的能力,使國家的戰略方針與大數據相一致。對于圖書館而言,利用、存儲和開發知識是其社會責任,處于當前“大數據”背景下的圖書館,其在處理數據、計算和搜索數據、發現只是、服務信息等方面的能力提升是當前的研究重點,這一問題要想得到根本解決,就要看清楚“大數據”給周邊環境帶來的深遠影響,對可以用于圖書館的各項工具、技術、理念等作出綜合研究,促進圖書館不斷提升其服務讀者信息的能力,為圖書館的未來發展貢獻力量。
1 大數據概述
當前,對于大數據的定義還不統一,有的分析專家指出,一個企業在半結構以及非結構化數據的創造一般叫做大數據,當關系型的數據庫在下載上述數據過程中,費用以及時間都是較大的支出,所以,大數據一般被稱作是非結構化的具有各種不同形式的大量數據的集合。1)大數據的應用領域與范圍。雖然大數據這一詞匯早就出現了,而真正的研究相關技術的歷史并不長。當前來講,數據的挖掘算法、語義引擎、分析預測性能力、可視化分析、數據的管理與質量等都屬于大數據的技術范圍,詳細來講,當前主要由分布式緩存、分布式文件系統、分布式的數據庫以及不同的分部儲存措施等組成。缺乏成型和廣泛運用的應用跟技術是造成當前大數據使用較難的主要原因,所以,當前能夠參與競爭的廠商主要是在分析以及存儲數據方面有著較大優勢的企業。2)大數據與云計算。云計算與大數據是相關聯的,當前的分析大型數據是要負責眾多電腦的工作分配,所以,大數據和云計算之間的關聯性,我們可以這樣認為,大數據在運行與存儲方面的難題被與計算所解決,并且建立了一定的架構平臺,通過分布式的處理方法,大數據對此平臺進行運用,計算能力是云計算的關鍵,計算對象則是大數據的關鍵,他們之間存在著互相促進的作用。對這兩者的不同進行分析,可以從下面幾點來講,應用方面,第一,從概念的角度分析,云是大數據運營的基本單位,云計算對IT產生了改變性的影響,業務受大數據影響而改變;第二,在受眾的角度分析,云計算的主要銷售對象是以技術或者解決措施為主要產品的主管部門,大數據的主要銷售對象則是業務部門。
2 大數據時代的圖書館數據處理與服務
1)圖書館具有了“大數據”特征。當前建設圖書館信息的速度不斷加快,讀者也不斷提出更高要求,在大數據的背景下,圖書館具備了相關特點。第一,在數據類別上,圖書館較多,其數據資源主要包括數據庫資源、網絡資源、光盤資源以及紙質的純印本等文獻資料信息,同時還包括平時讀者的信息以及相關服務信息,另外讀書館本身的有關信息也包括在內,上述相關數據在應用特點、數據格式以及編碼等方面的不同造成了圖書館的不統一,不同圖書館之間的差別更大,這也是許多不同數據產生的原因;第二,圖書館在信息方面具有量大和增速快的特點,但從圖書館自身將,其資源總量不多,但是總結全國的圖書館信息,其數據集卻是相當大的。2)大數據時代的圖書館數據處理。在數字化的背景下,處理圖書館的相關數據工作以處理器語義、網絡化和數字化為主要內容,以此為基礎,使用戶能夠在利用程度以及滿意程度上實現最大化,同時還包括建設語義化、數據庫以及服務方式等,在當前的大數據背景下,在處理數據的對象、方法以及范圍和目標等方面,圖書館的變化顯著,最常見的是在讀者借閱的喜好的基礎上,對讀者的服務數據做出相關研究,從而制定出更加科學的方法。與此同時,在大數據時代的背景下,對數據的研究和分析將代替圖書館的傳統業務而成為重點,處理和研究相關數據會發展成為圖書館的重點工作,圖書館要提升其服務質量、拓寬其數據資源、改善服務方法等將不再單純的以共享數據、創新思路和時間延長為重點,在眾多的數據資源中,挖掘其潛在價值與規律的發現成正比,同時對于提升圖書館的服務也就有促進作用。3)大數據時代的圖書館服務。圖書館的服務在用戶需求以及相關技術進步的推動下,不斷進步,在大數據背景下,從服務的方式方法等角度,圖書館的變化都很明顯,因為組織、獲取以及決定和研究相關數據是圖書館制定服務方案的基礎,所以,此背景下的圖書館服務在鮮明性與針對性方面更加明顯,其服務的方式方法也在不斷調整的方案的影響下而不斷進步。因此,從圖書館最基本的學科服務、咨詢信息以及文獻調整服務等角度,圖書館從自身具備的處理信息和服務優勢的方面都會獲取較大的發展,為包括公司和政府在內的社會部門在分析數據方面提供支持,在大數據背景下的圖書館將會以挖掘數據服務作為其最常態的服務。
3 結語
不同的技術,其發生與發展,對圖書館的進步和發展都會產生影響,在社會進步的推動下,用戶的要求也會不斷提升,大數據也不例外。當前,在數據的來源方面,圖書館具有復雜的特點,同時這也加快了圖書館朝著大數據時代的發展,通過數據分析來發現其價值是未來圖書館的重要業務之一,同時,圖書館在這些業務方面的發展潛力對其未來的發展也具有一定的決定性作用。本文以研究大數據的各種概念、含義以及特征為出發點,針對圖書館在處理數據業務方面的發展做出分析,隨著大數據時代的真正到來,將會有越來越多的專家和學者投入到對圖書館處理數據以及相關服務的研究中來,對其做出更加科學合理的應用型分析。
作者簡介:
岳亞琴(1990-),女,漢族,四川成都人,四川工商學院圖書館館員,從事圖書情報研究。