王蘭英
[摘要]大數據是科學進步的產物,是高校圖書館的重要資產,也是服務轉型的基礎。大數據具有全面性、多樣性和時效性的特征,預測和優化是大數據的核心。高校圖書館的大數據的形成、存儲和應用有其特點。大數據時代下高校圖書館應加快服務轉型,轉型的關鍵在于資源整合、語義分析和移動終端等3個方面。
[關鍵詞]大數據;知識服務;資源整合;語義分析;網絡平臺
1大數據是現代網絡技術的必然結果
由于互聯網、3G網絡和物聯網等各種信息網絡的快速發展,PC端、移動終端、RFID和無線傳感器等各種終端的廣泛使用,Hadoop平臺、數據流分析、云計算等網絡技術的不斷成熟,產生于各種終端的數據急劇膨脹。這些數據如此之大,存儲方式如此之復雜,人們就用大數據來形容這些以TB計量的信息數據。通常人們用4V來描述大數據的特征[2],即體量巨大(volume)、形態繁多(variety)、生成速度快(velocity)、價值大但密度低(value)。這是對大數據的量級、儲存方式、處理技術和利用價值等方面的描述。
對海量數據進行篩選分析,挖掘出有價值的信息,才是大數據的真正本質。從價值發現的角度來看,大數據具有全面、多樣和實時的特征。
1.1 大數據是全面的
大數據的全面性反映在兩個方面。一方面,幾乎人類社會的各個方面都有大數據的存在和使用,從電子商務、網絡教育到政府微博等,大數據無所不在、無所不包;另一方面,大數據為單一個體提供了歷史數據、同類比較等比較全面的描述。對大數據來說,樣本即總體。大數據的全面性能對事物的本質和行為者的意識做出比較客觀的判斷,能對事物的未來發展做出比較準確的預測。
1.2 大數據是多樣的
大數據的多樣性表現在兩個方面。首先,產生和儲存大數據的形式呈現多樣性,功能不同的數據終端生成的數據在形式上也各有不同,有文本、圖像,還有各種無線信號,從存儲形式上看,這些數據有結構化數據、非結構化數據和半結構化數據;其次,大數據產生的價值是多方面的,同樣的大數據由于參數選擇的不同,觀察角度的不同,會產生不同的價值,例如,同一組銷售數據,對生產廠家和對物流公司來說,其價值是不同的。大數據的多樣性特別是形態的多樣性,可以對事物進行直觀的多維度的描述,可以從數據中挖掘更多的價值。
1.3 大數據是實時的
由靜態發展轉向動態發展將成為信息發展的主流。大數據最重要的特征就是數據的時效性。大數據的時效性也包含兩個方面。一方面,數據的產生是實時的,由于產生大數據的各種終端不斷地實時地產生數據,如網絡訪問中的日志數、商品的二維碼掃描、通訊信息等,特別是隨著移動終端采集數據的技術的更新與進步,大數據的時效性更為突出;另一方面,大數據的處理是實時的,云計算和hadoop等網絡技術為大數據提供了實時的處理。
大數據的上述特征,使大數據蘊含著巨大的價值。《Big Data-A Revolution That Will Transform How We Live, Work and Think》一書的作者Viktor Mayer-Schonberger認為大數據的核心就是預測和優化。Google公司開發的自動駕駛汽車運用了視頻攝像頭、雷達傳感器和激光測距器來收集實時的數據,了解周圍的交通狀況,并通過詳盡的地圖對前方的道路進行導航,這一切都是通過Google的大數據中心來實現的。Aamzon的推薦引擎也是運用大數據的成功案例,其推薦引擎完全是基于客戶在過去一段時間的購買行為所做的:客戶的購物車中所收藏的商品、客戶喜歡的商品、其他用戶瀏覽或購買的商品……Aamzon使用大數據平臺,為每位客戶定制了專屬的個人主頁,利用這一策略,公司在其第三財政季度期間銷售增長27%,達到了1318億美元,而去年同期的銷售額則為96億美元。從這些經典的案例中,我們可以展望大數據對高校圖書館所產生的巨大價值。
2高校圖書館的大數據建設
大數據特別是非結構化數據和半結構化數據將成為未來圖書館的重要資產[3]。高校圖書館的大數據資源包括圖書館的紙型資源、數字資源、網絡資源和客戶資源。
2.1 紙型資源要加快數字化建設
圖書館的紙型資源是所有紙介質信息的總和,包括圖書、期刊和報紙,它是高校圖書館的大數據資源的基礎。為適應大數據時代的發展趨勢,未來高校圖書館應該將紙型資源與數字資源結合起來,紙質資源與數字資源互補共存,并且數字資源要逐步成為圖書館的主要資源,而紙質資源要逐步數字化,為在線閱讀和資源整合提供數字化基礎。
2.2 數字資源要進一步整合
圖書館的數字資源包括數據庫、電子期刊、電子圖書、網頁和多媒體資源。資源整合是高校圖書館發展的基礎工程,包括高校內部的資源整合,高校之間的資源整合和各類數據庫的共享等。資源整合可以提高現有資源的利用率,最大限度地滿足讀者的需求。目前已有的基于OPAC的數字資源整合是資源整合的初級階段,主要是查閱功能和數據庫的整合,未來還要加快客戶資源、數字化了的紙質資源、教學和實驗資源的整合,盡可能消除時間和空間的影響。高校圖書館的資源整合是大數據環境下的內在需求,同時大數據還可以為資源整合提供必要的數據和技術支持[4]。
2.3 網絡平臺是大數據的載體
高校圖書館的網絡平臺是大數據的根基,是生成、存儲和交換大數據的重要載體,是圖書館與客戶互動的重要平臺。高校圖書館建立網絡平臺擁有自己特有的優勢。
2.3.1 實體優勢。經過多年的積累和完善,高校圖書館積累了大量的圖書和期刊,其品質和專業性也逐年提高,這就能為客戶提供更多的和更便利的選擇,這種實體優勢是其他只提供虛擬的知識服務和信息服務的網絡平臺所無法比擬的。
2.3.2 客戶優勢。高校圖書館的服務對象主要是在校學生和教師,客戶群相對穩定,因此對客戶信息的認知程度非常高,這些信息包括客戶的個人信息、專業取向和知識水平等,對這些信息的掌握可以使圖書館在服務環節上做到細分,從而為客戶提供更準確和更高效的知識服務。
2.3.3 管理優勢。高校圖書館一直處在知識信息的最前沿,對圖書的質量和需求、最新的圖書信息、知識服務的新進展等都更加了解,可以為客戶提供更及時和更前沿的圖書信息。高校圖書館的管理人員和技術人員的專業水平高,管理經驗豐富,這是圖書館提供優質服務的不可或缺的軟實力。
高校圖書館應根據自身的優勢和需要建立更具特色的網絡平臺,使其成為信息更加豐富,資源更加全面,搜索更加便利,個性化更加突出的平臺,成為圖書館與客戶連接的重要窗口。
3大數據促高校圖書館的功能轉變
大數據時代下高校圖書館的服務功能將產生新的變化。除了要繼承和優化傳統的服務功能,也要開發大數據支持下的新的服務功能。
3.1 實體資源的跨區域整合
圖書館的最大優勢是它的實體資源,實體資源的整合可以進一步優化資源配置,最大限度地滿足客戶需求。高校圖書館的服務對象有明顯的區域性特征,在當地圖書館和購買行為無法滿足客戶的閱讀需求時,跨區域的實體資源的重新配置就顯得非常必要。大數據也伴隨著大物流,在物流相當發達的今天,圖書館實體資源的整合成為可能。高校圖書館應建立跨區域的圖書聯盟,建立跨區域的無償或有償的圖書預約機制和圖書調配機制,建立便利、可信、智能的圖書物流平臺。
3.2 專業化的客戶服務
在高校圖書館的網絡平臺建設中,提高搜索引擎的個性化和智能化是關鍵。目前高校圖書館已經提供了許多數字資源[5],包括CALIS、CADAL等數據庫,也提供了許多個性化服務,但由于受到技術方面的制約,現有的搜索引擎和語義分析還無法完全滿足客戶的搜索意圖,搜索的結果往往是機械的和被動的,客戶在提供的搜索數據面前,只能自己去篩選信息。如果一個教授與一個新生得出的搜索結果是一樣的,顯然違背了客戶的搜索意圖。大數據的全面性和多樣性為圖書館提供了比較詳細的客戶的信息,包括客戶的專業信息、借閱行為、網絡瀏覽記錄等,這些信息為圖書館開發優質、智能、提前的服務提供了可靠的依據。建立在大數據平臺下的搜索引擎,可以根據客戶的搜索歷史以及瀏覽習慣等數據進行分析,根據本體知識的來源、演化過程、知識間的因果關系和關聯知識進行判斷,將數據進行深加工,從而使搜索結果變得立體和科學,能充分滿足用戶間差異性的需求。
3.3 移動終端的信息服務
大數據時代的一個重要標志是移動終端的廣泛使用。手機以其方便快捷、碎片化時間的閱讀優勢,將成為今后閱讀的最主要的方式之一。據第十次全國國民閱讀調查報告[6],2012年我國18—70周歲國民人均每天手機閱讀的時長為13.53分鐘,比2010年增加了3.21分鐘,在大學生群體中手機閱讀時間遠超這個數字。高校圖書館應為客戶提供更多的針對移動終端的資源,通過短信等方式發布有關專業的信息,開通手機的訂閱服務功能等。建立移動終端的個人圖書館是圖書館服務功能轉型的重要環節。
4結語
大數據的來臨,是科技進步的必然結果,它在給傳統的高校圖書館帶來挑戰的同時,也帶來了機遇。只有正確認識大數據,深度挖掘大數據的價值,完善大數據技術,高校圖書館才能在大數據時代下得到發展。只有改變服務理念,了解客戶的需求,掌握專業進步的需求,提高服務品質,高校圖書館才能實現服務轉型。建立在大數據平臺下的高校圖書館,是未來高校圖書館發展的必然趨勢。
[參考文獻]
[1] 李福林.聯合發展,應對圖書館邊緣化[J].情報探索,2009(1):10—11.
[2] 李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J].中國科學院院刊,2012(6):647—657.
[3] 楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(4):120—122.
[4] 嚴霄鳳,張德馨.大數據研究[J].計算機技術與發展,2013(4):168—172.
[5] 龔亦農.數字圖書館的資源整合[J].圖書情報工作,2005(9):121—123.
[6] 中國新聞出版研究院.第十次全國國民閱讀調查報告[EB/OL]. [2013-07-27].http://www.chuban.cc/yw/201304/t20130419_140027.html.