文/常熟理工學院圖書館 胡悅
大數據技術的運用對高校圖書館的管理產生了極大影響,大數據技術為圖書館管理的效率和空間提供了更多的可能,為圖書館在功能上的轉型和信息化的發展找到了新的方向。
傳統的圖書館運營,一般是依據“以書為本”的模式,進行單純的書本閱覽和借還,或者是簡單的文獻資料的整理和管理。這樣的管理方式在現代社會是十分落后的。對于快速發展的社會而言,圖書館的慢效率仿佛是另一個時空,這里的時間依舊停留在20世紀。對于習慣快節奏的現代人而言,無法適應圖書館的慢效率,這也是越來越多的人不愛進圖書館的原因之一。人們不愛進圖書館,意味著圖書館的資源無法被充足利用,圖書館的書成為了“死書”,不僅造成了資源上的浪費,也限制了圖書館的發展。
首先,實體的紙質圖書需要大量的館藏空間。進入圖書館的紙質圖書,需要按中圖法進行編目,確定每一種圖書的索引號,以便讀者借書時,可以將書籍在浩如煙海的書架中迅速定位,準確找到自己要借的書。隨著圖書館的擴大,館藏書籍越來越多、越來越豐富,找書、借書和還書的步驟越來越復雜。其次,傳統的圖書館在信息的查找和閱覽方面,必須由讀者前往圖書館才能實現,雖然不少圖書館在館內設置了電腦設備供讀者自助查閱,但是設備過少,在人流高峰時期易造成擁堵和等待。在借書和還書環節仍舊依靠人工服務,無法24小時全天候進行管理和服務,某些讀者存在圖書借閱時間過期和續借的情況,無法及時滿足讀者的要求。最后,傳統的圖書館的管理體系存在組織結構落后的情況,崗位職能固化,各部門分工細致但缺少聯系,對于讀者的需求處于被動服務狀態,在知識服務和信息推送上,未形成主動服務的態勢,無法發揮圖書館平臺優勢。
大數據與云計算經常被一同提起,這兩項主流技術是互聯網領域所關注的焦點。但這兩者在運用方面有很大的不同,大數據是處理海量的數據,而云計算是進行基礎架構。本文主要論述的是大數據技術,通過大數據分析圖書館海量的書籍信息和讀者信息。大數據通過處理結構化、半結構化和非結構化數據進行儲存和數據分析,通過數據分析和價值鏈接,可以作為決策的依據。大數據一直處于不斷發展中,從3V特征到4V特征,隨后IBM公司提出了大數據的5V特征。最新的論述中,大數據具有Volume(海量性),即大數據在數據收集、存儲和計算的量都非常大,起始計量單位至少是P、E或Z。Variety(多樣性)即大數據的種類和來源多樣化;Value(高價值)即大數據雖然數據價值密度相對較低,但是浪里淘沙卻又彌足珍貴;Velocity(高速度)即大數據中數據增長和處理十分快速,時效性要求高;Veracity(準確性)即大數據的準確性和可信賴度,質量要求高。大數據的基本特征與圖書館的信息處理和要求在很大程度上是十分契合的,在圖書館的智慧化、信息化的過程中,大數據的運用得當將會對圖書館的智能發展十分有利。
(一)結構化數據的處理。人們在圖書館進行書籍信息的搜索時,帶有目的性的圖書搜索一般通過作者和書名。但是對于無目的的圖書檢索或是關于某一信息的大量圖書資料的收集,就需要進行關鍵字或是圖書分類進行檢索。這些就涉及大數據對于圖書的結構化數據的處理。傳統的圖書館信息處理系統過于緩慢和單一,容易造成信息搜索的遺漏,而大數據對于圖書信息進行學科、內容、時間和來源的分類,多樣化的信息處理在讀者進行某一關鍵詞的檢索時,能通過大數據層層篩選,為讀者提供高效、準確的信息檢索服務。這樣不僅使圖書館的效率提高,也加大了圖書館館藏圖書的使用率。
(二)個性化推送服務。大數據的最明顯特征是可以根據人們的搜索喜好,進行針對性推送服務。這在淘寶、微博、百度等相關平臺上已經進行了運用,人們在社交平臺上搜索某一東西時,點開購物軟件就能得到相關推送。這在圖書館的運營上也是十分有用的。在快節奏的現代生活中,智能手機的廣泛普及,短閱讀的流行,使人們對于書籍的閱讀減少。雖然社會上有“放下手機,重新拿起書籍”的提倡,但需要圖書館主動出擊,向人們推廣書籍閱讀。圖書館可以利用大數據的推送模式,依托于云計算所建立的圖書館APP或小程序,對圖書館的客戶進行閱讀愛好、習慣和偏愛書籍類型相關方面的數據收集,為客戶提供定制化的書籍推送,引導讀者進行閱讀。同時在社會健康知識的宣傳方面,圖書館也可以借助自身對于資料收集的高效性和準確性,對讀者進行相關知識的宣傳,擴大圖書館的社會影響力,讓讀者體驗到完善的服務,增加讀者與圖書館的聯系。
(一)數據安全風險。大數據在數據收集方面雖然來源多樣化,但是某些數據收集依舊涉及隱私方面的問題,大數據在日常的分析和處理上需要進行維護和確保數據安全。數據安全問題是不少大公司考慮的問題,由于收集的信息涉及客戶的相關隱私,一旦泄露就會造成社會動蕩,承擔法律風險和客戶信任問題。在圖書館方面,由于收集讀者的身份證號、學號、手機號、讀者借閱信息和借閱行為等敏感數據,所以對于數據維護和安全管理方面,圖書館需要投入大量的資金和人力。對于不盈利的圖書館機構而言,這無疑是一筆不小的開支。在圖書館沒有構建大數據管理的能力之前,對于具有這方面技術的IT合作企業的選擇也是一個重點。既需要構建一個高效的大數據管理系統,也需要進行數據安全的日常維護和安全風險的管控。
(二)知識產權數據化問題。圖書館在進行館藏書籍數據化時,在知識共享和知識產權方面也有法律的限制因素。例如,高校圖書館使用自動化的網絡數據搜尋工具為本校的優勢學科和關鍵領域抓取相關的數據資源,為學科領域建立自己的文獻數據庫時,可能會侵犯已下載作品的復制權和編輯權。并且難以驗證來自互聯網的數據運用權力,可能會導致知識產權糾紛和著作權保護困難。此外,圖書館在自制的軟件數據庫中數字化他人作品也可能出現知識產權問題。為了保護知識產權,某些圖書館的自制數據庫未完全向社會或個人開放,僅在有限的范圍內提供使用。
(一)建立風險評估。圖書館的智能化建設需要投入大量的資金和人力。這就需要圖書館在初期建構大數據處理模式時投入大量資金購買好的硬件設備,獲取設備供應商的準確信息,尋求好的品牌進行合作,確保設備的完善和優質。在網絡和信息服務方面,可以與優秀企業合作,強強聯手。圖書館工作人員需要不斷提高自身工作水平,學習數據的維護和處理方式,為圖書館數據的完整性、準確性和安全性提供保障。
(二)強化數字資源建設。高校圖書館可以深層次挖掘本校圖書館的資料,將有效的資料內容轉化為數字資源,集中儲存到所建立的功能較為完善的網絡數據庫中,盡可能開發本校的知識產權資源。從圖書館中篩選出可以完成數字資源轉化的文獻資料,以便高校的師生查閱和學習。對于古籍類的文獻資源,可以通過掃描、光學字符識別等技術進行數字化轉化,不光可以建立文本資料庫,對于視頻、音頻、圖片等多媒體數據也可以進行數據分類、儲藏,全方位構建信息化圖書館,促進高校圖書館文獻資源共享,提高圖書館的信息服務水平。
從以上研究可以得知,大數據技術對于圖書館信息化建設是機遇,也是挑戰。高校圖書館想要更好地服務廣大在校師生,必須把握時代的脈搏,準確抓住時代的機遇,促進高校圖書館在管理方面不斷提高和改善,引導高校圖書館智能化、信息化發展,使圖書館的資源得到最大化利用,為讀者構建綜合性服務平臺,促進知識的傳播。