魯黎
(中共湘西州委黨校,湖南吉首,416000)
大數據的顯著特點在于巨量的資料信息,將類型復雜繁瑣、數量巨多的數據信息構建成數據庫,利用云計算等信息技術實現對數據信息的精準提煉、分析處理與實時共享,其核心作用價值在于數據信息的集成處理與數據增值,旨在為日常經營管理提供有價值的數據服務。對于圖書館而言,大數據信息化背景下圖書館呈現出系統化的發展特點,隨著社會經濟的快速發展,圖書館所涉及的巨量數據信息資源不斷崛起,引起圖書館服務模式的必然轉變。為進一步推動圖書館信息化服務的建設發展,大數據信息技術的有效應用多圍繞“服務”這一主題來開展,包括平臺服務方式、數據信息資料的分析處理以及服務對象的轉變等等,將讀者產生的閱讀行為習慣轉化為數據信息,從而不斷強化圖書館信息化服務工作,更好地適應信息化時代發展的需要。
首先表現為數據信息的實時共享,圖書館管理終端可充分利用大數據信息技術來快速精準的提取讀者的相關數據信息,實現對讀者行為習慣的準確分析,從而更好地實施個性化服務,讀者能夠獲取到所需的有效信息,從而提高數據信息的高效使用。同時利用大數據信息技術能夠不斷拓展圖書館圖書資源的采購范圍,通過對讀者行為習慣、數據信息進行分析整合之后來為讀者采購更多所需的圖書資源,并為國家科教文化事業的建設發展提供相關的數據信息,借助大數據信息的實時共享特性來不斷提升圖書館信息化服務水平。
其次表現為數字化、信息化的資源存儲。利用大數據信息技術構建數字化圖書館,形成數據信息服務鏈。一方面能夠將一些館藏時間較久,且借閱率、展覽率不高的文本資料借助信息化平臺來向讀者全面生動的呈現,有利于我國優秀傳統文化的持續傳播,同時最大限度的保護了版權許可規定。另一方面對于日常大量的圖書資源信息能夠保證安全的、數字化資源存儲,不僅方便信息的檢索提取,還為圖書館節省了一定的空間場所[1]。
再次表現為信息交流的交互性和隨意性。傳統圖書館服務模式下,圖書的借閱歸還、口頭咨詢等多采用面對面的服務模式,而大數據信息化技術能夠打破時間、空間的壁壘,讀者不受空間限制能夠進行信息資料的隨時獲取或者進行有關咨詢,有效簡化了圖書資源的借閱手續,通過借助智能終端設備就能查閱相關數據資料。
為進一步提升圖書館信息化服務水平,需要熟練掌握信息服務技術的有效應用,在此主要介紹與數據信息挖掘相關的技術,方便應用于圖書語音識別、圖書采購以及移動借閱、數字圖書館的建設等方面。首先深度神經網絡是近年來機器學習深度研究的一個重要方向,通過模擬人腦并進行分析的形式來解釋圖像、聲音文本等相關數據,利用深度神經網絡技術來對圖書館相關的資源信息進行逐層提取、自動化提取,無需人工手動干預,大數據與深度神經網絡技術的結合為數字圖書館的建設與智能化發展開創了一個新的方向。利用深度神經網絡技術對館內可視化、音視頻文本等進行語音識別,識別精讀能夠提升近30%,同時應用于圖書圖像識別分類能夠大大降低誤差率。除此之外還可應用于圖書館內大數據信息資源檢索系統以及各類信息識別軟件中。為最大限度地實現數據信息的自動過濾與逐層分類,需要重點借助信息過濾技術,首先在于內容的過濾與信息檢索,通過模擬構建讀者感興趣的文本信息模型來實現信息檢索與過濾;其次在于協作過濾,憑借信息過濾技術能夠依據最近用戶感興趣的信息對其進行分析判斷,從而將得出的結果信息推送給其他用戶,協作過濾可充分應用于一些較為復雜多變的概念。最后針對信息過濾技術,可應用移動Agent信息過濾算法來智能分析讀者的閱讀喜好,建立相應的用戶信息采集庫,對于出現的高頻詞、關鍵詞進行過濾,從而方便管理人員有針對性的向讀者推送個性化信息服務。如下圖通過數據挖掘來進行信息過濾并構建出讀者個性化模型,實現圖書服務的針對性、個性化推薦,極大的提高了圖書館數據信息服務水平。

圖1 個性化推薦模型
數據資源分析是提升圖書館信息化服務質量的現實需求,利用大數據信心技術能夠促使讀物形式、業務功能更加多元化,數據資源的使用頻率也越來越高,同時更多圖書活動也相繼開展,這些表現對于數據信息的分析有著極高的要求。隨著館內各項數據信息資源的擴增,想要實現數據資源結構化、半結構化的整合形式相對困難,因而需要全面加強對數據分析的重視。一方面數據分析更符合線上線下讀者的個性化閱讀需求,通過手機終端、郵箱等來獲取所需的資源信息,避免了讀者從海量的資料中查找自己想要信息的情況。另一方面有助于推動正確決策的制定與管理,借助數據聚類分析挖掘、可視化分析技術以及數據集成等信息技術來挖掘并發現海量數據信息之間存在的關聯,以關聯規律來分析判斷圖書館服務工作發展趨勢,從而確保發展決策制定的可行性。如下圖是對結構化、半結構化以及非結構化數據的交叉同和,有利于運用大數據技術進行資源整合。

圖2 數據交叉融合
最主要的在于讀者借閱數據的分析,讀者是圖書館信息化服務的核心,通過對線上線下讀者的借閱數據、互聯網資源訪問數據以及各項圖書資源檢索行為習慣進行整合與分析,從而形成讀者特有的行為關聯規律以及興趣偏向,從而與圖書館服務改革創新方向結合,為讀者提供更加準確的服務。一是需要從全局發展角度去看待讀者整體的借閱數據,包括讀者人均借閱情況、季度借閱情況、借閱總量、借閱分類以及讀者借還周期、借閱量的增長情況等,將這些不同類型的借閱指標作為讀者借閱情況數據分析參數,從各種角度去詳細看待圖書館讀者借閱的全部情況,從而有針對性的采取相應的應對措施。二是需要對圖書資源采購相關數據進行分析,當前圖書館圖書采購多以書商作為主要采購渠道,在節省了采購時間獲得一定便利的同時也面臨著相應的問題,圖圖書采購質量以及實際到書率、館內圖書上架效率等較為欠缺,隨著圖書館采購需要以及圖書市場的發展變化,圖書館圖書采購需要從源頭上加強數據分析,從而合理選擇圖書采購類型以及采購渠道、方式。首先將全國性新書目錄、書商征訂目錄的數據信息進行比對,有利于圖書館更準確的了解采購出版的新書比率,從而合理統計每年度需要訂購的圖書種類、冊數以及費用比例等相關信息,同時圖書采購人員可參考其他圖書館或者以往的圖書訂購情況作出綜合評估。其次準確統計不同書商的實際到書日期以及已到、未到書的數量和具體原因,對整體到書率進行評估之后可考慮對未到書進行催缺或者進行換訂購。最后對各書商相關信息進行綜合評估,制定不同的評書級別,同時對館內圖書從驗收到上架的周期進行評估。三是圖書館館藏數據分析,主要指文獻資源、紙本圖書等資源,通過對館藏資源進行調查統計和量化分析,從而進一步提高圖書館館藏管理質量和服務水平,并借助數據分析情況來優化調整館藏資源結構,促進紙本、文獻資源的優化配置。首先結合資源的年代日期、語言種類以及文獻類型等多項指標對館藏資源進行調查統計與分析評估,為優化館藏結構打下堅實的基礎。其次通過對館藏文獻資源年度、種類等借閱情況進行分析可判斷出館藏實際利用率,從而依據館藏發展趨勢來合理剔除部分館藏資料,計算出實際的館藏剔除率[4]。
建設數字化圖書館,做好館藏資源數字化開發工作,理應引進Web開發技術、數據挖掘技術和WEBGIS技術。Web開發技術起源于1991年,該技術能準確監測和收集各種動態信息,為圖書館搭建更完善的館藏資源開發平臺,同時,也方便管理數字化書籍信息。在數據挖掘技術的支撐下,圖書館內部大數據存儲平臺具有良好的兼容功能,因而能保存大量不同種類、不同結構的書籍文化數據信息,包括各學科的電子書、學術文獻、專利項目、圖書館發展史與相關檔案等。而且,大數據時代在實現信息開放與共享的同時依然能做好隱私安全保護工作,避免讀者信息泄漏。WEBGIS技術用于搭建圖書檔案網絡管理平臺,能準確測繪和采集書籍資源相關信息,并對這些信息進行提煉處理、準確傳輸、分類存儲、安全管理、查詢檢索、客觀分析和應用,從而使圖書檔案管理工作更有效[5]。
其次為進一步規范讀者借閱管理行為,提高精細化管理水平,有必要創建相應的資源數知識庫。一方面對讀者的借閱行為進行規范管理,最大程度地保證讀者的借閱規范性和借閱質量。另一方面對借閱管理進行精細劃分,以精細化管理模式來促進圖書管理的系統化、規模化以及組織化,通過創建數據知識庫來加強圖書精細化管理的全面落實,為其提供強大的數據支撐,包括對服務工作的管理目標、方向、具體流程以及人員考核評價等進行精細化管理,將涉及的所有數據信息保存到數據知識庫中,方便管理人員對以往相關數據信息進行有效提取。
本文通過對大數據環境下圖書館信息化服務發展特征進行重點分析探討,從而依據圖書館館藏管理、讀者服務以及圖書采購借閱等需要,對大數據技術系統、數據庫平臺的搭建以及圖書館數據資源分析進行了全方位的闡述說明,充分發揮出大數據信息技術的作用和價值,在滿足讀者多元化閱讀需求的基礎上形成多元化與個性化相結合的服務模式。