晏 青
(汕頭市圖書館,廣東 汕頭 515041)
大數據時代,圖書館的數據信息來源更加廣泛,信息類型也變得多樣化,信息內容更為豐富。就信息載體而言,以往圖書館主要是一些紙質文獻,如圖書、報紙等。隨著信息技術的快速發展與革新,數字化數據信息所占的比例不斷增加。數字圖書館和手機圖書館建設工作的不斷推進,使圖書館的信息資源逐漸朝著多元化的方向發展。因此,圖書館應更加重視對用戶行為數據信息的梳理與分析,盡可能挖掘出數據信息中隱藏的潛在價值,充分應用大數據技術,不斷革新圖書館服務模式,確保讀者能夠獲得優質的個性化服務。
要利用大數據信息挖掘與分析技術,數據信息只有達到特定的儲存量級,才能獲得較為理想的信息挖掘效果。在互聯網和社交網絡快速發展的過程中,圖書館也開通了微博賬號、微信公眾號以及讀者論壇等,在圖書館與讀者進行溝通與交流的過程中會產生海量的數據信息。另外,讀者在登錄圖書館網站時形成的一些行為信息均被記錄與儲存起來,這些數據信息的數量也是非常巨大的。因此,圖書館在個性化服務系統構建過程中,利用大數據信息挖掘技術具有較高的可行性。
圖書館要想為讀者提供更為優質的個性化服務,首先應當掌握讀者的個性化信息需求。要想全面掌握讀者的個性化需求,圖書館只有對讀者的行為信息加以深入分析,才能提取到更為準確的用戶需求信息[1]。圖書館的讀者群體較多,不同時間段內讀者對于信息的需求也會發生較大變化,如何更加及時地了解讀者的個性化信息需求,確保圖書館能夠為讀者提供實時的信息支持,是圖書館開展個性化服務工作中的關鍵問題。利用大數據技術,圖書館能夠對讀者的行為信息,如檢索信息、瀏覽信息等進行實時跟蹤,再采用大數據分析技術挖掘出用戶潛在的信息需求,確保圖書館能夠為讀者提供有針對性的信息服務,從而有效改善圖書館的個性化服務水平[2]。
根據圖書館現有的信息資源以及網絡平臺,同時結合大數據自身特征,筆者認為圖書館個性化服務模型應當包含以下功能模塊:讀者接口功能模塊、數據檢索功能模塊、數據過濾功能模塊、信息集成功能模塊、信息規范化功能模塊、信息分析功能模塊、信息匹配功能模塊、數據推送功能模塊、讀者評價功能模塊以及讀者數據庫功能模塊等,具體功能模型如圖1所示。

圖1 基于大數據理論的圖書館個性化服務功能模型圖
該模塊的主要功能是連接讀者設備端和圖書館系統。讀者登錄圖書館個性化服務系統時,需要在該功能模塊中輸入正確的賬戶以及密碼,以完成讀者身份驗證。讀者也可以通過接口輸入需要檢索的信息,系統會依照用戶需求完成信息檢索,并結合讀者信息庫中的信息,為讀者提供精準的、有針對性的信息服務。讀者還能通過該接口對圖書館個性化服務進行反饋,為圖書館和讀者之間搭建一座交流與溝通的橋梁。
讀者經由讀者接口功能模塊完成系統注冊以后,系統會要求讀者輸入相應的個人信息,這些數據信息屬于結構化信息,系統會將其儲存至讀者信息庫中。另外,讀者在使用圖書館個性化服務系統過程中所提供的一些反饋信息同樣也會被儲存至讀者信息庫中。因此,圖書館就能通過對這些數據信息的分析,更加全面地掌握讀者信息需求,主動向讀者提供有較強針對性以及精準性的個性化服務。
當讀者輸入相應的檢索信息以后,系統就能夠根據讀者的信息需求,利用智能檢索方法自動為讀者檢索圖書館信息資源。當完成信息檢索以后,系統會把得到的數據信息反饋到該功能模塊中,如果未能檢索到符合要求的數據信息,系統會在網絡中繼續進行信息檢索,再將尋找到的數據信息添加至圖書館數據信息庫中,并把得到的數據信息反饋到該功能模塊。
在數據信息檢索完成以后,所得到的數據信息將被輸送至數據過濾功能模塊。在該功能模塊中,系統會完成對數據信息的篩選,并結合讀者提供的檢索信息,對收集到的數據信息按照相關度進行排除,從而獲得與讀者檢索信息具有更高相關性的信息資源。
圖書館讀者群體成員構成具有一定的復雜性,讀者的行為信息也分別儲存于圖書館的各個系統之中,同時,圖書館自身的資源系統也相對較多,如讀者行為數據信息庫、電子資源信息數據庫以及網絡日志數據庫等。因此,要想確保讀者能夠獲得更為全面的數據信息資源,圖書館只有把上述不同來源、不同格式、不同含義的數據信息進行邏輯層面上的集成,才能確保讀者能夠獲得范圍更廣以及更精準的數據信息。
通過大數據處理技術,圖書館能夠更加深入地挖掘用戶行為信息的潛在價值。而在這個過程中,圖書館應當確保數據信息在格式方面的一致性。由于信息集成功能模塊所得到的數據信息來源非常廣泛,信息的屬性也會存在較大差異。數據信息規范化處理過程主要包含四個不同工序,其流程示意圖如圖2所示。

圖2 大數據技術中數據信息規范化處理流程示意圖
該功能模塊承擔的主要任務是對信息規范化模塊傳輸過來的數據信息加以分析與處理。由于圖書館的數據信息包含非常多的半結構化以及非結構化數據信息,因此圖書館只有利用信息分析功能模塊完成對數據信息的分析,才能確保數據信息匹配的準確性,使讀者能夠獲得更為優質的個性化服務。
在得到讀者信息資源需求模型以后,系統也完成了數據信息的規范化處理。該功能模塊會把得到的讀者信息資源需求模型和檢索的數據信息進行匹配處理,對檢索的數據信息進行更深層次的篩選,選擇具有更高相關性的數據信息并傳輸至數據推送功能模塊,將匹配好的數據信息反饋給讀者。
該功能模塊通過對智能代理技術的應用,依照不同讀者的差異性信息需求,把一些讀者感興趣的信息資源經由讀者接口功能模塊主動推送至讀者客戶端。如:系統依照讀者行為信息的挖掘與分析結果,在讀者進行信息檢索的過程中,主動為讀者提供與檢索有關的信息內容,或者推送讀者沒有意識到的一些潛在信息。數據推送功能模塊還會依照讀者定制的內容,實時向讀者推送相關信息資源。
系統會將一些信息資源推送至讀者客戶端,讀者在收到這些推送信息以后,能夠經由讀者評價功能模塊對圖書館所提供的信息服務加以評價,而讀者做出的評價信息同樣會被儲存在讀者信息數據庫中。對讀者評價數據信息進行分析與挖掘,能夠為構建讀者需求模型提供更加精準的參考,同時還能作為圖書館提供個性化服務的重要參考,確保圖書館個性化服務能夠滿足讀者的信息需求。
圖書館在應用大數據技術開展讀者行為數據挖掘與分析工作時,能夠獲得讀者信息資源需求模型。但是,要想確保得到的模型具有較高的可靠性,圖書館就應當具備大量的樣本數據信息,同時也應達到數據挖掘的技術要求,不同數據信息應當存在相應的耦合度,只有這樣才能確保得出的結果更加準確與可靠[3]。現階段圖書館獲得的讀者數據信息基本上都是從圖書館所構建的系統中采集的,而系統外部讀者的一些行為信息是缺失的,這將導致信息挖掘與分析得出的結果的準確性偏低。針對這一問題,圖書館應當加強與移動、聯通和電信等運營商之間的合作,確保圖書館能夠獲取更為全面的行為信息,打破圖書館信息來源受限的局面,從而保障所建立的讀者需求信息模型更為精準。
圖書館在利用大數據處理技術的過程中,要完成對海量數據信息的存儲以及分析,因此應當具備較高容量以及較快運算速度的軟件與硬件設施[4]。受到政策以及經濟發展水平的影響,圖書館在軟件與硬件設施上和大數據的技術要求存在較大差異。圖書館要想更好地利用大數據技術,就需要購入先進的軟件以及硬件設備,但是這需要大量的資金,一般圖書館很難承受。圖書館可以與大數據技術企業合作,如:廈門大學圖書館采用阿里云服務重構站內的搜索體系,不僅能夠利用企業擁有的先進大數據技術,還可以減小硬件設施的資金投入。圖書館可通過這類合作實現更多功能,滿足讀者的個性化信息需求。