唐 書
(國家圖書館,北京 100080)
隨著信息技術的高速發展,人們對知識的渴求日益增加。國家越來越重視全民閱讀,相繼頒布了一系列閱讀政策[1]。圖書館作為重要的文化傳播機構,對于全民閱讀具有重要的推動作用[2]。圖書采訪工作一直是圖書館信息資源建設的重要一環,對于圖書館的發展具有重要影響,傳統的圖書采訪工作主要依賴人力,無法保證采訪的準確性和科學性[3],影響了圖書采訪效果,因此,圖書館亟須設計新的圖書推薦模型,以有效解決采訪工作面臨的問題。信息技術的發展推動了移動終端的普及,龐大的數據量影響了圖書館圖書采訪推薦的效果,用戶歷史行為推薦法應運而生。受用戶數據平臺的限制,傳統的數據源主要由數據庫與用戶行為日志組成,圖書館只要高效地完成用戶信息的采集,就能解決信息數據量過大造成的采訪困難等問題。因此,筆者基于用戶歷史行為設計了新的圖書推薦方法,以期為后續的圖書采訪工作提供參考。
圖書采訪是圖書推薦的關鍵環節,科學的圖書采訪業務流程能提升圖書推薦效果[4]。目前,圖書館采用的圖書采訪模式包括一些影響圖書采訪質量的不穩定因素,如:圖書出版發行、館配商、圖書采購經費、采訪人員素質、采訪工作流程等。因此,圖書館要制作符合館藏建設要求的采訪清單[5],收集圖書采訪信息,判斷圖書的價值,進一步優化圖書采訪業務流程。具體的流程如下:一是采訪人員要注重圖書采訪信息的收集。二是采訪人員要對圖書價值進行綜合判斷。三是采訪人員要把價值高的圖書編入圖書推薦單。四是采訪人員要對圖書進行驗收,對不符合要求的圖書進行標記反饋[6]。圖書采訪推薦需要進行線上統一管理,增加推薦流程的規范性,因此,圖書館可篩選現有圖書的關鍵詞,構建相關的圖書數據庫,為圖書信息的查詢利用提供保障。
用戶歷史行為與圖書館實際推薦數據的形成有重要聯系,因此,圖書館可基于用戶歷史行為,構建圖書采訪推薦模型,以提高推薦的準確性。筆者利用卡方自動交互檢測法(CHAID)進行決策樹挖掘分類[7],通過提取用戶歷史行為的信息,設定反應變量和解釋變量,對圖書數據庫總樣本進行最優分割,根據卡方檢驗的顯著性進行排序,以實現對圖書信息的自動判斷及智能化分析。在數據處理初期,圖書館可利用聯機分析處理(OLAP)對現有的數據信息進行基礎化處理,從圖書數據庫調取數據,并與挖掘分類的數據進行對比分析,從時間、位置、學科等角度觀察相同卡方檢驗的顯著性數值,留取相似度較高的對應圖書信息。
用戶信息處理完畢后,圖書館可利用快速自動提取關鍵詞算法(RAKE)提取數據中的關鍵詞,利用詞項距離、詞間關系頻率、共現頻率構建共現矩陣,通過語境值進行計算,得到候選關鍵詞的特征,根據設定閾值選定關鍵詞,并進行用戶信息過濾,根據現有信息之間的頻率關系,計算出采訪關聯系數,設計模型使用的關鍵詞庫,完成模型參數提取及關鍵詞融合[8]。RAKE算法是一種結合中文語義和關鍵詞的自動提取算法,能夠根據現有的數據庫結構完成信息的快速存取,設計相關的分類評價函數,并刪除不符合模型構建規范的詞語,提高語義數據庫的數據提取效果。圖書館可結合在線分析處理程序,生成館內用戶購買關聯性規則,并參照該關聯性規則,進行數據比對,提高圖書采訪推薦效率。在圖書檢索的過程中,圖書館可手工添加數據化清單,以提高推薦效果。
從圖1可以看出,圖書的關鍵詞提取是圖書精準推薦的重點,因此,圖書館可利用卷積神經網絡進行圖書內核語序分析整合,將圖書內核語序作為輸入項,置入卷積神經網絡模型中,根據設定的各層神經網絡參數進行計算,提取圖書中的隱含信息,以保證圖書語義和關鍵詞的關聯性效果。
圖書館可通過聯機公共目錄檢索系統(OPAC)獲取用戶的檢索信息,把這些信息上傳到采訪推薦模型中,以完成圖書的智能化推薦[9]。此外,該模型具備決策效率比對功能,降低了圖書館圖書采訪推薦的難度,提高了圖書館圖書采訪推薦的效果。
圖書館可把基于用戶歷史行為的圖書采訪推薦模型嵌入圖書采訪推薦平臺,以實現圖書采訪的精準推薦,最大限度地滿足用戶的多元化需求。圖書館應分析該平臺的主要使用人群及其不同的需求,設計圖書采訪推薦平臺的功能模塊。圖書采訪推薦平臺的功能模塊包括圖書采購模塊、圖書供貨模塊、圖書驗收模塊和系統管理模塊。圖書采購模塊具備圖書推薦功能,即用戶以在線推薦或上傳文件推薦的方式將推薦的書單提供給采訪人員。圖書采訪人員可使用圖書審核子包對推薦單中的圖書進行審核,選擇書目形成采購計劃單,并給出審核結果。在實際使用的過程中,財務人員可通過該平臺發布采購計劃單,根據供應商對采購計劃單的報價,對各個供應商的報價進行比較,選出合適的供應商,上傳合同子包,完成整個采購任務。圖書供貨模塊的工作流程是:圖書采訪工作人員把采購單發送給供應商;供應商形成供貨單發貨,并將物流單號等信息上傳到平臺;圖書采訪人員查詢圖書寄出狀態,確定書目類別、數量等無誤后,將驗收信息上傳到圖書驗收模塊,完成圖書采訪工作。系統管理模塊的作用是對圖書推薦單類、圖書推薦項、采購計劃單類、采購項、報價單類、供貨項、驗收單、驗收項、用戶信息、權限信息、角色信息、部門信息、人員信息、圖書分類信息、書商信息等的維護操作,保障圖書館采訪推薦工作的正常運行。
為了檢驗基于用戶歷史行為的圖書采訪推薦方法的效果,筆者對某圖書館進行了實例分析。筆者不僅要根據該館的圖書類型及相關的圖書信息進行關鍵詞提取和關鍵詞映射,還要根據用戶的歷史搜索信息進行關鍵詞抽取,計算關鍵詞密度,按照密度值從高到低進行排序,選取前10個關鍵詞作為圖書采訪推薦關鍵詞。此外,筆者不僅要根據關鍵詞計算相關圖書的關聯性,輸出推薦書目,并進行圖書推薦,還要根據圖書類別關鍵詞選取精確率、關鍵詞集召回率等指標,計算出用戶滿意度的數值。筆者利用相關公式,對基于用戶歷史行為的圖書采訪推薦方法和傳統圖書采訪推薦方法的用戶滿意度進行了對比分析。
從表1可以看出,傳統圖書采訪推薦方法的采訪推薦效果較差,已無法滿足圖書館圖書采訪的需求。基于用戶歷史行為的圖書采訪推薦方法的用戶滿意度較高,推薦效果較好,該方法具有有效性和一定的應用價值,能夠為圖書館開展圖書采訪工作提供幫助。

表1 應用效果