黃偉

關鍵詞:讀者閱讀;數據挖掘;精準化;推薦服務;模式構建
摘 要:文章闡述了圖書館推薦服務應用數據挖掘技術的必要性,介紹了讀者閱讀數據挖掘技術應用于圖書館文獻資源推薦服務、文獻資源檢索服務、文獻資源管理服務等工作中的現狀,分析了基于讀者閱讀數據挖掘技術下精準推薦服務模式構建的三個影響要素,即數據庫建設、精準推薦計算方法與面向讀者的操作流程,在此基礎上從前端應用、算法實現、角色建模、數據搜集四個方面提出具體的實施方案。
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2019)06-0087-03
數據挖掘技術是指從數據庫中挖掘讀者需要的資源,匹配讀者的信息需求。隨著讀者閱讀多樣化和個性化的發展,圖書館越來越重視數據挖掘技術在精準推薦服務中的應用,這就需要圖書館從海量數據資源中進行分析與建模,最大限度地將匹配讀者需求的目標資源篩查出來,并推薦給讀者[1]。實際工作中,這種精準推薦正是圖書館主動式服務理念的具體表現,精準推薦能夠為讀者提供針對性強、個性化鮮明的信息服務,充分體現了圖書館以讀者為中心的服務思想。此外,應該用讀者閱讀痕跡數據,發現讀者的閱讀規律與偏好,有利于圖書館滿足讀者對信息資源的多樣化、動態化需求。
1 基于讀者閱讀數據挖掘的精準推薦服務的必要性
應用數據挖掘技術能夠滿足圖書館資源建設豐富化的需要,同時也能滿足讀者資源需求多樣化的需要,因此具有現實必要性。
1.1 能夠滿足圖書館資源建設豐富化的需要
伴隨信息技術和互聯網技術的飛速發展,數據呈現出爆炸式增長的態勢,圖書館作為文獻資源的構建與交流中心,越來越重視數據庫的建設與完善。在此背景下,各級各類圖書館紛紛依托自身館藏資源和地方特色建立起多種類的數據庫,如地方文獻數據庫、學科專業數據庫、文史資料數據庫、特色信息資源庫等[2]。然而,豐富的數據資源給圖書館構建完善的檢索系統帶來了諸多困難,紙質資源的數字化轉換更是增加了檢索結果全面與準確輸出的難度。此外,大量的資源集合易導致數據重復、無效數據等問題的出現,不利于圖書館開展數據維護工作,嚴重阻礙了圖書館資源建設工作的開展。數據挖掘技術的應用實現了圖書館資源構建過程的可視化,能夠使數據間的關系更加清晰,并對龐大的數據庫進行梳理,清除數據庫中的無效資源,因此能夠促進圖書館資源建設的豐富與完善。
1.2 能夠滿足讀者資源需求多樣化的需要
在圖書館服務中,讀者的閱讀需求呈現出多樣化、個性化和特色化的特點。一方面,讀者的主體越來越趨向于多元化,圖書館完善數字服務之后突破了空間和時間的制約,讀者數量不斷增加。而讀者受生活環境、教育背景等因素的影響,其信息需求也具有特色化和個性化的特點[3]。另一方面,讀者獲取資源的方式更加多樣化,圖書館需要創新信息資源的推薦方式,積極開發依托互聯網平臺的精準推薦服務。總之,讀者對圖書館服務的要求越來越高,應用數據挖掘技術可以更好地掌握讀者的需求,提高圖書館推薦服務的精準度。
2 讀者閱讀數據挖掘技術在圖書館精準推薦服務中的應用
2.1 在文獻資源推薦服務中的應用
圖書館需要對讀者閱讀數據(包括檢索頻率、閱讀次數、文獻領域等[4])進行分析和研究,從中能夠發現數據之間的隱含關系與語義規則,這也是圖書館進行精準推薦服務的物質基礎,讀者數據的分析結果為圖書館精準推薦服務提供了客觀的科學數據支持。而事實上,讀者的數據信息不是一成不變的,會隨著讀者閱讀傾向、喜好的不同而發生動態變化,這就需要圖書館具體問題具體分析。數據的挖掘與關聯也要具備即時性,通過計算讀者的閱讀歷史數據,挖掘讀者數據與信息資源的關聯與規律,結合置信度等參考值,預測讀者的信息閱讀行為,進而對其提供精準的推薦服務。
2.2 在文獻資源檢索服務中的應用
信息資源檢索結果是圖書館為讀者提供精準推薦服務的重要內容,也是獲取讀者閱讀數據的主要途徑。在傳統的圖書館信息檢索系統中,檢索結果往往是相關文獻的羅列與堆砌,對文獻資源間的關系沒有進一步的闡述與說明,這就會產生檢索結果的關聯性等級排序不夠突出的問題。數據挖掘技術在文獻資源檢索服務中的應用,可以結合讀者閱讀需求,將檢索的目標資源按照匹配度數值依次排序,從資源檢索的環節精準文獻的輸出結果,提高圖書館資源推薦的質量和效率[5]。
2.3 在文獻資源管理服務中的應用
圖書館的信息資源具有數量豐富、涉及領域廣泛、格式種類繁多等特點,圖書館只有加強對文獻資源的管理,才能從根本上優化資源推薦工作,切實滿足讀者的個性化、多樣化閱讀需求。數據挖掘技術在文獻資源管理服務中的應用,能夠使圖書館根據讀者檢索痕跡大數據分析哪些資源是熱門讀物,這些資源有何共同點和特殊之處,從而預測文獻的流通與借閱趨勢,一方面對“潛力股”資源進行群體定位推薦,加強受歡迎資源的建設;另一方面可以將舊資源進行清理和轉移,節省圖書館的資源儲存空間,避免資源配置空間的浪費,為圖書館的信息資源精準推薦服務提供充足的環境保障[6]。
3 基于讀者閱讀數據挖掘的精準推薦服務模式構建
基于讀者閱讀數據挖掘的精準推薦服務模式構建有三個影響要素:數據庫、精準推薦計算方法、面向讀者的操作流程。其中,數據庫建設是物質基礎,精準推薦計算方法是技術保障及操作流程的成果展示。
3.1 數據庫建設
數據庫建設是基于讀者閱讀數據挖掘的精準推薦服務模式構建的,這里所說的數據庫包括文獻資源數據庫和讀者閱讀數據庫兩類。讀者信息表(見表1)除記錄讀者的個人基本信息外,還增加了對讀者閱讀興趣及閱讀需求等數據的記錄匯總,通過了解讀者需求偏好與館藏資源的種類的關聯與規律,加快資源與讀者需求匹配的速度[7],幫助圖書館在資源建設中有的放矢,精準推薦,縮短了服務時間,優化了服務路徑。讀者服務部可依據讀者閱讀數據庫的信息采集情況開展講座、讀者沙龍等活動,提高讀者滿意度。
3.2 精準推薦計算方法
精準推薦計算方法是提高圖書館推薦服務效率的技術保障,圖書館可以根據讀者的實際閱讀情況選用適宜的推薦計算方法,常見的方法有以下三種:第一,以數據內容為核心的算法,這種推薦計算方法的側重點在于分別分析館藏文獻與讀者閱讀數據,挖掘相似資源,確定資源推薦的基數,完成資源推薦服務。這種計算方法的好處是保證了資源推薦的客觀性與科學性,完全以讀者的實際閱讀行為為立足點,最大限度地避免了人工的干預和介入。第二,以最近鄰居為核心的分類計算法,這也是目前圖書館最常用的精準推薦計算方法。該方法將有共同閱讀需求的讀者進行分類,對群體內讀者閱讀數據進行關聯,以其中一個讀者的閱讀情況作為參照依據,評估其對某一類資源的閱讀加權評價值,推算距離該讀者由近至遠的其他讀者對此資源的感興趣程度,依據距離的排序生成推薦列表,指導圖書館有針對性地對群體內讀者進行信息推送。第三,依據關聯規則的推薦計算法,這種方法是將讀者閱讀數據和文獻數據比作商品,探尋兩類數據中的關聯性,并按照一定的關聯規則進行排序和成果輸出,進而產生以關聯規則為紐帶的資源推薦列表[8]。
3.3 操作流程
基于讀者閱讀數據挖掘的精準推薦服務模式構建最終需要呈現出完整的操作流程。讀者需要登錄圖書館的資源推薦系統,如果讀者是新用戶,圖書館需要做好用戶數據收集、整理和儲存工作,將讀者個人信息數據轉入推薦引擎,進一步結合讀者個性化標注的工作情況、受教育背景、專業領域等已知信息,進行文獻數據庫資源的匹配與檢索,實現精準化資源推薦。如果讀者已經有歷史閱讀數據,那么圖書館可以調取以往的數據,以此為基礎進行聚類計算和數據挖掘計算,向讀者精準推薦新資源。
4 基于讀者閱讀數據挖掘的精準推薦服務模式實現方案
筆者通過對讀者閱讀數據挖掘技術與圖書館精準推薦服務的分析,從前端應用、算法實現、角色建模與數據搜集四個方面提出具體的服務模式實現方案。
4.1 優化面向讀者的前端應用,實現圖書館與讀者的實時性推薦互動
在前端應用部分,圖書館系統接收來自移動設備的推薦請求,對請求數據進行初步分析與處理后,再將結果反饋給用戶,完成資源推薦的整體流程。需要注意的是,由于移動設備傳送過來的推薦請求語義有可能是不規范的,圖書館需要結合實際情況應用數據的關聯技術,構建數字資源的本體與語義網知識庫,為讀者提供精準的、個性化的推薦服務。
4.2 選取精準化算法,充分采用大數據挖掘技術
圖書館要想實現對讀者的資源精準推薦,精準化的算法是重要的技術保障。一方面,圖書館要選取適當的基礎算法,保證資源文獻的構建質量;另一方面,圖書館還要充分應用大數據挖掘算法,提高讀者檢索需求目標文獻與圖書館系統推薦文獻的匹配度,充分采用大數據挖掘技術分析讀者的閱讀規律,探尋隱藏在數據之間的內在聯系。總之,圖書館應該做到基于不同用戶的實際情況推薦多樣化、個性化的信息資源,保證圖書館精準推薦的高效性和穩定性。
4.3 完善角色建模,協調讀者與文獻本體的關系
如圖1所示,讀者閱讀數據挖掘技術下圖書館精準推薦服務模式的構建,需要以讀者閱讀產生的動態數據為研究本體,圖書館資源推薦系統不僅強調文獻資源的建模,還重視用戶數據的建模。具體來說,圖書館可以依據讀者的閱讀偏好和閱讀規律構建讀者畫像,從中刻畫出讀者長期或短期的閱讀興趣,從而發現讀者的閱讀需求,進一步應用數據挖掘技術從文獻資源建模庫中進行相關性數據的匹配與篩選。這種雙向角色建模的方式可以使數據的關聯更加直觀,協調用戶與文獻本體的關系,使數據資源的分布更加全面。
4.4 全面收集數據,突出數據特征
事實上,無論是讀者數據還是文獻數據的本體建模,關鍵都在于選取數據的特征,提煉數據自身的關鍵節點。圖書館構建基于讀者閱讀數據挖掘的精準推薦服務模式,其目的正是為讀者提供個性化、特色化的推送體驗,建立在讀者閱讀數據特征基礎上進行的數據挖掘與關聯分析,則更能凸顯出這種個性化和特色化。因此,在數據收集層面,圖書館要充分考慮讀者歷史瀏覽記錄、讀者行為、專業儲備等方面的情況,從而推薦對于讀者來說價值更高的信息資源,提高讀者的體驗滿意度。
5 結語
綜上所述,基于讀者閱讀數據挖掘的精準推薦服務是大爆炸數據時代下圖書館服務轉型的必經之路。通過應用讀者閱讀數據挖掘技術,圖書館可以從讀者層面探尋隱藏的數據規律和關聯。有規律可循的用戶數據能為圖書館的精準推薦服務奠定良好的基礎,有利于圖書館在大量的文獻數據中精準檢索到讀者的目標資源,從而實現減少資源獲取時間、簡化資源檢索途徑、優化資源推薦效率、提高讀者滿意度的服務目標。
參考文獻:
[1] 王大壯.基于用戶行為和大數據分析的圖書館個性化服務探究[J].圖書館學刊,2017(12):111-115.
[2] 謝康.基于讀者個性化特征數據挖掘的圖書館書目推薦[J].現代電子技術,2018(6):34-36.
[3] 王正林.基于數據挖掘的圖書館書目推薦套餐化服務研究[J].河南圖書館學刊,2017(11):126-127.
[4] 柳益君,何勝,熊太純,等.大數據挖掘視角下的圖書館智慧服務:模型、技術和服務[J].現代情報,2017(11):81-86.
[5] 韓璐.基于數據挖掘的圖書館書目推薦服務的研究[D].唐山:華北理工大學,2017.
[6] 聶飛霞.基于數據挖掘技術的移動圖書館個性化圖書推薦服務[J].圖書館學刊,2014(5):104-106.
[7] 王燕紅.基于數據挖掘的圖書館個性化服務系統的設計與研究[D].廈門:華僑大學,2012.
[8] 孔功勝.個性化推薦在圖書館信息服務系統中的應用[J].圖書館學刊,2011(10):120-122.
(編校:馬懷云)