江波


摘?要:隨著數據挖掘技術的不斷發展,信息數據的挖掘水平得到快速提高。為了提高數字圖書館電子資源推薦服務的水平,有效避免“數據孤島”,文章從基于用戶行為數據挖掘的數字圖書館電子資源推薦服務模型的構建策略及構建方案著手,分析了數據挖掘技術在數字圖書館電子資源推薦服務中的作用,為數字圖書館提高用戶的信息采用率提供了參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)12-0059-03
關鍵詞:用戶行為;數據挖掘;數字圖書館;電子資源推薦服務
隨著互聯網技術的不斷發展,圖書信息資源的電子化進程也得到快速推進,數字圖書館的電子資源推薦服務是信息資源電子化推進過程中的一個重要環節,應該引起圖書館界的重視。為了滿足用戶的實際需求,數字圖書館在開展電子資源推薦服務前,應了解用戶的個性化特征和使用習慣。從這個角度看,用戶行為特征的提取能力決定數字圖書館電子資源推薦服務的水平。隨著科技的發展,數據挖掘技術水平得到快速提高,在應用領域也得到迅速推廣,數字圖書館采用數據挖掘技術對用戶的行為特征進行提取,可避免“知識迷航”“信息過載”等情況的發生。
1?用戶行為的類型
互聯網技術的發展不僅給圖書館帶來了大量的信息資源,在很大程度上還拓寬了用戶獲取信息資源的渠道,改變了用戶獲取信息的習慣和方式。為了幫助人們從互聯網海量的信息資源中獲取他們所需的信息,數字圖書館在提高信息資源檢索能力的同時,也應不斷提高對用戶行為特征的挖掘能力。用戶行為指圖書館用戶為了解決自身在日常生產生活中遇到的問題,或者為了達到某種目的,對一定時期的相關事件數據進行查詢、檢索和信息加工等。圖書館只有掌握用戶的這些行為特征,才能整理和分析用戶的使用特點及信息需求,才能充分發揮自身優勢為用戶提供更貼合實際的服務。常見的用戶行為主要有兩種:一是用戶在圖書館內的直接使用行為,即用戶進入圖書館,在不同區域進行信息資源的查閱和咨詢行為。二是用戶通過圖書館網站進行的檢索行為,即用戶帶著問題在圖書館網站進行檢索、瀏覽、交流互動及下載資源信息等行為。
2?數字圖書館挖掘用戶行為數據的必要性
隨著圖書館數字化進程的不斷推進,數字圖書館擁有的數據量呈幾何倍數增長,這些數據極大地豐富了館藏資源,給用戶的信息獲取帶來了便利。數字圖書館的數據資源主要包括館藏書刊資源信息、電子期刊資源信息、視頻音頻信息、用戶借閱信息,以及用戶的留言信息、分享信息和相關的硬件設備信息等,這些數據是數字圖書館正常運轉的基礎。但是,受技術水平和經費的限制,部分數字圖書館還不能很好地利用先進技術對館藏數據進行合理優化和融合。在這種情況下,大量數據不能進行有效連接與貫通,不能得到有效利用,形成了“數據孤島”。然而,這些冗余、孤立存在的數據往往含有大量有價值的信息,如果這些信息不能被及時發現和有效利用,就會造成資源浪費,同時也削弱了數字圖書館的服務能力。
針對上述情況,數字圖書館應重視館藏數據的冗余問題,尤其是用戶行為數據的冗余、孤立等問題,并采取有效手段進行解決。一方面,數字圖書館可以采取有效的管理手段,對館藏數據進行分類管理,避免出現疊加或盲區等現象,方便用戶快速獲取數據;另一方面,數字圖書館可以采用先進的技術,如數據挖掘技術,對館藏數據進行挖掘和整理。隨著數據挖掘技術的逐漸成熟,該技術的數據特征挖掘效果良好,可以幫助使用單位實現數據的有效利用。因此,數字圖書館應引入數據挖掘技術對用戶行為數據進行挖掘,及時分析用戶的行為特征,掌握用戶的使用習慣,為個性化推薦服務打下基礎。
3?基于用戶行為數據挖掘的數字圖書館電子資源推薦服務模型構建
數字圖書館通過對用戶行為數據進行挖掘的方式,掌握用戶的行為習慣和行為特征,提高服務水平。筆者結合數字圖書館的資源情況,構建了基于用戶行為數據挖掘的數字圖書館電子資源推薦服務模型。
3.1?電子資源推薦服務模型的構建策略
電子資源推薦服務在數字圖書館各種功能中占主要地位,它是數字圖書館與用戶聯系的中間紐帶,可以完整展現數字圖書館的服務能力和水平。電子資源推薦服務主要有交互性、人性化、即時性等特征。即時性和交互性特征的作用是通過大量數據即時鏈接、即時交互,解決用戶在海量數據包圍中可能出現的“知識信息迷航”問題;個性化特征的作用是在用戶被動接受無用數據時,幫助用戶過濾掉主觀上不需要的信息,解決“知識信息過載”的問題。具體的構建策略如圖1所示。
3.1.1?利用關聯技術應對“知識信息迷航”的問題。關聯技術是一個統稱,包括本體、云平臺等,具有規范化、可共享等特點。在本體、云平臺的基礎上,關聯技術可以對多種類型的知識庫(包括異構知識庫)進行有機連接,各類知識庫通過關聯技術進行連接,最終形成龐大的數據集群庫。一方面,用戶可以通過數據集群庫對相關的信息資源進行精確匹配查詢,提高檢索數據的準確率和查全率;另一方面,各類信息數據管理平臺通過該數據集群庫縮小數據資源的檢索范圍,提高用戶檢索數據資源的效率,進而解決“知識信息迷航”的問題。
3.1.2?利用關聯技術應對“知識信息過載”的問題。數字圖書館在提供電子資源推薦服務的過程中,“知識信息過載”的問題尤為凸顯。數字圖書館如果沒有掌握用戶的行為特征,就會向用戶推薦過多不需要的信息,給用戶帶來一定的困擾。數字圖書館通過關聯技術,可以將用戶的行為數據進行有機連接,挖掘用戶的行為特征,對用戶進行有效推薦,提高用戶的滿意度。
3.2?電子資源推薦服務模型的構建方案
基于用戶行為數據挖掘的數字圖書館電子資源推薦服務方案主要由用戶行為特征數據本體庫、用戶需求與喜好挖掘本體庫和館藏資源信息庫三部分構成,具體的構建方案如圖2所示。
3.2.1?用戶行為特征數據本體庫的構建方案。數字圖書館可利用本體技術,對獲取的用戶行為特征信息進行再處理,提取與用戶行為特征數據庫相關的字段。同時,數字圖書館也應分析整理館藏資源信息庫的信息,提取與用戶行為特征相關聯的服務日志信息等內容,進而構建用戶行為特征數據本體庫。該本體庫構建的一個難點是用戶實際需求與館藏資源的匹配問題,在整個本體庫構建的過程中應引起數字圖書館的重視。
3.2.2?用戶需求與喜好挖掘本體庫的構建方案。數字圖書館積累了大量用戶需求及喜好的信息,如何利用這些信息提高電子資源推薦服務的效率是其亟須解決的問題。在構建用戶需求與喜好挖掘本體庫的過程中,數字圖書館要詳細統計和分析用戶的行為日志,對用戶的顯性需求和隱性需求進行分類,用特定的本體術語進行描述,方便相關功能模塊的調用。
3.2.3?電子資源推薦服務流程設計。當用戶登錄數字圖書館后,系統會根據用戶的登錄信息,在用戶行為特征數據本體庫和用戶需求與喜好挖掘本體庫中進行檢索,將用戶的需求與館藏資源進行信息匹配,得出用戶可能需要的圖書、期刊、專利等方面的信息,并以小窗口的形式向用戶進行推送。當用戶在操作界面檢索需要的信息時,系統會將用戶輸入的檢索信息與用戶的特征數據信息進行融合,找出關聯信息,并在館藏資源信息庫中進行檢索。基于用戶行為數據挖掘的數字圖書館電子資源推薦服務是一個實時的過程,主要通過系統后臺運行,避免影響用戶的實際操作,同時又能向用戶推送符合其要求的信息。
4?基于用戶行為數據挖掘的數字圖書館電子資源推薦服務的優勢分析
4.1?推薦服務更加精準
基于用戶行為數據挖掘的數字圖書館從用戶的實際需求出發,對用戶行為特征進行挖掘,并對獲取的用戶行為特征信息進行詳細比對和關聯分析,找出其中的隱性信息,更好地掌握用戶的行為習慣、需求和喜好等內容,進而為用戶提供精準的電子資源推薦服務。數字圖書館利用數據挖掘技術不僅提高了電子資源推薦服務的準確性,還滿足了用戶的個性化信息需求,提高了用戶的信息采用率。
4.2?用戶使用更加便捷
基于用戶行為數據挖掘的數字圖書館電子資源推薦服務的操作系統是自動運行的,系統后臺能自動根據用戶的登錄信息獲取用戶的行為特征信息,并與館藏資源數據庫中的資源進行比對,找出用戶可能需要的資源信息并進行推薦。在推薦信息時,數字圖書館通過小窗口顯示的方式,避免對用戶的操作界面產生影響,進而提高用戶的檢索效率。因此,用戶在輸入檢索信息關鍵詞時,可以快速瀏覽系統的推薦信息,如果推薦信息包括用戶需要查找的信息,用戶就不需要再重新查找。
4.3?數字圖書館管理更加高效
基于用戶行為數據挖掘的數字圖書館電子資源推薦服務主要是通過運行計算機程序實現的,不需要專門人員負責實施。該推薦服務主要是通過增設系統模塊實現的,也就是說在系統升級過程中數字圖書館只要將模塊融入管理系統,就不需要再派專門人員負責分析用戶行為,從而降低了經費開支,提高了管理效率。
5?結語
隨著科技的不斷發展,數據挖掘技術已經滲透到各行各業,并在多個領域發揮著積極的作用。基于用戶行為數據挖掘的數字圖書館電子資源推薦服務提高了用戶的信息采用率,為數字圖書館電子資源推薦服務智能化發展打下了堅實的基礎。
參考文獻:
[1] 張宏.我國高校圖書館大數據研究現狀分析[J].圖書館工作與研究,2016(7):46-50.
[2] 王捷.大數據時代下圖書館開展信息服務的對策[J].現代情報,2013(3):81-83.
[3] 張衛群.圖書館用戶信息行為研究綜述[J].圖書館學研究,2006(8):87-90.
[4] 朱立紅.高校圖書館的數據挖掘技術應用與用戶研究[J].圖書館雜志,2008(6):39-42.
[5] 應璇,孫濟慶.面向大數據的用戶檢索行為研究[J].情報雜志,2014(2):140-143.
(編校:孫新梅)