朱靜 徐一然 吳穎 孫敘倫 任娟



摘要:本文以圖書館用戶畫像為切入點,在充分融合用戶屬性數據、用戶人格數據、內容偏好數據、互動數據和會話數據的基礎上,構建標簽化的圖書館用戶畫像模型,并在此基礎上提出基于大數據的高校圖書館用戶畫像情境化推薦模式,從而為讀者提供更為精準的個性化知識推薦服務。
關鍵詞:高校圖書館;情境化推薦;用戶畫像;用戶標簽
中圖分類號:G350.7
文獻標識碼:A
1緒論
基于大數據的高校圖書館情境化推薦模式利用圖像處理技術,將數據進行可視化呈現,促進高校圖書館開展針對某類用戶的閱讀推廣和智慧化推送。高校圖書館可以有效利用大數據和用戶畫像技術實現服務模式的創新,如知識服務、學科服務、web服務、手機終端服務等等,同時根據用戶特征變化調整用戶畫像,提高閱讀推廣效果。
2高校圖書館用戶畫像建模
2.1用戶畫像數據獲取
圖書館用戶畫像數據的來源主要包括高校圖書館門戶網站、圖書館集成管理系統、移動圖書館、門禁管理系統及微信等平臺。圖書館用戶畫像數據資源包括用戶屬性數據、用戶人格數據、內容偏好數據、互動數據、會話數據和情境數據。用戶屬性數據可以通過系統的注冊信息獲取,用戶人格數據可以在系統注冊時的個人信息中進行完善。內容偏好數據、互動數據和會話數據都可以從圖書館門戶網站獲得。情境數據包括時間情境數據、位置情境數據和自然情境數據,其中時間情境數據和位置情境數據都可以通過定位技術獲得,如WIFI、藍牙、RFID、GPS、北斗、無線網絡基站等,而自然情境數據可以通過用戶手持的智能終端設備和傳感器來獲取。
2.2構建用戶標簽
根據圖書館用戶畫像獲取的途徑,為了滿足大數據背景下用戶的情境化推薦需求,本文構建了圖書館用戶畫像模型的靜態與動態標簽體系。其中,用戶屬性與用戶人格為靜態標簽,用戶偏好、互動、會話和情境為動態標簽。
2.3用戶畫像模型的建立
(1)用戶屬性標簽。用戶屬性標簽包括用戶姓名標簽、性別標簽、年齡標簽、出生日期標簽、教育程度標簽、用戶專業標簽和婚姻狀況標簽。用戶屬性標簽的形式化表示為User_Information={Name,Gender,Age,Birth,Education,Major,Marital}。Name為用戶姓名,為用戶記錄的唯一標識;Gender為用戶性別編碼,為男性或者是女性;Age為用戶年齡代碼,一般分為18歲以下、18至35歲、36歲及以上;Birth為用戶出生日期識別碼;Education為用戶教育程度編碼,一般分為??啤⒈究?、碩士、博士等;Major為用戶專業編碼,如機械設計制造及其自動化、軟件工程、市場營銷等;Marital為用戶婚姻狀況編碼,為已婚或未婚。
(2)用戶人格標簽。用戶人格標簽包括用戶興趣愛好標簽、用戶理想標簽、用戶能力標簽、用戶氣質標簽和用戶性格標簽。用戶人格標簽的形式化表示為User_Personality={Interest,Ideal,Capacity,Temperament,Character}。Interest為用戶興趣愛好編碼,可能包括運動、音樂、棋類、寫作、表演等;Ideal為用戶理想編碼,一般包括職業理想、素質理想、生活理想、社會理想;Capacity為用戶能力編碼,一般包括智力、專門能力和創造力;Temperament為用戶氣質編碼,一般分為膽汁質、多血質、黏液質和抑郁質;Character為用戶性格編碼,一般分為理論型、經濟型、權力型、社會型、審美型、宗教型。
(3)內容偏好標簽。內容偏好標簽包括瀏覽標簽、閱讀標簽、檢索標簽、預約標簽和續借標簽。內容偏好標簽的形式化表示為User_Preference={Browser,Reading,Search,Res-ervation,Renewal}。Browser為瀏覽情況編碼,即用戶瀏覽圖書館門戶網站的時間和頁面停留時間,頁面停留的時間越長表示用戶越感興趣;Reading為閱讀情況編碼,表示的是用戶閱讀的具體內容;Search為檢索情況編碼,一般表示用戶通過關鍵字對感興趣的主題進行檢索;Reservation為預約書籍編碼,反映了用戶的潛在需求;Renewal為續借書籍編碼,表示用戶閱讀完一本書籍后對其產生了濃厚的興趣,從而引發客戶的續借行為。
(4)互動標簽?;訕撕灠ㄊ詹貥撕?、評論標簽、分享標簽和情感態度標簽?;訕撕灥男问交硎緸閁ser_Interact={Collection,Comment,Share,Attitude}。Collection為收藏文獻編碼,表示用戶對搜集來的文獻資料進行篩選、加工和貯存的過程;Comment為評論情況編碼;Share為分享內容編碼,部分用戶會對其感興趣的書籍在社交平臺進行分享;Attitude為情感態度編碼,表示的是用戶對書籍以及其他用戶分享內容的喜好程度。
(5)會話標簽。會話標簽包括訪問時間標簽、訪問次數標簽、資源下載量標簽、咨詢量標簽和瀏覽路徑標簽。會話標簽的形式化表示為User_Dialogue={TID,Visits,Downloads,Consulation,Path}。TID為用戶訪問時間唯一識別碼;Visits為訪問次數編碼;Downloads為下載情況編碼;Consulation為咨詢情況編碼;Path為瀏覽路徑編碼。會話標簽反映了圖書館用戶的行為特征。
(6)情境標簽。情境標簽包括時間情境標簽、位置情境標簽、自然情境標簽。情境標簽的形式化表示為User_Situa-tion={Time,Position,Nature}。其中時間情境標簽的形式化表示Time={Datetime,Month,Parttime},Datetime表示用戶瀏覽的絕對時間,Month為1—12月,Parttime可以分為清晨、上午、中午、下午、夜晚;位置情境標簽的形式化表示為Position={City,PosType},City指的是用戶所在城市,PosType可能包括閱覽室、借閱室、機房、教室、宿舍、餐廳、體育館、操場等。自然情境標簽的形式化表示為Nature={Weather,Temp,Humidity,Windscale,Noise}。Weather主要包括晴、多云、雨、雪、冰雹、霜凍、霧等;Temp主要包括30℃及以上、21℃~29℃、11℃~20℃、0℃~10℃、零度及以下;Humidity表示的是自然情境中的濕度;Windscale描述的是風級,分為0~17級;Noise表示的是噪音,一般分為0~29分貝、30~49分貝、50~69分貝、70~89分貝、90分貝及以上。
3基于大數據的高校圖書館情境化推薦
讀者對高校圖書館資源的興趣度與其所在的情境高度相關。在圖書館用戶畫像情境化推薦模式下,我們首先要計算圖書館用戶的當前情境與歷史情境的相似度,然后再獲得與當前情境類似的歷史情境中的讀者對資源項目的興趣度排名,最后利用top-n規則選擇排名靠前的n個資源推薦給目標用戶,如圖3所示:基于大數據的高校圖書館情境化推薦的實現過程見圖4。
首先是數據資源層,包括數據獲取和數據處理。圖書館用戶畫像數據可以通過高校圖書館門戶網站、圖書館集成管理系統、移動圖書館、門禁管理系統及微信等平臺獲取。數據獲取結束后需要進行數據集成、數據轉換、數據規約、數據清洗和數據聚類,這幾項可以統稱為數據的處理。數據處理完畢之后,我們還將對數據進行存儲。
下一步是數據挖掘層,數據挖掘層主要通過從圖書館數據庫中提取關鍵特征信息并建立基于大數據的高校圖書館用戶畫像標簽體系,并對標簽進行分類建模和用戶標識,勾勒數字化圖書館用戶畫像。
最后是應用服務層,應用服務層通過用戶畫像特征計算目標用戶與服務資源的相似度,并結合用戶當前的情境(時間情境、位置情境、自然情境),為圖書館讀者推薦與其所在情境最匹配的個性化資源。應用服務層中最重要的是要實現推薦應用的可視化,即利用可視化技術將數據轉換為用戶能夠識別的圖形或圖像在屏幕上進行顯示,可視化推薦能夠把大量、繁雜、看似毫無關聯的數據、信息、知識以一種用戶能夠理解的視覺方式呈現出來。常見的數據可視化形式有圖表、數據流、層次結構、時間序列、矩陣、信息圖形、地圖、網絡等。
基于大數據的高校圖書館情境化推薦模式能夠完善圖書館資源,更科學地對目標讀者進行分析,及時調整推薦書目,提升用戶體驗。同時可以對讀者群進行精準刻畫,可以對具有相似閱讀興趣或內容偏好一致的讀者建立多重關聯,繪制出基于用戶畫像的讀者關系圖譜,深度挖掘讀者的潛在閱讀傾向,指導圖書館完善業務運營流程、精準開展各類閱讀推廣服務。
4結語
本文基于圖書館用戶屬性數據、用戶人格數據、內容偏好數據、互動數據、會話數據和情境數據進行標簽化識別,圍繞這六個維度構建基于大數據的高校圖書館用戶畫像模型,以此為基礎建立基于大數據的高校圖書館情境化推薦模型。需要特別注意的是,由于圖書館用戶的服務需求是實時變化的,因此需要對用戶的興趣變化以及所處情境進行動態化跟蹤。
作者簡介:朱靜(1985— ),女,漢族,山西臨汾人,碩士,講師,研究方向:電子商務與供應鏈管理;徐一然(1989— ),男,漢族,江蘇句客人,碩士,講師,研究方向:思想政治教育與高等教育管理;吳穎(1990— ),女,漢族,江蘇泰州人,碩士,講師,研究方向:思想政治教育與高等教育管理;孫敘倫(1992— ),男,漢族,江蘇鹽城人,碩士,研究方向:公共管理;任娟(1989— ),女,漢族,江蘇溧陽人,碩士,講師,研究方向:人力資源管理。