汪 圳 李建苗 李 東
(1.長安大學圖書館 陜西西安 710064)
(2.西安信息職業大學數字經濟管理學院 陜西西安 710125)
在信息爆炸的時代,高校用戶并不缺少數字化的信息資源,而是無法高效率地獲取最需要的知識。越來越多的高校用戶需要個性化定制信息推送服務。新時代的圖書館閱讀推廣服務,應同時考慮優質的內容和用戶的知識需求。傳統的圖書推薦往往是基于對圖書內容方面的考慮,但對于圖書館用戶,除了借閱信息,其他維度的信息獲取及分析還遠遠不夠。用戶興趣愛好和學術背景千差萬別,因此,傳統的推薦策略和簡單的借閱信息早已不能滿足圖書館閱讀推廣服務的需要。基于此,在推進“資源找人”的個性化服務以改變閱讀推廣中的被動困境時,應充分考慮用戶所處的情境要素對用戶閱讀偏好產生的實時性影響。
情境可以全面準確地描述實體的所有信息,包括實體本身、應用程序及復雜的網絡關系等[1]。用戶情境作為情境信息的一個維度,主要包含了用戶的基本信息、行為信息、時空信息,是多維度情境信息的集合。根據情境信息可以進一步挖掘用戶內心的動機、需求及偏好等[2]。面對不同的研究對象時會使用不同的情境要素分類方法,情境要素維度的劃分會影響系統識別用戶情境的效率[3]。本文參考的相關用戶情境的研究如下:Dey認為用戶情境要素包括用戶基本信息、心理特征、社會地位等多方面的要素信息[1];汪圳等人在研究面向科研用戶的數字圖書館個性化知識服務中,從四個維度全景式地描述了科研情境,即科研人員在科研過程中研究科研對象來完成科研任務[4];鄧仲華等人認為地學領域的科研用戶情境包括個人信息、信息行為、處理資源、接受服務、時間歷史及社會關系六個維度的信息[5];郭順利等人在研究移動圖書館用戶的需求時,將圖書館用戶情境劃分為用戶的位置信息、基本信息和社會網絡信息三個方面[6]。
近些年來,隨著推薦策略研究愈加得到圖書館的重視,一些高校的數字圖書館引入了個性化信息服務。楊永權[7]介紹了美國具有代表性的大學圖書館的個性化推薦系統:華盛頓大學圖書館“My Gateway”系統、康奈爾大學圖書館“MyLibrary@Cornell”系統及北卡羅萊納州立大學“My Library@LANL”系統等。在國內,具有代表性的圖書館個性化服務系統有中國人民大學數字圖書館的個性化推薦系統、深圳圖書館開發的“圖書館自動化集成系統”[8]以及浙江大學圖書館的MyLibrary系統[9]。盡管部分大學數字圖書館引進的個性化服務效果還不太明顯,但都是對信息時代如何提高知識服務質量的積極探索。
綜上所述, 目前高校圖書館在引入個性化服務領域還處于探索階段,諸多數字圖書館的個性化服務采用了熱門檢索詞或基于用戶基本信息等老舊的方式,導致知識推送服務的質量還不太高。本文引入情境感知技術,同時考慮高校大學生群體在圖書館平臺產生的行為信息及高校教務系統的課程信息,提出一種融入用戶情境的數字圖書館平臺推薦系統框架。
數字圖書館面向大學生群體進行個性化知識服務時,不僅要考慮高質量的知識內容,還要考慮用戶所處的情境產生的知識需求。只有在恰當的時機推送用戶最需要的知識,才能提高個性化服務的質量。
本研究提出了一種融入用戶多維度信息的數字圖書館推薦系統框架,如圖1所示,從左至右分別是用戶情境、云端大數據處理中心及用戶定制化服務。每個模塊實現的功能分別為用戶情境模型的構建、個性化推薦技術的支撐及用戶的定制化服務。

圖1 融入用戶情境的數字圖書館平臺推薦系統框架
數字圖書館向學生群體進行信息資源推薦時,需要充分考慮在校大學生的實際需求, 情境可以較全面地描述大學生的狀態,進而推理獲取大學生群體的知識需求。
構建在校大學生的情境模型首先應對用戶的情境要素進行抽取與分析。在數字圖書館應用環境中,考慮用戶情境的3個維度的信息:用戶基本特征信息(U-basic)、數字圖書館用戶行為信息(U-lib)、高校教務系統信息(U-edu)。大學生群體的用戶情境表示為:Context={ID,U-basic,Ulib,U-edu}。其中,U-basic={ID,Sex,Age, NativeP};U-lib={LB,LS,LD,LR};U-edu={ES,EC,Ecur,EG ,ET}。
用戶情境要素的含義見表1。
組成數字圖書館用戶情境的三個維度要素之間的交互關系如圖2所示。本文構建了用戶情境要素的交互模型。該模型能夠準確識別數字圖書館用戶所處的動態情境,從而推理用戶的興趣偏好,這是個性化服務的前提。
隨著數字圖書館資源的急劇增加,大量的數據信息會影響目標用戶對資源的識別和有效的獲取。如何匹配數字圖書館優質的資源與用戶的需求需要不同的推薦策略來實現。數字圖書館云端大數據處理平臺會存儲大量的指標數據。這些精細化、碎片化的數據信息能夠反映用戶偏好,將這些數據進行篩檢處理,可以使用戶需求更容易被系統理解,進而提供更符合用戶需求的知識資源。

表1 用戶情境要素的含義和說明

圖2 情境要素交互關系圖
云端大數據處理平臺主要包括四種推薦策略:基于熱門書目的推薦、基于用戶相似度的資源推薦、基于相關課程信息的資源推薦及基于相似情境的資源推薦。數字圖書館知識推薦模型如圖3所示。
3.2.1 基于熱門書目的推薦

圖3 數字圖書館資源推薦模型
知識資源個體存在差異,僅根據用戶需求決定的推薦方案會存在推薦資源質量不高的情況,所以評判知識庫內知識資源的質量也是推薦流程中非常重要的過程。本文在參考館藏資源評價指標的相關研究[10-12]后,構建了資源評估體系,從資源特征、資源推薦熱度、資源活躍度、新書上架、評價反饋5個方面來構建評價指標,最后應用皮爾森線性相關分析方法,搭建知識資源受歡迎程度模型。云端大數據處理中心根據知識資源的模型對用戶的推薦方案進行篩選,在此基礎上產生資源推薦集合W。
3.2.2 基于用戶相似度的資源推薦
目標用戶對數字圖書館資源的偏好受其所處情境的影響,這些情境要素也會對相似用戶群體產生類似的影響。根據社會從眾的心理機制,目標用戶的興趣偏好傾向于類似用戶群,因此可以根據相似用戶的閱讀喜好為目標用戶進行資源推薦。
相似性計算方法包括余弦相似性、皮爾森相似性和改進的余弦相似性三種。由于改進的余弦相似性克服了前兩種算法的缺點,因此,本文選擇改進的余弦相似性計算方法計算目標用戶與已知用戶群之間的相似性。
用戶相似性計算表達式為:

其中,Ua為目標用戶,Ui為系統中已有用戶群中的第i個用戶。
最后選擇相似性高的N個用戶組成相似用戶集AUa,將其偏好定義為目標用戶的偏好,在此基礎上確定數字圖書館資源推薦集X。
3.2.3 基于課程相關的資源推薦
教務系統主要包括教師信息、學生信息和課程信息。不同專業背景的學生涉及到的課程信息包含不同的教材、資源與任課教師信息,通過對課程與知識資源、教師與知識資源的分析可以確定學生用戶與知識資源的關聯關系。云端大數據處理中心根據用戶所處的專業、學習階段等信息,為用戶關聯數字圖書館相關度高的資源集合Y。
3.2.4 基于相似情境的資源推薦
用戶在特定的情境下產生知識需求,當數字圖書館提供的資源滿足用戶時,用戶的查詢信息和數字圖書館資源應用情境被管理系統存儲。本文定義的數字圖書館知識模型(ILD)包括數字圖書館資源應用情境(Context(H))、數字圖書館資源載體(Carrier)和數字圖書館資源內容(Content)三部分。
即數字圖書館知識模型ILD={Context(H),Carrier, Content}。
當用戶i情境信息較完整時,系統獲取用戶i的當前情境Context(C)i,與數字圖書館知識j的應用情境Context(H)j做相似性計算,即sin{Context(H)j,Context(C)i},在此基礎上選取相似度最高的前N條知識資源組成用戶潛在感興趣資源集合Z推薦給用戶。
在集成用戶情境的數字圖書館知識管理平臺中,用戶在不同情境下產生了不同的知識需求,隨著數字圖書館知識應用情境的不斷擴充,系統能夠保證更好的自行適應性。
定制化應用層面以提升優質館藏資源的推送及用戶線上體驗為目標,期望提升數字圖書館資源的利用率。本文在上節分別得到了基于熱門書目、用戶相似度、課程相關及情境相似的數字圖書館資源集合。接下來,本文將根據圖書館用戶的推薦情境分別設計不同的定制化應用,包括個人課程、個性化推薦、定制化信息檢索及主題書架。
3.3.1 個人課程
(1)課程相關
根據用戶課程名等信息,通過拆分分詞,形成課程相關推薦,為用戶關聯館藏資源,并將紙質文獻與電子資源匹配,圖書相應的新書、熱門等標簽就會清晰易見,將圖書館資源推送到相應課程中,形成課程與館藏資源的匹配。
(2)專業精選
精選課程教學推薦、課程大綱或教師推薦等信息,提供包括推薦圖書、課程網站、相關課件、其他資料等形式的定制化資源。專業精選推薦的圖書將與館藏圖書進行匹配,并展現館藏狀態、電子書、新書、熱門、推薦、教參等不同標簽,通過圖書館館藏輔助使得用戶能夠對相應課程進行深入學習。
相關課件和其他資料可由館員自主上傳到相應的課程中,用戶可在該課程模塊中下載學習,集聚課程的館藏資源和電子教參資源,創新支撐線上教學。
3.3.2 個性化推薦
(1)熱門推薦。在熱門資源的基礎上,根據用戶設定的閱讀偏好類別,進一步向用戶展示個性化的熱門資源,提高資源利用率。
(2)新書推薦。在新書資源的基礎上,根據用戶設定的閱讀偏好類別,進一步向用戶展示個性化的熱門資源,提高資源利用率。
(3)智慧推薦。個性化推薦如果一味以用戶需求為驅動(小到信息檢索結果,大到資源宏觀的優化配置)就會容易使用戶陷入習慣性為興趣所導、忽略更廣闊信息資源的信息繭房,從而產生信息盲區。智慧推薦,即用云計算分析、學習用戶的海量行為數據,如點擊、搜索、收藏等,獲取用戶個人和群體的情境狀態,綜合考慮冷門資源、用戶基礎信息、專業背景等信息,進行權重排序,從而為用戶提供智慧推薦。智慧推薦根據多維度的用戶個人情境狀態和相同資源借閱者、相同資源收藏者、相同搜索詞使用者的群體情境狀態,結合借還數據、點擊數據、評分、收藏數據等,優化算法,增加用戶與資源的偶遇率,從而激活睡眠用戶,降低用戶的信息繭房風險,進一步提升圖書館的資源使用效率。
3.3.3 定制化信息檢索
(1)保存常用圖書搜索詞,設置個性化搜索偏好。可保存常用搜索詞記錄,方便多次檢索,尤其為使用高級檢索的用戶提供便利。可設置出版時間范圍、期望的出版社(數量可以設置)、期望的著者(數量可以設置),調整權重大小;還可設置搜索結果數,從而進一步精確結果范圍,提高檢索效率,滿足深度檢索需求。
(2)提供多種結果排序方式。提供多種結果排序方式,包括默認排序方式(按檢索條件的符合程度依次排列)、按出版時間排列。
(3)搜索外部資源,并提供外部搜索結果的訪問入口。針對保存的圖書搜索詞,在搜索館藏之外,同時搜索圖書館的部分數據庫資源,并提供訪問入口,滿足用戶的閱讀和科研學習需求。
3.3.4 主題書架
(1)新生入館。可根據調查問卷或教務信息,按新生的籍貫、學習水平、興趣方向自動生成主題書架,展示介紹本地、本校歷史,優勢專業,相關課程教師,課程簡介等相關資源。
(2)考試專區。可根據調查問卷或教務信息,了解用戶近期的考試需求,如英語四六級考試、研究生考試、公務員考試以及各種職業技能考試,自動生成主題書架,展示相關教輔、考試指南類資源。
(3)就業專區。可根據調查問卷,了解有就業需求的用戶信息,自動生成主題書架,展示就業前景、往年畢業生就業報告書、產業現狀、就職指南等相關資源。
(4)特色收藏。用戶可對符合自己興趣愛好或學習需求的圖書或其他資源進行收藏,并自定義收藏夾名稱(即特色收藏)。收藏夾內可嵌套新的收藏,層層分級,歸集偏好資源,打造用戶個人系統性的閱讀和學習體系。在對接圖書館相關電子書鏡像版或圖書鏈接的情況下,支持搜索、在線查看和添加“特色收藏”,以便于學習需要和快速訪問。
(5)我的數據庫。展示全館數據庫,并提供簡要介紹和訪問入口。支持關鍵詞搜索數據庫和分類展示,用戶可添加自己常用的數據庫以便于快捷訪問。
情境要素的引入能有效匹配數字圖書館資源與用戶需求。本文從用戶基本信息、數字圖書館用戶行為要素和高校教務系統要素三個維度構建了用戶的情境模型,提出了一種融入用戶情境的數字圖書館平臺推薦系統框架,并分析了各組成模塊的關鍵技術、實現的功能及模塊間的交互關系。