


摘要:數字圖書館在發展過程中,信息的載量越來越大,服務模式難以創新?,F存的個性化信息服務存在多種弊端。用戶畫像通過分析用戶的行為偏好,為精準推薦做參考。本文基于用戶的畫像視角,通過分析構建過程,提出了一種數字圖書館個性化信息服務研究的新思路。
關鍵詞:用戶畫像;個性化;數字圖書館
1背景
當今,數字化、開放化、互聯化的信息環境愈演愈烈,人類社會進入了數據富足供給的時代,數據資源已不再是稀缺資源[1]。“互聯網+”時代的到來促使高校數字圖書館所處的社會環境和技術環境出現較大改變,數字圖書館的服務內涵由信息搜索和信息瀏覽拓展為行為策略指出和信息共享,出現了新的服務模式包括嵌入式服務,全媒體服務,O2O服務,MOOCs服務,云閱讀服務[2]。
隨著用戶對于信息的需求量增加,數字圖書館未來的發展趨勢逐漸偏向于用戶的個性化信息服務研究。數字圖書館的個性化信息服務大致包括自定義服務界面設定、符合個人需求的內容定制、個性化信息推送服務以及智能的信息檢索定制等[3]。當前,個性化數字圖書館信息服務中存在技術問題和用戶隱私問題以及圖書館員素質方面的問題,同時如何為用戶推送符合他們要求的內容也成為研究的難題。用戶畫像的概念最早由交互設計之父艾倫·庫珀(AlanCooper)提出。
他說,用戶畫像是真實用戶的虛擬表示,基于一組真實數據的目標用戶模型。自2011年起,互聯網正式進入了大數據時代。網絡社交文化的迅猛發展連帶出龐大的線上用戶數據,有了足夠的數據基礎,如何精準的服務于用戶的問題也隨之產生,對用戶畫像的研究熱潮也開始興起。本文通過分析用戶畫像以及數字圖書館個性化信息服務的研究現狀,分析了用戶畫像具體的構建過程,并提出了其對于個性化信息服務的價值。
2領域研究進展
2.1用戶畫像研究現狀
以CNKI數據庫作為來源數據庫,以“用戶畫像”為關鍵詞進行檢索,限定中文文獻,不限定時間,檢索到的文獻數量為629,對檢索到的文獻進行可視化分析,如圖1所示。從圖中可以看出,對于用戶畫像的研究,在2010-2013年的熱度較低;隨著大數據時代的來臨,2013年以后,國內眾多學者對用戶畫像研究的熱度逐步上升。通過對文獻的細致梳理,目前國內學者對于用戶畫像的研究主要分為:(1)理論層面的探討;(2)用戶畫像模型構建方法;(3)用戶畫像的應用。
2.1.1理論層面研究現狀
用戶畫像的概念最初應用于電子商務領域。在大數據時代,用戶信息泛濫。如圖2所示,每個用戶的特定信息都被抽象到標簽中,這些標簽用于具體化用戶的形象,以便為用戶提供有針對性的服務。國內學者對于用戶畫像的定義有不同的理解。余孟杰對于用戶畫像的定義更加偏向于用戶角色,指出在產品研發時需要這樣一個角色來進行討論,通過“用戶信息標簽化”把抽象化的數據具體為虛擬人物[4]。徐恩,於志文,杜賀和郭斌認為用戶畫像是基于一系列數據的模型[5]。劉海,盧慧,阮金花,田丙強,胡守忠等認為用戶畫像是消費者基本信息和消費記錄所構成的數據集合[6]。黎小林等基于商品營銷的角度認為用戶畫像是指通過收集與分析用戶的相關數字化數據蹤跡,如頁面點擊歷史、商品交易記錄、用戶反饋數據等,將用戶所有的標簽綜合起來,勾勒出該用戶的整體特征與輪廓[7]。
2.1.2模型構建的研究現狀
陳澤宇和黃勃提出了基于主題詞改進的詞向量模型來構建用戶畫像,相比于只利用目標單詞的詞向量,用主題詞向量將代表這個主題下單詞的整體語義,更好的表達了用戶的特征[8]。張壯,馮小年和錢鐵云提出一種基于多模態融合的用戶畫像模型用于解決用戶畫像建模中各模態不能深入交互的問題[9]。蔣明會,苗奪謙,羅晟,趙才榮等基于粒計算思想,本文以用戶在搜索引擎的歷史搜索記錄和用戶屬性(年齡、性別、學歷)為原始數據,使用Stacking模型融合技術對多種模型進行融合以改進單一模型、單一粒度學習的限制,實現了多粒度的用戶畫像[10]。徐恩,於志文,杜賀,郭斌等基于手機感知數據從年齡、性別和人格特征三方面來構建用戶畫像.然后,使用隨機森林分類模型識別性別,并利用SVR來識別人格特征.由此提出了一種基于多維感知數據的用戶畫像模型[11]。
2.1.3在圖書館領域應用的現狀
王雪峰通過基于用戶畫像的相關理論,對智慧圖書館的群體進行劃分,從而對不同用戶的行為需求進行深層次的挖掘,并分析每一類用戶群體的典型特征,實現了用戶畫像的精準刻畫。從而對群體用戶的行為進行可視化呈現[12]。徐海玲等基于概念格構建了高校圖書館群體用戶興趣畫像,揭示不同群體用戶的行為需求,挖掘潛在的行為規律,為高校圖書館不同群體用戶的個性化服務提供參考[13]。李丹等在圖書館廣泛的讀者行為框架中定位用戶與應用系統的互動需求,探討可以更好地在讀者與INNOPAC等應用系統的互動關系中發揮良好作用的推薦方式[14]。過仕明通過用戶畫像和場景五力等相關理論,構建了數字圖書館用戶畫像,揭示了不同群體用戶的行為需求,并對其場景進行了重構,為數字圖書館更好發展提供了服務和參考[15]。
王雪峰基于超級IP和用戶畫像的理論,清晰明了的揭示了不同群體用戶的特征,對群體用戶的行為進行可視化呈現,并基于用戶的行為提供更加符合特征的場景,從而進一步提升智慧圖書館的服務能力[12]。
2.2數字圖書館個性化信息服務
胡英義總結了互聯網環境下高校圖書館提供信息服務的必要性和緊迫性,并提出改變提供信息服務的方式和方法[16]。在過去的十年中,徐遠峰提出了通過現代信息技術提高圖書館信息服務水平并竊聽信息技術潛力''的想法[17]。劉素清等根據新媒體的特點,提出了數字圖書館信息服務的新方向,分析了新媒體時代用戶對決策信息的個性化需求[18]?;跀祿诰蚣夹g,安貝提出了大學數字圖書館的信息服務優化策略,并優化了大學數字圖書館的信息服務策略[19]。
3基于用戶畫像的個性化服務策略研究
3.1數據來源和構建方法
數據的收集面向全體師生,包括本科生,碩士生,博士生以及教師。數據的來源是圖書館后臺記錄的數據,主要是借書的記錄數據以及用戶的靜態屬性即性別、年齡、專業、年級、職稱等如圖3。通過構建不同群體的借閱偏好,構建用戶畫像,為用戶提供個性化服務。根據數據來源的不同,目前對用戶畫像的構建方法主要分為兩種:基于人文學科范疇的研究方向和基于計算機、數據統計等范疇的研究方向。圖書館個性化信息服務的用戶畫像屬于人文學科范疇的研究方向。
3.2構建步驟與個性化服務
將采集到的數據進行數據清理,構建標簽體系后進行聚類,然后進行可視化的呈現。半結構化和非結構化數據主要是在各種系統模塊中生成的行為數據,例如書目歸還系統中的數據恢復,電子閱讀管理系統中的數據輸入,Internet接口上的數據和數據庫操作數據等。由于數據生成的形式不同,標準和規范不同,數據的存儲方式和格式具有一定程度的排他性,因此較為復雜?;诩上到y和統一的管理數據,收集各種類型的數據并完成數據清除操作更加方便和可操作[20]。
用戶畫像的本質是完成對用戶標簽的描述,即對用戶進行標簽。在人為干預的前提下,放置一個用于標記用戶肖像的系統,可以對數據挖掘過程中創建的數據進行排序并消除其偏差,并歸納和制定標簽的特定特征的標識。建立用戶標簽系統的具體過程主要包括:獲取有關用戶數據的信息,提取信息要點,將其與典型的,具有代表性的參考詞表進行比較,形成用戶需要的標簽對應的詞表。
聚類分析是一種根據事物的特征對個體進行分類的方法,將數據分為具有較大外部差異但內部相似度較高的幾類,目前,聚類分析研究領域主要涉及處理過程,模型識別和市場分析。K-均值算法和C-模糊工具的聚類算法(FCM算法)是目前使用最廣泛的兩種分類方法。聚類后可以根據不同群體即本科生、碩士生、博士生以及教師的不同的行為偏好構建用戶畫像[21]。
建立用戶畫像可為讀者的個性化服務打下良好基礎。用戶數據的來源和格式決定了推薦策略,推薦內容及其呈現形式,并直接影響用戶對推薦內容的關注和接受程度。在數字圖書館的個性化信息服務的過程中,通過分析用戶的來源來構建和預測用戶畫像的具體模型。然后根據用戶可能需要的信息進行深入的數據挖掘,完成對信息資源的推送服務。
4結語
數字圖書館的服務模式正在發生改變,隨著大數據技術的成熟發展,多種創新模式層出不窮。個性化信息服務作為數字圖書館未來的發展趨勢,對它的深入研究有十分重要的意義。用戶畫像的概念多應用于互聯網營銷領域,將其借鑒于圖書館的個性化服務能夠促進數字圖書館的發展,更好的服務于讀者。
參考文獻
[1]朝樂門.信息資源管理理論的繼承與創新:大數據與數據科學視角[J].中國圖書館學報,2019(02):26-42.
[2]鄭美玉.“互聯網+”時代高校數字圖書館服務模式創新研究[J].情報理論與實踐,2016,39(7):36-40.
[3]趙天昀.數字圖書館個性化信息服務中用戶隱私保護研究[J].圖書館理論與實踐,2018(2):101-103.
[4]余孟杰.產品研發中用戶畫像的數據模建——從具象到抽象[J].設計藝術研究,2014(6):60-64.
[5]徐恩,於志文,杜賀,郭斌.基于移動感知數據的用戶畫像系統[J].鄭州大學學報:理學版,2019,51(4):30-36.
[6]劉海,盧慧,阮金花,田丙強,胡守忠.基于“用戶畫像”挖掘的精準營銷細分模型研究[J].絲綢,2015,52(12):37-42.
[7]黎小林,徐蘇,王海忠.在線平臺用戶畫像對品牌依戀的影響[J].廣東財經大學學報,2019(5):38-49.
[8]陳澤宇,黃勃.改進詞向量模型的用戶畫像研究[J].計算機工程與應用,2020,56(1):180-184.
[9]張壯,馮小年,錢鐵云.基于多模態融合技術的用戶畫像方法[J].北京大學學報:自然科學版,2020,56(1):105-111.
[10]蔣明會,苗奪謙,羅晟,趙才榮.基于粒計算的多粒度用戶畫像[J].模式識別與人工智能,2019,32(8):691-698.
[11]徐恩,於志文,杜賀,郭斌.基于移動感知數據的用戶畫像系統[J].鄭州大學學報:理學版,2019,51(4):30-36.
[12]王雪峰.智慧圖書館知識服務場景構建研究——以吉林藝術學院圖書館為例[J].情報科學,2019,37(12):98-104.
[13]徐海玲,張海濤,張梟慧,魏明珠.基于概念格的高校圖書館群體用戶興趣畫像研究[J].情報科學,2019,37(9):153-158.
[14]李丹,高建忠.基于用戶畫像的圖書館推薦服務初探[J].圖書館,2019(7): 66-71.
[15]過仕明.數字圖書館用戶畫像及場景重構研究[J].情報科學,2019,37 (12):11-18.
[16]胡迎義.高校圖書館個性化信息服務研究[J].蘭臺內外,2018(12):38- 40.
[17]續遠鳳.近十年我國圖書館信息服務研究綜述[J].圖書館界,2016(6):35 -39.
[18]劉素清,彭妍,惠中艷,等.面向決策支持的高校圖書館信息服務[J].中國中醫藥圖書情報雜志,2019,43(2):38-41.
[19]安蓓.基于數據挖掘技術的高校圖書館信息服務優化策略[J].信息記錄材料,2019,20(4):198-199.
[20]潘宇光.高校智慧圖書館讀者信息需求的用戶畫像[J].合肥工業大學學報(社會科學版),2018,32(2):113-119.
[21]譚浩,郭雅婷.基于大數據的用戶畫像構建方法與運用[J].包裝工程,2019,40(22):95-101.
作者簡介
曹曉雅(1997—),女,漢,山東泰安,碩士,北京聯合大學,研究方向:數字圖書館。