明海?楊曉農
【摘 要】文章主要分析基于用戶畫像的數字圖館精準服務體系的建設要點及流程,首先對數字圖書館用戶畫像的基本需求和功能需求進行分析,確定用戶畫像體驗構建的核心要素,其次通過架構模型和聚類算法分析等實現用戶畫像的結果可視化,為用戶群體和個體提供精準的服務內容推薦。
【關? 鍵? 詞】用戶畫像;大數據;數字圖書館;服務推薦
【作者單位】明海,蘇州科技大學圖書館;楊曉農,鄭州大學信息管理學院。
【基金項目】2016年國家社科基金項目《“超越存取”推廣行動背景下圖書館社會影響力研究》(16BTQ008)。
【中圖分類號】G252 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.03.019
面向用戶畫像的數字圖書館精準服務體系建設具有重要意義。基于用戶角度出發進行研究,通過建立畫像能夠讓用戶獲取更好的服務內容,獲得更好的數字圖書館使用體驗。用戶使用數字圖書館的主要目的是獲取圖書資源,傳統的圖書館只是作為資源提供方,給用戶提供檢索信息和獲取資源的平臺,本質上與線下圖書館區別不大。而基于用戶畫像的數字圖書館能夠為客戶提供個性化服務,可以根據用戶的愛好和需求幫助用戶挖掘更多其感興趣的資源,拓寬知識獲取范圍[1]。對數字圖書館來說,精準的用戶特征分析可以幫助自身完善產品結構,依據用戶的選擇增加不同的服務內容,調整產品服務內容的開發方向,從而提高資源的有效利用率。
一、數字圖書館用戶畫像分析
1.用戶需求分析
在數字內容日趨可計算化、語義化和數據化的當下,數字圖書館迎來了與大數據相契合的多模態化改革,由資料檢索存儲等單一功能向多元化的服務方向發展,給用戶帶來了更好的使用體驗[2]。用戶畫像對規劃數字圖書館服務戰略至關重要,能夠解決服務內容的精準度以及個性化服務定制等難題,實現由“人找服務”向“服務找人”的轉變。同時,用戶畫像能夠解決數字圖書館與用戶細粒度不對稱的問題,為每一個用戶貼上精準的標簽,從而實現圖書資源和服務內容的精準化推送。
用戶畫像的建立本質上屬于大數據分析,需要明晰用戶的基本屬性、行為屬性、情感屬性、愛好屬性等多個維度的屬性,再通過交叉分析確定用戶的基本特征,以現有的可提供的服務內容和可使用的資源為基礎,向用戶推送偏好資源以及個性化服務內容,并且根據不同的使用場景和其他外部屬性調整推送策略。建立用戶畫像旨在為顧客提供更好的服務以增強用戶的忠誠度,并通過用戶畫像對用戶行為的預測幫助用戶拓寬獲取知識的途徑。比如用戶喜好科普類圖書,但由于知識獲取途徑有限,其難以發現更多的圖書資源,圖書館就能利用用戶畫像結合推送算法為其提供豐富的資源,激發用戶使用數字圖書館及館內數字產品的主動性[3]。
2.用戶畫像層次
用戶畫像是將用戶數據進行收集分析,從而將用戶需求實現數據化、可視化和關聯化的過程,在此過程中,用戶的行為數據被貼上特征標簽,當用戶的標簽足夠多時,系統就能夠勾畫出用戶的整體特征,即建立此用戶的行為畫像。建立用戶的行為畫像可分為接觸點數據、體系標簽和方案產出三層,接觸點數據層包括數據來源和數據處理,體系標簽層包括標簽體系、標簽權重和標簽更新,方案產出層包括用戶畫像可視化和場景定義。
接觸點數據層收集到的用戶相關信息,最能體現用戶行為的三種信息是內容偏好行為、社交行為和會話行為。內容偏好行為包括閱讀、檢索、借閱、下載、預約、續借等操作,能夠反映用戶的性格、興趣愛好、圖書愛好等特征。社交行為與交流、分享、點贊、評論等操作相關聯,能夠反映用戶的社交能力和性格特征等。會話行為包括登錄、訪問、瀏覽等操作,能夠反映用戶的日常生活習慣、閱讀習慣和數字圖書館使用習慣等。數據在收集完成后經分析形成標簽體系,為了讓標簽的描述更加精準,系統在不斷更新標簽內容的同時,還要為每個標簽加以權重區分,從而讓用戶的關鍵行為特征在標簽體系中更加突出[4]。在完成前兩個步驟之后,系統就可以產出具體的用戶畫像方案,方案通常以可視化的形式呈現,管理人員通過場景定義可對整個方案進行校正。在數字圖書館的交互界面,后臺管理人員能夠對數據進行分類、排序、組合,并使用曲線、二維圖形、三維立體圖形和動畫等多種形式加以展現,展現用戶的象形思維。
二、數字圖書館用戶畫像的功能分析
1.整合用戶數據
數字圖書館建立用戶畫像,并以此作為用戶的行為數據庫,其目的在于幫助數字圖書館發掘用戶需求以及用戶潛在的商業價值,以便更好地感知市場動向,提高數字圖書館產品的用戶滿意度,吸引更多用戶。隨著用戶感知服務、預測發展等概念的出現,圖書館的服務內容也向更加多元化的方向發展,各個平臺和組織之間存在更多的聯動性,能夠打破部門和系統之間的障礙,建立數據共享機制,形成統一規劃的綜合服務體系。用戶畫像要從用戶角度出發,以線索分析為數據來源,收集與用戶有關的各項數據,再進行分類整理,推測行為數據。
2.定位目標用戶
數字圖書館的用戶畫像建立后,要與用戶的屬性特征相關聯,通過屬性特征定位目標用戶,即系統設定用戶標簽后根據用戶畫像標簽庫聚類個體用戶,根據用戶間的互動行為找出用戶間的相似度以及用戶的行為特征,再由個體用戶的行為特征向外擴散,形成用戶行為特征群,實現目標用戶群體的定位。從用戶角度來看,用戶畫像能夠幫助其詳細了解自身的潛在需求,而數字圖書館可以將用戶群體進行特征分類,使用戶的借閱體驗感得到提升。對數字圖書館產品本身來說,定位目標用戶是拓展用戶資源、促使服務內容多元化的必要條件。
3.輔助精準推薦
數字圖書館的核心功能為提供檢索、檢查、借還、下載、會員等服務內容,這些基本的服務內容對每個用戶來說體驗都是一致的,但是用戶內心的服務標準不同,不僅與其性格、社會閱歷有關,還與其服務需求標準等有關,這些維度形成了用戶畫像的“像素”體系。在輔助精準推薦體系下,用戶的隱顯興趣都可以被捕捉到,并且能夠在不同情境下獲得智能差異化服務[5]。其實,輔助精準推薦就是用戶偏好的關聯推薦,比如用戶喜歡看美食類書籍,輔助精準推薦體系就可以為其推送與美食相關的內容。
三、基于用戶畫像的數字圖書館服務推送體系框架設計
在用戶畫像內容體系下,數字圖書館想要完善精準推送服務,應至少滿足服務定位精準化和服務功能用戶化兩個基本要求。服務定位精確化指服務定位不以群體為單位,而是細分到個人,為不同背景、不同文化程度、不同知識獲取需求的人提供差異化的個性服務和內容,利用數據挖掘、聚類分析、預測分析等方法發現用戶有意表述的需求、潛在的隱性需求和預測用戶未來的需求發展方向等,以實現服務定位精準化。服務功能用戶化指從用戶角度制定服務內容,將服務體系與用戶的自然特征結合起來,幫助數字圖書館做到認識用戶、理解用戶、了解用戶[6]。
1.體系組成要素
數字圖書館的精準推薦服務體系要素由用戶、基礎數據、畫像建模三部分組成。用戶是服務的對象,也是主體。用戶畫像分析是系統基于用戶在使用數字圖書館過程中積累下的行為數據,通過用戶產生行為的原因、目的來分析用戶的真實需求和基礎需求,從而實現用戶的特征分類和定位,即當前用戶屬于哪一類用戶,如基礎用戶、核心用戶或者粉絲用戶等。給用戶設置類型標簽才能精準地為其定制服務,這一切均建立在挖掘用戶真實需求的基礎上,數字圖書館在滿足用戶需求的過程中發現并確定服務核心點,使服務內容更有計劃性。基礎數據是分析用戶行為特征的工具,也是連接數字圖書館用戶畫像與真實用戶的紐帶,主要包括用戶數據和館藏資源數據,二者的結合可以使用戶的行為特征與服務需求聯系起來,用戶的需求越大,其計算權重越大。行為數據又分為正向數據和負向數據,如喜歡屬于正向數據,討厭則屬于負向數據,此兩種類型數據對于用戶畫像的構建來說均屬于核心數據。
2.架構模型構建
數字圖書館用戶畫像模型由數據模塊、推薦模塊和用戶模塊三部分構成。
一是數據模塊。數據層屬于構架的基礎層,數據模塊使數字圖書館具備一定的外界感知能力。一方面,用戶的需求主要通過數據分析來完成,數據收集過程需要借助各種感應器,由于用戶基本上無法獲知整個數據獲取過程,所以收集數據更能呈現用戶真實的內心想法,這是一種單向的感知路徑。在收集數據時,數字圖書館需要利用高端的設備拓寬數據來源的深度和廣度,實現對數據的高精度控制。另一方面,由于時刻都在產生新的數據,用戶數據量將達到巨量級,數字圖書館用戶數據處理系統應得到一定水平的技術支持,以保證計算的高效性和準確性。不管是非結構化數據還是半結構化或是流式數據都要重新解構,不同結構的數據都要經過擇選、去劣、存優、轉換、裝載等一系列標準化處理后才能移入知識庫,以提高用戶畫像的刻畫能力。
二是推薦模塊。推薦模塊是實現用戶畫像實際應用價值的中間模塊,也是整個構架模型中最關鍵的一環。在完成用戶的數據分析后,依據用戶行為特征實現資源的智能匹配即推薦模型生效的過程。
三是用戶模塊。用戶模塊是數字圖書館與用戶進行人機交流的橋梁,也是用戶畫像可視化應用的例證之一。系統根據已經收集的用戶背景信息,給用戶設置不同類型的標簽,在數據庫中針對每一類型的標簽建立服務項目索引,從而為不同類型的用戶提供相應的服務內容[7]。在用戶模塊中,系統為了給用戶提供更加直觀簡易的人機交互界面,方便用戶第一時間找到核心功能或主推功能應,還要給用戶提供反饋信息的渠道。
四、基于用戶畫像的數字圖書館精準推薦服務應用
1.用戶畫像的可視化處理
在實際應用過程中,數字圖書館首先要根據主要目標用戶確定數據權重,比如用戶是高校學生群體,則應將其與學習屬性相結合,服務內容更偏向于學術研究方向,主要收集的數據為學生的基本在校信息(包括系別、年級、專業等)、借閱圖書的詳細信息、借走及歸還時間信息、產品使用頻率等。同時,數字圖書館還可以將用戶的基本信息劃分為個人信息和閱讀信息兩個維度,根據維度場景提煉有用信息。在主題分類之后,數字圖書館要根據主題內容進行變量可靠性檢驗,從而確定各個變量間的隱性聯系。其次是分析標準分類抽取,用戶畫像的差異性主要表現在標簽的差異性上,不同特征的標簽應與主題維度相契合。最后,系統在獲得差異化標簽的公因子后,再將公因子作為聚類分析的變量,通常會選用K-means聚類算法對目標用戶群體進行聚類整理,形成樣本相似庫,最終獲得樣本特征信息。
2.精準推薦服務實現流程
應用協同過濾算法能夠計算目標用戶與每類項目中用戶群體的主題偏好相似度,尋找具有同類偏好的用戶群。一是針對不同類型的用戶群進行服務推薦,進一步將個體特征差異化,實現對群體內個體的精準服務推薦;二是構建從用戶到圖書類別的偏好映射矩陣,使用K-means聚類算法對用戶的圖書偏好類型進行聚類分析,通過計算最近鄰居、產生推薦等過程得出精確的聚類結果;三是綜合準確率和召回率,對推薦結果進行評估與改進學習,達到理想的服務標準。
大數據時代,數據的價值明顯提升,通過構建用戶畫像幫助數字圖書館實現精準的戰略定位和服務內容戰略化調整,是未來業界重要的發展趨勢。借助用戶畫像,數字圖館能夠集中核心資源發展更有商業競爭力的服務項目,在此過程中,不僅優化了用戶的服務體驗,而且還能讓數字圖書館更好地把握市場動向,挖掘用戶的潛在價值。
|參考文獻|
[1]劉海鷗,姚蘇梅,黃文娜,等. 基于用戶畫像的圖書館大數據知識服務情境化推薦[J]. 圖書館學研究,2018(24):57-63+32.
[2]宋美琦,陳燁,張瑞. 用戶畫像研究述評[J]. 情報科學,2019(4):171-177.
[3]單軫,邵波. 國內圖書館領域用戶畫像研究的冷思考:困境與出路[J]. 圖書館學研究,2019(5):8-13+30.
[4]許鵬程,畢強,張晗,等. 數據驅動下數字圖書館用戶畫像模型構建[J]. 圖書情報工作,2019(3):30-37.
[5]陳丹,柳益君,羅燁,等. 基于用戶畫像的圖書館個性化智慧服務模型框架構建[J]. 圖書館工作與研究,2019(6):72-78.
[6]王慶,趙發珍. 基于“用戶畫像”的圖書館資源推薦模式設計與分析[J]. 現代情報,2018(3):105-109+137.
[7]陳慧香,邵波. 國外圖書館領域用戶畫像的研究現狀及啟示[J]. 圖書館學研究,2017(20):16-20.
3275500589248