摘 要:大數據時代用戶需求日益多元化、個性化,基于用戶畫像的智能信息服務深刻地改變了人們的生活,對圖書館領域產生了重要影響,研究用戶畫像對社會的發展具有重要作用。本篇文章通過對用戶畫像的定義、數據特征及來源、圖書館用戶畫像的構建方法以及圖書館服務的完善路徑等方面展開介紹,旨在突出強調大數據下圖書館服務的精準用戶畫像研究的重要性。
關鍵詞:用戶畫像;圖書館服務;用戶行為
1 引言
近年來,基于用戶畫像的智能信息服務在眾多領域得到了廣泛應用,圖書館也逐漸融入到了用戶畫像的發展浪潮中,用戶畫像方法近年來不斷被應用于營銷服務研究領域中,成為精準描述用戶行為特征的有利工具之一。它可以準確描述差異化的用戶群體特征,通過畫像建模呈現特定業務情境下每個差異群體的用戶類型、心理使用偏好和使用習慣,從而驅動以用戶需求為導向的服務創新與發展。
2 用戶畫像概述
1)用戶畫像的概念。用戶畫像又稱用戶角色,作為一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,用戶畫像在各領域得到了廣泛的應用。一個persona(Persona是用戶模型的簡稱)可以比任何一個真實的個體都更有代表性。一個代表典型用戶的persona的資料有性別、年紀、收入、地域、情感、所有瀏覽過的URL、以及這些URL包含的內容、關鍵詞等。
2)構建用戶畫像的方法。關于構建用戶畫像的方法很多,比較典型的是Alen Cooper的“七步人物角色法”,包括界定用戶行為變量、將訪談主題映射至行為變量、界定重要的行為模式、綜合特征和相關目標、檢查完整性、展開敘述、制定任務角色模型七個步驟。Lene Nielsen的“十步人物角色法”,包括發現用戶、建立假設、調研、發現共同模式、構造虛構角色、定義場景目標、復核與買進、知識的散布、創建劇情和持續的發展十個步驟。
2)用戶畫像的數據特征。用戶畫像是基于海量數據建立起來的標簽式虛擬用戶,針對其數據來源不同的學者有不同的看法,例如學者姜建武等人認為:籠統地看,用戶畫像的數據來源大概包括兩種類型:靜態的用戶基本數據(年齡、體重等)和動態的時間、地點、行為等數據(也稱為靜態信息本體和動態信息本體),同時動態信息本體隱藏在用戶行為之中,需要利用互聯網技術進行捕捉。也就是將用戶畫像的數據來源概括為靜態的基本數據和動態的行為數據。
3 大數據下圖書館用戶畫像的構建方法
數字圖書館繪制用戶畫像是轉變服務視角,從用戶角度進行戰略規劃,以全方位用戶數據采集、挖掘與分析,以保障圖書館資源、服務環境與用戶需求匹配。
1)精準識別目標群體,作出假設。首先,要明確用戶群體,數字圖書館登錄系統的注冊信息,是識別、區分用戶群體的良好方法。數字圖書館也需要采集用戶不同情境下的動態行為數據,從媒體、場景、路徑等多個維度,識別用戶在不同狀態下的訪問軌跡。其次,做出用戶角色假設,在用戶角色分析之前,要有個對用戶劃分的方向。任何一個用戶群體都有多種分類方式,首先要確定怎樣來分類客戶,確定分類方式之后,再具體一個一個分類來研究。
2)收集數據。對于用戶的研究,一般從定性和定量兩方面進行。定性研究的方法主要包括用戶訪談、現場調查和可用性測試等。用戶訪談是在創建人物角色時最常采用的方法,最好是非正式、松散的談話,訪談主題是用戶的目標、觀點和行為。現場調查,也稱為情境調查,是觀察人們在自然狀態下的行為,得到的更多的是關于人們在使用網站時的上下文環境信息,比如地點、時間、方式和原因。可用性測試是一種觀察用戶行為的經典的定性研究技術。
定量研究能更高的決定工作的重要性和優先級,一般采用問卷調查和數據分析相結合的方式來研究。問卷調查相對于其他方法而言,更容易收集到用戶的目標、行為、觀點和人口統計特征的量化數據,是定量研究的第一選擇。但要注意的是,問卷調查得到的是自我評價的數據,是用戶自己想要告訴的關于他們自己的事,并不完全是他們的實際行為。基于這個原因,在有可能的情況下,用數據分析網站流量統計來補足問卷調查數據是一個明智的選擇。
3)用戶畫像構建。在構建用戶畫像模型過程中,涉及復雜的計算方法,主要依靠機器學習來完成。例如,數字圖書館需要對收集而來的用戶數據進行底層規整處理,將紛亂復雜無序的大數據轉化為維度相同的向量,便于后續的機器計算。再對整理好的數據進行相似、相反的類別劃分,聚類的算法為圖書情報常用的計算方法k-means,除此之外,數字圖書館對用戶畫像建構的計算方法還包相似度計算、預測算法、語言處理數據關聯統計算法等。
4 基于精準用戶畫像的圖書館服務完善路徑
1)關注用戶畫像與資源模型的匹配度,完善館藏資源建設。數字圖書館需要將用戶畫像與館藏的信息資源進行匹配,首先,要對用戶畫像進行數據描述,即標簽處理;其次,要對館藏資源進行同樣的數據處理,抽取特征標識和語義相關資源信息;最后,將兩個數據集進行交互匹配,若匹配成功,則生成群的相似集,數字圖書館通過用戶畫像建立起來的標簽則可映射到主題中,與相似集進行進一步的匹配。在此基礎上,數字圖書館可精準分析用戶的閱讀偏好,進而為用戶構建特色數據庫,加強資源建設力度,提高數字圖書館的核心競爭力。
2)挖掘隱性語義模型。數字圖書館在收集數據源時,要注重突破原有的數據庫資源模型限制(原有的數據庫資源局限于用戶的基本信息和內容偏好數據,忽視用戶閱讀行為所產生的瀏覽痕跡,即隱性語義),采用隱性語義進行資源的推薦,形成“用戶標簽——隱性語義模型——內容標簽”的流程,這個模型的優勢在于能夠充分挖掘隱性語義,從而使數字圖書館能夠進行精準的信息推送服務。
3)監控動態知識流動軌跡。基于用戶畫像的數字圖書館信息服務,能夠形成多種數據規律的揭示手段,例如,數字圖書館可以構建信息資源的關系流動網絡圖譜,形成面向不同用戶的推理圖譜,圖譜間具有明顯的差異特征和推理特征,可以追蹤到不同時間、空間下的多維度閱讀軌跡。通過這種動態的用戶畫像構建過程,可以為數字圖書館信息服務提供實時的演化過程以供參考,使得數字圖書館的信息服務是不斷以用戶為中心的,隨著用戶需求的變化而不斷完善的。
5 結語
知識服務是圖書館重要工作內容,雖然近年來人們對圖書館發展與用戶畫像的融合進行了研究,但與其他行業部門相比,無論是圖書館學與用戶畫像的基礎理論及圖書館實踐應用都相對落后。用戶畫像是大數據時代精準服務的重要工具,圖書館擁有巨量的讀者用戶群和龐大的數據,引入用戶畫像可以促使圖書館真正了解用戶,為用戶提供全方位、人性化、個性化的定向優質服務,我國圖書館界應重新審視服務系統以更開放的視角,進一步深入開展用戶畫像的理論研究與實踐探索。
參考文獻
[1]穆德,亞爾.贏在用戶:Web人物角色創建和應用實踐指南[M].范曉燕譯.北京:機械工業出版社,2007.
[2]趙巖.基于用戶畫像的數字圖書館智慧閱讀推薦系統研究[J].圖書館學刊,2018,40(07):121-124.
[3]薛歡雪.高校圖書館學科服務用戶畫像創建過程[J].圖書館學研究,2018(13):67-71,82.
[4]陳添源.高校移動圖書館用戶畫像構建實證[J].圖書情報工作,2018,62(07):38-46.
作者簡介
吳睿青(1996-),女,漢族,山西省運城市,碩士研究生,上海大學,研究方向:圖書館。