程 全
(廣州工程技術職業學院,廣東 廣州 510075)
用戶畫像的概念是在大數據環境背景下產生的,建立在對數據的挖掘與分析基礎上,是對用戶閱讀習慣與消費習慣進行整理和標簽的過程,是用戶具體行為的數據抽象化。總之,用戶畫像的作用在于使圖書館站在客觀的角度分析用戶的閱讀消費行為,避開工作人員的主觀因素影響,使圖書館的信息服務從用戶需求出發,聚焦用戶的閱讀偏好與行為規律,從而提高圖書館信息服務的針對性和有效性,以需求帶動發展,促使圖書館信息服務精準推送,打造高效實用的圖書館信息服務模式。因此,基于用戶畫像的數字圖書館信息服務模式研究,對于提升數字圖書館信息服務質量具有重要的現實意義。
對用戶的閱讀喜好與行為數據進行畫像刻畫,可以更好地了解用戶對信息資源的需求,為圖書館進行精準推送與制定決策提供基礎[1]。實際上,基于用戶畫像行為需求的數字化刻畫,凸顯了圖書館以用戶為中心的服務理念,與數字圖書館信息服務內涵是相契合的,數字圖書館通過對用戶信息行為軌跡進行分析,得到一個又一個標簽,這些標簽共同還原了用戶的借閱行為,數字圖書館在進行階段工作總結時,對應構建的數字資源、推送的信息服務與用戶畫像數據,就可以明顯地發現其中的差距,進而為下一階段的工作計劃提供指導,有助于為數字圖書館信息服務提供科學決策。
數字圖書館進行用戶畫像構建有以下幾點作用:第一,可以通過用戶畫像分析潛在的用戶,進行精準推送;第二,通過用戶畫像分析,數字圖書館可以為用戶提供個性化、定制化的信息推送服務,滿足用戶的閱讀需求;第三,數字圖書館可以通過用戶畫像收集資源的利用效果,例如應用可視化的數據分析技術,跟蹤了解用戶對所推送信息的點擊率和閱讀率,以此評估資源推薦和信息服務的準確率與某一時間段內的信息利用效果[2]。總之,數字圖書館構建用戶畫像,并以此為基礎進行信息服務模式的建設,有助于提高數字圖書館信息服務水平。
首先,數字圖書館要大量收集數據源,作為構建用戶畫像的基本要素,數據源的目的在于最高程度的還原用戶的信息和行為。數據源的來源有用戶基本信息、用戶內容偏好數據、用戶互動數據、用戶會話數據、用戶其他數據五大類,詳見表1。這幾類數據被儲存到服務器中,數據間是相對獨立的,數字圖書館在進行用戶畫像建設時,要提取這幾類數據并實現相對獨立系統間的有序整合,呈現出初步的用戶畫像刻畫,然后再通過用戶的動態行為數據進行關聯,最終得出修正后的用戶畫像。

表1 數字圖書館構建用戶畫像數據來源[3]
經歷用戶數據源收集和初步畫像步驟后,用戶畫像模型的構建就可以真正開始了,這是一個比較復雜的和不斷完善的過程。構建用戶畫像模型是通過分析用戶日常的閱讀行為,為數字圖書館進一步精準信息服務、準確分析用戶閱讀興趣和習慣、為讀者提供有針對性的個性化信息服務的一種有效措施。因此,數字圖書館需要對用戶數據進行分類與聚類的分析整合,對用戶閱讀行為進行細分,從而勾勒出用戶的畫像并建立標簽體系。
在構建用戶畫像模型過程中,涉及到復雜的計算方法,主要依靠機器學習來完成。例如,數字圖書館需要對收集而來的用戶數據進行底層規整處理,將紛亂復雜無序的大數據轉化為維度相同的向量,便于后續的機器計算,接下來,要對整理好的數據進行相似、相反的類別劃分,聚類的算法為圖書情報常用的計算方法k-means[4],除此之外,數字圖書館對用戶畫像建構的計算方法還包相似度計算、預測算法、語言處理、數據關聯統計算法等。
基于用戶畫像的構建,數字圖書館在信息服務模式上有所創新,預測用戶感興趣的模塊、構建相似資源集,并從實際的反饋結果對信息服務進行評估,創新了數字圖書館信息服務的評價機制。圖1是基于用戶畫像的數字圖書館信息資源推送模式,由圖可知,數字圖書館的信息服務和推送服務,緊緊圍繞用戶畫像進行,用戶畫像庫成為數字圖書館信息服務的出發點與落腳點。

圖1 基于用戶畫像的數字圖書館信息資源推送模式[5]
基于用戶畫像視角的數字圖書館信息服務需要提前勾勒出用戶畫像模型,從中預測用戶的潛在閱讀需求,進而深度挖掘數據資源,向用戶推送他們可能感興趣的內容,同時,加強信息服務內容的建設,拓展服務內容范圍,豐富信息服務方式。具體流程為:第一,用標簽標記用戶的特征,并提取特征,進行相似的聚類整合。第二,根據用戶畫像標簽,挖掘與用戶閱讀需求相匹配的數據資源,進行信息的預處理。第三,通過分類、組織、相似性計算元數據,與用戶畫像需求相匹配,關聯信息資源與用戶的閱讀偏好,進一步實現數字資源推薦服務,為用戶制定多樣化、個性化的信息資源[6]。
數字圖書館通過分析聚類的標簽,應用主題描述的方法對標簽進行層次分析,全面描述多層次的用戶畫像,即他們所感興趣的閱讀主題。實際上,在數字圖書館參考用戶畫像的同時,用戶的閱讀需求是處于動態變化中的,那么,就需要數字圖書館納入這種動態變量,對新生成的數據加以實時更新。上述基于用戶畫像的數字圖書館信息資源推送模式示意圖中,用戶畫像庫生成的相似群,即是用戶原有的興趣行為模型所呈現出的動態變化。在此基礎上,數字圖書館的信息服務創新表現為關注用戶的群體性特征,因為個體的讀者用戶閱讀偏好變化相對明顯,而群體用戶的變化幅度是相對較小,更有利于圖書館針對用戶相似群提供相應的服務。
數字圖書館需要將用戶畫像與館藏的信息資源進行匹配,首先,數字圖書館要對用戶畫像進行數據描述,即標簽處理;其次,數字圖書館要對館藏資源進行同樣的數據處理,抽取特征標識和語義相關資源信息;最后,將兩個數據集進行交互匹配,如上述基于用戶畫像的數字圖書館信息資源推送模式示意圖中,用戶相似資源集與主題的匹配,如若匹配成功,則生成群的相似集,數字圖書館通過用戶畫像建立起來的標簽則可映射到主題中,與相似集進行進一步的匹配[7]。在此基礎上,數字圖書館可精準分析用戶的閱讀資源和閱讀偏好,進而為用戶構建特色數據庫,加強資源建設力度,提高數字圖書館的核心競爭力。
數字圖書館在收集數據源時,要注重突破原有的數據庫資源模型限制(原有的數據庫資源局限于用戶的基本信息和內容偏好數據,忽視用戶閱讀行為所產生的瀏覽痕跡,即隱性語義),采用隱性語義進行資源的推薦,形成“用戶標簽——隱性語義模型——內容標簽”的流程,這個模型的優勢在于能夠充分挖掘隱性語義,即對用戶畫像的實時計算體現出用戶對于發現某一類信息資源的興趣度(CTR)[8],從而使數字圖書館能夠進行精準的信息推送服務。通過挖掘隱性語義來揭示用戶畫像所體現出的用戶興趣度值,完善數字圖書館信息服務,是一項有效的策略。
基于用戶畫像的數字圖書館信息服務模式需要圖書館拓展信息服務內容,傳統的信息服務內容可被劃分為文本、視頻、圖片、網頁等,用戶畫像的構建充分利用了大數據技術和人工智能技術,這就使人機交互受到了重視,用戶畫像構建過程中的知識挖掘與呈現,要求數字圖書館基于數據關聯和發現的方法來拓展其數據集,如拓展用戶行為的數據庫、豐富館藏資源的數量和涉獵學科領域,從而實現用戶畫像即用戶需求與數字圖書館信息服務的連接,提高數字圖書館信息服務的效率。
最后,基于用戶畫像的數字圖書館信息服務,不僅能夠為數字圖書館的知識發現服務提供科學的分析資源,還能夠形成多種數據規律的揭示手段,例如,數字圖書館可以構建信息資源的關系流動網絡圖譜,形成面向不同用戶的推理圖譜,圖譜間具有明顯的差異特征和推理特征,可以追蹤到不同時間、空間下用戶留下的多維度閱讀軌跡。通過這種動態的用戶畫像構建過程,可以為數字圖書館信息服務提供實時的演化過程以供參考,使得數字圖書館的信息服務是不斷以用戶為中心的,隨著用戶需求的變化而不斷完善的。
用戶畫像的構建能夠準確地描繪出大數據時代用戶的閱讀偏好、行為習慣以及屬性特征,并將這類規律性的有序信息進行標簽化顯性處理,深層次挖掘用戶畫像可以提高數字圖書館的數據價值,提高信息的利用效率。因此,基于用戶畫像的數字圖書館信息服務模式研究具有重要的現實意義。通過用戶畫像的描述與標簽識別,有利于對數字圖書館服務改善作出精準的判斷,為數字圖書館決策的制度提供科學基礎,可以說,用戶畫像的作用體現在數字圖書館服務的方方面面。總之,通過對用戶畫像的分析與數字圖書館服務信息服務進行研究,使用戶特征可視化、生動化,是圖書情報領域學術研究的新進展。
[1] 張鈞.基于用戶畫像的圖書館知識發現服務研究[J].圖書與情報,2017(6):60-63.
[2] 王慶,趙發珍.基于“用戶畫像”的圖書館資源推薦模式設計與分析[J].現代情報,2018(3):105-109,137.
[3] 劉速.淺議數字圖書館知識發現系統中的用戶畫像——以天津圖書館為例[J].圖書館理論與實踐,2017(6):103-106.
[4] 姜建武,等.基于用戶畫像的信息智能推送方法[J].微型機與應用,2016(23):86-89.
[5] 裘惠麟,邵波.圖書館精準服務研究現狀及發展策略[J].圖書館學研究,2017(16):2-7.
[6] 王順箐.以用戶畫像構建智慧閱讀推薦系統[J].圖書館學研究,2018(4):92-96.
[7] 胡媛,毛寧.基于用戶畫像的數字圖書館知識社區用戶模型構建[J].圖書館理論與實踐,2017(4):82-85,97.
[8] 曾建勛.精準服務需要用戶畫像[J].數字圖書館論壇,2017(12):1.