劉曉婷,楊 超,趙宇鵬
(河北北方學院,河北 張家口 075000)
隨著大數據、人工智能、云計算等技術的廣泛應用,社會逐步向智能化方向發展。黨的十九大報告提出建設智慧社會,這是對信息社會發展趨勢判斷的科學部署。圖書館應當牢牢把握信息化發展帶來的機遇,為圖書館智慧化發展以及為讀者提供更好的智慧化服務不斷開辟新路徑,從而更好地推進智慧社會的建設。
近年來,用戶畫像在電子商務、醫療衛生、旅游業、圖書館等領域都有應用。相關研究表明,用戶畫像技術的運用,對深入了解用戶需求,實現信息服務個性化和精準化有顯著作用。用戶畫像最初在電商領域中得到應用,當前也是在電子商務領域的應用最為成熟,主要體現在根據消費習慣等用戶行為數據,推薦個性化商品和服務信息,從而實現精準營銷。在醫療衛生領域,主要體現在根據用戶健康信息行為進行健康信息推薦。在旅游行業,主要應用于旅游信息推薦。在圖書館行業,當前主要是應用于精準讀者服務方面,用戶畫像技術在圖書館領域尚屬起步階段。
用戶畫像的概念最早由Alan Cooper提出,是指構建能夠反映目標用戶真實數據信息情況的虛擬模型[1]。簡單地說就是用戶信息標簽化,是通過用戶的基本屬性信息、行為信息興趣偏好等特征性數據,對用戶進行聚類分析,形成并建立基于用戶需求的普遍性和差異性模型。
使用CNKI統計分析工具對檢索結果進行分析發現,國內最早對用戶畫像技術在圖書館領域的研究是在2014年,從2017年開始發文量持續上升,2018年后的發文量占全部文獻的93%。文獻研究表明,用戶畫像已經成為近年來國內圖書館學、情報學領域的熱點研究方向。
通過對所收集的文獻全文進行詳細的閱讀和分析,對當前國內用戶畫像技術在圖書館領域的研究進行梳理。研究主要集中在4個方面,其中對用戶畫像模型構建方面的研究最多。
1.2.1 用戶畫像模型的構建
陳添源[2]基于高校移動圖書館的特定情境,通過對高校師生進行問卷調研的方式,對人口統計、使用行為、使用心理進行統計,并利用因子分析、聚類分析和判別分析法選取適宜的用戶畫像個數,從而構建其用戶畫像標簽體系;李曉敏等[3]為實現智慧圖書館精準實體圖書推薦,對讀者的自然屬性、興趣屬性、社交屬性與圖書的相似性進行匹配,構建智慧圖書館用戶畫像;于興尚等[4]以讀者基本信息、閱讀行為、心理特征、社交網絡、情境感知5個方面作為數據源,構建用戶畫像。肖海清等[5]為促進高校圖書館閱讀推廣,從數據采集層、數據處理層、標簽抽取層、用戶交互關聯層及應用實現層5個層面,構建了基于閱讀推廣內在循環為機制的參與式用戶畫像模型;楊群等[6]基于大學圖書館微知識服務,規劃微知識服務流程,設計了基于用戶畫像的微知識服務體系模型。張宇等[7]基于圖書知識服務系統,通過讀者基本信息、情境信息、內容偏好信息和互動會話信息4個方面對用戶畫像模型進行構建,為圖書館知識服務系統提升了效率和精度。
1.2.2 用戶畫像算法與技術
李偉等[8]基于經典k-means算法,提出了一種基于馬氏距離的多視角二分k-means算法,優化在多視角聚類中陷入局部最優的缺陷,設計了高校圖書館用戶畫像框架;廖運平等[9]將圖書館用戶畫像分成面向設計與面向營銷兩類,并分別探析二者的內涵、特征、創建方法和創建步驟;吳智勤等[10]對當前科研用戶畫像存在的算力算法不足、標簽不全和不準的問題進行分析與改善,提出了基于社交網絡方法和知識圖譜技術的用戶畫像標簽的構建策略。朱會華等[11]運用數據挖掘、知識聚類,創建基于用戶畫像的讀者薦購、學科薦購、采訪薦購模式。
1.2.3 圖書館精準服務應用
毛玉蘭[12]構建圖書館用戶畫像,用以提升圖書館閱讀推廣精準性,顯著提高閱讀推廣工作效果并提升讀者服務滿意度;李晶潔等[13]以天津商業大學圖書館為例,依托讀者數據并從多維度建立數據模型,構建用戶畫像,并通過用戶畫像對優化館藏結構建設和服務提出建議;劉海鷗等[14]從用戶畫像大數據收集、處理、存儲和安全4個方面具體闡釋移動圖書館大數據應用策略,促進用戶畫像在移動圖書館知識發現、知識產權保護、精準推送等方面的具體應用;張若蘭[15]對于智慧圖書館情景化知識推薦服務方面,設計了基于用戶畫像服務的目標與服務流程,并總結相關應用經驗。
1.2.4 用戶畫像相關隱私問題研究
周林興等[16]剖析了圖書館用戶畫像在構建和使用過程中存在的隱私問題,從意識、管理、技術和法制4個層面提出相應策略,從而更好實現圖書館用戶畫像隱私治理。
用戶畫像建立在真實而復雜的眾多數據基礎上,其核心是用戶信息的標簽化,需要將不同的用戶通過差異化的標簽進行描述,將用戶特征標識出來。圖書館用戶畫像標簽體系,基于高校圖書館用戶需求,用戶畫像標簽首先需要包含讀者人口屬性,其中包括性別、專業、年級、身份類別(如教師或學生)。讀者心理屬性分為興趣屬性和社交屬性兩類。興趣屬性主要是指讀者線上和線下使用圖書館獲取文獻的偏好,涉及線上電子文獻的查詢、瀏覽、下載、閱讀和紙質文獻查詢、借閱情況,包含電子書、論文、視頻和紙質圖書與期刊。社交屬性主要是指讀者與圖書館相關事物的互動,如圖書館網站平臺的話題討論、微信公眾號發文的評論、相關學科內容的關注與分享、圖書館推廣活動的參與等。讀者行為屬性,主要是指讀者線上或線下使用圖書館的行為方式與特點,如訪問的方式、訪問終端、經常訪問的時間段、每次訪問耗用的時長、訪問的頻率等。構建的高校圖書館用戶畫像標簽體系,如圖1所示。
高校圖書館用戶畫像的構建要遵循兩個原則:一是能夠代表讀者的全部特征,能夠將讀者對圖書館資源的利用和圖書館服務的使用情況準確地表述出來;二是能夠滿足高校圖書館業務需求,把圖書館開展的工作和服務所需的支持數據盡可能全面涵蓋。構建用戶畫像可按照以下流程進行。
(1)基礎數據的采集。數據的獲取來源于圖書館管理系統、圖書館門禁系統、座位管理系統以及圖書館門戶網站的網絡日志等。圖書館管理系統保存讀者的基本信息,如專業、年級、年齡、性別、身份,還包括讀者借還書信息。圖書館門禁系統記錄了讀者入館頻次、入館時間及時長。座位管理系統記錄了讀者習慣使用的閱覽室、座位號、學習時間、頻次等。圖書館門戶網站記錄了讀者檢索、在線閱讀文獻、互動留言等信息行為。涉及的讀者數據按照用戶畫像標簽體系分為讀者人口屬性數據、讀者心理屬性數據、讀者行為屬性數據,再根據這些特征對讀者進行畫像。收集到的用戶畫像數據可分成兩類:一類是靜態數據,另一類是動態數據。不會實時變動的數據是靜態數據,如讀者人口屬性數據,而會實時變動的數據為動態數據,如讀者心理屬性數據、讀者行為屬性數據。根據用戶的靜態數據能夠了解用戶的基本需求,根據用戶的動態數據可以為用戶提供精準的個性化服務。
(2)數據預處理。其主要是對收集的數據進行結構化和清洗,對存在噪聲和缺失、錯誤、不規則的數據,進行清洗、去除、轉換等處理。由于高校圖書館的數據量很大,數據中包含很多冗余數據,必須去除重復數據。
(3)用戶畫像構建。用戶靜態數據主要來源于高校圖書館信息管理系統數據庫,從數據庫直接采集后,采用抽取、轉換、加載技術。而動態數據是實時變化的,需要用權重來衡量數據的重要程度。根據用戶畫像標簽體系,用一些較為成熟的大數據工具軟件構建用戶畫像和畫像的權重。由于用戶畫像無法完全準確地描述一個群體,要根據不斷變化的讀者數據進行不斷的修改,更符合讀者的特征。
近年來,在高新技術的飛速發展下,高校圖書館逐漸向智慧圖書館轉型發展,要求圖書館服務更加個性化、精準化、主動化,服務內容和服務方式也更加豐富多樣。將用戶畫像技術應用到智慧圖書館的建設中,對資源精準推薦、數據統計、館藏資源建設、學科服務等圖書館服務將會有很大幫助,從而更好的滿足讀者需求。
圖書館資源的精準推薦,是指能夠按照高校師生的信息需求為讀者主動推送館藏信息資源,包括館藏紙本圖書、期刊,電子圖書、期刊,數據庫信息等。以往無差別的資源推薦,對于圖書館來說往往是付出很多的勞動,但效果不理想。高校圖書館資源精準推薦,對促進高校閱讀推廣、提高資源利用率有重要的作用。
通過系統構建師生用戶畫像,對圖書館讀者不同維度和不同層次的標簽信息進行組織與挖掘,將其與館藏資源包括館藏圖書和期刊相匹配,讀者人口屬性更能反映一類讀者的共性需求,讀者心理屬性和行為屬性更能體現每一讀者的個性需求,從而精準地實現對讀者的資源推薦。在用戶畫像的技術支持下,圖書館能夠提高資源推薦的精準性,促進高校師生信息利用,為開展各項線下和線上閱讀推廣活動提高成效。
高校圖書館每年都有較多的經費用于資源的采訪,對于一些經費不充足的高校,資金的利用率就顯得尤為重要。在每年圖書館資源采訪工作中,如何能將經費用在最能滿足師生需求的資源建設上,是各個高校資源建設方面都在深入研究的問題。
基于用戶畫像技術,根據用戶人口屬性、心理屬性、行為屬性生成個人畫像和群體畫像,并對圖書信息資源按中圖法和學科進行分類,對文獻信息資源和用戶數據進行數據清洗、降噪,數據發掘、聚類等,最終結合本校圖書館采訪的基本方向和原則,將近幾年新出版的圖書信息資源和高校師生的畫像相匹配。以此在基于讀者資源需求、館藏資源利用率、學科建設需求的基礎上,為圖書采訪提供科學的、有依據的薦購。
高校教師承擔教學和科研的雙重任務,科研往往是由團隊合作來完成的,團隊中的成員多數在人口屬性和興趣屬性上具有一定的相似性。與此同時,每一個團隊成員在讀者屬性、行為、偏好上也存在個體差異,從而有利于為不同的讀者制定不同的學科服務策略。
學校各個學科的重點研究領域,對研究團隊及個人,在深入采集讀者屬性、行為、偏好數據的基礎上,通過數據挖掘與分析用戶數據,構建群體和個人用戶畫像,根據用戶畫像把握和預測用戶的科研興趣偏好,把握科研需求,分析用戶的研究領域熱點問題、研究趨勢、合作學者、學術影響力、研究成果分析等,并為科研團隊成員推送個性化的科學情報服務。
用戶畫像能夠讓智慧圖書館掌握師生實際和潛在的信息需求特征,通過對圖書館業務進行數據統計分析,為圖書館未來發展決策提供支持和幫助。
例如,可以通過用戶畫像分析不同專業和年級的學生到圖書館進行借閱、自習、參加讀者活動、使用圖書館智慧空間等設施的需求;分析圖書館組織的各種讀者活動,每種活動更吸引哪類讀者參與;按照學科對館藏資源進行分類,分析用戶對各個學科的資源需求等。基于用戶畫像,智慧圖書館讀者需求得以全面呈現,各項服務向精準化發展,并為未來圖書館工作與發展提供方向指引,促進圖書館服務水平和讀者滿意度的不斷提升。
當前,各地高校圖書館逐漸向智慧圖書館轉型發展,從設備、技術、服務等方面進行探索和實踐,為讀者提供更加智慧化的圖書館服務。從用戶畫像角度,深入結合圖書館工作內容,探討通過提高服務精準性來實現高校圖書館智慧服務的方法和策略,對提升高校圖書館服務水平和向智慧圖書館轉型發展有重要的理論與實踐意義。