[摘 要] 用戶畫像服務失靈用來描述用戶畫像服務供給理想和現實之間的差距,指受用戶畫像服務自身固有局限和外在不利因素的制約,服務偏離了預想或計劃,未能有效完成服務任務并達成既定目標,進而失去用戶信任的局面。無法提供精準個性化服務與偏離圖書館核心價值理念是圖書館用戶畫像服務失靈的主要原因。為規避服務失靈風險,圖書館在追求技術效率的同時,必須具備和履行更高道德水準的價值理念。為此,圖書館要為用戶賦權賦能,改進優化算法,構建資源服務畫像,打破信息繭房,實現普遍均等服務,依法建立合規完備的個人信息保護體系。
[關鍵詞] 圖書館 用戶畫像 服務失靈 風險規避
[中圖分類號] G250.7 [文獻標志碼] A [ DOI ] 10.19764 / j.cnki.tsgjs.20230176
[本文引用格式] 于風程.圖書館用戶畫像服務失靈風險及其規避[J].圖書館建設,2024(2):110-118,126.
* 本文系中共山東省委黨校(山東行政學院)重大項目攻關創新科研支撐項目“圖書館用戶畫像服務失靈風險及其規避”的階段性成果,項目編號:2023CX096。
Risk of the Failure of Library User Profiling Service and Its Avoidance
Yu Fengcheng
[Abstract] The failure of user profiling service is the gap between the ideal and the reality of user profiling service supply. Restricted by own inherent limitations and external adverse factors, user profiling service deviates from expectations, fails to effectively complete the task and achieve the goals, thus loses users’ trust. The failure to provide accurate and personalized services and the deviation from the core values of the library frequently result in the failure of user profiling services. In order to avoid the risk of service failure, the library must have and fulfill more higher moral value while pursuing technical efficiency. To this end, library should empower users, improve optimization algorithms, build resource service profiling, break the information cocoon room, ensure universal and equal service, and establish the personal information protection system.
[Keywords] Library; User profiling; Service failure; Risk averse
0 引 言
改進粗放、無差別、同質化的被動式服務,主動為用戶提供精準的個性化服務,滿足用戶個性化、特色化、多樣化的需求是圖書館孜孜以求并為之不懈努力的目標。近年來,隨著大數據和人工智能技術的發展,圖書館借鑒電子商務領域的成功經驗,引入用戶畫像這一新的服務形態,從而有效、快速、準確地分析出用戶需求和行為偏好,主動為用戶提供精準的個性化服務?!皵祿椭腔刍慕Y合將成為圖書館轉型的軸心”[1],可以預見,用戶畫像服務必將成為圖書館的新理論研究和實踐探索熱點。
1 用戶畫像及其應用研究簡要回顧
交互設計之父Cooper最早提出,用戶畫像(Personas)是建立在真實用戶數據之上的虛擬角色描述[2]?!缎畔踩夹g 個人信息安全規范》規定,用戶畫像(User Profiling)是指通過收集、匯聚、分析個人信息,對某特定自然人個人特征,如其職業、經濟、健康、教育、個人喜好、信用、行為等方面做出分析或預測,形成其個人特征模型的過程[3]。
Personas為Cooper在1998年開創使用[4],主要應用于交互設計領域或產品設計,利用問卷、訪談等方式獲取用戶特征而提煉得出的虛擬的“典型用戶”,是具有某種顯著特征的用戶群體的概念模型,這是早期概念。User Profiling是大數據環境下,人工智能自動抓取用戶數據,針對一個個具體人物或者群體形成的用戶模型,應用于產品設計、客戶管理、推薦、營銷等方面。在大數據和人工智能得到廣泛運用的當下,本文采用User Profiling這一概念。Personas和User Profiling二者有所區別,但是并不存在本質區別,而是“相輔相成”[5]。從Personas 到User Profiling是用戶畫像這一概念隨著信息技術發展而不斷演變的結果,User Profiling是對Persona的繼承和發展,豐富與深化。
用戶畫像的實質是把用戶信息標簽化,把用戶特征抽象成高度精煉、語義突出的標簽,標簽主要抽象自用戶統計學中的信息、性格、喜好、習慣、行為等靜態數據和動態數據,這些數據可通過數據庫工具或者網絡爬蟲技術從業務系統中獲取,也可通過調研的方式來獲取。
用戶畫像又分為個人畫像和群體畫像。個人畫像可用以提供個性化服務。群體畫像描述用戶群體特征,常用以輔助決策,如設計和改進服務、優化圖書館空間、優化資源配置、制定規章。群體畫像盡管是面向某一群體,但也可以為群體中的個體成員提供高質量個性化服務奠定堅實基礎。
目前,國內外對用戶畫像的研究主要涵蓋了用戶畫像概念、構成要素、特征、算法與技術、模型構建、應用可行性探索等諸多領域。本文重點關注、研究用戶畫像在圖書館實踐應用中可能面臨的挑戰這一問題。
在國外,20世紀80年代的英國國家書目和Blaise-line(歐洲首批在線服務之一)的服務優化是用戶畫像在圖書館領域有文獻記錄的最早應用[6]。 在國內,2010年鄭寶鑫在《基于用戶畫像、信令挖掘技術的手機游戲產品推廣》一文中最早明確提出用戶畫像這一概念[7]。2014年,吳國芳[8]、李業根[9]分別發表論文,提出將用戶畫像運用于圖書館,這是國內較早地將圖書館與用戶畫像相結合的中文文獻。
圖書館探索研究將用戶畫像運用于多種工作場景,運用用戶畫像實現個性化檢索,開展知識發現服務,構建微知識服務體系,進行閱讀推廣,推薦個性化資源及服務,開展精準營銷,構建大數據分析平臺,智能薦購館藏文獻資源,實施空間再造,開展移動視覺設計及服務設計等。
這些應用場景可以大致概括為個性化服務和輔助決策兩個領域,其中個性化服務又以個性化推送為主。也有少數研究者注意到了用戶畫像存在的問題,如會導致過度服務、不當服務、服務“內卷”等問題[10]。
總之,目前圖書館用戶畫像的應用研究多著眼于化解圖書館同質化供給與用戶個性化需求的矛盾,以減少無效供給,更偏重發揮提升圖書館服務效能的積極作用。但是,人工智能技術是一把雙刃劍,其內在的、固有的局限性不可避免地會給圖書館帶來消極影響,而目前的研究卻多忽略了這一點,少數這方面的研究缺乏總體上把握和宏觀上審視,顯得不夠系統性、較為零散。
2 圖書館用戶畫像服務及其失靈的概念界定
圖書館用戶畫像服務是指圖書館根據用戶人口統計學信息、社交關系、需求偏好、行為模式等數據抽象出來而形成的標簽化的用戶模型,以此結合不同情境預測用戶的信息需求、信息行為,從而主動為用戶精準推送個性化資源、服務,或用以輔助決策(配置資源、設計服務、優化空間、制定規章)的一種智慧化服務模式。
圖書館用戶畫像服務的直接目標是為用戶主動提供精準的、智慧化的個性化服務,為用戶提供超越預期的良好體驗;根本目標則是在遵守法律的基礎上,踐行智識自由、平等、民主、包容等圖書館核心價值理念,保障用戶平等的文化(信息)權利,從而保持用戶對圖書館持續增長的滿意度和忠誠度,增強用戶黏性,促進圖書館可持續發展。這兩個目標是圖書館理想中的用戶畫像服務效果,實現了工具理性與人文精神的完美結合。
圖書館用戶畫像服務失靈用來描述用戶畫像服務供給理想和現實之間的差距,指受用戶畫像服務自身固有局限和外在不利因素的制約,服務偏離了預想或計劃,未能有效完成服務任務并達成既定目標,進而失去用戶信任的局面。
中國青年報社社會調查中心2021年的調查顯示,在廣泛運用用戶畫像的互聯網領域,用戶畫像失靈現象已經出現[11]?!拔覀冋l都不是從未來穿越回來的,因此任何對未來的具體描述都充滿風險”[12],盡管這是劉煒針對未來十年哪些信息技術在圖書情報行業應用并將帶來怎樣的影響而提出的觀點,但其同樣適用于用戶畫像這一新的服務形態,我們要高度重視用戶畫像服務可能存在的風險。
3 圖書館用戶畫像服務失靈的原因
簡而言之,圖書館用戶畫像服務失靈的原因是不能實現直接目標和根本目標。
3.1 無法提供精準個性化服務,沒有實現直接目標
用戶畫像服務實質是用過去發生的事件預測未來發生的事件。但未來是充滿不確定性的,對未來的預測往往附帶諸多假定條件,一旦假定條件不成立,不準確性就是一種必然。
用戶畫像服務的運行機理是基于概率統計來尋找重復出現的模式或規律,遵循觀察—獲取數據—分析數據—挖掘統計規律—建模再現數據規律的過程,通過處理數據,從數據中發現一些深層次的知識、模式、關系或趨勢,預測個人或群體的可能行為。
圖書館用戶畫像服務隱含著這樣的邏輯:用戶需求和信息行為是有規律的;這個規律是可以被挖掘和掌握的;這個規律具有延續性,即過去的需求和信息行為規律在未來繼續有效。這三個方面環環相扣,任何一個方面出了問題,用戶畫像服務都會失靈。這要求用戶需求偏好和信息行為必須呈現較強的規律性,挖掘規律的算法是有效的,用戶需求和行為偏好須在一定時期內靜態維持不變,而不是動態的、變動的,否則失靈將不可避免。
3.1.1 不同類型的需求和行為的可預測性存在差異
用戶畫像服務是數據驅動,規律蘊含在歷史數據之中,充足數量的高質量數據是用戶畫像服務的基礎。
用戶需求包括規律性需求、弱規律性需求、無規律性需求、漂移性需求。這些共同構成了用戶多樣化需求的豐富多彩、不可缺少的組成部分,它們可以產生的數據是不同的,因而它們的可預測性也是不同的。
規律性需求一般在一定時期內維持靜態不變,充足數量的高質量數據呈規律性分布,正確的算法可以挖掘出規律,精準構建細粒度的畫像,并以此預測未來,可預測性較高。
弱規律性需求往往數據數量不足、質量不高,數據分布的規律性不明顯,挖掘規律的難度很高,構建的用戶畫像往往呈現出粗粒度特征,可預測性較低。
無規律性需求往往表現為隨機性需求、偶然性需求甚至是瞬時性需求,呈現出一次性特征,波動性較大,始終處于動態變化中,數據極少,基本不具備可預測性。無法有效預測無規律性需求是包括用戶畫像服務在內各種預測技術的先天局限。
在現實場景中,用戶自身興趣發生改變,或者受人群、環境、熱點事件、情境等外部因素的影響,用戶興趣容易漂移。這意味著原有需求及行為規律對未來是失效的,不具有延續性。這種漂移興趣即使在長期來看是規律性需求,但在漂移的起始階段往往缺乏足夠數量和質量的數據,處于冷啟動狀態,很難保證預測的準確性。冷啟動現象是預測所面臨的不可回避的挑戰。
3.1.2 忽視構建資源畫像
資源畫像是在用戶畫像思想和構建原理的基礎上,對資源的各種信息數據進行挖掘和處理,從而生成關于資源的畫像模型[13]。
圖書館用戶畫像服務能否成功實現精準推薦取決于用戶與資源的匹配度。為實現用戶與資源的準確匹配,需要將準確的、動態的用戶標簽與圖書館資源深層標簽之間建立關聯映射,結合相關性特征、情景特征、協同特征,為用戶實時準確地推薦符合其需求的信息。因此加強資源的有效描述與標引,多維度、多屬性構建資源畫像也就成為必不可少的基礎工作。很顯然,資源畫像與用戶畫像同等重要,是用戶畫像服務不可或缺的重要組成部分,用戶畫像只有與資源畫像深度融合為一體,才能深化用戶畫像服務效能。
實踐中,往往過于重視對用戶畫像的構建,忽視了對圖書館資源及服務的多維、細粒度、精準標識,對資源畫像重要性缺乏足夠認識,少有構建資源畫像。用戶精準的個性化需求依然對應著近似同質化、辨識度不高、粗粒度的資源,無法實現用戶與資源的精確匹配,用戶畫像失去了應有作用,無法精準推薦個性化資源和服務。
3.1.3 算法失靈導致畫像失真與推薦失準
人工智能成效依賴于大數據、計算能力、人工智能算法這三個要素的有效結合。用戶畫像服務,無論是畫像構建還是資源推薦同樣要依賴于算法。但是算法也有可能錯誤洞察規律,并不能保證百分之百的準確無誤,表現為畫像失真,推薦不準。實踐表明,真正需要的資源不可能完全靠算法按照一定規則來精準篩選,很多時候依賴于用戶的隱性知識、洞察力來定性判斷。面對同樣的資源,不同用戶的TOP-N(排名前N)選項很可能不完全一致,甚至于在不同心理狀態、情境、時間階段,同一用戶的需求和選擇都有可能不一致。
算法之所以會失靈的原因有兩個:一是,自然界和人類社會還有太多的規律沒有被人類所認識,人類自身的求知欲和獵奇心理會激發人對新信息的渴望,預測人類需求和行為偏好充滿了風險和挑戰,作為試圖利用數字概率來描述人類思考過程的算法也自然不可能洞察所有規律。
二是,目前的算法并不完美。人類智慧的源泉在于知識、經驗與推理能力。單純依賴數據驅動的算法,其性能跟人類智慧差別非常大,無法達到真正的智能,容易被欺騙或者被操縱。算法依賴于大量的數據,一旦面對數據缺失、數據稀疏的情況,算法的準確性、可靠性是存疑的。同時,算法不是在脫離人類社會的真空中產生和運行的,代表著選擇,意味著判斷,承載著價值。算法黑箱現象帶來的技術屏障、算法歧視,在人工智能的深度學習中都難以識別,深刻地影響用戶的選擇自由。
3.2 無法實現根本目標,偏離圖書館核心價值理念
在智能化階段,人類必須深入思考智能化如何更好地服務于人。用戶畫像作為新興人工智能技術,對提高圖書館服務效率,滿足用戶個性化需求起到了積極作用,但同時,我們必須看到,近年來方興未艾的基于人工智能技術的知識獲取方式,正在摧毀“圖書館精神”[14]。具體表現在這種知識獲取方式有悖于圖書館長期實踐形成并極其珍視的智識自由、平等、民主、包容等核心價值理念。如果在用戶畫像服務過程中,背離了圖書館核心價值理念,必然導致用戶的不滿與排斥,不能促進社會對圖書館事業的理解與支持,如此則沒有達到圖書館用戶畫像服務的預期,導致服務失靈。
3.2.1 誘導需求偏離智識自由,產生信息繭房
現代圖書館學確立了智識自由的核心價值[15],2002年,IFLA《圖書館格拉斯哥宣言:信息服務和智識自由》宣布:“不受限制地獲取、傳遞信息是人類的基本權利?!盵16]
智識自由是指人人享有不受限制地尋求與接收各種觀點的信息的權利[17],強調用戶自主選擇、獨立決策,將知識與信息的選擇權完全交給讀者,圖書館不干預用戶信息行為和需求,在提供知識與信息時要保持服務價值的中立性。
用戶畫像服務主動向用戶推送服務在一定程度上干預了用戶信息需求和行為,這與智識自由產生了偏離。盡管圖書館是出于善意,是為了能最大程度滿足用戶需求,提高用戶獲取信息的效率,但是過度介入用戶信息需求,會架空用戶選擇的權利,使得用戶長期依賴于他人的審美經驗或信息推送,失去了自由搜索、獲取資源、自主學習、主動思考解決問題的能力和權利。人的自由全面發展需要全面的信息知識,圖書館不能通過信息過濾把人的信息需求框架于某一方面。
研究證實協同過濾、用戶畫像等算法技術手段極易導致“信息繭房”[18]。 在跟隨大數據算法、精準個性化推送浪潮中,用戶畫像服務持續推送經過過濾的同質化內容,固化、窄化了用戶的需求,用戶失去了獲得異質信息的機會,不知不覺中陷于“信息繭房”的困境中。“信息繭房”與互聯網開放多元的精神格格不入,也是智識自由被破壞的必然后果和極端后果。
3.2.2 違背平等服務理念
現代圖書館學確立了平等服務的核心價值。1994年聯合國教科文組織《公共圖書館宣言》強調了平等服務,《公共圖書館法》明確規定“公共圖書館應當按照平等、開放、共享的要求向社會公眾提供服務。”[19]
平等服務理念主張對所有人一視同仁,提供普遍均等服務,平等對待所有群體,同時對不能正常利用圖書館服務的特殊群體予以特殊服務。在進行圖書館服務創新時,必須高度警惕平等服務理念自覺或不自覺遭到侵蝕的可能,保障全部用戶都能平等地獲得這一服務,避免群體分化。
圖書館根據用戶群體畫像預測這一群體的整體需求與行為,以此來規劃圖書館的未來發展和建設思路,輔助決策。這種情況極易導致資源配置、服務設計、空間布局、規章制定等方面向擁有畫像的優勢群體傾斜。
用戶畫像服務高度依賴線上服務,基于數據驅動,服務利用的越多,數據足跡越多,服務越精準,推送的資源越多。特殊群體由于各種障礙難以利用線上服務,數據少甚至沒有留下數字足跡,這種情況必然影響用戶畫像服務的準確性,不精準的服務必然進一步影響到用戶對服務的利用欲望,形成惡性循環,導致特殊群體無法獲得高質量的用戶畫像服務。這種數字排斥會加劇用戶畫像服務在不同群體間的馬太效應。圖書館要高度警惕用戶畫像服務可能筑起的不公平的圍墻,避免數字鴻溝和數字排斥剝奪不會使用智能終端的數字貧困群體的平等權利。
3.2.3 個人信息保護存在較大風險
蔣永福[17]認為,圖書館維護智識自由,要堅持用戶自主選擇和保守用戶秘密的原則,這里的用戶秘密就包括用戶個人信息,同時,保護個人信息是法律對圖書館的基本要求。因此,個人信息保護極其重要,其地位不亞于智識自由,本文不將個人信息保護作為智識自由的一部分來論述,而將其單獨論述。
《個人信息保護法》規定,“個人信息是以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,不包括匿名化處理后的信息?!盵20]這一定義較《網絡安全法》《民法典》在一定程度上拓寬了個人信息的范圍。
圖書館大量保有用戶個人信息,人工智能在為用戶提供快捷精準服務的同時,也給他們的個人信息安全帶來極大風險,圖書館遭遇網絡攻擊、內部泄露、第三方對數據過度挖掘和濫用的情況時有發生。隨著用戶信息安全意識的增強,個人信息安全焦慮廣泛存在。用戶迫切要求圖書館提供強有力的個人信息保護措施,否則會排斥圖書館利用個人信息來提供服務,造成服務失靈。
但是,受制于整個社會個人信息保護水平,圖書館個人信息保護存在較大風險,面臨嚴峻挑戰。目前,圖書館對個人信息保護意識與管理水平存在不足,對個人信息保護不力所引致的后果還缺乏足夠認識,缺乏與服務規模相適應的專業人員和技術支持,國內大部分圖書館都沒有明確與用戶達成個人信息收集和服務協議,已有的個人信息保護政策則合規性、系統性不足,呈現出碎片化特征,文字過于冗長,語言晦澀不明。
4 規避圖書館用戶畫像服務失靈的必要舉措
用戶畫像服務對滿足個體和社會的需要有重要意義,完成了“人找信息”到“信息找人”的轉變,實現了人與信息的高效連接。算法必將越來越成為主流推薦方式。但是在享受人工智能技術紅利的同時,要有效防控技術失范帶來的種種問題,促進人工智能服務健康、持續、安全有序發展,要著重從兩個方向發力,一方面完善人工智能技術,另一方面要用主流價值導向駕馭算法。作為公益性機構的圖書館,在追求技術效率的同時,必須具備和履行更高道德水準的價值理念,更體現人文關懷,要做好把關人的角色。
4.1 為用戶賦權賦能,增強用戶的主體性
用戶畫像服務所需洞察的客觀規律本身包含著主體的意志、主體的經驗、主體的實踐,其只會在主體的不斷實踐中呈現出來并不斷進化。不存在沒有主體參與的、一成不變的客觀規律。
現代服務理論認為,用戶和生產者共同決定服務的質量,用戶應參與服務的生產,而不僅僅消費服務,高質量的服務依賴于用戶的主體性和創造性。
但是,在算法主導的世界里,人不再是擁有復雜內涵的豐富個體,一個個具體的、鮮活的、豐富多彩的人異化為一個個堆積的數字標簽,成為被定義、被分類、被評價的客體,人的主體性蕩然無存。
最了解用戶需求的是用戶自己,因此,用戶畫像服務更要強調用戶的主體地位,向用戶開放,為用戶參與算法決策提供渠道,通過用戶的主觀感知對服務過程進行修正。增強用戶主體性,保障用戶的參與機會與發言權,需要為用戶賦權賦能,構建圖書館與用戶利益平衡機制。為此,圖書館要著重開展以下工作:
賦予用戶知情權。個人信息處理過程要對用戶公開透明,要公示算法基本原理、服務目的、主要運行機理機制、用戶標簽管理規則等。
賦予用戶同意權。用戶對用戶畫像服務有同意及終止的權利,圖書館應落實《互聯網信息服務算法推薦管理規定》中“一鍵關閉個性化推薦”的規定,并提供不針對個人特征的選項。
賦予用戶修改權、刪除權。用戶可以修改錯誤、不完整的標簽,添加標簽,可以基于被遺忘權來刪除過時的、不想保留的標簽。這有助于以人工干預方式突破人工智能確定標簽的限制,實現畫像的動態完善及迭代,有助于以系統推送與用戶自選相結合的方式優化信息推薦,更好地完成精準化內容定制與推送服務,完善和改進用戶畫像服務,也可以有效破解信息繭房,解決零數據冷啟動問題。
賦予用戶評價反饋權。用戶的評價反饋是至關重要的一環,圖書館要圍繞畫像與用戶面貌的一致性、推薦系統性能、推薦結果的準確性、推送模式等要素建立畫像服務評價體系,依據評價情況來完善和改進用戶畫像服務,提升用戶體驗。
賦予用戶個人信息保護權。圖書館要從法律、圖書館協會、個體圖書館三個層面構建保護與利用相平衡的、嚴密有效的個人信息保護體系。
為用戶賦能。為更好地踐行用戶權利,把用戶主體地位落到實處,必須預防權利貧困。 權利貧困是多種因素合力作用的結果,個人能力不足是內因,也是主因。特殊群體因為個人能力局限更易陷入權利貧困。真正的權利平等必須通過能力的平等來實現,解決權利貧困的根本之道是提高個人能力。信息素養的差異性在客觀上造成了用戶權益保障的不平等,因此圖書館要加強用戶尤其是特殊群體的信息素養培訓,增強用戶信息意識,提升用戶信息能力,樹立信息倫理觀念,減少數字融入障礙,使用戶得以高效享用用戶畫像服務,促進平等服務和打破信息繭房。
4.2 不斷改進優化算法
人工智能技術本質是以數字算法為核心和輔以計算機技術的產品。算法和數據對人工智能成效至關重要。算法代表著用系統的方法描述解決問題的策略。同樣問題可用不同算法來解決,而一個算法的優劣將影響到算法乃至人工智能的效率。
用戶畫像服務主要涉及畫像建模算法和推薦算法兩種類型的算法。近幾年,畫像建模算法多用統計、聚類分析、貝葉斯網絡、主題模型、神經網絡等類型算法,推薦算法多用基于內容的推薦、協同過濾推薦、基于知識推薦、基于關聯規則推薦、基于圖論推薦、混合推薦等類型算法。每一類型算法都具體有多種算法,每一種具體算法都在不斷改進發展。實踐中,每種算法都有其優缺點,僅靠一套通用的架構模型很難適用于所有的推薦場景,往往會采取多個算法的組合。
隨著信息技術的發展,圖書館要積極采用新技術,結合圖書館特點來不斷改進算法、優化算法,使算法挖掘出的規律更接近于客觀現實,達到畫像準確、推薦精準的成效。圖書館要定期審核、評估、驗證算法機制、模型、數據和應用結果,不得設置有違法律法規、倫理道德的算法模型。
4.3 構建資源畫像
圖書館要整合紙本資源與數字資源,利用語義挖掘、機器深度學習等數據挖掘技術,通過著錄、標引、解析、鏈接來多維度提取館藏資源屬性特征(題名、責任者、出版者、出版時間、媒體類型、語種)、內容特征(學科分類、主題詞、關鍵詞)及利用狀況特征(借閱者特點、利用方式、利用頻次),實現數據化和知識元化解構、重組與關聯,建立資源標簽體系,從而構建多維度動態的資源畫像。圖書館傳統標引粒度較粗,與精準的用戶標簽不相匹配,需要大規模地改造原有的標引,實現適度的細粒度標引,構建立體清晰且適用性強的畫像[21]。
4.4 保障智識自由,打破信息繭房
圖書館面對主動推送與智識自由之間的張力,要堅持適度的原則,適度干預、適度推薦,避免過度服務。既要充分滿足用戶需求給予良好體驗,又要避免頻密推送煩擾用戶,引起用戶反感乃至排斥。當然何為適度并沒有一個清晰、客觀的標準,更多取決于用戶的主觀感受,因此需要雙方的調適,這期間用戶的服務評價反饋就極端重要,圖書館要根據評價反饋調整推送的強度。
盡管當前國內外對于“信息繭房”形成原因和機理研究尚處于開放性探索階段,沒有穩定理論體系[18],但是,從用戶和技術視角看,“信息繭房”的形成是用戶主動或被動、長時間地獲取同質化信息所致,一方面是用戶數字素養欠缺,存在信息回避等選擇性信息行為;另一方面,在所想即所見的算法時代,算法是“信息繭房”的誘因,起到了推波助瀾的作用。
打破“信息繭房”的關鍵是異質信息的獲取,在保證推薦結果準確性的同時要保證推薦內容的多樣性。為此,圖書館要幫助用戶提高信息素養,增強主動搜尋并獲取異質信息的意識和能力;要不斷優化和改進算法來防止需求固化和窄化, 挖掘用戶潛在信息需求,呈現不同偏好權重的信息,適當減少按照用戶興趣和相關性推薦信息,推薦一定比例的“信息冷點”[22]、逆向信息、隨機信息等偏好之外的異質信息,力求推薦信息的多樣性,限制每日推送數量;在實體或者虛擬空間構建多元渠道以幫助用戶接收多樣化信息,要為用戶創造信息偶遇的機會,發揮“有溫度的文化社交中心”[23]作用,幫助具有較大差異性的不同群體形成更有利于異質性信息傳播的“弱關系”網絡。
4.5 線上線下融合發展,實現普遍均等服務
圖書館個性化服務是一項系統工程,要充分利用線上線下兩種路徑,既要努力開展用戶畫像服務,也“應當同時提供不針對其個人特征的選項”[20],保障所有用戶的平等權益。
圖書館應拓展用戶畫像服務群體,讓包括特殊群體在內的更多用戶均等受益。 開展用戶信息素養培訓,提高其數字技能,增加館內智能終端配置數量,提供智能終端借用服務,盡可能消除經濟障礙,實現智能終端使用自由,方便特殊群體應用線上服務,從而讓更多用戶留下數字足跡,從而獲取用戶畫像服務。
圖書館要強化線下服務,實現線上線下融合發展,防止簡單以線上服務取代線下服務的傾向。在信息技術日益上升為社會資源再分配的重要力量的情況下,必須保障線下服務與線上服務資源配置與服務設計的平等地位。圖書館要呼吁政府加快構建覆蓋城鄉、便捷高效、保基本、促公平的公共文化服務體系,保障公眾基本公共文化權益,同時要采取多種形式開展各類用戶需求調研,實現更貼近特殊群體的分眾服務,以彌補其不能獲取用戶畫像服務的缺憾。
4.6 依法處理個人信息,建立合規完備的個人信息保護體系
個人信息處理包括個人信息的收集、存儲、使用、加工、傳輸、提供、公開、刪除等活動。圖書館作為個人信息處理者要承擔保障個人信息安全的責任,建立合規完備的個人信息保護體系,防止信息丟失、不當使用、篡改、未經授權訪問或披露,實現個人信息的有效保護和充分利用的平衡。
《網絡安全法》(2016年)、《公共文化服務保障法》(2016年)、《公共圖書館法》(2017年)、《民法典》(2020年)、《個人信息保護法》(2021年)都要求保護個人信息。按照“特別法優于一般法”規則,《個人信息保護法》是專門調整個人信息處理和保護的法律,具有特別性,總體上相比以上其他法律享有優先適用的地位。本文以《個人信息保護法》為依據,闡釋法律對圖書館處理和保護個人信息的要求?!秱€人信息保護法》要求以“可證明”的方式開展數據保護工作,不僅形式合規,更要實質合規。
圖書館要構建以“告知—同意”為核心的個人信息處理核心規則,應當遵循合法、正當、必要和誠信原則;應當具有明確、合理的目的,并應當與處理目的直接相關,采取對個人權益影響最小的方式收集個人信息;應當限于實現處理目的的最小范圍,不得過度收集個人信息;應當遵循公開、透明原則,公開個人信息處理規則,明示處理的目的、方式和范圍;注重未成年人個人信息保護;賦予用戶充分權利,用戶擁有自主決定權,即同意權和撤回權,同時用戶有權查閱、復制、可攜帶、更正、補充、刪除個人信息,有權要求圖書館對其個人信息處理規則進行解釋說明,有權要求圖書館建立申請受理和處理機制。
圖書館要建立并明示個人信息保護政策。個人信息保護政策內容要重點圍繞“告知—同意”原則—— 這一個人信息保護制度的基石來展開?!缎畔踩夹g個人信息安全規范》規定個人信息保護政策內容應包括但不限于:圖書館的基本情況;收集、使用個人信息的業務功能,收集的個人信息類型;個人信息收集方式、存儲期限、涉及數據出境情況等個人信息處理規則;對外共享、轉讓、公開披露個人信息的有關情況;個人信息主體的權利和實現機制;提供個人信息后可能存在的安全風險,及不提供個人信息可能產生的影響;個人信息安全基本原則、數據安全能力及個人信息安全保護措施;處理個人信息主體詢問、投訴的渠道和機制,以及外部糾紛解決機構及聯絡方式。除此以外,參照國際上多個國家圖書館個人信息保護政策還可以包括未成年人個人信息保護、個人信息保護政策更新等事項[24]。個人信息保護政策要以顯著方式告知供用戶查閱,并定期審查、及時改進,語言要簡單明了,清晰易懂,便于用戶理解。
圖書館要完善內部管理制度,建立覆蓋個人信息處理全過程的操作規程,制定第三方合規處理個人信息的監管制度,以有效監督管理內部人員及第三方。依據個人信息內容及敏感程度制定個人信息分級分類標準及管理制度,對敏感信息、未成年人信息采取保護特別措施;合理確定個人信息處理的操作權限,采取符合最小授權的訪問控制策略,對批量修改、拷貝、下載個人信息等重要操作設置內部審批流程;對處理敏感個人信息、對外提供或公開個人信息等高風險處理活動進行事前影響評估;定期對圖書館處理個人信息遵守法律、行政法規的情況進行合規審計;定期對館員進行個人信息安全教育和培訓,必要時設置專職數據館員,館員對個人信息應當予以保密,不得泄露或者向他人非法提供;制定并組織實施個人信息安全事件應急預案,履行個人信息泄露通知和補救義務。
圖書館要加強技術保護。圖書館要積極采用新的信息技術,將管理和技術手段結合,加強大數據環境下的網絡安全防護技術建設。在個人信息使用時,采用加密法(如SSL)、假名法、掩蓋法、哈希函數和模糊法等多種數據脫敏技術增強個人信息安全性。這些方法各具特點,安全性、實用性、準確性和高效性在個人信息保護應用中存在不同的局限性,“大數據環境下信息脫敏技術有效性在減弱”[25],需要針對具體情況綜合運用以達到去標識化、匿名化的要求。通過防火墻、非法入侵監測報警系統、網絡隔離等技術手段保障數據存儲安全,利用區塊鏈技術打造用戶畫像數據管理防火墻。圖書館要加強用戶數字行為安全保障。填報用戶個人信息時圖書館應給予獨立和封閉的空間、輸入界面,自動或者提示用戶清除網絡檢索或瀏覽痕跡,增設插件功能提醒用戶注意個人隱私保護,建議讀者使用復雜密碼、定期修改密碼,不輕易披露個人信息。
5 結 語
目前, 用戶畫像服務對圖書館而言還是新生事物,其應用研究更多處于理論探討狀況,應用實踐尚處在萌芽狀態,偶見小規模、試驗性質的案例,并未面向所有用戶大規模可復制、可推廣地開展,因此用戶畫像服務在實踐中可能存在的問題尚未浮現。文化和旅游部日前發布的《“十四五”公共文化服務體系建設規劃》明確提出“構建公共文化服務用戶畫像和知識圖譜,為差異化服務提供數據支持”[23],因此用戶畫像服務大規模進入圖書館是未來可期的大概率事件。大規模應用的情況下,如同其他行業一般,圖書館用戶畫像服務失靈的風險自始至終也將存在。對此,圖書館要保持足夠警醒,高度重視這一風險,在風險暴露之前采取行之有效的舉措予以規避、控制、化解,防止給圖書館事業帶來無可挽回的損失。
參考文獻:
[1] 柯平.業務新常態[J].圖書館建設,2020(5):4-5.
[2] COOPER A.About face 3.0:the essentials of interaction design[M].New York:John Wiley Sons,2007:10.
[3] 國家標準化管理委員會.信息安全技術 個人信息安全規范[EB/OL].[2022-09-01].http://c.gb688.cn/bzgk/gb/sho wGb type=onlinehcno=4568F276E0F8346EB0FBA0 97AA0CE05E.
[4] 單軫,邵波.國內圖書館領域用戶畫像研究的冷思考:困境與出路[J].圖書館學研究,2019(5):8-13.
[5] 廖運,盧明芳,楊思洛.大數據視域下智慧圖書館用戶畫像研究[J].國家圖書館學刊,2020(3):73-81.
[6] BISHOP J,LEWIS P R.Blaise-line and the British National Bibliography:profiles of users and uses[J]. Journal of librarianship information science,1985(2): 119-136.
[7] 鄭寶鑫.基于用戶畫像、信息挖掘技術的手機游戲產品推廣[C]//廣東省通信學會.廣東通信2010青年論壇優秀論文集.[出版地不詳]:[出版者不詳],2010:127-130.
[8] 吳國芳.紹興圖書館圖書檢索垂直引擎研究及應用[J].紹興文理學院學報(自然科學),2014(7):18-21.
[9] 李業根.基于大數據的圖書館信息營銷策略[J]. 圖書館學刊,2014(10):7-9.
[10] 王麗,譚凱波,黃云.用戶畫像在圖書館個性化服務應用中的問題及對策[J].數字圖書館論壇,2021(10):66-72.
[11] 孫山.70.5%受訪者體驗過互聯網用戶畫像 感覺符合實際的不足一半[EB/OL].[2023-02-06].http://news.youth. cn/gn/202101/t20210113_12661879.htm.
[12] 劉煒,周德明.從被顛覆到顛覆者:未來十年圖書館技術應用趨勢前瞻[J].圖書館雜志,2015(1):4-12.
[13] 劉海鷗,李凱,姜波.移動圖書館推薦系統中的用戶畫像與資源畫像情境化融合研究[J].圖書館,2021(6):66-71.
[14] 焦艷鵬,劉藏.知識獲取、人工智能與圖書館精神[J].中國圖書館學報,2021(4):20-32.
[15] 范并思.閱讀推廣與圖書館學:基礎理論問題分析[J].中國圖書館學報,2014(5):4-10.
[16] IFLA.The glasgow declaration on libraries,information services and intellectual freedom[EB/OL].[2023-02-15].http://www.ifla.org/faife/policy/iflastat/gldeclar-e. html.
[17] 蔣永福.圖書館學通論[M].哈爾濱:黑龍江大學出版社, 2009:158.
[18] 朱紅濤,李姝熹.信息繭房研究綜述[J].圖書情報工作, 2021(18):141-149.
[19] 中華人民共和國公共圖書館法[EB/OL].[2022-09-01]. http://www.npc.gov.cn/npc/c12435/201811/3885276ce afc4ed788695e8c45c55dcc.shtml.
[20] 中華人民共和國個人信息保護法[EB/OL].[2022-09-01]. http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672 c74491a80b53a172bb753fe.shtml.
[21] 陳丹,羅燁,吳智勤.基于大數據挖掘和用戶畫像的高校圖書館個性化服務研究[J].圖書館研究與工作,2019(4): 50-53.
[22] 楊天才.運用零數據破除信息繭房的研究[J].圖書與情報,2020(4):15-20.
[23] 文化和旅游部. \"十四五\" 公共文化服務體系建設規劃[EB/OL].[2022-09-01].http://www.gov.cn/zhengce/ zhengceku/2021-06/23/content_5620456.htm.
[24] 徐磊.讀者個人信息保護的世界圖景與中國方案——以國外國家圖書館網站讀者個人信息保護政策為視角[J].圖書館工作與研究,2021(12):22-30.
[25] 郭軍.大數據環境下圖書館用戶個人信息保護研究[J].圖書館工作與研究,2020(1):11-19.
[作者簡介]
于風程 1973年生,中共山東省委黨校(山東行政學院)圖書和文化館教授,研究方向為圖書館管理與信息服務。E-mail:yufengcheng@shandong.cn。
[收稿日期:2023-02-21]