摘要:數智時代數據的開放利用是驅動社會及圖書館發展的核心資產,圖書館積累了各類有價值的用戶數據,圖書館用戶數據治理面臨數據質量、數據倫理、數據法律等各種風險挑戰。文章搭建了價值、制度、技術三維分析框架,提出了優化用戶數據治理的多元化路徑,以期實現圖書館用戶數據的最大化價值。
關鍵詞:用戶數據治理;圖書館;三維框架;優化路徑
中圖分類號:G251文獻標志碼:A
0引言
隨著大數據、物聯網、元宇宙、生成性人工智能等技術的迅速發展,當今社會已經進入數據和智能技術互融互通的數智時代。“數據”作為第五大生產要素,是促進新一輪科技革命與產業變革的關鍵力量[1],成為驅動社會和圖書館發展的核心資產。圖書館作為文化服務機構,積累了大量的各類數據,數據呈現幾何式增長,用戶數據作為其中最重要的一類數據,存在著共享開放不夠、隱私保護不力等數據弊病,亟須開展全方位多層次的用戶數據治理,實現其服務價值和創新價值。
1數據治理的內涵要義及關鍵要素
1.1數據治理的內涵要義
目前,學術界對數據治理的定義并未達成一致,綜合相關研究,可以從以下方面加以理解:(1)微觀機理層面,學者們認為數據治理類似于數據管理,是對個體數據整個生命周期的管理,就是對數據的采集、加工、挖掘、保存、維護、傳輸的管理[2]。(2)中觀機理層面,學者們從不同領域、不同學科對數據治理進行定義。從經濟學的角度,大多認為數據治理是對數據這一核心資產的計劃、執行和監督,利用組織人員、流程和技術的相互協作,促進數據要素的流通,實現對數據資產的有效組織和配置[3]。從社會學的角度,學者們認為,數據治理的價值在于服務社會治理,正確處理數據技術賦能與社會治理之間的矛盾,形成多方參與的數據共享流通模式,最終推動社會治理的變革[4]。(3)宏觀機理層面,數據治理的視角要聚焦到“數據世界”上,數據治理是以國家、國際組織等為主體,對數據權利、流通、管理等方面的治理,以推動國家治理能力提升和治理體系現代化。綜合各方觀點,本文認為,數據治理就是對各類數據的分類、管理、控制、監督,其關鍵在于保證數據質量和數據安全,其目標是實現數據利用的最大化價值,更好地服務于各行各業。
1.2數據治理的關鍵要素
數據治理的關鍵要素主要包括:(1)從數據治理的基礎環節來看,關鍵要素包括數據質量、數據安全、數據隱私。這些涉及數據的完整性、準確性、保密性、可用性等方面。(2)從數據治理的過程環節來看,關鍵因素包括數據標準化、數據可視化、數據管理工具等,這些可確保數據的一致性、數據分析的精準性等。(3)從數據治理的實現環節來看,關鍵要素包括戰略規劃、組織架構與機制、數據管理、業務價值等。這些可實現數據治理的最大化利用和持續推進。
2圖書館用戶數據的類型及價值風險分析
圖書館用戶數據治理指對圖書館用戶產生的各類數據及數據處理各個環節的管理、控制和監督,實現用戶數據最大化價值,促進智慧圖書館的建設發展。
2.1圖書館用戶數據的類型
(1)用戶角色數據。其包括用戶基本角色數據及用戶特定角色數據。用戶基本角色數據是指用戶的姓名、性別、職業、年齡、學科背景、文化教育程度等,這些信息能夠幫助圖書館了解用戶的基本特征和屬性。用戶特定角色數據是指用戶在圖書館的特定角色,比如在圖書館接受服務的類型、資源訪問類型,在圖書館的特定用戶畫像等,這些數據可以精準了解用戶需求,更好地進行個性化服務。
(2)用戶借閱數據。圖書館用戶借閱數據記錄了用戶的借閱歷史、借閱偏好、借閱頻率等,這些信息能夠反映用戶對不同類型書籍的需求和興趣,分析和了解用戶的借閱數據可以優化館藏資源,精準開展閱讀推廣活動,提升圖書館的智慧化服務水平。
(3)用戶互動數據。用戶互動數據具體包括用戶對圖書館采購的建議意見等薦購數據、用戶對圖書館服務和設施的評價及建議的反饋、讀者調查問卷等數據,用戶在網站、微博、微信公眾號等平臺和社交媒體的留言、評論、分享等數據。這類數據收集處理難度比較大,但可利用價值也更大。
(4)用戶正負貢獻度數據。這類數據包括用戶借還書的誠信數據,參加圖書館公益服務和進行志愿服務的貢獻數據等。根據這些數據,圖書館可以健全完善懲戒和激勵機制,更好地策劃圖書館各類公益活動,組建圖書館志愿服務隊伍。
2.2圖書館用戶數據的價值風險
圖書館用戶數據存在巨大的社會價值,圖書館可以通過分析用戶數據為用戶提供更加個性化的服務,提升圖書館服務的質量,提高用戶的閱讀體驗和滿意度,從而制定更加科學合理的資源配置策略。但產生價值的同時,也面臨一些風險。
(1)圖書館用戶數據質量風險。圖書館用戶數據質量低表現為用戶數據來源不同,數據格式也存在差異,數據結構和數據元素轉換處理比較困難,數據采集和管理過程中可能會出現數據丟失、數據損壞、數據泄露等問題,這會影響圖書館對用戶需求的準確判斷,進而影響服務質量。
(2)圖書館用戶數據倫理風險。一是用戶數據隱私風險。在數據治理過程中,圖書館需要收集、處理、存儲大量的用戶數據,而這些數據往往包含用戶的姓名、聯系方式、借閱記錄、閱讀偏好等個人信息。如果這些數據在未經授權的情況下被泄露,可能會對用戶隱私造成嚴重損害。二是用戶數據侵權風險。圖書館也有可能將用戶數據用于非授權目的,如廣告推送、商業營銷等,造成數據侵權,這可能會導致用戶對圖書館產生不信任,降低用戶滿意度。三是用戶數據安全風險。一方面,云計算、人工智能等大數據技術自身存在邏輯缺陷,用戶數據的存儲和傳輸過程中可能存在數據泄露的風險。另一方面,圖書館用戶數據也可能被黑客攻擊,因惡意軟件或自然災害等因素受到損壞,數據濫用會使圖書館面臨巨大的經濟損失。
(3)圖書館用戶數據法律風險。圖書館工作人員可能缺乏足夠的數據安全及法律意識,違背相關的數據保護法規,如我國的《網絡安全法》和《個人信息保護法》等,導致用戶數據治理不合規,面臨一定的法律風險。
3三維框架下圖書館用戶數據治理的優化路徑
本文從價值-制度-技術三維分析層面提出優化圖書館用戶數據治理績效的具體路徑,主要包括以下3個方面。
3.1價值管理層面
(1)構建用戶數據戰略管理策略。這個戰略應該考慮圖書館的價值觀和使命愿景,明確用戶數據治理的目標、范圍、職責流程及數據分類、數據質量、數據安全、數據使用等方面的規定,確保用戶數據使用處理共享的規范化,保證用戶數據的質量、安全性和可靠性。
(2)健全有效的用戶數據管理機制。這個機制包括數據管理標準規范機制、用戶參與機制及用戶反饋機制, 建立統一的數據管理標準,鼓勵用戶參與數據采集、數據反饋、數據評估等數據治理的各個方面,及時了解用戶需求和反饋,保證用戶反饋的內外暢通,不斷優化數據服務。
第8期2024年4月江蘇科技信息 ·圖書與檔案No.8April,2024
第8期2024年4月江蘇科技信息 ·圖書與檔案No.8April,2024
(3)優化用戶數據全流程管理鏈條。一是建立用戶數據元數據和數據質量標準。綜合考慮用戶數據的類型、格式、來源、時間等不同因素,以確保數據的可讀性和易用性。二是實施用戶數據安全與隱私保護。這些措施包括數據加密、訪問控制、數據備份、用戶數據使用協議等方面,以確保用戶數據的完整性和安全性。三是實施用戶數據質量監控和評估。檢查與評估應包括數據的準確性、完整性、可靠性等方面,并應定期對數據治理工作進行檢查、評估和改進,以確保數據治理能夠持續滿足圖書館的發展需求和用戶需求。
(4)創新用戶數據管理方法。一是“用戶畫像”的方法。該方法包括收集用戶的基本信息、學術背景、興趣愛好等信息,并將其進行分析,以創建用戶畫像,更好地滿足用戶的需求。二是“用戶行為分析”方法。該方法包括收集用戶在圖書館的活動軌跡、借閱記錄、閱讀習慣、搜索歷史、訪問記錄等信息,并對其進行分析,以了解用戶的學術興趣、閱讀偏好和行為習慣等。三是“用戶反饋”的方法。該方法包括通過用戶調查和反饋機制來收集用戶對圖書館服務的意見和建議,這些反饋信息將被用于改進圖書館的服務和設施,更好地滿足用戶的需求。
3.2組織制度層面
(1)搭建用戶數據治理組織架構。一是建立用戶數據管理委員會。數據管理委員會應該由圖書館領導、數據專家、用戶代表和其他利益相關者組成,其主要職責包括制定數據治理策略和標準規范,監督數據管理員的工作、審核和批準數據使用及共享等。二是成立專業的數據治理團隊。團隊成員應該包括數據管理員、技術專家、數據分析師等不同角色的人員, 以確保數據治理工作的全面性和綜合性。治理團隊負責協調各部門之間的用戶數據共享和互通, 參與制定數據政策、標準規范,監督指導數據評估,以確保數據治理工作的協同性和高效性。
(2)建立用戶數據倫理保障制度。一是建立用戶數據倫理預警研判機制。搭建用戶數據預警研判模型,設立特定的預警閾值,利用各種挖掘算法及預測方法進行預警數據挖掘,從海量數據中提取關鍵性要素,產生有價值的預測數據,開展有效的風險評估,提前發現潛在侵犯個人隱私的倫理風險。二是完善用戶數據治理倫理風險監控機制。運用大數據技術手段實時監控數據,對實時數據進行快速判斷、綜合集成和精確分析,嚴密防范圖書館用戶數據在數據治理過程中被非法應用和泄露濫用。三是規范用戶數據倫理風險獎懲機制。依據相關法規制定圖書館用戶數據倫理風險防控相關規程,確保圖書館數據治理倫理機制有法可依、有章可循,并根據圖書館用戶反映的倫理問題,采取針對性措施,對圖書館數據治理主體責任方進行獎懲處罰。
(3)健全用戶數據治理制度體系。一是熟悉用戶數據治理相關政策法規。圖書館用戶數據治理的政策法規主要包括數據保護法、網絡安全法、個人信息保護法等。二是建立用戶數據管理制度。這些制度包括用戶數據分類統計制度、用戶數據個人隱私保護制度、用戶數據安全管理制度、用戶數據治理培訓制度等。三是建立數據治理效果評估制度。效果評估是數據治理的關鍵一環,評估制度包括評估主體、評估程序、評估方法、評估周期、評估保障等內容。
3.3技術工具層面
(1)引入用戶數據治理關鍵技術。圖書館用戶數據治理的關鍵技術涵蓋數據采集、存儲等生命周期的全流程。數據采集技術可以采用傳感器、攝像頭等設備, 收集用戶行為數據和環境數據。數據存儲技術可以采用分布式存儲、云計算等技術, 確保數據的可靠性。數據分析技術可以采用自然語言處理、機器學習、深度學習等技術,實現數據的智能化分析。數據安全技術可以采用防火墻、加密等技術,確保數據的安全和保密。
(2)采用用戶數據挖掘及治理管理工具。一是用戶數據挖掘和分析工具。圖書館可以采用數據挖掘和分析軟件、數據可視化工具等來分析和挖掘用戶數據,以便更好地了解用戶需求和行為。二是用戶數據質量管理工具。圖書館可以引入數據清洗、去重、校驗和整合等數據質量工具,自動檢測和糾正數據中的錯誤和問題,以確保數據的質量和可靠性,提升數據質量。三是用戶數據安全監控和審計工具。圖書館可以采用數據安全掃描、數據安全漏洞檢測和數據安全審計等工具,及時發現和解決數據安全問題,以確保數據的安全性和完整性。
(3)完善用戶數據治理應用平臺建設。這一平臺包括可信身份認證、電子簽章、電子歸檔、地理信息服務、移動應用開發等公共基礎數據組件及人工智能、用戶數據管理系統、用戶數據倉庫、用戶數據可視化、5G、區塊鏈等公共技術組件,在建設過程中尤其注重體系的標準化與開放性,強化其在業務技術組織賦能、應用場景等方面的作用,保證平臺體系穩定運行和在不同層級地區的互聯互通。
4結語
數智時代新技術的迅猛發展和數據的4V特性,在給圖書館發展帶來機遇的同時也提出了巨大的挑戰。圖書館數據特別是用戶數據的開發利用,是建設現代智慧圖書館的關鍵因素,要更加系統地總結用戶數據治理實踐經驗和規律,深入研究用戶數據治理的關鍵技術方法,使用戶數據治理與圖書館戰略、服務和管理緊密結合,促進圖書館用戶數據治理的可持續發展,發揮其最大利用價值,更好地促進未來圖書館高質量發展。
參考文獻
[1]佚名.2021年度中國圖情檔學界十大學術熱點[J].情報資料工作,2022(1):5-12.
[2]張寧,袁勤儉.數據治理研究述評[J].情報雜志,2017(5):129-134.
[3]董濤.知識產權數據治理研究[J].管理世界,2022(4):109-125.
[4]張康之.數據治理:認識與建構的向度[J].電子政務,2018(1):2-13.
(編輯編輯李春燕)
英文標題
Study on the optimized paths of user data governance in library within the value-institution-technology framework
Deng ?Rongjing
(Zhejiang Provincial Party School of CPC, Hangzhou 311121, China)
Abstract: ?Utilization of open data in the digital age is the core asset that drives the development of society and library. Libraries have accumulated various valuable user data, whose governance faces various risks and challenges, such as data quality, data ethics, and data laws. In this article, a three-dimensional analysis framework of value, institution, and technology is constructed, demonstrating diversified paths to optimize the governance of user data in libraries with an aim to maximize the value of library user data.
Key words: user data governance; library; three-dimensional framework; optimization path
作者簡介:鄧蓉敬(1979—),女,副研究館員,研究員,碩士;研究方向:情報服務與數據治理。