


[摘 要]數智技術推動圖書館數智化轉型。拓展圖書館數據治理內容,提升圖書館數據價值,研究數智時代圖書館數據治理具有重要的現實意義。采用文獻調研、問卷調查和訪談等方法,在分析圖書館數據類型與特征的基礎上,結合數智時代圖書館數據治理現狀,構建數智時代圖書館數據治理的解決方案。圖書館數據治理是一個系統、動態過程,需要制定圖書館數據治理中長期計劃,注重數據治理績效;重視制度建設,形成結構化規制體系;嚴格選取治理工具,聚焦數據實施能力;堅持問題導向,注意治理工作的全局把控;注重倫理道德建設,推動數智時代圖書館數據治理高質量發展。
[關鍵詞]數智時代 圖書館 數據治理
[分類號]G250.7
圖書館數據治理是圖書館數字化建設的重要組成部分,涉及圖書館業務管理、資源建設、讀者服務等方面。隨著數智時代的到來,圖書館的數字化轉型進程不斷加快,數據治理逐漸成為圖書館管理的重要環節。從實踐來看,南京大學圖書館開展了數據治理項目,北京大學圖書館建立了數據治理體系,中國礦業大學圖書館構建了高校圖書館數據中臺的功能架構[1]。但是,縣級及以下圖書館由于資源有限,技術力量薄弱,讀者流量相對較小,產生的數據量也較小。圖書館缺乏對數據治理重要性的認識,同時也缺乏數據治理所需的專業技能和知識,在開展數據治理工作時,面臨諸多挑戰。從理論來看,目前學界在圖書館數據治理方面已經進行了較為充分的研究,取得了富有價值的研究成果,涉及圖書館數據治理意義與價值、內涵、倫理及智慧圖書館數據治理框架、風險等[2-5]。隨著數智技術的快速發展與廣泛應用,數據資源成為推動社會經濟發展的關鍵生產要素。在大數據與人工智能深度融合的數智時代,大數據、機器學習、人工智能等數智技術賦能圖書館數智化轉型,成為圖書館創新發展的重要基石。如何開展數智時代圖書館數據治理工作并借助數據治理手段促進數據價值釋放,是業界與學界共同關注的重要議題,需要進一步作出理論回答和實踐回應。
1 圖書館數據治理概述
治理即依理而治,是決策與行動的組合系統,是治理主體依據法理、情理以及倫理規約等對治理客體所進行的管理、評估、監督、指導、約束、調整等的綜合體[6]。數據治理是對數據資產管理行使權力和控制的活動集合。其目的在于提高數據質量,促進數據共享,其內容包含數據搜集、分析、處理、利用等[7]。圖書館數據治理是指圖書館對數據的采集、存儲、傳輸、處理、分析、共享、安全保護等環節進行統一管理與監督,以保障數據的完整性、可用性、保密性和合法性。據此,將圖書館數據資源轉化為數據資產,從而實現數據價值的最大化。毋庸置疑,從傳統意義上講,用以記錄或描繪圖書館一切工作或活動的符號、數字、文字、圖形、圖像等統稱為圖書館“數據”。這些數據分屬于圖書館不同的管理系統,載體各異、標準不一,為圖書館某一項業務工作服務,數據之間缺乏聯系,數據潛能難以充分發揮。隨著大數據和人工智能等技術的飛速發展,很多圖書館實現了從傳統圖書館到數字圖書館再到智慧圖書館的躍遷。圖書館數據沖破了原有概念的界限,不再僅僅是圖書館的數據,還可以是圖書館通過接入訪問、征集和租用或是購買的外部產生的用于圖書館服務工作的數據。由此,數智時代圖書館數據治理的對象數據不再僅限于傳統意義上的以各類載體形態記錄的資源數據、用戶數據、業務管理數據等,還包括各類實時采集的傳感數據、體驗數據、系統數據和一些未經采集和未進行數字化的數據(例如古籍、非物質文化遺產)等。參考國外權威機構OCLC的網格化分類[8]、W3C圖書館關聯數據孵化小組對圖書館數據的界定[9]、中國國家圖書館對圖書館數據的劃分和總結[10]、盧小賓等提出的智慧圖書館數據標準體系[11]、白廣思對數字圖書館大數據的分類研究[12],筆者將大數據、人工智能等新技術加持下擁有新資源、新媒體、新服務圖書館的數據分為如下幾類(見表1)。
從表1可見,圖書館數據呈現的情況是由數智時代的現實情況、用戶的實際需求和圖書館的發展目標共同決定的。數據沖破傳統意義上的借閱數據、管理數據的界限,更多地融入了機器采集感知的海量信息。數智時代圖書館數據的特點主要表現在來源廣、類型多、實時性強、增長速度快、數據間的交聯關系復雜、挖掘潛力大等。
2 數智時代圖書館數據治理現狀
2.1 圖書館數據治理面臨的現實挑戰
圖書館數據涉及資源、運維、管理、服務等多個環節,數據管理困難。隨著數智時代的到來,圖書館服務范圍的持續拓展,在圖書館領域開展數據治理、提升數據質量、激發數據價值的重要性和必要性日益凸顯。結合當今行業數據治理的要求,圖書館數據治理仍面臨許多現實挑戰。
2.1.1 數據基礎薄弱
圖書館數據類型多,經調研發現“劣質數據”在許多圖書館普遍存在。表現為數據的錯誤和誤差,以及關鍵數據不完整或陳舊。單個圖書館內部存在不同時期由不同供應商研發的系統,這些系統如同孤立存在的高樓,想要深度推進、橫向互通,難度很大。“數據孤島”幾乎是所有圖書館均面臨的困境。并且圖書館建立越早、規模越大,管理和技術方面的包袱越重。
2.1.2 數據管理維度單一,數據治理落后
隨著圖書館數字化、智能化的普及和計算機技術、網絡技術的飛速發展,圖書館對于數據治理重要性的認識逐步提高,但實際開展數據治理的工作情況卻很不樂觀。調查顯示,對于數據治理工作,大部分圖書館做的都是基礎性操作,缺乏頂層規劃和管理。許多圖書館建立的數據管理制度、相關標準、流程也不完備。即便是大學圖書館,不少數據管理工作都由信息中心托管,很多圖書館尤其是區、縣級以下的圖書館,根本沒有從事數據管理的部門。
數智時代,人機協同、數據相通、多方協調,圖書館數據治理,不僅是其自身的責任,圖書館、用戶、利益相關的各個領域或部門都應參與到圖書館數據治理工作中去。
2.1.3 數據價值量化評估困難,數據挖掘不足
圖書館擁有海量的數據,盡管數據是圖書館的核心資產已形成普遍共識,但由于對數據這一無形資產的量化評估比較困難,在數據類型多、量級大、增速快的情況下,不同層級數據產生的價值不一,數據治理投入大,短期效果難以顯現。數據價值量化評估困難,會阻礙數據價值挖掘,影響圖書館數據使用,有時甚至會影響圖書館實施數據治理的意愿。
2.1.4 缺乏相對統一的數據質量標準
圖書館數據治理是對數據整個生命周期的治理,治理工作涉及從數據的產生到最后共享利用等各個層面。數據作為原材料,其質量是數據治理最為關鍵、最為核心的要素。當下,圖書館數據治理在數據建設、質量建設層面面臨很多現實難題,例如各類數據量級大、各系統數據更新速度不一致、“數據孤島”現象等。
2.2 圖書館數據治理的常見誤區
數據治理實施周期長、工作繁雜。通過調研發現,數據治理實施方通常會給圖書館管理者一些建議,如提出“以用戶為中心的自服務化數據治理”,要進行覆蓋數據全生命周期的數據治理,在數據治理時要減少人工干預等。面對這些建議,圖書館管理者要根據本館的實際,明確數據治理的目標和訴求,避免數據治理時的誤區。數據治理常見誤區包含以下幾個方面。
2.2.1 需求不明確
圖書館數據治理工作難在找到切入點。圖書館進行數據治理一定是為了解決現實問題的。但是,具體怎么解決,治理范圍多大,實施的先后順序是什么,要達到怎樣的目標,在開始數據治理前往往沒有清晰定位。
2.2.2 各部門職責及制度規范不清
問題數據的產生來自具體業務。表面上看是技術問題造成的數據問題,其實是由管理不科學、不規范產生的。在規劃數據治理時,不考慮建立涵蓋技術、業務、管理等部門的強有力的組織架構和高效執行的制度規范流程,會導致治理效果大打折扣。
2.2.3 大而全的數據治理
廣義的數據治理涵蓋范圍大、內容多。在一個項目里完成圖書館各個系統、版塊數據從產生到應用共享的治理工作是不現實的。數據治理要從最核心的、最重要的、最容易產生問題的地方著手,才能做到收效快,成效高。
2.2.4 過度依賴數據治理工具
數據治理包含很多內容,工具只是其中一個組成部分。圖書館開展數據治理工作,應將組織架構放在首要位置。有組織的存在,就會有人負責,以人為中心的數據治理工作才能容易推動、持續做好及推廣落地。
2.2.5 數據標準難落地
制定數據標準,目的是做到數據標準化。筆者調研發現國際圖聯(IFLA)、美國圖書館協會(ALA)、國家科技圖書文獻中心(NSTL)、中國高等教育文獻保障系統(CALIS)、中國國家圖書館、全國圖書館標準化技術委員會等均就圖書館數據的數字描述出臺了相應的標準,內容涉及組織、管理和使用性數據標準[14],如元數據描述規范、館藏資源數字化加工規范等。光有標準還不夠,一定要做到各項標準的落地實施,將標準貫徹到數據治理的全過程。
3 數智時代圖書館數據治理的解決方案
數智時代體現為數智化、數智賦能、數智驅動,是大數據和人工智能結合的產物,其中,數智化的基礎是數據,核心是富有人類智慧的智能算法,呈現萬物數據、處理智慧、響應及時、持續成長的特點[15]。數智化對圖書館治理提出了更高要求,開放圖書館的數字化轉型和高質量發展,迫切要求探索新的治理模式和治理對策。
數智時代,有不少圖書館還在進行大規模的信息化建設,有的圖書館各種信息系統的建設和優化升級工作也在如火如荼地開展。但是很多圖書館老舊系統中的存量數據質量問題突出,新舊系統數據交織,數據價值難以釋放,嚴重影響了圖書館服務水平的提升。對于圖書館數據治理,由于圖書館的基礎、發展定位、開展業務范圍的不同,實施數據治理的路徑和方法也應不同。筆者參考多方調研的結果,給出圖書館數據治理的解決方案,如圖1所示。
數智時代圖書館數據治理的解決方案從戰略規劃到組織架構,從專題到工具選擇,牽涉的環節非常多。圖書館數據治理可選擇的路徑有兩個:一是自上而下逐步細化的方式;二是自下而上逐個擊破的方式。兩種方式各有優缺點,如表2所示。圖書館開展治理工作,要立足自身的實際情況決定采用方式。
4 數智時代圖書館數據治理實施策略
4.1 制定圖書館數據治理中長期計劃,注重數據治理績效
數據治理是現實圖書館IT規劃目標架構的重要舉措,從圖書館的長遠發展考慮,開展數據治理工作要在繼承圖書館IT規劃和以往的信息化建設成果的基礎上進行。因此,圖書館數據治理要與圖書館IT規劃和當前開展的信息化建設項目同向同行,無縫結合。并且確保實施方對圖書館IT規劃和館內現行的信息化建設現狀有深入的了解。調研顯示,眾多行業領域的治理實踐無不證明數據治理是一個長期建設、逐步顯效的過程和戰略性舉措,希望一次性把數據治理工作做好是不切實際的,必須制定長期建設實施路線。就圖書館而言,數據質量相關問題突出,不容拖延猶豫,因此,在圖書館數據治理實施層面,小步伐快速跑、以點帶面的短線操作更符合圖書館實際。從策略上看,數據治理既要兼顧長遠目標又要兼顧短期效果,建議圖書館選擇與有長期服務和數據治理能力的機構保持長期合作,以便獲得產品、技術、咨詢、實施等全方位、多角度的長期支持和幫助。注重用戶數智素養技能與提升,助力圖書館數據治理創新發展等。
4.2 重視制度建設,形成結構化規制體系
近年來,以元宇宙、ChatGPT為代表的強人工智能技術將圖書館引入數智時代,這些技術內嵌的破壞性效應,給圖書館帶來了技術、空間、倫理、規范維度等多層面、多場域的風險掣肘和規制挑戰。針對以上風險場景,需要在不同維度適配不同的風險規制思路,形成結構化規制體系,即:技術維度加強數據要素的場景化規制,空間維度加強數字鴻溝的穿透式規制,倫理維度加強向上向善的介入式規制,規范維度加強科學及時的標準化規制。建立法律規制、技術規制、倫理規制、標準規制相結合的結構化規制體系,實現數智時代圖書館數據治理風險的“全流程、全方位、全體系”規制。
4.3 嚴格選取治理工具,聚焦數據實施能力
“工欲善其事,必先利其器”。數據治理是一項長期而復雜的系統工程,如沒有好的工具數據治理工作就難以很好地實施。因此,圖書館在開展數據治理工作時一定要引入業界優秀的數據治理工具。但工具的選用并不是決定數據治理成敗的決定要素。圖書館數據治理工作的落地見效,需要各相關系統的升級改造和相關人員對數據進行大規模的采集、清洗和更新工作。因此,圖書館在開展數據治理工作時,不應過分關注治理工具,而要把重點聚焦在與合作機構未來幾年的實施能力和服務水平上。同時,對于從技術輔助到“主體化”的轉型風險,圖書館需從底層數據結構的場景化解構出發,針對數據要素的場景化進行及時、有效規制,從數據收集、處理、儲存、管理、分析與應用等階段分別映射隱存的問題及風險,形成適應不同風險治理需求的場景化制度,進而降低人工智能技術帶來的負面影響。
4.4 堅持問題導向,注意治理工作的全局把控
不少圖書館因數據質量導致開展數據治理工作需要投入大量的人力和時間。圖書館數據治理工作實施要先解決具體的數據質量問題,治理實施過程中必須嚴格堅持以數據問題為導向,每一步工作都要明確具體解決什么問題,可以達到什么樣的效果。同時,圖書館也不能一味埋頭解決數據質量問題,而忽視數據治理體系的長期建設路徑。數智時代,數據安全和網絡安全風險、技術不完備風險、技術依賴和第三方依賴風險等均需要圖書館做出應對。一方面,圖書館數據治理必須站在IT戰略和總體架構管控的角度把握數據治理的各項決策,確保不偏離圖書館的戰略方向。另一方面,圖書館必須在堅持“以人為本”的前提下,創新監管工具,注重以人工智能為代表的各類算法的監管[16],尤其是監管者積極推動算法活動,維護管理者、館員、用戶等相關利益者的主體地位和權利,為圖書館數據治理高質量發展保駕護航。
4.5 注重數據倫理道德建設
數智時代,倫理風險防控是數據治理的關鍵目標,更是圖書館提升數據價值與創新數據服務的前提。圖書館數據風險治理過程中,管理者、館員和用戶在數智技術應用前即應對風險進行認知,初步把握人工智能應用價值及風險,形成風險意識,精細治理能平衡人工智能應用的價值效能與風險治理[17]。為了提升圖書館數據治理效果,應當重視倫理制度和規范,提倡向上向善、尊重個體、公平競爭、合作共享,弘揚契約精神和人文精神。利用數據時要妥善保護和處理保密和隱私問題,制定基于倫理道德的政策、工作流程和標準,并嚴格督促執行。
5 結語
數智時代,圖書館如果不進行數據治理,數據質量難以支撐基于大數據和人工智能等的分析應用,數據就成為負資產。筆者從圖書館數據治理解決方案入手,結合大數據和人工智能環境下圖書館數據治理的實施路徑,構建了圖書館數據治理的路徑選擇。誠然,人是圖書館數據治理工程中最活躍也是最重要的因素。在關注技術、工具的同時,一定要注重提升館員的“數字素養”。加速圖書館數字人才培養是促進圖書館數據治理能力提升的必修功夫[18]。今后,圖書館應以用戶需求為中心,依托前沿技術,利用先進治理工具,發揮人的主觀能動性,通過圖書館數據治理,促進服務創新和價值創造,提升圖書館服務效能。由于當前實際進行數據治理的圖書館數量較少,筆者未能較為全面地對比不同圖書館之間數據治理能力差異,未來可在研究基礎上增加案例樣本數量,對模型加以驗證和完善。
參考文獻:
[1] 鮑劼,等.高校圖書館數據中臺建構研究——以中國礦業大學圖書館為例[J].圖書館學刊,2023(8):34-38.
[2] 馬坤.大數據背景下圖書館數據價值提升策略研究[J].新世紀圖書館,2023(8):14-19.
[3] 趙發珍.數據賦能圖書館治理創新:內涵、模式及發展路徑[J].國家圖書館學刊,2023(2):40-48.
[4] 蘇杰初.數智時代圖書館數據治理倫理機制及其優化路徑研究[J].圖書館,2023(10):62-68,90.
[5] 盧鳳玲.融合數據治理體系的智慧圖書館框架研究[J].圖書館,2021(5):74-78.
[6] 楊新涯,文佩丹,卓應忠.智慧圖書館的全數據體系研究[J].圖書情報工作,2023(13):29-35.
[7] 劉陽陽.智慧圖書館體系下數據治理的法律模式選擇[J].情報理論與實踐,2023(3):90-97.
[8] 孫紅蕾.圖書館公共數據治理的主要問題、概念框架與實踐路徑[J].圖書館學研究,2022(3):11-17.
[9] W3C.LibraryLinked Data Incubator Group:Datasets value vocabularies and metadata element Sets[EB/OL].[2022-10-22][2023-10-30].http://www.w3c.org/2005/Ineubator/lld/xgr-lld-20111025/.
[10] 魏大威.大數據時代的國家數字圖書館建設[EB/OL].[2022-10-22][2023-10-30].http://www.nle.gov.en/dsb
-zt/xzzt/2014xdjsyth/xdjszlxz/download/igdata.Pdf.
[11] 盧小賓,洪先鋒,蔣玲.智慧圖書館數據標準體系研究[J].圖書情報知識,2021(4):50-61.
[12] 白廣思.數字圖書館大數據分類研究[J].圖書館學研究,2016(3):53-57.
[13] 鐘戈,高大勇.圖書館智慧知識服務數據治理模式研究[J].圖書館學刊,2022(10):50-55.
[14] 陸康,等.我國圖書館數據治理框架:價值、維度與路徑[J].圖書館理論與實踐,2022(4):121-125.
[15] 楊穎,郭晶.“數智化”賦能革命老區特種旅游應用途徑及發展策略[J].社會科學家,2022(12):58-64.
[16] 夏蘇迪,等.數智時代的算法素養:內涵、范疇及未來展望[J].圖書情報知識,2023(1):23-34.
[17] 高穎,曾文革.數智時代的高等教育:風險生成及結構化規制[J].高等工程教育研究,2023(6):92-98.
[18] 劉婷,李書寧.國外數據館員崗位2013—2018年設置情況調查與分析[J].圖書館學研究,2019(20):27-33.
賈秀華 女,1979年生。碩士,館員。研究方向:信息資源建設。
(收稿日期:2023-10-30;責編:徐向東。)