陸 康 劉 慧 杜京容 任貝貝
(1.南京曉莊學院 南京 211171; 2.上海市網絡技術綜合應用研究所 上海 200336)
習近平同志指出:“隨著信息技術和人類生產生活交匯融合, 互聯網快速普及, 全球數據呈現爆發增長、海量集聚的特點, 對經濟發展、社會治理、國家管理、人民生活都產生了重大影響。”[1]互聯網大數據技術的創新發展與應用影響了社會的治理模式、組織機構的決策形式、商業的運營模式以及個人的生活方式。國際互聯網空間競爭激烈,數據主權治理的邊界等問題越發模糊,各國都在積極開展數據主權、數據治理等戰略建設規劃,以保障本國的數據安全[2]。我國也在穩步推進數據安全國家標準的制定工作,以數據安全監管、規范行業數據安全為目的,指導國內組織與機構提升數據安全能力,促進數據應用的規范化,進而提升數據安全性[3]。我國大數據仍然處于發展的初級階段,在部分領域得到迅速推廣,社會占有率不斷提高。在面向用戶服務的應用與業務中,數據控制者希望能夠獲取更多、更全面的數據,以提供更加精確高效的個性化服務。隨著互聯網領域大數據應用的普及,數據價值也逐漸顯現出來,隨之而來的安全問題也備受關注。用戶在互聯網上的任何操作都會產生“數據痕跡”。數據挖掘、匯聚以及分析技術等使用到這些“痕跡”,匯聚的“數據痕跡”將會帶來“隱形”信息,也容易暴露隱私。圖書館智慧服務的感知對象主要是“數據痕跡”。智慧圖書館是圖書館發展的新趨勢,同時也是一種重要的發展理念[4]。圖書館領域圍繞“技術至上”原則開展圖書館智慧服務研究,缺乏制度、理論體系的保障。隨著大數據的廣泛應用,圖書館不僅需要參考國外的數據管理模式實現業務的優化,也需要結合國內的規范標準,建立適合圖書館發展的數據制度體系,以提高數據的使用效率,保障數據安全,避免“數據痕跡”濫用造成用戶隱私泄露。我國《信息安全技術 大數據安全管理指南》(以下簡稱《大數據安全管理指南》)為圖書館智慧服務的大數據應用提供了管理標準,也為制定我國圖書館大數據規范化使用的行業規則提供了依據。
圖書館伴隨著信息技術的發展而不斷進步。復合圖書館、數字圖書館促進了圖書館服務創新。以信息技術為基礎的智慧圖書館逐漸成為圖書館未來發展的趨勢之一。智慧圖書館是智能技術、智慧館員和圖書館業務與管理三方相互作用、相互融合的結果, 智慧圖書館的核心是智慧服務[5]。筆者在CNKI以“智慧圖書館”+“大數據”為主題進行檢索,獲得相關文獻410篇(如表1所示)。

表1 CNKI“智慧圖書館”+“大數據”主題年度發文量
隨著圖書館領域對智慧圖書館的認識逐漸深入,學者們對智慧圖書館產生了不同的見解與認知。王世偉將智慧圖書館三大特點概括為互聯的圖書館、高效的圖書館、便利的圖書館[6]。復合圖書館、數字圖書館與智慧圖書館有關聯,也有各自的特點,都是信息技術發展推動圖書館進步的不同形態。圖書館時刻關注新技術的發展。數字孿生連續4年被列入十大戰略技術趨勢,它與圖書館深度融合,對于探索6G時代未來圖書館運行新模式,具有一定價值與意義[7]。圖書館作為向社會公眾免費開放的公共文化設施,應在新型環境中創新發展路徑,獲得社會賦能,規避發展風險,以更高水平的創新實現高質量發展,從而保持在開放社會中的文化與信息主流地位[8]。服務創新是圖書館創新發展的基礎。互聯網環境為圖書館服務提供了創新的基礎,從而促進了圖書館服務的創新,而圖書館智慧服務源自服務創新。
隨著大數據的出現,各種系統產生的大量多維度數據可以被標注,這讓數據控制者可以運用大量數據標注組成的標簽體系描述事物與人。例如商業領域的智慧應用中,標注所建立的標簽體系既可以用來描述服務或者產品的內容屬性,也可以用來描述用戶,即所謂的“用戶畫像”。圖書館的各項業務是實施服務的基礎。圖書館智慧服務的發展離不開業務體系的參照。適應業務發展的智慧服務才是圖書館所需要的服務模式。圖書館是一個復雜的“有機體”,包括空間建筑、基礎硬件、信息系統、館藏資源、數據與館員等因素,這些因素的多樣化組合成為圖書館智慧服務開展的重要支撐條件。互聯網技術的迅猛發展也推動了圖書館的功能轉化與提升,圖書館功能轉化與提升的途徑和策略研究是其面臨的重要課題[9]。以技術創新為主的智慧化應用是智慧服務研究的主要內容。互聯網環境復雜,文獻資源從傳統的文本向圖像、流媒體等多媒體轉變,而復雜網絡對圖像、流媒體、文本等數據的統一組織、存儲、挖掘,對數據結構之間的隱含關聯的探索成為圖書館實施智慧服務的重要技術流程之一。圖像、流媒體以及文本挖掘等技術在用戶畫像、精準推薦、智能問答等圖書館智慧服務應用中具有獨特的優勢[10]。當然圖書館智慧服務也需要“非技術”因素的支持,資源分類體系的構建、管理機制的重構、合作開發機制的建立、館員隊伍建設等也是智慧服務發展的重要因素[11]。
圖書館資源、管理、開發涉及的內容與系統、數據息息相關,而館員能力與素質的提高,也與業務實施存在著一定的關聯。所以,當前圖書館智慧服務的研究離不開對大數據的探討,在大數據被公認為重要資源的背景下,數據決策、數據驅動圖書館智慧服務體系構建也將成為下一代圖書館重要的研究方向。在缺乏針對性的圖書館智慧服務體系建設指導意見的前提下,《大數據安全管理指南》等國內標準成為我國圖書館發展的重要參考依據。
大數據技術發展與應用影響廣泛,大數據的使用必然涉及數據的管理問題,一方面數據的控制者希望獲取更多、更全面的數據,以提高服務的精準性與高效性;另一方面數據的主體擔心個人數據,尤其涉及個人信息與行為的隱私數據泄露。數據管理面臨著安全風險,這是互聯網技術創新發展過程中不可避免的。所以,數據控制者需要制度標準對大數據及其應用加以規范,而《大數據安全管理指南》能指導擁有、處理大數據的組織機構做好大數據安全管理、風險評估工作,有效、安全地使用大數據,并通過技術、制度等措施來保障數據安全。
《大數據安全管理指南》標準為組織機構的大數據安全管理提供指導,其內容包括大數據安全管理基本原則、概念以及管理過程。該標準對大數據的數據收集、存儲、使用、分發(共享)、刪除等概念與管理要求作了規定,并明確了組織機構內數據控制者、處理者與數據主體等角色的安全職責。標準適用于所有的組織機構,包括企業、政府部門、非營利機構等。
大數據安全管理原則明確了組織應該承擔的義務,對數據收集、數據使用、數據共享中可能出現的問題作了明確的限定,例如數據共享的責任不轉移原則,規定了數據共享給第三方,但是原數據控制者仍然承擔保護與連帶責任。在數據獲取、數據共享、數據重用和數據加值等實踐過程中,社會各種崗位將更重視數據的獲取、保存、利用和傳播,同時產生新的崗位更加凸顯創造數據價值的功能[12]。圖書館等組織在數據收集、數據使用以及數據共享等方面扮演著重要的角色。數據收集規范、數據使用規范以及數據共享規范等長期以來支撐著研究機構與大學數據中心的科研工作。隨著大數據應用逐漸從科研工作向業務工作拓展,《大數據安全管理指南》等標準、規范可以幫助圖書館、科研人員開展能力建設,同時對圖書館的基礎設施層、數據資源層以及服務應用層產生一定的影響。
圖書館智慧服務需要數據的支持。多維度、全面性的數據能夠發掘出更高的價值,但也面臨著一些新的安全風險。關聯分析是數據價值發掘的常用方法,這種方法在發掘價值的同時,也可能暴露用戶個人隱私。數據隱私成為數字經濟時代圖書館等組織發展的重要問題。傳統的互聯網安全機制已經不適應大數據的新特性。圖書館的智慧服務除了實現資源分析以外,用戶行為分析成為感知用戶需求最直接的方法。一味追求數據價值造成數據濫用可能會給公共利益、國家安全等造成嚴重損害。所以,圖書館需要對智慧服務的數據使用行為加以約束,而《大數據安全管理指南》為實現和維護圖書館數據的保密性、完整性、可用性、可核查性、真實性與可靠性提供了指導方法。
圖書館對文獻資源整合與規范化建設的長期探索使得館員具有較強的規則意識。圖書館數據的獲取、存儲、管理、組織、分析以及應用需要穩定可靠的信息化基礎設施支持,而基礎設施的技術規范化為大數據驅動圖書館業務實施提供質量保障。圖書館產生數據的基礎設施包括視頻監控、傳感設備、機器人(自助借閱、咨詢、盤點等功能)以及RFID設備等,而數據共享與發布平臺包括互聯網、物聯網以及移動互聯網等,云計算、AI等為數據挖掘與分析提供了有效的工具,存儲設備、計算設備以及網絡設備提供了基礎的系統連接與匯聚基礎。基礎設施為大數據驅動圖書館智慧服務提供了保障,大數據安全管理角色與責任也需要從基礎設施中得以體現。例如圖書館的文獻資源服務對搜索協議有很大的需求,而圖書館系統是多樣化的,但是圖書館的用戶需要訪問多個站點,也不需要學習每個站點的搜索語法,專業化與易用化的檢索形式才能讓用戶接受。圖書館Z39.50協議的強大功能與Web提供的易用性相結合,用于從異構系統中搜索和檢索,通過URL(SRU)實現搜索,通過Open Search、上下文查詢語言(CQL)和X Query來完善多系統文獻資源檢索[13]。用戶檢索數據是用戶行為數據的一部分,其收集應該滿足意圖合規原則、質量保障原則以及數據最小化原則。業務平臺與系統的關聯與整合規范化一直以來是圖書館技術團隊所關注的方向。大數據時代的圖書館技術團隊不僅承擔著技術創新的任務,也是安全管理團隊中核心成員之一。圖書館安全管理團隊應對實施的大數據應用項目安全全面負責。各業務部門根據業務需求對所需的數據開展收集、挖掘與分析,負責具體項目的技術實現,并對收集、使用的數據安全負責。圖書館應該圍繞業務需求對數據收集、挖掘、分析與使用等各階段行為制定安全制度,并落實到具體的業務館員。

表2 《大數據安全管理指南》八大原則

圖1 圖書館數據驅動業務關聯圖
資源是圖書館的主體。數字圖書館時代以來,文獻資源服務制度化日趨加強。隨著大數據時代的到來,圖書館對數據資源制度化管理的需求也越發明顯。圖書館的數據資源由大數據與大數據處理工具(技術)組成。圖書館大數據既包括組成文獻資源的資源數據,也包括由系統產生的記錄系統運行和用戶行為的日志數據。數據推動著圖書館智慧服務不斷創新發展。例如上海圖書館“智慧服務”:“新數據,讓閱讀更‘悅讀’”“新技術,讓智慧更閃耀”“新空間,讓創新更容易”“新媒體,讓服務無處不在”“新資源,讓數字閱讀更精彩”[14]。隨著數據成為重要的資源,圖書館資源的數據化也越來越明顯。除了傳統的文獻數字資源外,系統數據、互聯網數據等也逐漸被用于“智慧服務”來感知用戶需求,從而提高服務的精準性。傳統的文獻資源相關制度已經不再適用于大數據環境,圖書館需要重新構建數據資源的制度,以適應新的服務模式與環境。圖書館服務創新由來已久,尤其是近些年來對下一代圖書館系統的探討,加快了自身結構調整,實現了管理高效、功能優化,最終完成從傳統圖書館到現代圖書館的轉變[15]。互聯網思維所體現的以用戶為中心的精神,正是圖書館服務的理念追求[16]。圖書館服務的制度化、規范化是維護“以用戶為中心”精神的基礎。圖書館制度規范化不僅需要結合業務發展對傳統制度進行完善,也需要結合服務創新、技術創新對文獻資源服務保障體系實施重構與修訂。數據資源作為數字資源在大數據環境下圖書館智慧服務體系的重要組成部分,承擔著服務創新的重要責任,其中制度規范是實現該責任的核心步驟之一。
《關于圖書館與知識自由的聲明》《圖書館員及其他信息工作者倫理準則》《互聯網宣言》《被遺忘權》《網絡中立與零評價》系列制度文本的頒布標志著IFLA(International Federation of Library Associations and Institutions, 國際圖聯)圖書館倫理規范日趨完善[17]。而通常學者們容易將數據科學家的倫理框架與傳統的圖書館員倫理框架混為一談,缺乏適應圖書館業務發展的信息倫理框架以及一個更全面和包容的數據倫理思考和概念化框架[18]。圖書館以服務用戶為宗旨,無論是數字圖書館還是未來的智慧圖書館都是圍繞服務用戶開展業務的。圖書館業務在互聯網平臺的體現主要通過應用得以體現。圖書館技術發展、服務創新的超前性與制度完善的滯后性產生了矛盾,這在一定程度上容易引發服務應用的倫理危機。雖然IFLA與圖書館學界不斷呼吁圖書館的倫理規范,但是制度的完善不及服務創新的速度。這也是圖書館服務變革不斷招致倫理學者們批評的主要原因。圖書館“以用戶為中心”的服務理念與技術創新的“以人為本”理念的一致性,使得圖書館服務應用倫理規范化的實現成為可能。圖書館需要技術創新、服務創新來滿足用戶在文獻資源服務等各方面的需求,因為用戶長期受互聯網思維的影響,對陳舊的圖書館服務模式容易產生不滿情緒。這讓圖書館不得不加快步伐引入互聯網技術、工具以及理念改造、完善圖書館的傳統服務,從而提升服務效率,這也直接導致圖書館重技術、輕制度的現象長期存在。所以,圖書館在服務創新過程中,不僅需要關注新技術、新理念帶來的效率提升,也需要完善服務應用的相關制度,避免倫理危機出現。《大數據安全管理指南》等國內標準不僅為我國的圖書館技術創新提供了發展依據,也為圖書館服務應用的倫理規范提供了參照條件。
數字圖書館發展至今形成當前的多源異構數據的協作融合以及AI等新工具在商業領域的廣泛應用,智慧服務等環境營造了大數據驅動智慧服務體系構建氛圍,而這種氛圍需要的制度保障——《大數據安全管理指南》等標準已經頒布實施,這也為我國圖書館創新發展提供了新的策略。圖書館的智慧服務體系建設不能因隱私問題而束縛發展,但也不能因為數據問題侵犯用戶的個人權益[19]。所以,圖書館智慧服務體系的建立,需要進一步完善基礎設施、數據資源、服務應用等方面的內容。
電信行業將數據分為A—D類(A:用戶身份;B:用戶服務內容;C:用戶服務衍生;D:企業運營管理)與1—4級(4:極敏感級;3:敏感級;2:較敏感級;1:低敏感級),業務系統則對數據分類、分級管理。其中涉及業務支撐的基礎設施系統(B域)、互聯網支撐系統(O域)、信息管理系統(M域)、DPI/信令數據系統以及業務管理平臺等五大領域數據。智慧圖書館基礎設施的技術標準化,關系到多平臺、多系統的整合關聯。資源存儲層、數據傳輸層和應用層三個層級是圖書館文獻資源服務的基礎。技術標準化一直是圖書館技術人員所探索的內容,包括:資源存儲的跨平臺整合,如OPAC多平臺使用標準制定;數據傳輸層的跨平臺共享,如Z39.50協議、SDLIP(Simple Digital Library Interoperability Protocol)協議等標準的制定;應用層的跨平臺分享,如Java虛擬機、C++語言的類庫實現等標準規范等[20]。在大數據驅動圖書館智慧服務的實現過程中,工具必不可少,例如運用機器學習理論,借助于MATLAB的貝葉斯工具箱FULLBNT 1.0.7訓練出用于用戶借閱行為分析的貝葉斯模型b-net,并在此基礎上開發軟件Borrow-behavior,實現行為分析的功能,達到對b-net中的概率矩陣進行知識挖掘的目的[21]。“讓數據說話”“讓數據發聲”等數據決策理念在圖書館領域已經逐漸形成共識。然而泛在的理論研究環境下,實踐的缺乏讓基礎設施的標準化難以得到有效檢驗,《大數據安全管理指南》等標準與大數據驅動圖書館的智慧服務體系有效融合,需要實踐來不斷完善技術標準化制度,進而保障圖書館智慧服務的有效實施。
圖書館是一個復雜的“有機體”。圖書館的決策信息存在著分布廣泛、流動性大的特征,極易導致信息過載。長期以來信息搜集和分析工具的技術創新不足,導致有效信息稀缺,從而無法保證圖書館科學合理地制定決策目標。另外,圖書館數據決策規劃設計過程中,科層制管理結構容易形成信息孤島,各部門數據信息分割嚴重,缺乏信息共享機制。所以,環境容易造成數據決策設計的盲目性和隨意性[22]。數據資源層的模式統一是信息共享、數據共享的基礎,也是數據驅動業務發展的前提。多系統、多平臺的數據共享匯聚成“大數據”,雖然大數據存在著一定的安全風險,但是其產生的應用價值足以讓人雀躍。圖書館作為公益性的文獻資源服務機構,履行對用戶的安全承諾、保障用戶權益是館員最基本的職業操守。所以,在大數據作為重要資源的年代,館員作為數據處理者,不僅需要從數據結構統一等技術角度來考慮共享問題,也需要從倫理道德角度思考對涉及用戶數據的適度使用,以保護用戶隱私與數據系統的安全穩定。《大數據安全管理指南》對數據收集、存儲、使用、分發、刪除等作了明確規定。其中收集,需要明確目的與用途以及數據源與收集范圍等;存儲,需要數據分類(A—D類)分級(1—4級)等;使用,依據法律法規建立正當使用原則,明確使用目的與范圍等,并強調最小化使用原則,建立圍繞大數據處理技術與模型的安全保護機制,如分布式處理安全、數據分析安全、數據加密處理、數據脫敏處理以及數據溯源原則等;分發(數據共享),需要遵循責任不隨數據轉移原則,承擔安全責任等,建立大數據公開的審核制度,審核信息發布是否遵守法律法規要求等;刪除,則需要建立刪除超出留存期限的數據,建立與分類分級機制相適應的數據銷毀機制等。圖書館文獻資源服務需要基礎設施平臺的保障,而數據資源模式的統一化是數據收集、存儲、使用、分發(共享)、刪除的保障。
圖書館資源發現服務是一種“大數據”規模的元數據庫搜索服務[23]。對用戶需求的“發現”,是圖書館提高服務效率的捷徑。文獻資源角度的資源發現服務,已經取得了一系列的實踐成果,其中影響力較大的有OCLC(Online Computer Library Center)的World Cat Local(WCL)、EBSCO的EBSCO Discovery Service(EDS)等[24],以及國內的“超星發現”“萬方學術搜索”,高校圖書館的“未名搜索”(北京大學圖書館)、“思源搜索”(上海交通大學圖書館)等[25]。服務應用層的用戶需求化獲取,從文獻資源服務的知識發現開始,逐漸在圖書館信息化工作中得以實踐。然而大數據驅動圖書館的智慧服務與服務應用的結合,其過程較為復雜。一方面,基礎設施層的系統關聯與數據匯聚過程較為復雜;另一方面數據資源層的統一模式,無論是技術標準統一,還是館員、系統設計者與監管者應在思想方面統一。“以用戶為中心”一直是圖書館所推崇的服務理念。從數字圖書館到未來的智慧圖書館以及大數據驅動圖書館的智慧服務的初衷,都是圍繞該理念開展業務的技術創新、服務創新等。《大數據安全管理指南》中除了對大數據系統、大數據的安全實施防護以外,大數據主要活動職責等內容都是直接或者間接來保護用戶的數據安全,包括隱私、倫理等角度。大數據驅動圖書館智慧服務體系中的大數據管理平臺運行的安全,直接影響到服務應用層的業務實施。運行安全管理的目的應該是確保圖書館大數據平臺持續性滿足要求,例如建立風險評估機制、建立規范化的項目審核流程,對職責、角色進行監督等,并運用技術方法保障服務應用層能夠滿足業務的實施,例如更新數據存儲方式,提高數據共享效率,更新大數據分析算法、分析方式,提高數據價值發掘效率等。
一直以來,圖書館對新技術的追捧程度逐年上升,導致“重技術、輕制度”的現象長期存在。圖書館通過大數據驅動業務的發展,進而促進圖書館的發展,采取了一系列的技術創新、服務創新。這些基于大數據的創新離不開對大數據的控制,如何對大數據進行有效管理成為關系到圖書館未來發展的重要工作。我國圖書館領域已經具備數字資源大數據的管理能力,這種能力源自數字資源商與圖書館的不斷努力。然而提供智慧服務的用戶數據管理,卻一直空白,主要表現在我國圖書館的門戶網站、新媒體平臺等互聯網服務平臺普遍缺乏隱私政策(條款)。《大數據安全管理指南》注重對數據的使用,智慧圖書館的發展離不開數據的規范使用,進而擺脫新技術與傳統服務沖突造成的倫理危機。我國圖書館大數據管理體系的構建需要《大數據安全管理指南》的指導與支持(見表3),進而形成圖書館行業內部的大數據應用的標準化、規范化良好氛圍。
圖書館需要規范化使用數據,無論是文獻資源數據還是用戶行為數據等,數據使用規范是現代圖書館管理規范體系的重要組成部分。我國圖書館大數據管理體系圍繞《大數據安全管理指南》等相關制度實現科學化的構建,反映了我國圖書館從借鑒英美等西方圖書館的制度逐漸轉向借鑒國內法規標準,這是制度自信的一種體現。我國圖書館需要根據國內的場景、環境,因地制宜地構建相應的行業標準,從而進一步推進圖書館事業的發展。

表3 我國圖書館大數據管理制度參照《大數據安全管理指南》內容對應關系
以大數據為基礎的圖書館智慧服務體系,已經成為未來圖書館發展的趨勢之一。數據作為重要的資源,在圖書館領域也備受關注。在當前我國《網絡安全法》《民法》等有關大數據應用、用戶數據使用等法律制度仍然不夠完善的背景下,圖書館如何使用數據以及對數據安全和用戶隱私的保護仍然不夠明確。我國的《大數據安全管理指南》等國內標準,雖然在適用方面不能完全匹配圖書館大數據使用的場景,但是作為國內的通用標準,圖書館仍然可以借鑒其中的條款制定行業準則,供圖書館行業來規范、約束數據的使用行為,從而為大數據驅動圖書館智慧服務體系的構建提供基礎,進一步促進圖書館智慧服務的發展。
以數據驅動圖書館智慧服務體系構建,雖然存在著一些安全風險,例如大數據濫用給用戶與國家安全帶來損害,數據共享增加管理難度,數據不準確、不完整給圖書館的利益帶來損失,大數據增加了訪問控制的難度,數據匯聚也增加了遭受互聯網攻擊的風險等。這些風險的存在都是由于圖書館缺乏規范化的大數據管理體系。我國《大數據安全管理指南》等國家通用標準,為圖書館大數據安全管理原則的制定、安全管理目標的確立、戰略與策略的規劃以及在大數據安全管理中的角色與責任的明確等提供了參考依據。圖書館在發展過程中,應該不斷借鑒互聯網相關的制度標準,與時俱進,不斷完善智慧服務體系,促進智慧服務發展。