陸興華
互聯網發展至今,數據已成為支撐人工智能、區塊鏈、云計算等技術的“養料”,在所應用的場景中變得越來越重要了。隨著社會的發展,催生了政府數據的開放制度,各國政府紛紛在線公開其掌握的公共數據資源供公眾利用[1]。政府數據開放是數字政府、數據經濟以及數字社會建設的關鍵環節,其中所包含的與人及其行為相關的信息對于社會發展和個人都有重要意義,而含有大量敏感信息的數據開放利用也成為威脅組織或個人隱私等合法權益的問題。2021年09月01日實施的《個人信息保護法》成為規范公共數據開放利用、保護個人合法權益的重要依據。
數智時代,圖書館的精準營銷、個性化業務等服務是建立在對用戶需求感知基礎上,是對用戶數據進行挖掘、分析而來,其過程是實現個人數據開放共享與驅動創新生態的路徑。可以說數據應用逐漸成為圖書館關注、研究的對象之一,但需要注意數據存在的二元屬性,尤其是社會生產活動對數據資源的需求與日俱增[2]的環境下,圖書館在為用戶服務過程中需要妥善解決用戶數據安全與保護兼顧的問題。在圖書館對個人數據使用日趨頻繁的環境中,對數據的價值與隱私二元屬性平衡的探討具有一定的現實意義。
《國際圖聯趨勢報告》 (IFLA Trend Report) 將人工智能列為四大技術趨勢之一[3]。人工智能與圖書館密切相關,今天圖書館界和情報界要做的,不是跟在這一熱潮的后面,而是要利用自己的專業優勢,參與并在人工智能的發展中有所作為[4]。一些智能分析應用日趨成熟,這需要數據支持,如卷積神經網絡 (Convolutional Neural Network, CNN) 和協同過濾 (Collaborative Filtering)等為圖書館的智慧服務提供了實現的方法[5],提高了服務效率。美國圖書館協會 (American Library Association, ALA)將區塊鏈技術列為未來圖書館重大變革性技術列表[6],也給圖書館數字版權管理帶來新的思維[7]。區塊鏈的去中心化、不可篡改、開放與透明以及安全可信等特征已成為數智時代圖書館信息共享、版權保護、身份認證、資源存儲以及網絡眾籌等業務實施新的變革支撐點[8]。
云計算并不是一種全新的網絡技術,而是一種全新的網絡應用概念。云計算的核心概念就是以互聯網為中心,在網站上提供快速且安全的云計算服務與數據存儲[9],最終實現計算與數據資源的集中匯聚。國外圖書館租用云計算服務已經成為常態,包括IaaS(Infrastructure-as-a-Service,基礎設施即服務 )、PaaS(Platform-as-a-Service,平臺即服務)、SaaS(Software-as-a-Service,軟件即服務)[10]。租用云服務本質上就是將圖書館的服務通過外包給云計算服務商,提供圖書館文獻資源數據相關服務。我國圖書館近些年來也在積極探索云計算相關業務,包括云計算、業務流程重組、私有云建設以及下一代圖書館系統的云部署等,形成“數據—系統—應用”三位一體的服務模式。云計算改變了傳統圖書館的服務模式,不僅重建圖書館業務生態體系,而且提升了圖書館服務效率,降低了圖書館運營成本。但是,云計算的數據安全、數據隱私以及數據權利等現實問題也困擾著圖書館[11]。
在大數據、云計算、人工智能以及區塊鏈等新興數字技術的推動下,互聯網空間發生了翻天覆地的變化,這種變化從原來以信息技術基礎相互關聯網絡轉變為嵌入式的信息空間,使得人們可以通過設備、系統平臺便捷自由地利用數據流的挖掘、分析以及應用[12]尋找出已知或者未知、公共或者私人的信息,從而在開放多元的渠道中獲取大數據中蘊含著的巨大商業價值和支持科學決策的價值信息[13]。可以說數據不僅能夠勾勒出用戶個人世界,也能夠預測系統、行業甚至學術領域的演變趨勢,對社會生產、學術研究起到促進作用,使其成為當前學術交流中極具魅力的話題。從這一價值角度來說,數據對于圖書館無論是用于開展用戶服務(用戶行為數據價值),還是用于開展知識服務(文獻資源數據價值),都是智慧服務關鍵所在。
數據資源一般是特定項目中已有可重用的數據,這是圖書館數字資源的基礎。圖書館文獻資源數據以及支撐智慧服務的用戶行為數據屬于具有隱私特征性質的資源。長期以來,圖書館一直以此類數據應用創新來促進服務發展,并且取得了一些成就。從數據應用角度來說,圖書館數據價值的體現主要集中于文獻資源建設、用戶智慧服務以及空間智慧管理等方面,其中個人數據的虛擬替代、多元共享、跨界融合、智能即時成為智慧服務與智慧管理數據價值獲取是涉及隱私問題的關鍵所在。數據在圖書館的文獻資源建設中的價值性源自于數字圖書館,資源的數字化其核心就是以數據作為載體。隨著數據智能以及物聯網技術的不斷發展,圖書館和用戶之間的服務模式也不斷改變,數據作為資源被用作文獻服務,同時也被用作獲取用戶各類需求的因素,其中包括資源需求、空間需求等。數據的價值性隨著圖書館服務的拓展而不斷衍生,逐漸形成“服務—感知”雙重特性。
數據對圖書館業務發展所起到促進作用,其核心在于其具有價值性內容,包括虛擬替代性(信息、讀者等)、多元共享性(多系統、多渠道關聯)、跨界融合(涉及多方應用)、智能即時等。然而,數據作為資源與引用的重要中介,也需要進一步厘清價值與隱私關系,做到利用與保護的平衡。
大數據技術的發展給人類社會帶來極大便利的同時,科技創新、服務創新所帶來的傳統模式轉型也帶來了安全、用戶權益方面的問題,而個人信息安全與數據隱私是用戶所關切的問題之一[14],顯得尤為重要。近些年,Facebook、攜程、網易、天涯等企業都出現過隱私泄露事件,加劇了社會各界對個人信息安全問題的擔憂。早在2016年業界就對數據應用的復雜性作了研討,并在中國高校圖書館發展論壇以“機遇與挑戰并存:大學圖書館可持續發展策略及實踐”為主題,在探索我國圖書館遠景規劃與協同發展、深層次服務與拓展服務、空間再造與服務推廣、服務能力建設與用戶信息素養培養等方面,深刻認識到當前圖書館發展的復雜性,認為數據作為促進圖書館發展重要的資源,雖然在可持續發展方面有著舉足輕重的作用,但隱私也是需要關注問題之一[15]。對于數據應用及其隱私保護問題,筆者認為目前圖書館界的主要隱私保護在以下三個方面需要關注。
首先,圖書館開展智慧服務時要注重數據的隱私保護。數據是圖書館開展智慧服務的基礎,不僅是生產要素,也是與其他生產要素相互融合,發揮倍增效益的來源,其中個人數據就是感知用戶需求的主要來源。數據要素的特征包括虛擬替代、多元共享、跨界融合與智能即時,這也是隱私保護所要關注的內容。
其次,在虛擬替代用戶的應用場景中,要展開隱私保護。圖書館智慧服務對數據有著強烈的需求,其中虛擬替代用戶個人身份,成為隱私保護新的對象,而多元共享、跨界融合以及智能即時等都是圍繞虛擬替代用戶個人身份來展開隱私保護,匿名化、模糊化等技術方法隱藏用戶的身份核心信息成為主要的技術方法,也是當前圖書館用戶數據保護的主要途徑。
最后,在數據逐漸向資產化轉變的過程中,要注重平衡數據價值與隱私關系。傳統的用戶數據保護模式已經不能適應大數據環境下的智慧圖書館對數據的應用需求,尤其是數據價值倍增與隱私風險突出的矛盾成為數據應用需要平衡的問題。筆者認為,數據的生產力屬性及其技術支撐等在將數據逐漸向資產化轉變,運用資產管理模式來平衡價值與隱私關系將成為圖書館個人數據治理促進服務創新的重要路徑。
圖書館在數智時代要贏得機遇,應對挑戰,除了目前在用戶隱私保護方面采取的一些技術措施和制度外,還需面對數智技術發展所帶來的新問題,例如虛擬替代逐步增強后,個人數據就具備了隱私屬性,如通信、郵件、照片以及活動軌跡等信息。利用學習分析、用戶畫像等模型等進行用戶數據分析,“勾勒”出用戶生活的方方面面,如不加約束,就容易造成對隱私的侵犯。
數智環境下,數據應用要做到合法、合規,讓用戶擁有知情權與選擇權,這種面上的制度保障并不困難,但是云計算、人工智能、區塊鏈等去中心化,數據的二次、多次使用行為,想要做到制度全面貫穿,面面俱到,并非易事。另外,互聯網廣泛應用的、面向用戶的隱私權利方案仍然存在著不合理性,這是由于建立在傳統保護基礎上的通過匿名化、模糊化對隱私數據加以保護技術,已不能夠滿足當前數智環境下社會對數據的共享需求。
歐盟的《通用數據保護條例》(General Data Protection Regulation,簡稱GDPR)仍然堅持完善個人信息條款來保護用戶數據隱私,同時《網絡安全法》及其衍生的個人信息保護方面的標準——《信息安全技術 個人信息安全規范》等都遵從著制度保障理念,但是冗長的隱私政策和乏力的“知情—同意”機制在數智時代不斷招致“隱私已死”的悲觀論調。用戶個人信息保護意識隨著數據的廣泛使用而逐漸增強成為當下數據應用矛盾的兩個方面。《公共圖書館法》第43條中“公共圖書館應當妥善保護讀者的個人信息、借閱信息以及其他可能涉及讀者隱私的信息,不得出售或者以其他方式非法向他人提供”的表述中雖然得到一定體現,但數智時代用戶個人信息以數據的形式存在,并且伴隨著圖書館數據應用直接影響著圖書館業務實施的效果。從現實情況來看,數據二元屬性使得數據對于數據隱私保護與價值利用普遍存在著兩者對立的誤解,認為隱私保護降低了數據共享效率,對創新發展有阻礙作用。法律經濟學者Richard Posner認為,隱私并不是人們所感知的那樣,具有多數人所相信的社會價值。所以筆者認為,數據隱私并非數據共享等數據使用行為的對立面,而是對數據使用行為的控制。
數據對圖書館業務產生的影響包括用戶服務、館員能力、業務管理、資源結構等方面,而對圖書館學研究的影響已在研究工具、研究熱點、研究方法、研究內容、研究對象、研究趨勢等方面改變著學科研究內容[16],這些影響都將改變傳統圖書館以文獻資源為中心的服務體系,促使圖書館利用數據,借助數智技術實現智慧服務創新的方向轉變。
“數智”本質是大數據、人工智能、云計算、物聯網等新一代技術思維與技術應用,而大數據支撐的智慧圖書館發展以及新型信息基礎設施建設賦予了圖書館新機遇[10],其中,大數據與人工智能應用涉及到的數據成為圖書館發展的重要資源之一,也成為圖書館關注的焦點,某種程度上占據主導地位[17]。與此同時,用戶對個人數據安全的關注也越來越高,不能合理使用數據,有可能觸犯法律。因此,數據應用在往廣度與深度發展的同時,隱私與價值兩者之間的關系需要做到有效平衡,才能避免引發安全問題。
數智時代,以數據生成資料屬性開展的一系列創新,促進了社會發展的同時也侵犯了傳統意義上的用戶隱私權益。長期以來,對于數據隱私與數據價值存在著對立的誤解,認為隱私保護降低了數據價值的發掘,對社會創新發展有阻礙作用。然而,數據隱私保護雖然在一定程度上影響了數據價值的獲取,但是該機制能夠在生產資料屬性方面促進數據安全、有效、穩定、長久地為社會發展作貢獻。
數據價值需要真實、可靠的數據資源供各類工具來挖掘,而真實、可靠的數據需要完善的數據隱私保護機制來保障。我國多部法律并行推動數據保護規則的完善,例如《網絡安全法》(2016)、《電子商務法》 (2018)、《民法典》第四篇《人格權》 (2020)、《數據安全法》 (2021) 《個人信息保護法》(2021)等,這些不同性質法律規范雖然制定的初衷不同,但卻可以推動圖書館從“數據隱私保護”向“數據治理保護和應用”轉變,尤其是近期頒布實施的《數據安全法》 《個人信息保護法》,對數據隱私、數據價值有著明確的法律規定,強調了用戶權益。在數據應用過程中,分類治理、多元并進、多源創新等數據開放共享政策,有助于實現數據價值與隱私平衡。其中分類治理將數據分為個人數據與非個人數據,強化個人數據的授權開放共享,并將個人數據重點區分為個人敏感數據與非敏感數據,突出個人敏感數據的人格權,重點隱私權保護,利用《個人信息保護法》等增強隱私數據的控制力,充分保障用戶的“知情——同意”權利。因此,數智時代圖書館需要進一步完善數據治理體系,圍繞圖書館的用戶需求、用戶價值、社會價值以及館員價值等體系內容,進一步在用戶、圖書館、館員等共同作用下實現數據治理模式優化,進一步厘清個人數據與非個人數據,個人敏感數據與非敏感數據等,并進行分級管理,將個人非敏感數據作為用戶活動的副產品,匯聚用戶行為數據具有較高的業務價值,促進圖書館業務的健康發展。
大數據技術在給社會帶來多方面積極變化的同時,其野蠻生長與廣泛運用也給人們的隱私帶來了一系列的倫理困境,包括數據挖掘與隱私信息的整合、數據預測與隱私信息的呈現、數據監控與隱私信息的透明、數據分享與隱私信息的擴散等方面[18]。隱私權傳統規范基礎以用戶個體為本位,以私人和公共為二分法,圍繞空間、事物與主體維度,并且從用戶個體本位轉向社會本位,從控制范式轉向信任范式,從獨占維度轉向溝通維度,從二元對峙轉向一體多元,從權利視角轉向權力視角,從概念獨斷轉向語用商談[19]。
隱私泄露也隨著數據使用頻繁而風險加大,直接影響了數智時代圖書館有序發展,進而會在很大程度上阻礙技術創新、服務創新。智慧圖書館存在和產生依賴于用戶需求,用戶需要是圖書館發展的不竭動力[20],由此數據驅動創新需要充分發揮,需要破除數據價值與隱私保護的悖論問題。智慧圖書館領域需要構建便利的數據開放共享與激勵數據驅動創新生態,以實現數據要素價值的最大化釋放。數據之所以有生產資料屬性,就是因為其擁有第三方所需的用戶信息,其中包括資源使用數據,也包括空間使用數據,用戶借閱行為數據、數字資源訪問行為數據、入館數據以及選座數據等,“學習分析”“用戶畫像”等數據價值發掘就是通過自動化方式處理用戶數據的活動,而該活動用于評估、分析、預測用戶的特定方面,涵蓋了個人數據信息的各種活動。根據歐盟GDPR、我國《個人信息安全規范》對個人數據使用的明確規定,其中對個人敏感數據的數據價值發掘活動是明令禁止的,除非數據主體出于自身目的給予明確同意或者數據價值發掘活動出于重大公共利益所必需,例如新冠肺炎患者或者接觸者的軌跡追蹤等。所以,圖書館對業務數據價值的發掘,需要圖書館根據《個人信息安全規范》等法律標準的要求,在加強個人數據使用規范的前提下來保障業務的實施。
數智生態中,數據處理的形式多樣,無論是數字資源的組織,還是根據用戶數據來實施“學習分析”“用戶畫像”開展“智慧”服務,可以說圖書館涉及的數據使用面較為廣泛。數智時代的到來,技術發展日新月異,我國圖書館創新也是基于此背景下廣泛使用數據,例如CADAL以虛擬現實技術重構圖書館信息資源建設等[21]。然而,我國圖書館現有正式制度《公共文化服務保障法》《公共圖書館法》《數字圖書館資源管理指南》《數字圖書館安全管理指南》等都無法全面涵蓋數據隱私、數據價值等數據二元平衡方面的問題。因此,需要借助于《民法典 人格權編》 《公共圖書館法》 《網絡安全法》 《數據安全法》 《個人信息保護法》《個人信息安全規范》《大數據安全管理指南》等法律、標準以及技術方案共同構建圖書館智慧服務體系,讓數據價值更好地為圖書館的“智慧”發展服務。
從建立制度的滯后性來說,圖書館創新的“無制可約”現象符合社會發展的規律。當今現行的個人數據保護原則都是基于1980年OECD(Organization for Economic Co-operation and Development, 經濟合作與發展組織)制定的《隱私保護及個人數據跨國流通指南》,其中目的明確、知情同意以及最小化原則等成為各國數據制度的標配。然而,在數智時代,這些原則已經顯得“力不從心”。圖書館創新與數據制度在目標方面雖然存在著一致性,但是由于制度的滯后性,使得圖書館創新在某些方面存在著被質疑的現象。商業互聯網普遍根據《個人信息安全規范》等國內標準制定隱私條款等數據制度,而我國圖書館仍然缺乏該方面的數據制度建設,存在著安全風險與倫理危機[22]。圖書館服務制度是將服務創新傳遞給用戶的基礎手段,其創新意味著對制度價值的創新選擇和實現[23]。數智時代,我國圖書館亟需在數據制度方面的建設,以適應外部環境的變化[24],構建以政府主管部門、圖書館行業協會、圖書館等組成的聯盟,完善個人數據治理的行業制度,形成我國圖書館領域的共治機制,保障業務發展,在一定程度上對圖書館技術創新起到一定的促進作用。
數智時代,圖書館智慧服務的“用戶畫像”“學習分析”會極大地依賴于用戶數據,因此圖書館在數據應用上一方面需要加強對數據的分層管理、授權訪問等,另一方面要加強技術創新,提升數據挖掘的精準性,降低用戶數據的采集量,做到數據利用最小化、效率最大化。圖書館智慧服務不僅需要數據的價值的順利實現,同時更要通過技術制度解決數據隱私、安全等問題,完善使用標準來保障數據價值。數據二元屬性的存在,圖書館必須面對數據的隱私與價值問題,做到從數據內涵角度,運用技術、制度創新,逐步完善數據隱私與數據價值之間的平衡關系,將制度創新與技術創新、服務創新協同發展,形成自治機制。數據秩序平衡將成為我國圖書館發展過程中一項重要工作,并且是由技術、制度趨向統一,共同作用,最終實現為圖書館創新發展提供基礎保障。
我國圖書館對技術創新由來已久,并且積累了一系列的成果。大數據、人工智能、區塊鏈以及云計算等技術被廣泛運用到圖書館業務中,促進了個性化服務、精準服務以及智慧服務的健康發展。隨著《數據安全法》 《個人信息保護法》的實施以及外部環境的變化,對圖書館數據安全、個人信息保護也提出了新的要求,即圖書館在發掘用戶數據價值的同時,也應時刻關注用戶的數據安全與隱私等問題。圖書館應該遵循法治規范、共治協同、自治機制對個人信息中的數據隱私、個人權益進行妥善保護,正確認識隱私與價值的關系,運用現有法律、標準來完善治理機制,逐漸消除數據隱私與數據價值對立思維,促進數據價值有效利用,實現圖書館數據隱私、數據價值的有效治理,形成圖書館高質量發展的新模式。