當前,大數據、物聯網、人工智能、“互聯網+”以及無線射頻識別(Radio Frequency Identification,RFID)等智能技術陸續興起,推動了圖書館向智慧化方向發展。用戶對圖書館的知識需求日益廣泛,如學習交流、信息定制、虛擬參考和知識管理等,促使圖書館向個性化、主動化、智能化和智慧化的深層次信息服務轉型,智慧圖書館應運而生,智慧服務隨之而來。
智慧圖書館為圖書館界帶來生機的同時,也存在許多用戶隱私方面的安全隱患。一方面用戶必須要向智慧圖書館提供個人基本信息,另一方面智慧圖書館為了能夠提供個性化的服務,需要對獲取的用戶信息進行過濾、分析和挖掘,識別用戶的需求傾向。無論用戶主動提供的顯性信息,還是智慧圖書館通過處理得到的隱性信息,極有可能被不法分子通過網絡攻擊盜取,進行非法使用和銷售,如果不能妥善保存、合理利用,容易導致用戶的個人隱私受到侵犯。因此,如何有效保護智慧圖書館用戶的個人隱私,提高用戶對智慧服務的信賴和支持,具有重要的實際意義。
智慧圖書館以提供泛在智慧服務為主,是繼數字圖書館、復合圖書館后圖書館發展的一個更高級的形態[1]。智慧圖書館的概念最早由芬蘭奧盧大學圖書館的Aittola提出,他認為智慧圖書館是一個不受空間限制,可以被感知的移動圖書館[2]。隨著“智慧地球”、“智慧城市”、“智慧社區”和“智慧校園”等智慧概念的提出,我國在智慧圖書館領域開始了更深層次的研究。在內涵上,烏恩認為,智慧圖書館融入了智慧館員的知識服務,是對高校圖書館的各種信息資源、開放獲取資源以及個性化的知識資源等進行深度知識挖掘以及具有分析用戶需求功能的專家式的系統服務,是一種高品質、高價值、深內容的高層次服務[3];在特點上,謝芳對智慧圖書館的先進性和開放性、系統化和智能化等進行了詳細的闡述[4];在構建模式上,吳娟等人從邏輯架構和物理架構兩個層面論述了基于智能服務的智慧圖書館平臺[5];而在用戶隱私保護上,相關研究極少,只有王家玲對智慧圖書館模式下讀者隱私技術進行了研究[6]。綜上所述,現階段對智慧圖書館的研究大部分集中在其內涵特點和服務模式上,只有極少文獻探討了用戶隱私保護問題,因此研究智慧圖書館模式下的用戶隱私保護問題十分必要。
圖書館用戶隱私保護是指圖書館界對用戶在與圖書館有關的活動過程中所產生的個人隱私信息進行人為的和技術上的管理,以便對該用戶的隱私安全進行保護,防止隱私信息外泄[7]。現階段,圖書館用戶隱私的保護問題可從法律、技術和圖書館自身3個層面進行研究。在法律層面上,我國與美國等發達國家相比仍有差距,還有待提高。魏翠翠[8]分析了美國各州圖書館法中用戶隱私保護條款的內容和特點,認為我國應從“加緊立法進程”“內容上完善”和“時間上與時俱進”3方面建立健全圖書館的相關法規和規章。在技術層面上[9-10],主要有訪問控制技術、數據加密技術、差分隱私模型等數據挖掘算法以及身份認證技術等方面的研究。在圖書館自身層面上,彭華杰[11]提出在圖書館設立“隱私館員”和“算法師”等職位,對用戶個人數據開展專業化的管理,并承擔解決隱私權爭議的任務。國內學者還分別對大數據環境下[12]、云環境下[13]、“互聯網+”環境下[14]、數字圖書館模式下[15]的用戶隱私問題進行了研究,提出了相應的保護策略。
區塊鏈(Blockchain)產生于2009年1月3日,創始人為中本聰[16],是近年來最具顛覆性的新興技術之一。2016 年,國務院印發的《“十三五”國家信息化規劃》首次將區塊鏈技術納入其中,為區塊鏈技術的發展提供了政策引領[17]。區塊鏈是一種按照時間順序將數據區塊以鏈條的方式組合成特定數據結構,并以密碼學方式保證的不可篡改和不可偽造的去中心化共享總賬,能夠安全存儲簡單的、有先后關系的、能在系統內驗證的數據[18]。區塊鏈中每個數據區塊主要由區塊頭和區塊體組成,區塊與區塊之間按照時間先后順序鏈接成一個完整的鏈條,即為區塊鏈。每創建一個新區塊,即可通過哈希算法與前一個區塊相連,這樣就創建了一個區塊的鏈條。該鏈條可以逐個增加區塊,同時該區塊也可回溯之前的交易信息,以確保數據的安全。區塊鏈是分布式數據儲存、點對點傳輸、共識機制及加密算法等計算機技術在互聯網時代的創新應用模式,具有去中心化、去信任、開放性、自治性、信息不可篡改和匿名性等特點,能夠通過運用數據加密、時間戳、分布式共識和經濟激勵等手段,在節點無需互相信任的分布式系統中實現基于去中心化信用的點對點數據共享、協調與協作,為中心化機構普遍存在數據存儲不安全及用戶隱私易于泄露等問題提供了解決途徑[19]。
隨著區塊鏈技術的興起,隱私泄露問題得到了解決。區塊鏈具有去中心化、匿名性和信息不可篡改等特點,在隱私保護方面具有突出的優勢。黃永剛提出區塊鏈技術可使信息由數據轉移向價值轉移,討論了醫療在去中心化、隱私保護、基因測序方面的應用并構想相關場景,為電子檔案建設帶來新的研究思路[20];王繼業等人構建了基于區塊鏈的數據安全共享網絡體系,實現了企業內部及企業間的數據安全共享[21];章寧等人針對互聯網租車場景中個人隱私保護問題,提出了一種基于區塊鏈的個人隱私保護機制[22];陳捷等人以區塊鏈智能合約在智能家居隱私保護中的執行模式為例,證明了區塊鏈在物聯網隱私保護中的優勢及可行性[23]。在智慧圖書館用戶隱私保護問題上,尚無學者結合區塊鏈技術進行研究。本文將區塊鏈技術應用于智慧圖書館用戶隱私保護研究,具有一定的創新性。
3.1.1 智慧圖書館服務模式
智慧圖書館的服務模式體現在實體圖書館和虛擬圖書館兩方面。信息技術的不斷革新為實體圖書館的發展提供了動力,物聯網、人工智能、云計算、大數據、可視化及RFID等前沿技術的發展帶動了圖書管理系統、門禁系統、座位管理系統、自助借還設備以及后臺監控系統的實現和運行,為用戶提供了各項智能服務;用戶需求的不斷提升,引領了虛擬圖書館的創新發展,用戶可以通過各種網絡終端進行知識導航、一站式檢索、虛擬參考咨詢等,智慧圖書館通過對用戶瀏覽、搜索、下載等個體行為數據的采集和分析,進行精準預測,針對不同用戶提供個性化服務。
3.1.2 智慧圖書館服務模式下的用戶隱私內涵
關于智慧圖書館服務模式下的用戶隱私,主要是針對個性化用戶進行研究的,智慧圖書館為用戶提供的如信息定制、虛擬參考咨詢、知識管理等智慧服務,都是面向用戶的實際需求,努力提升用戶滿意度的服務項目。美國圖書館協會將圖書館用戶隱私定義為圖書館有能力對用戶的想法、情感、信仰、恐懼、計劃、想象和控制等個人信息在不能與別人分享時給予保護[24]。
智慧圖書館模式下的用戶隱私主要包括用戶的基本信息和行為信息,用戶基本信息主要包括用戶的學號、證件號、姓名、性別、年齡、聯系方式、學歷、部門及婚姻狀況等。用戶的行為信息是指用戶在使用圖書館的過程中留下的痕跡,包括用戶訪問圖書館網絡平臺的時間、瀏覽及下載記錄,借助自助設備進行的圖書借還記錄、選座及懲罰記錄,進行參考咨詢服務過程中的Cookies網站數據存儲,以及使用各種數字移動終端服務APP時填寫的信息及獲取記錄等。
根據智慧圖書館的服務模式及其用戶隱私內涵,提出了基于區塊鏈的用戶隱私保護架構模型。該模型的體系結構由用戶、智慧圖書館和第三方服務商3類主體構成,稱為“智慧鏈”。根據區塊鏈的基礎架構,可將智慧鏈系統分為數據層、網絡層、共識層、激勵層、合約層和應用層[25],各層的隱私保護機制如圖1所示。

圖1 智慧鏈系統隱私保護機制
3.2.1 數據層
數據層封裝了智慧圖書館獲取的底層數據區塊,系統為智慧鏈創建創世區塊(區塊鏈的初始塊)。網絡節點對帶有交易行為的數據塊進行驗證,運用哈希函數檢測前一個區塊的信息的完整性,并加蓋時間戳,按照時間順序鏈接到主鏈上,形成不可篡改和不可偽造的智慧鏈數據庫。在數據層中,Merkle可信樹負責組織智慧鏈中的交易,基于Merkle可信樹的數字簽名方案在安全性上僅依賴于哈希函數的安全性,且不需要太多的理論假設,這使基于Merkle可信樹的數字簽名更加安全、實用。
3.2.2 網絡層
智慧鏈各個區塊之間的網絡通信是在網絡層完成的,網絡層主要包括各類網絡傳輸協議及驗證機制等。智慧鏈是一種P2P網絡(點對點網絡),所有區塊共享所擁有的資源。這些資源通過網絡提供服務和內容,區塊之間可以在去中心化的環境中直接互訪,自由交易。
3.2.3 共識層
智慧鏈中所有的節點在鏈接之前,分散在去中心化的系統中,因此需要一種有效的共識機制保證這些節點維護的全局賬本是相同的。共識層中常見的共識機制包括工作量證明機制(Proof-of-Work,PoW)、權益證明機制(Proof of Stake,PoS)和股份授權證明機制(Delegated Proof of Stake,DPOS)等。本文選取PoW機制負責使智慧鏈節點的有效性達成共識,并保證區塊鏈的安全性。PoW機制的核心思路是設置一個數學難題,讓參與節點求解難題,在求解過程中付出最大工作量(算力)的節點將被選擇為記賬節點,由此節點生成新的區塊,其他節點通過接受此區塊更新自己的全局賬本[26]。
3.2.4 激勵層
激勵層主要指經濟激勵的發行和分配,制定一定的激勵措施,激發區塊參與智慧鏈中的安全驗證工作。在智慧鏈中必須激勵遵守規則參與記賬的節點,懲罰不遵守規則的節點,從而保證系統的良性循環。
3.2.5 合約層
合約層主要包括各種腳本代碼、算法機制以及智能合約等。腳本和算法用于智慧鏈上的區塊進行編程,智能合約支持區塊之間自動觸發執行合約條款,無需人工干預。
3.2.6 應用層
應用層封裝了智慧鏈的應用場景——智慧圖書館的用戶信息循環模型,包括數據感知、數據傳輸和數據管理(圖2)。

圖2智慧圖書館用戶信息循環模型
3.2.6.1 數據感知
數據感知即用戶信息的采集和量化過程。這些信息主要包括用戶的基本特征數據、網絡日志存儲的用戶行為數據,以及通過RFID技術和智能傳感設備獲取的用戶信息等。
用戶使用智慧圖書館后,生成用戶數據,智慧圖書館對用戶數據進行運算,生成哈希函數,然后用用戶的私鑰對哈希函數進行簽名,生成智慧鏈上的原始數據,并創建數據存儲交易進行廣播。同時,用對稱秘鑰對用戶數據和簽名后的哈希函數進行加密,然后用用戶的公鑰對加密秘鑰加密,形成消息后發送給用戶。
3.2.6.2 數據傳輸
數據傳輸是將智慧圖書館通過數據感知采集的數據經光纖網絡、無線局域網、RFID網絡和藍牙網絡等上傳到智慧圖書館數據存儲庫的過程。用戶從智慧圖書館得到自己的數據消息后,驗證圖書館的簽名,并用私鑰解密出智慧圖書館的加密秘鑰,從而解密出原始數據,生成新的加密秘鑰后重新加密,生成區塊數據,然后傳輸到智慧鏈上,保證傳輸的安全性。
3.2.6.3 數據管理
數據管理是指智慧圖書館根據設定的算法和規則,對數據資源進行運算,實現智慧化利用的過程,包括規律發現、行為預測、精準查詢、智能定位和數據價值挖掘等。用戶設置個人隱私的訪問控制權限,任何人要想使用都必須經過用戶授權。智慧圖書館(包含第三方服務商)對用戶信息管理之前,首先需要請求獲取數據的公鑰及數據管理需求,用戶創建訪問控制交易,并向智慧鏈網絡廣播該交易,智慧圖書館收到交易信息后,即可獲取對數據的應用權限,從而為用戶提供智慧服務。
本文將區塊鏈技術應用于智慧圖書館的用戶隱私保護問題的研究,構建隱私保護模型,運用時間戳、哈希函數、Merkle 可信樹及共識機制等技術保證了智慧鏈的防篡改、隱私加密和安全存儲。智慧圖書館模式下用戶隱私保護問題的研究意義深遠,期待智慧圖書館建設者和區塊鏈技術人才不斷創新,研究出更有效的用戶隱私保護機制,同時探索區塊鏈技術在智慧圖書館其他領域的應用。