孫明溪++孫曉宇++劉春琦
摘 要:云計算環境中,圖書館面臨著讀者隱私安全威脅。圖書館對讀者數據進行存儲、利用、傳遞過程中可能會受到多個環節的威脅,涉及讀者隱私安全問題。因此,作者提出構建圖書館讀者隱私保護技術模型,分別設計圖書館、用戶、圖書館外方和云端4個模塊,利用現代信息技術來保護讀者隱私,有效實現圖書館在云環境下對讀者數據的隱私保護。
關鍵詞:云計算 圖書館 讀者隱私 隱私保護 技術模型
中圖分類號:G252 文獻標識碼:A 文章編號:1672-3791(2017)09(c)-0008-04
在云計算環境下,圖書館實現了以讀者為中心,為讀者提供高速、安全、便捷的資源獲取和網絡服務[1]。隨著信息化程度的提高,圖書館在讀者獲取資源、使用服務的過程中將收集大量讀者數據。圖書館對讀者數據進行采集、存儲、分析、挖掘、傳遞,能夠有效規劃圖書館資源配置,使讀者服務更加人性化、個性化、科學化,大幅度提高了讀者閱讀愉悅感和圖書館服務市場占有率[2]。
圖書館讀者數據有讀者的姓名、肖像、身份證號、專業、職業、工作單位、聯系方式等個人信息,還有讀者使用圖書館服務與資源記錄、網絡訪問行為,以及館內監控與讀者違章公告等。本文研究的圖書館讀者不只是本館用戶,還包括其他成員館用戶。圖書館利用讀者數據提供更精準服務的同時,也大大增加了圖書館讀者隱私泄露的風險[3]。國際圖聯(IFLA)明確規定:圖書館用戶享有個人的信息隱私權,圖書館員及其所屬機構應保護用戶的信息隱私,不論其使用何種形式的信息、享受何種形式的服務[4]。圖書館讀者數據隱私保護的方式有很多種,如建立完備的法律法規、強化圖書館組織建設、提高讀者隱私保護意識、采用技術保障等。本文主要探究利用技術來保障圖書館讀者數據隱私安全。雖然飛速發展的信息技術在一定程度上增加了讀者隱私保護的難度,但在云環境下利用技術來保障圖書館讀者數據隱私安全是被廣泛認可的。在圖書館存儲、分析、利用讀者數據時,有效保障讀者數據安全是圖書館健康發展的關鍵因素。
1 國內外研究現狀
1.1 國內研究現狀
為了了解國內圖書情報界學者對圖書館讀者隱私的研究成果,本文選擇“讀者隱私、用戶隱私”作為檢索詞,限定“學科類別(圖書情報與數字圖書館)”,以CNKI(中國知網)作為文獻數據庫進行期刊的“主題”檢索。檢索結果見表1。
從表1中可以看出,國內學者對讀者隱私保護的研究始于2000年,在圖書情報期刊中發表論文類研究成果共553篇,其中核心期刊中涉及該領域論文160篇。
圖情界學者們越來越關注該領域的研究,在核心期刊中發表的論文也逐年遞增(見圖1)。但從發表的論文數量來看,業界對該領域的關注度不高,這幾年文獻數量呈減少趨勢。
1.2 國外研究現狀
以Web of Science作為檢索平臺,選擇“User Privacy”作為檢索詞,研究領域為“Information Science Library Science”,進行文獻檢索。檢索時間為2009年至2017年。
本文統計的是國外圖情界在核心期刊中發表論文的數量(見表2),總體呈上升趨勢(見圖2),與國內同一時期核心期刊中發表論文相比數量多,說明國外學者對該領域的研究更為深入。但從論文成果數量來說,圖情界學者對圖書館讀者隱私保護的研究還很缺乏。
2 圖書館讀者隱私安全威脅
圖書館日常運行過程中有很多環節威脅了讀者隱私安全。首先,圖書館能夠實時監測讀者借閱行為、網絡動態路徑、地理位置、行為習慣、社會關系等,監測數據都是在讀者毫不知情的情況下獲取的。同時,圖書館在為讀者提供借閱服務、參考咨詢服務、個性化服務、移動服務過程中,能收集到大量的讀者服務數據;其次,圖書館對讀者數據監管不到位,數據監管人員權責不明確,缺乏有效保護讀者數據的規章制度;再次,圖書館對讀者數據利用不規范。圖書館為制定科學、合理的未來發展策略,加工原始讀者數據,提高其使用價值與私密程度。加工過程則是利用現代信息技術來挖掘讀者數據、洞察讀者需求、預測讀者未來行為,這當中涉及讀者敏感問題,使得讀者隱私受到侵犯。另外,圖書館會與其他館有業務往來,為了保證跨館服務的開展,館際之間會共享讀者數據;圖書館合作商在館內進行調試和維護過程中,能夠通過后臺訪問到讀者數據,不法分子可能會惡意篡改、竊取讀者數據;最后,在圖書館日常運營過程中,也會面臨系統漏洞、技術缺陷、物理環境等多方面的威脅。
3 構建讀者數據隱私保護技術模型
在云環境下,圖書館讀者數據在存儲、利用、傳遞過程中受到多種方式的威脅,保護讀者數據的主體不只是圖書館,還包括圖書館用戶、其他圖書館、服務商和云端。因此,本文構建技術模型分為圖書館模塊、用戶模塊、館外方模塊、云端模塊。每個模塊將針對上文涉及的不同種類讀者數據安全威脅提出多個保護技術,模塊之間相互聯系構成圖書館讀者隱私保護技術模型。在隱私保護技術模型中,每一個模塊所包含的技術類型不盡相同(見圖3)。
3.1 圖書館模塊
3.1.1 數據加密技術
數據加密是通過加密算法在密鑰的控制下將明文加密為密文的過程。數據加密技術是數據隱私保護最常用技術,圖書館的讀者數據應當以加密的方式存儲。
首先,在圖書館加密讀者存儲數據過程中可以采用傳統的加密算法,包括對稱加密和公約加密兩種類型,為了汲取兩種加密算法的優點,圖書館存儲讀者數據可采用對稱加密來加密數據,用公鑰加密來傳遞對稱加密中的密鑰[5]。加密技術的安全性取決于密鑰的安全性,密鑰具有無窮盡性、隨機性、靈活性。
其次,在加密讀者應用數據過程中,圖書館利用、傳輸讀者數據可采用可搜索加密技術來加密讀者數據。圖書館將讀者數據加密并生成可搜索索引[6],建立加密讀者數據與索引之間的關聯。endprint
3.1.2 數據擾亂技術
數據擾亂技術是指通過匿名、擾亂、添加隨機變量、添加隨機偏移值、替換等方法對原始的數據集中敏感信息進行替代,生成加入擾亂信息的模糊數據集進行公示和計算等操作[7]。針對實時獲取的讀者服務數據,采用擾亂技術來模糊讀者隱私數據,防止館內不法分子讀取讀者數據。
3.1.3 可回收性與所有權證明
可回收性證明(POR)與所有權證明(PDP)[8]都是驗證讀者數據完整性的云技術。圖書館應安排專門的責任館員,負責讀者數據庫監管,定期用可回收性和所有權證明技術對讀者數據完整性進行檢驗。特別是經過修改、利用、傳遞后的讀者數據,更需要定期檢驗其完整性。
3.1.4 秘密共享技術
秘密共享技術是將秘密拆分給N個碎片交由N個人各自保管,避免秘密過于集中,只有若干個人同時進行解密才能恢復秘密[9]。圖書館在制定未來發展決策時,可采用秘密共享技術將經過加工得到的讀者隱私秘密分隔開,分散保管在多個圖書館高層領導的手中。當圖書館高層要進行決策工作時,共同拿出這些秘密碎片作為發展決策的參考,從而分散讀者隱私泄露的風險。
3.1.5 安全多方計算技術
安全多方計算是指在一個分布式網絡環境下多個參與方各自輸入某個數據參數,并得到各自相應的輸出結果,不會透露其他參與各方輸入輸出的數據,確保參與各方的獨立性[10]。安全多方技術可以應用在讀者數據挖掘、分析讀者閱覽喜好、文獻資源建設等工作中。在云技術環境中,安全多方技術尚不成熟,但具有發展前景。
3.1.6 災備技術
災備技術是指圖書館在面對系統故障、水災火災等突發事件時,能夠正常運行關鍵業務,能利用災備技術保障讀者數據的完整、安全。常見的災備技術是以備份為核心任務的讀者數據保障技術。
3.2 用戶模塊
用戶指的是圖書館讀者、館員,還包括成員館訪問者、服務合作商。用戶模塊主要包括用戶訪問讀者數據、圖書館收集讀者數據過程中涉及的讀者隱私保護技術。
3.2.1 訪問控制技術
訪問控制技術是授權用戶在合法范圍內訪問圖書館資源,圖書館根據用戶身份及其屬性來限制用戶對資源的訪問或對功能的使用。
訪問控制(Access Control)一般包括用戶授權、身份認證、訪問認可、審計追蹤四個基本環節[11]。具體而言,用戶授權用于劃定各類用戶的訪問級別;身份認證負責驗證用戶是否具備訪問讀者數據的資格,通常采用口令、生物特征、物理密鑰、電子密鑰等認證技術;訪問認可環節基于授權策略賦予用戶實際訪問資源的權限;審計追蹤記錄訪問軌跡,用于事后問責[11]。
3.2.2 身份識別技術
圖書館在采集讀者數據時,要先通過身份識別技術得到讀者授意,再獲取讀者數據。讀者將主密鑰交給可信任的第三方密鑰分配中心,圖書館每次身份識別都需要通過密鑰分配中心認證,保證在讀者授意的情況下收集和利用圖書館讀者數據,是讀者意愿的實質證明[12]。
3.2.3 P3P個人隱私保護技術
P3P(Platform for Privacy Project)是個人信息安全的隱私參數選擇平臺[13],能夠識別多種Cookies嵌入方式。讀者在P3P平臺中設置讀者個人隱私參數,若訪問網站要求讀取讀者數據超出參數范圍,P3P將拒絕有關Cookies并會向讀者發布警告,說明網站應用讀者數據目的與期限。
讀者可以在P3P中設置IP地址獲取允許、計算機機型獲取允許、電子郵件保密設置。同時,P3P能主動告知讀者圖書館將要獲取那些讀者數據,有利于讀者維護自身權益。
3.2.4 讀者瀏覽器隱私設置
讀者在訪問圖書館網站前在瀏覽器上進行隱私設置,編輯允許接收或拒絕接收Cookie。Cookie可稱作瀏覽器緩存,指網站為了識別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據[14]。讀者在瀏覽圖書館網站時,會有一些Cookies存儲在讀者的電腦中,圖書館可以利用這些Cookies來為讀者推送個性化的資源和服務信息。
3.3 圖書館外方模塊
圖書館外各方包括其他圖書館、圖書館服務商等,館外各方訪問圖書館讀者數據、圖書館向外方傳遞讀者數據均存在安全隱患,館外方技術模塊主要保障圖書館在對外交流過程中讀者隱私數據安全。
3.3.1 數字簽名技術
數字簽名技術是云環境下實現網絡信息傳遞的核心技術,指在電子數據文檔中添加一組特定的密碼或符號,用于識別數據發布者身份及承諾,數據接收方能夠向第三方證明其收到文件真偽性而采取的一種措施[15]。圖書館在參與圖書館聯盟等組織、與服務商合作的過程中需要傳遞讀者數據,可以將數字簽名密碼加在讀者數據中保證數據傳輸的安全,杜絕篡改讀者隱私數據等不法行為。
3.3.2 安全通信
安全通信是保障信號的安全,為讀者數據安全傳輸提供了物理基礎。圖書館讀者數據的傳輸包括圖書館內各部門間傳輸、圖書館與圖書館間傳輸、圖書館與服務商間傳輸等類型。在云環境中,根據不同的傳輸類型采用SSL(安全套接層)、TLS(傳輸層安全)、VPN(虛擬專用網絡)和IPSec(因特網協議安全性)[16]等安全技術來保障信號的安全。
3.3.3 SSL VPN技術
SSL VPN是采用SSL協議來實現遠程接入的一種新型VPN技術,是解決遠程用戶訪問敏感數據最簡單最安全的解決技術[17],它增強了圖書館安全訪問和安全的級別和能力[18]。
3.3.4 匿名化技術
K-匿名化技術是保護網絡發布信息的技術,通過擾亂的方法使得發布的信息存在至少K個不可區分的記錄,不能唯一標識,數據竊取者不能判別出隱私信息數據所屬的具體個體,從而保護了用戶隱私[19]。K-匿名通過參數K指定用戶可承受的最大信息泄露風險[20]。endprint
3.4 云端模塊
圖書館可以將讀者數據存儲在網絡云中,采用屬性加密算法[21]加密云端數據。另外,云災備是一種利用云技術為圖書館提供讀者數據保存、管理的災備服務,快速實現圖書館讀者數據的災備目標,降低災備投入成本和工作強度。
4 結語
云計算環境大大提高了圖書館使用讀者數據效率、降低了圖書館存儲讀者數據成本,但同時也為圖書館讀者數據隱私安全保護帶來了極大的挑戰。本文在分析了圖書館讀者數據隱私安全威脅的基礎上,提出了圖書館讀者隱私保護技術模型,以圖書館為核心,圍繞用戶、其他館、服務商開展讀者數據技術保護,實現圖書館讀者隱私有效保護。
但本文的不足之處是,只在理論層面上討論了利用技術保護圖書館讀者數據隱私安全的問題,接下來應當開展對技術保護模型的實踐應用研究。
參考文獻
[1] 劉立龍.云時代圖書館的讀者服務拓展[J].中國成人教育,2015(15):62-64.
[2] 馬曉亭.大數據時代基于服務等級協議的圖書館讀者隱私感知與保護研究[J].情報理論與實踐,2014,4(37):57-60.
[3] 田淑嫻,許春漫.國外圖書館用戶隱私保護指南文本分析與啟示[J].圖書情報工作,2015(18):61-65,116.
[4] 汪強.用戶個人信息保護有法可依[J].圖書館工作與研究,2014(4):8-12.
[5] 蔡紅云,田俊峰.云計算中的數據隱私保護研究[J].山東大學學報:理學版,2014,49(9):83-89,96.
[6] 李經緯,賈春福,劉哲理,等.可搜索加密技術研究綜述 [J].軟件學報,2015(1):109-128.
[7] 賈哲.分布式環境中的信息挖掘與隱私保護相關技術研究[D].北京:北京郵電大學,2012.
[8] Rajat Saxena,Somnath Dey.Cloud Audit: A Data Integrity Verification Approach for Cloud Computing[J].Procedia Computer Science,2016(89):142-151.
[9] 肖青華.秘密共享及相關應用研究[D].杭州:浙江大學,2005.
[10]趙川.實用安全兩方計算理論研究[D].濟南:山東大學, 2016.
[11]張玉清,王曉菲,劉雪峰,等.云計算環境安全綜述[J]. 軟件學報,2016,27(6):1328-1348.
[12]徐險峰.圖書館用戶隱私權保護研究綜述[J].圖書館建 設,2010(7):30-34.
[13]易斌,方錦平,陳淑文.圖書館讀者隱私的自我保護問題 與對策研究[J].圖書館學研究,2012(9):93-95.
[14]沈海波,洪帆.基于Cookie的Web服務安全認證系統[J]. 計算機工程與設計,2006,27(5):762-764,881.
[15]曹陽.基于秘密共享的數字簽名方案[J].重慶郵電大學 學報:自然科學版,2015,27(3):418-421.
[16]云計算——隱私保護技術[EB/OL].http://wenku.baidu.com/link?url=8LugCHODyRVs3OVP-_K82a9mpfFYd_f1e5Xy9sqOP-Wo4BwPNHJSaMixe6fEC6kXmGJYcFmRT1CWjB0fm1Km4wY73SoKSprkxYBi7wT89v,2017-04-26.
[17]劉東,王雙,周靜.量子密鑰在電網SSLVPN中的應用[J]. 電網技術,2014(2):544-548.
[18]朱意秋.基于SSL協議的VPN技術研究和實現[J].輕工 科技,2015(5):55-56,76.
[19]汪小寒,羅永龍,江葉峰,等.基于KD樹最優投影劃分的K匿名算法[J].南京大學學報:自然科學,2016,52(6):1052-1064.
[20]宋金玲,劉國華,黃黎明,等.K-匿名隱私保護模型中K值 的優化選擇算法[J].小型微型計算機系統,2011,32(10):1987-1993.
[21]王彩芬,鄧云霞,牛淑芬.一個新的理想格上基于屬性的 加密方案[J].計算機工程與應用,2016(17):123-127.endprint