陸 康,劉 慧,任貝貝,張 婧
(1.南京曉莊學院圖書館;2.上海市網絡技術綜合應用研究所)
大數據、人工智能、區塊鏈等新技術被廣泛應用于社會各個領域,為社會發展帶來便利的同時,其弊端也越發凸顯。在圖書館服務智慧化過程中,各類型數據急劇增長,其服務的初衷是通過數據共享感知用戶所需,從而實現精準的文獻資源推送,用戶身份識別方式從傳統的身份證件、密碼、數字簽名逐漸演變為指紋、視網膜、虹膜、面部特征等生物識別方式。但歐文·凱莫林斯基等在《重新發現布蘭代斯的隱私權》一書中認為,當前環境下的信息隱私權保護是失敗的,信息隱私權有著極大的能力來獲取個人最為私密與個性的內容,也有著多元化的途徑來獲取個人隱私。[1]
數據共享與數據隱私之間存在著眾所周知的悖論。[2]數據需求方希望數據能夠實現最大化共享,數據提供方則因擔心數據隱私的泄露而有所保留。當數據被全面監控,數據挖掘、數據分析與數據共享在社會化后必然導致數據隱私問題的出現,而共享平臺之間的利益相關性原則導致利益多元化,甚至引發用戶個體觀念與相關行為改變。[3]《2017年大數據發展趨勢報告》中,“大數據的安全和隱私持續令人擔憂”再次上榜,名列第三條。[4]我國數據隱私問題研究熱度從2004年起呈逐年上升趨勢,隱私保護逐漸成為研究熱點主題之一。[5]智慧圖書館的發展離不開物聯網、社交網絡、云計算、區塊鏈以及大數據等技術的支持,而用戶對隱私問題的關注使得圖書館不得不加強對數據的安全保護,因此,“數據共享”與“數據隱私”也成為智慧圖書館發展過程中不可回避的議題之一。
① 大數據隱私技術與方案視角:大數據強調數據共享,而保護用戶數據隱私不能回避技術問題。Kai Fan等提出密文策略屬性的加密(CP-ABE)是實現云共享下隱私安全的有效方法;[6]Surmila Thokchom 等提出了一種安全有效的將共享動態數據存儲在不可信云服務器上的方案,并提供了第三方審核員的隱私保護完整性檢查;[7]任雪斌等全面闡述了敏感信息在數據處理、數據分析過程中泄露的可能性,明確了大數據隱私保護的研究方向。[8]② 劉陽等調研了美國56所研究型大學圖書館的讀者隱私政策后認為,美國圖書館在尊重用戶隱私方面有著完善的保護策略;[9]吳雪敏比較了中日兩國圖書館的讀者隱私權保護,認為我國在讀者隱私權保護方面權利救濟意識薄弱、相關法律政策缺失、行業協會職能缺位、圖書館主觀能動性較差、學術研究過于宏觀化等;[10]王肅之以《中華人民共和國公共圖書館法》為依據,認為公共圖書館的用戶個人信息保護應該遵循合法、全面、明確和責任原則,具體內容應該包括信息概念、信息獲取、發布與使用、保護措施與免責聲明等;[11]何培育等則從《信息安全技術 個人信息安全規范》角度分析了第三方應用程序“隱私條款”,認為建立統一的隱私保護標準、發揮行業自律的引導作用、構建體系化的隱私保護機制是用戶信息安全的有效保障;[12]黃如花等從我國政府數據開放共享政策框架與內容以及問題角度進行分析,認為數據開放共享的質量有待提高、個人保護政策有待具體化、知識產權等問題有待完善。[13]綜上,學術界希望政府在數據開放共享方面提高質量、完善體系,提升政策操作性、保障力,同時也希望在數據隱私制度、技術方面有所建樹。目前,關于“數據共享”與“數據隱私”技術方法(網絡安全)等微觀角度與社會方法(法律、法規)等宏觀角度的研究都較為豐富,但是普遍缺乏從倫理視角展開的智慧圖書館宏觀與微觀層面數據使用的研究。
“數據共享”是指在大數據、云計算、人工智能等互聯網智慧服務環境下,以不同的結構和形式呈現的具有一定價值的數據,如視頻、音頻、文本等結構化數據和非結構化數據,在物聯網、移動互聯網等載體中不同類型數據自動生成,[14]為互聯網數據價值提煉提供了“原料”。“數據共享”在公共領域的內涵源自于資源描述框架(Resource Description Framework,RDF),在互聯網空間中不同類型與來源的數據實體之間一旦建立RDF鏈接,用戶便能夠瀏覽與其中一個數據源相關的其他來源的項集,并通過搜索引擎實現數據搜索與抓取的功能,最終實現數據共享。[15]大數據時代,多維數據匯聚、整合、關聯、分析與挖掘,實現服務的精準性、智慧性與高效性,是“數據共享”應用領域的目標。數據共享是互聯網“自由、開放、平等、協作、迭代、共享、去中心、自組織、非商業”理念之一,在商業化現實主義的環境下,這種理念在不斷淡化,自組織形成了各自的利益集團,“數據鴻溝”“數據霸權”導致共享、自由、平等逐漸成為“理想”。軟件開源運動為“數據共享”的應用實踐開辟了新的“路徑”,這也使得大數據價值得到充分發揮。
從法理意義上講,隱私是指已經發生了的符合道德規范和正當的而又不能或不愿展示的人、事、物或情感活動等。[16]隨著互聯網社會的不斷發展,隱私的界定范圍不斷擴張,信息隱私問題從涉及私密、敏感、非公開的個人信息逐步向適應智慧服務應用的共享、非敏感與公開的個人數據轉變。[17]大數據時代數據價值的發掘在一定程度上推動了社會的進步,提高了生產效率,但是與用戶相關的隱私問題一直以來都是學界存在爭論的問題之一。數據隱私與保護密切相關,用戶的關注點在于個人隱私的保護,而數據隱私研究的價值在于機構、組織對數據價值的發掘,其中存在著侵犯用戶隱私的風險。圖書館從數字圖書館向智慧圖書館發展的過程中,也會存在著同樣的問題。圖書館領域提倡資源共享的初衷也蘊含“數據共享”意義,其中智慧服務所需的大數據價值的發掘(尤其是涉及用戶行為數據)、用戶隱私保護等都建立在人文概念下,技術層面的“數據共享”范圍不斷擴大,人文領域的“數據隱私”等問題形勢嚴峻。新一代圖書館系統或者稱為下一代圖書館系統已經在技術層面關注到用戶數據隱私問題,但是圖書館數據隱私制度的形成、發布需要與業務密切關聯,以起到相互促進與發展的作用。
大數據時代的數據量激增,為數據資源的使用提供了基礎,“數據共享”提供了數據匯聚的方式,也為數據資源價值發掘提供了條件。然而,數據控制者、處理者(圖書館等)與數據主體(用戶)都存在著“共享”方式的顧慮。此外,數據控制者、處理者的數據素養參差不齊,所處地域的不同也造成隱私保護法律、法規與政策存在差異。電子商務等互聯網門戶網站的隱私政策雖然在用戶數據收集、使用等方面做了告知、許可等闡述,但是在“數據共享”過程中,用戶無法在同一業務系統中動態監測個人信息,造成數據界限越來越模糊。
“數據共享”促進大數據體量的不斷提高,數據需求者運用不同算法挖掘“數據共享”匯聚下的數據,這一過程包括算法選取與分析、數據選取與存儲、數據清洗與分析、業務系統應用的開發、分析結果發布與展示等,因此,“數據隱私”在數據應用價值發掘的步驟中,可能存在算法選擇不準確、數據選取不精確、數據清洗不充分、業務系統應用開發不全面等問題,導致用戶隱私泄露或被盜用,造成了用戶數據的非可控性。
無論是數據界限問題還是數據的非可控性問題,都是由于大數據時代下的“數據共享”引起的,這也是與“數據隱私”沖突的關鍵癥結所在。
在公共領域,“數據共享”的需求度越來越高,人工智能、云計算等技術應用的基礎是“大數據”的支持,多維度的“數據共享”能夠提升人工智能的準確性,使“云計算”的結論更為精確。然而,由于公共領域的數據處于不同的業務系統中,而業務系統屬于不同的管理機構,系統之間需要關聯才能形成共享機制,使得“數據共享”機制的建立存在著隔閡。“數據隱私”方面,圖書館領域的用戶隱私問題從數字圖書館開始就受到關注。隨著數字閱讀的普及,資源服務提供商為了利益,也開始逐漸關注用戶的閱讀行為,部分電子書閱讀軟件與閱讀器的隱私政策雖然公開化,但是有悖于圖書館服務的價值觀。[18]圖書館應結合資源服務、具體業務建立相關的隱私保護策略,讓用戶充分了解、掌握圖書館系統的“數據共享”機制,打消用戶對“數據隱私”的顧慮。
目前,信息安全已成為用戶重點關注的問題之一。谷歌、百度等搜索引擎公司掌握了較多用戶檢索行為數據,淘寶、京東、蘇寧易購等購物平臺掌握了較全面的用戶消費行為數據,QQ、微信、新浪微博等獲取了較多的用戶互動交流行為數據,微軟、蘋果、谷歌等操作系統供應企業則掌握全球互聯網用戶各種類別的行為數據。用戶行為數據的應用價值被用于商業營銷(圖書館則用于閱讀精準推廣),通過數據挖掘可以進一步獲取用戶的隱性需求,其心理動態、興趣愛好、學術深度等都將被全面剖析,用戶畫像由此產生,該類行為已經造成了對用戶“數據隱私”的侵犯。圖書館在大力提倡智慧服務的環境下,也需要密切關注“數據共享”過程中侵犯“數據隱私”等問題。
隨著互聯網技術的發展,二維碼、人臉識別、紙質書刊自助借閱系統、RFID等技術被引入圖書館數字化應用。技術創新引發了圖書館服務變革,使用戶享受到便利與高效的服務,但制度保障不及時、不全面造成了“數據共享”與“數據隱私”等矛盾日趨明顯,這也是互聯網社會普遍存在的現象:技術創新的快速發展與業務制度規范化制定緩慢產生了矛盾。安全穩定的環境才能夠促進社會的發展,“數據隱私”等問題的制度建立與行為規范構建是圖書館等機構在行業內部所重視的問題之一。圖書館研究者對互聯網的新技術、新方法、新理論專心致志的研究精神成為智慧圖書館發展的動力,技術創新所帶來的亟需制定、解決的問題也同樣需要關注。
從互聯網文化角度分析,智慧地球、智慧城市、智慧圖書館等概念的提出會對用戶生活方式產生潛移默化的滲透與影響。[19]智慧服務影響了用戶的行為方式、思維模式等,在“數據共享”的大背景下,這些原本屬于用戶個體的“隱私”問題被暴露在互聯網中,并且在互聯網技術變革過程中,引發互聯網社會與傳統社會觀念、模式的碰撞并慢慢融合。“數據隱私”等問題在“智慧”所需的“數據共享”環境下引發的不僅是技術問題,也涉及到法律、制度、倫理價值等方面的問題,從圖書館角度回顧互聯網的發展歷程,技術與倫理的沖突長期存在。基于互聯網技術,圖書館在智慧服務理念下,實踐服務的精準化與管理的精細化、進一步提高數字圖書館服務效率,是圖書館在互聯網發展浪潮中服務創新的必經之路。從用戶個人角度,多元化的用戶需求促使機構部門在“數據共享”理論下利用大數據的匯聚、整合、挖掘、與分析以滿足用戶的需求。這也是圖書館服務質量提升的一種捷徑,然而用戶又對服務提升過程中個人數據的使用產生擔憂。因此,圖書館“數據共享”價值觀與用戶個人“數據隱私”價值觀也產生了沖突。
技術創新促進了生產力的發展,同時也帶來了新的問題。互聯網的創新將物、人通過網絡關聯起來,而用戶享受互聯網帶來便利的同時,卻不能完全地將自我感知、自我意識在互聯網中真實展示,反而對“數據隱私”問題過度細化。隨著智慧化互聯網的不斷發展,用戶“數據隱私”問題核心的部分只剩下意識與感覺,所謂的核心數據與信息的保護會越來越規范,意識、感覺也會逐漸擺脫技術的束縛。技術長期以來不斷給用戶帶來驚喜,隨著時間的推移也會讓用戶的心態日趨平淡,可見技術與人文會相互制約、融合,達到統一的境界。因此,當社會發展到一定程度,“數據共享”與“數據隱私”的矛盾就會迎刃而解。圖書館也是如此,智慧服務處于初始階段,技術、倫理等問題存在是正常的,學者、管理者、館員以及數據集成商之間立場不同,矛盾存在也是必然的。
智慧服務中的核心問題包括兩個對立方面:一方面強調“數據共享”,對“數據隱私”的保護不夠重視;另一方面強調“數據隱私”,卻阻礙了“數據共享”的發展。學界從數據隱私角度針對這個悖論做了深入、全面的研究。① 倫理方面:提高數據使用的透明度,轉變用戶數據隱私觀念,提升數據應用價值以及尋求合理的倫理決策點等。[3]② 技術方面:虛擬化技術和多租戶技術是云存儲存在諸多安全問題甚至安全悖論的根本原因,[20]數據加密、安全審計、密文訪問控制仍然是數據安全保障的基本方法。③政策、法律、制度方面:《中華人民共和國網絡安全法》《信息安全技術 個人信息安全規范》等為大數據的實踐應用提供了保障,《中華人民共和國公共圖書館法》為圖書館用戶數據隱私保障提供了法律基礎。“安全”是相對的,不能一味強調安全問題而忽略了社會進步與發展,因此,智慧服務的“數據隱私”也不能一味追求數據保護而忽略數據價值的發掘。對“數據共享”的交換過程行為進行全程監測,提升數據價值,將數據維度與數據需求高度匹配,以降低“數據隱私”泄露風險。
科學主義(Scientism)有雙重含義:其一是指“自然科學家或被認為屬于自然科學家的典型的方法和態度”,其二是指“過分信賴自然科學方法應用于所有研究領域(如在哲學、社會科學以及人文學科中)的功效”。[21]圖書館智慧服務從技術角度的現實意義在于:第一,強調了透明機制,闡述“數據隱私”技術保障解釋方式,如按需獲取用戶數據以保證數據安全;第二,強調數據收集機構的權利和義務及數據接觸者的數據素養。技術方法公開化,為技術共享與產業鏈的建立提供了基礎,如密碼學理論用于數據的加密,雖然存在著爭議,但是能在一定程度上解決數據隱私問題。技術方法不能受限于技術原理本身,而應與人文、社會方法融合,才能使智慧圖書館等機構業務發展中的悖論問題得到有效解決。
“數據共享”以及對數據的使用不可避免,“數據隱私”以及相關數據倫理問題需要時刻反思。用戶對“數據隱私”的擔憂,主要是由圖書館等機構數據使用不透明所致。因此,在數據素養教育方面,既要讓圖書館等數據控制者、處理者具有規范數據的能力,也要讓用戶充分了解圖書館開展智慧服務涉及的“數據隱私”技術與策略。在權利賦予方面,圖書館等機構如果能在“數據共享”過程中給予用戶多渠道選擇權利,讓用戶能夠支配與自己相關的數據,也可避免用戶對“數據隱私”問題的擔憂。圖書館、用戶等“數據隱私”意識的提升,是適應互聯網智慧服務發展的重要表現。此外,行業自律是智慧圖書館在大數據隱私法律尚未立法前提下指導圖書館數據規范的有效方法之一,完善圖書館數據使用的行業自律規則,約束、規范數據使用行為,能夠避免“數據隱私”因“數據共享”造成的用戶隱私泄露,從而構建安全、穩定的智慧圖書館運營環境。
2019年,國家互聯網信息辦公室發布《數據安全管理辦法(征求意見稿)》,[22]強調了用戶的選擇權,而當前大多數國內圖書館都未建立規范化的用戶隱私保護制度。圖書館“智慧”的基礎是通過對數據的使用獲取應用價值,感知用戶所需,開展針對性的服務。然而,這些都建立在對業務系統等用戶互聯網行為數據收集、分析與挖掘的基礎上,必然涉及到用戶數據隱私問題。現有的數據保護法律建立在經濟合作與發展組織(Organization for Economic Co-operation and Development,OECD)發布的數據保護指南基礎上,主要圍繞五項原則制定: 數據收集的目的單一性、數據主體擁有數據使用的知情權、用戶數據的使用必須經過用戶同意或者法律允許、用戶數據的準確性、數據保存具有周期性。[23]《中華人民共和國網絡安全法》《信息安全技術 個人信息安全規范》以及歐盟的《一般數據保護條例》等法律、標準都為智慧圖書館數據的規范化使用提供了依據。
數據體量越大、維度越高,越可以分析出較為準確的結果,得到較高的應用價值。然而,多維度獲取用戶數據時可能存在的數據安全問題令用戶擔憂。圖書館可建立高效、透明的數據共享機制,一方面讓用戶擁有個人數據被如何使用的知情權,另一方面賦予數據價值發掘過程的透明性。在將用戶作為弱勢保護群體認知的基礎上,告知用戶數據被收集的內容、使用范圍、可能的去向、機構組織承擔的風險、用戶的權利與義務等,在業務穩定發展的基礎上,逐步賦予數據主體(用戶)對相關數據的決定權。
用戶、館員以及相關人員數據素養的提升,有助于增強其數據隱私意識,客觀分析互聯網隱私泄露事件,動態調整數據隱私觀念,結合業務解決具體的問題。培養用戶、館員的數據素養有助于增強用戶在使用智慧圖書館業務系統時的隱私保護意識,也有助于館員在使用用戶數據過程中,注意以業務相關數據為基礎進行收割、清洗無關數據,既提高了數據價值,也降低了隱私泄露風險。數據素養、倫理教育是從人的角度形成的適應大數據環境主體的自律能力訓練,需要融合業務從多途徑開展數據倫理教育,提升用戶及館員等主體的技術倫理能力。
智慧圖書館在業務設計與服務過程中,需要統一用戶價值與機構價值,與用戶在數據隱私問題上達成共識。構建數據價值共享平臺的目的是解決業務實施的具體問題,以業務發展為契機,將智慧服務的利弊權衡告知用戶,力爭使圖書館、用戶在數據價值方面保持一致,減少用戶與圖書館在數據隱私方面的矛盾。智慧圖書館業務設計、實施與開展需要圍繞用戶需求展開,讓用戶接受該業務并產生共同的價值,以降低用戶數據隱私泄露風險,同時實現提升用戶數據安全技術能力、養成良好的上網習慣和行為、從自我保護角度增強數據保護意識的雙贏局面。
數據決策是智慧圖書館開展服務的基礎,而智慧服務的對象是用戶,因此智慧圖書館業務設計過程需要融入倫理決策點。圖書館數據使用規范化制度的建立可以讓用戶了解數據的收集、使用及去向,圖書館與用戶可以通過訪談、問卷調查等方式,尋求服務效率與隱私保護利益平衡的倫理決策點,達到觀念上的一致,緩解“數據共享”與“數據隱私”所帶來的矛盾。由于數據控制者(圖書館)與數據主體(用戶)在對數據的認識方面往往只從自身利益出發,很難從中找到平衡點,這就需要借助于第三方機構進行評估、調查,從中找出合理化的倫理決策點。首先,采用問卷調查等方式與用戶溝通,知其所想;其次,對調研結果進行分析、處理與評價,評估業務的實施與用戶的價值觀是否一致;再次,融合圖書館業務與用戶所想、所需,確定兩者能接受的價值程度;最后,依據決策結論指導圖書館進行隱私政策的制定。智慧圖書館的數據共享活動必須遵循權利與責任相統一的原則,同時要讓數據主體(用戶)擁有知情權。