〔摘 要〕[目的/意義]在高校圖書館學科服務中,運用多種手段獲取讀者信息行為數據,用以數據挖掘和信息推送服務,提高了信息服務效率,可能無意侵犯了讀者隱私。[方法/過程]高校圖書館信息服務獲取讀者信息行為過程中,采用信息混淆隱私保護策略,同時引入第三方認證技術,設計并實現讀者隱私保護模型,避免在信息服務中對讀者隱私的侵犯。[結果/結論]探討出技術與制度相結合的讀者隱私保護策略模型,應用于高校圖書館讀者數據規范管理。
〔關鍵詞〕網絡信息;讀者隱私保護;圖書館;信息服務
〔中圖分類號〕G250.73 〔文獻標識碼〕A 〔文章編號〕1008-0821(2016)06-0119-05
〔Abstract〕[Purpose/significance]In the university library subject service,using a variety of means to obtain the reader information behavior data,data mining and information push service,improved the efficiency of the information service,may inadvertently violated the reader privacy.[Method/process]Information service for readers of university library information behavior in the process,the confused information privacy protection strategy,at the same time introducing the third-party certification technology,designing and implementing the reader privacy protection model,avoid to invasion of privacy in the information service.[Result/conclusion]Discussed the combination of technology and system reader privacy policy model,applied in the data management of university library readers.
〔Key words〕network information;readers intimacy protection;library;information service
1 網絡隱私概念與侵犯現狀
通常說互聯網改變商業模式,商業模式改變生活方式,人類與教育,醫療,文化,出版,物流,旅游等公共服務行業的聯系更加緊密[1]。人類生活涉及網絡的點點滴滴,隨著物流體系實名認證條例以及移動運營商實名細則實施,用戶已經無法做網絡背后的隱身人,個人信息泄露等一系列問題也會隨之發生。不法分子利用網絡盜取用戶的賬號,進行一系列詐騙等犯罪活動,給人們的生活帶來很多不必要的麻煩。金融業涉及用戶隱私保護,主要從資金安全保護考慮。互聯網改變了商業支付模式,支付寶等個人商業支付模式在方便用戶購物等行為的同時,資金賬戶安全也逐步被日益重視起來,如2015年12月28日上午,中國人民銀行正式發布了《非銀行支付機構網絡支付業務管理辦法》,新規意在保護用戶隱私[2]。支付機構應以“最小化”原則采集、使用、存儲和傳輸客戶信息,并基于征求意見稿增加了不得存儲客戶銀行卡磁道或芯片信息的規定。然而隨著一些特殊的監測要求,有些場合需要對網絡用戶進行一定的監控以防止一些危險的事情發生,如歐洲多國擬增強網絡監控應對威脅或犧牲民眾隱私[3]。互聯網隱私保護,不僅是監管機構需要加強網絡管理,而且需要用戶自身加強隱私防范。網絡用戶也需要具備加強隱私的保護意識[4]。在社會網絡中,用戶隱私保護不僅需要網絡管理部門,如公安部門,網站管理部門等機構制定協同保護機制,而且也需要用戶采用安全策略對自身核心信息進行規避,如身份證信息,銀行卡信息等。總之,個人安全已經突破傳統的安全領域,信息安全也是未來安全領域中重要組成部分之一。圖書館管理著大量的讀者個人信息,圖書館各種資源與服務系統中也記錄著讀者涉及個人研究動態與學術思想的數據信息,其信息安全也必須通過技術與制度手段得到有效的保護。
2 高校圖書館讀者信息數據現狀
網絡環境的不斷發展,已經逐漸形成具有社會特色的網絡社會,如微信朋友圈,微博空間等已經逐步形成一定網絡社會空間。高校圖書館在網絡化信息化的環境下,為了滿足讀者的網絡偏好,建設了微信圖書館,移動圖書館等符合讀者使用習慣的互聯網應用平臺。高校圖書館作為高校的專業文獻資源保障部門,提供著讀者所需的教學與科研文獻資源。信息技術發展促進資源的數字化水平的提高,互聯網也拓寬了讀者獲取資源的途徑。數字圖書館多年來的發展,不僅在圖書館技術應用水平得到提升,也在一定程度上促進了資源數字化的發展。數字資源也逐漸提高在資源體系中的地位。長期以來數字資源類型存在差異,音頻、視頻、電子圖書、電子期刊等格式,并且存在資源供應商的不同,圖書館暫時無法對數字資源進行有效的統一管理。現有主要的圖書館管理系統中,也缺乏數字資源管理模塊,導致了高校圖書館在復雜的網絡環境下,無法對讀者利用數字資源等信息進行有效的統計分析。部分館員和圖情界學者針對讀者資源獲取方式、資源獲取的內容以及途徑在技術和策略方面做了理論與實踐性的研究工作。最初研究的目的是為了準確獲取讀者信息需求數據,保障圖書館能夠在有限的資源經費情況下,采購讀者所需的資源,提高圖書館的資源利用率。例如運用網絡日志分析的方式對讀者使用數字資源的情況進行統計,得出數字資源的利用率數據,從中分析出讀者信息行為,挖掘需求動態信息[5-7]。數字圖書館建設至今形成了多種系統并存的狀態,如門禁系統、無線網絡系統、座位管理系統、圖書館管理系統等,各種系統在運行過程中,一般會以日志的形式記錄讀者訪問信息,可以利用這些信息進行數據關聯的方式得到讀者在圖書館的信息行為數據,得出讀者的行為軌跡。數字圖書館系統組合運行,為資源與服務網絡化服務提供了方便,同時能夠吸引讀者利用圖書館進行教學與科研的資源獲取。高校圖書館提供的各種系統主要分為資源類系統和服務類系統,如表1所示:
針對這些得到的數據進行挖掘,可能會得到一些涉及讀者思想行為與學術動態等內容的信息,但是過渡挖掘其中的數據信息,也許已經涉及侵犯讀者隱私等問題[8]。在系統運行過程中產生日志等涉及讀者隱私數據,一般通過對這些數據進行挖掘,才能夠圖書館資源建設與讀者服務的指導性信息,利用這些信息運營圖書館,才能夠提高圖書館的服務效率,迄今為止在利用圖書館讀者行為數據的過程中,暫時還未規范建立一套針對讀者數據安全的隱私保護機制。本文以高校數字圖書館的各種系統數據為研究對象,提取出與讀者信息行為數據相關的日志的保護方法和策略進行研究,實踐探討高校圖書館可行性的讀者信息保護機制模型。
3 讀者網絡信息行為與隱私保護
由于互聯網的普及,改變了讀者獲取信息的方式,百度等已經成為讀者主要的搜索工具。在高校圖書館開展以讀者為中心的理念推動下,讀者利用互聯網進行信息檢索等行為,是高校圖書館想要獲取的重要信息之一。高校數字圖書館建設至今,各種信息資源的網絡化與數字化普及,已經能夠滿足現代讀者的資源獲取的習性需求。但是資源的建設成本不斷提高同時讀者需求也存在著多樣化發展,在此背景下也帶來了圖書館改變原有的以資源為中心的圖書館建設模式,逐步向以讀者服務為中心的模式轉變。掌握讀者的信息行為數據,是進行以個性化讀者服務的關鍵基礎。資源獲取方式互聯網化,與傳統的資源檢索形式相比,顯示出其高效性、便捷性。讀者獲取信息的方式已經離不開互聯網的支持。在網絡環境復雜化與讀者資源獲取習性的背景下,高校圖書館也逐步嘗試運用新的技術獲取讀者信息動態以及資源動態信息。數字資源在互聯網中多媒體應用的大環境下,已經逐步被廣大讀者所認可。由于數字資源的內容以及供應商不盡相同,資源的品質與服務也逐步被圖書館所關注,同時數字資源利用率統計數據等也逐步被用以評估數字資源效益。部分圖書館技術部門和一些軟件開發者設計并實踐了針對數字資源的統計分析系統,該系統不僅能夠統計分析出數字資源的利用率詳細情況,如訪問的數據庫類目,訪問、瀏覽、下載的數字資源名稱、類型等,而且能夠通過訪問情況獲取到讀者的詳細信息,如班級、姓名、研究內容和研究方向等信息。紙質資源的統計分析可以利用圖書館管理系統對讀者用戶的借閱行為監測,例如通過對讀者借閱數據信息能夠獲取到讀者階段性研究方向與信息行為。紙質資源的管理系統,是一個相對封閉的系統,如匯文系統等。讀者信息行為數據需要通過圖書館管理用戶登錄獲取,與各種服務系統之間的關聯性不夠順暢。在圖書館管理系統中進行紙質資源的讀者借閱行為分析一般是在系統內部進行,例如統計一定時間內讀者借閱量等數據信息。圖書館中多系統整合不僅利于統計分析的方便,同時也降低了系統的管理成本。將業務相關的系統進行關聯,通常利用數據接口形式進行,在一定程度上達到部分功能整合的目的。在多系統整合與數據關聯,挖掘其中讀者相關的數據信息,不能夠有效的控制系統之間的數據的穩定性與安全性,也會出現讀者隱私數據泄露以及系統崩潰的情況出現。所以,在當前圖書館比較關注系統整合,異構系統數據關聯整合環境下,雖然方便了管理者對系統管控,但是也在一定程度上對讀者信息數據隱私侵犯。所以,在圖書館實際工作需要條件下,根據所需關聯獲取有關的數據信息,避免核心無關的數據截取,從數據挖掘的根源規避對讀者隱私的侵犯。
4 數據隱私保護策略規劃
高校圖書館應用系統建設在校園網范圍內,并且系統之間存在著獨立性,不同系統之間的數據標準也不盡相同,如果不建立數據接口對相關系統進行關聯,系統中數據的安全系數較高并且處于穩定的狀態。近些年來,圖書館為了各種業務需求,將業務相關的系統進行數據關聯,在此過程中也帶來了一系列數據安全性問題。系統之間的關聯主要目的就是方便對不同系統之間目的數據進行采集,用以后續的數據挖掘、分析,獲取對圖書館有用的讀者信息需求動態數據信息。由于讀者在系統中的信息行為等數據本身就已經涉及讀者隱私問題,如何保護這些數據不被圖書館用作信息服務以外的用途,是圖書館技術人員與管理者所需要思考的問題。圖書館需要通過制定制度來規范讀者數據的利用,主要圍繞以下4點來進行逐一制定策略。
4.1 提高數據采集精度
高校圖書館為了滿足學科服務需要,運用技術手段采集讀者信息行為數據,并對信息行為數據進行分析,得到讀者資源需求并匹配相關資源推送給讀者,從而達到提高圖書館資源利用率的目的。例如利用微信圖書館和移動圖書館等平臺進行信息的定點推送。圖書館在數據采集過程中,由于參數設置不夠完善,標準不夠明確,會導致許多無關學科信息也同時被采集,不僅增加了數據清洗的工作量,并且也容易泄露讀者信息。所以,在數據采集過程中,必須要優化采集參數設置,例如關鍵詞等,做到采集精度的提高,保障數據采集的準確性與高效性,也避免對讀者隱私的泄露風險。
4.2 研究數據采集法規
讀者信息、讀者數據、讀者隱私這些不同的說法一直長期存在,如何界定之間的關系,需要從法律法規方面進行討論。數字圖書館建設至今,資源數字化和管理數字化程度不斷提高。管理數字化系統的管理對象為讀者以及與讀者相關的資源。系統運行過程中,就會時刻產生系統日志,其中難免會涉及讀者數據信息,如何保證該信息不被不法分子所利用,不僅是技術保障的問題,而應該是制度與技術同時制定策略,在達到保障信息服務工作目的的同時又能夠有效保護讀者隱私目的。我國沒有制定單獨的個人信息保護法律和法規,相關法律和法規也只是針對姓名、肖像權、名譽和隱私等權利[9]。在相關信息保護基礎上,建立適應高校圖書館的數據采集制度,是圖書館管理者所要考慮的問題。可以適當在資源與服務項目服務過程中,以告知的方法讓讀者知曉相關權利和義務。具體原則性內容包括以下5點:
(1)圖書館與讀者之間的建立知情與同意原則。圖書館在信息服務過程中,明確告知讀者的信息將被采集、處理、并且被利用等情況,并征得讀者同意。
(2)圖書館必須告知讀者信息利用的目的用途。圖書館在信息服務過程中,要解答讀者關于信息服務工作中,讀者信息采集的目的與用途,以打消讀者存在的顧慮。
(3)圖書館遵循信息質量和安全保障的原則。圖書館在獲取讀者信息數據過程中,必須準確獲取數據的字段信息,剔除無用數據信息,在一定程度上保障數據的安全。
(4)圖書館遵循讀者信息保密義務。圖書館在讀者信息管理與數據挖掘過程中,不能散布、出售和非法利用讀者的信息,否則應該承擔相應的法律責任。
(5)應急機制例外原則。如遇到政府等行政機關以及安全政法機關在遵照相關規定的前提下,提取圖書館系統讀者數據,應允許政府等執法機構維護管理職責中合理使用。
4.3 建立匿名模型體系
高校圖書館的服務對象較為固定,可以劃分為教師讀者和學生讀者。高校中為了方便人員管理,往往建立類似于人員編號的管理方法。如教師有教師工號,學生有學號等。所以,可以建立以讀者代號的方式隱蔽讀者敏感信息的方法,既可以讓圖書館時刻掌握讀者的學術動態,也可以在一定程度上避免讀者真實信息外泄。由于讀者的工號或者學號的惟一性,可以用作系統關聯的字段進行系統集成。通過讀者的工號或者學號取代讀者的真實信息,用以分析讀者的學術動態的匿名模型體系,從管理角度,利用現有的讀者身份認證體系進行讀者隱私保護,可以避免核心敏感信息的泄露,具體模型如圖1所示:
4.4 多方信息交互信息管理
高校圖書館的讀者用戶個人注冊信息,如果與學校數字化校園關聯,一般是通過第三方的信息交互推送至圖書館管理系統中,例如高校新生報到注冊、新教工注冊等,通過一卡通管理中心將圖書館所需的讀者證件號、身份證號、單位、讀者類型等信息推送至圖書館管理系統中。交互式的方式常用的方法是訪問的控制,第三方信息推送的過程中,按照預先設置的參數和策略進行信息推送,在一定程度上避免了讀者用戶信息泄露的風險。多方信息交互管理的方式,以高校圖書館為例,一般包括圖書館、用戶信息管理方(學工處和人事處)、一卡通管理中心。讀者用戶與各種系統之間信息交互模式如圖2所示。
讀者數據信息集中管理的方式,保證了數據的穩定性與安全性,通過認證與授權方式對讀者用戶的自主權進行管理,也方便了讀者對自身數據的維護。針對系統平臺的數據信息請求,通過訪問授權與訪問令牌結合的方式,保證了系統平臺與讀者信息數據庫之間的通信穩定與安全,系統平臺可以將系統中有關用戶的數據傳遞給讀者用戶信息數據庫,進一步保證數據的安全性與穩定性。高校一卡通的管理模式一般是通過該方式進行管理的。
5 網絡技術隱私保護方法
5.1 采用獨立認證方式
隨著網絡實名制度的普及,網絡中的門戶網站,軟件工具等都需要進行實名注冊登記。采用手機實名認證是比較簡易的方式之一。由于手機實名認證體系較為規范,而用戶通過手機獲取動態驗證碼登錄,是當前比較安全的用戶認證登錄方式之一。高校圖書館在各種系統建設過程中,需要逐步引入獨立認證系統,在規范用戶行為的同時,也避免用戶的隱私泄露等風險。
5.2 采取信息混淆方式
高校圖書館獲取讀者信息的目的,主要是想通過信息追蹤的方式進行學科服務,同時獲取資源動態信息用以指導資源建設。在圖書館各種系統中,獲取的讀者的信息,一般較為精確。按照統計學相關理論進行歸納、統計、分析,個人的動態信息不足以反映客觀事實,所以,通過將海量的讀者需求信息,通過信息混淆的手段進行聚類分析,可以較為準確地反映讀者的信息需求。信息混淆的方式,可以將單個讀者信息模糊化,在這個過程中可以避免讀者的個人思想動態與學術研究泄露。這個方法可以在宏觀層面掌握讀者信息需求,但是對于特定讀者的個性化服務無法實現。
5.3 模糊網絡監控方式
高校圖書館各種系統的異構性,決定了技術人員無法通過同構系統手段獲取相關的數據。通過網絡監控的方法,能夠較為全面的獲取到讀者在網絡范圍內的信息動態,可以較小地受到異構系統的影響。圖書館進行針對性的讀者服務是未來發展的趨勢,針對性的讀者服務前提是獲取讀者的需求。例如讀者通過管理服務系統向圖書館發出信息請求,讀者通過資源系統獲取信息資源數據信息等。所以,部分高校圖書館實踐了網絡監測方法用以時刻掌握讀者的信息行為,其主要原理是在校園網范圍以內,讀者訪問圖書館所擁有的資源信息的行為進行記錄。高校圖書館的讀者群體,一般都有統一的身份識別號,如學號或者工號。網絡監控過程中,讀者訪問的記錄,一般都會被準確記錄,如IP地址信息,實名認證后的姓名等,通過身份識別號的方式取代讀者的核心信息,一方面可以獲取到讀者的信息需求同時保護了讀者的核心信息;另一方面可以精確獲取到讀者的信息需求動態,從而可以進行個性化服務。
5.4 用戶信息中心化管理
多系統綜合運行是圖書館數字化服務的基本模式,在圖書館的多系統服務過程中,涉及讀者個人信息部分,需要建立可信的第三方中心模型進行管理。因此本文在總結讀者信息保護策略前提下,提出讀者信息的中心化管理模式,與圖書館各種系統合作提供可信的讀者個人信息的管理與應用服務。例如在Web服務框架以服務的方式進行封裝應用,并對外發布形成一套跨平臺的Web服務共享體系[10]。
6 讀者信息保護模型與實踐
南京曉莊學院圖書館在與數字化校園的數據對接過程中,優化了讀者數據庫注冊部分。將原始讀者資源庫采用數據對接的方式引入圖書館管理系統中,如條碼號、姓名、單位、身份證號碼、證件號、生效日期與失效日期等。在系統對接過程中,為了規范讀者信息與應用服務數據,需要設計一套讀者用戶信息模型,目的是為了規范讀者個人信息與各種系統語義的標準化。其中包含讀者用戶信息編碼規范,系統之間通信權限的設置模型,讀者信息應用記錄模型等。
6.1 理論設計部分
定義1 中心服務UID為注冊讀者用戶提供惟一的身份識別符,如身份證號、證件號等。讀者用戶身份識別符號集合UIDs={ID1,ID2,ID3,…,IDn},代表了中心服務中n個讀者群體信息的集合。
定義2 服務系統System為各種服務平臺儲存一類讀者信息。Systems={S1,S2,S3,…,Sn},代表了服務系統中由n個系統組成的一類讀者數據的集合。
定義3 權限管理AP為各種系統以及各種讀者的權限進行劃分。如讀者中分為教師讀者和學生讀者,其使用圖書館的權限存在差異性。AP={AD,TID,SID},其中AD表示圖書館管理員,TID為教師讀者,SID為學生讀者。
在圖書館網絡中,讀者用戶信息的編碼規范需要對類型標識、數據格式以及取值范圍進行定義。例如讀者的證件號、性別、出生年月、身份證號碼、登錄系統的密碼等。數據格式的定義如男女分別可以用{“M”,“F”}標識。
所以,讀者的個人信息應用軌跡模型可以用{UIDs、Systems、AP}所示,其中UIDs表示用戶的基本信息,Systems表示讀者用戶在各個系統之間信息行為軌跡數據,AP為用戶的權限。例如AP在讀者用戶權限管理,接受或者拒絕讀者用戶訪問系統,Systems可以用以讀者信息行為統計分析等。
6.2 保護實施部分
讀者用戶信息管理,伴隨著應用的需求,例如微信圖書館、移動圖書館的登錄訪問,只有有效用戶才能夠利用圖書館提供的資源與服務系統。讀者信息服務針對的對象不同,可以分成兩類,第一,以讀者為數據源,即以讀者為研究對象,統計分析讀者的信息行為,例如訪問的數字資源、借閱的圖書、使用過的設備設施、訪問圖書館門戶的頁面等。第二,將讀者信息行為與系統運行數據聯合統計,運用數據挖掘方法獲取應用需求等信息,例如圖書館資源熱點信息、讀者關注較多資源信息、校內讀者研究動態熱點、讀者借閱排行、圖書借閱量、讀者近期研究內容等信息。
高校圖書館一方面需要獲取讀者的信息需求;另外一方面也擔心在此過程中對讀者隱私權的侵犯。在技術引領發展的環境下,高校圖書館利用先進技術的同時,也需要不斷對技術尚未考慮到的人文層面的問題進行修訂。互聯網中的讀者隱私保護也逐步被提升到決策層面來,圖書館也需要不斷完善讀者數據保護策略。高校圖書館在保證圖書館工作正常運行的同時通過技術與制度手段保護信息數據的安全,是圖書館管理職責之一。高校圖書館隱私保護與數據應用模型,如圖3所示。
引入第三方認證方法,能夠保證了數據的真實與可靠性基礎上,能夠保障讀者個人信息的安全。在對讀者信息的抽取應用的過程中,也能夠避免虛假信息對圖書館數據管理與數據挖掘結果的影響。數字資源分析利用與館藏資源分析方面,圖書館能夠從資源利用角度獲取讀者的信息需求。座位管理與門禁管理系統數據方面,也在一定程度上反映讀者對圖書館空間利用的狀態。模型能夠根據不同應用的需求,提供相關的數據,在一定程度上能夠避免無關信息對數據應用結果的干擾,同時也避免過多無關數據泄露讀者個人信息的危險。
7 結束語
高校圖書館屬于專業性圖書館,其工作職責是為高校提供教學與科研服務。隨著讀者教學與科研水平的不斷提高,對資源的要求也隨之提升。高校圖書館在圍繞讀者需求的環境下,采取讀者信息行為跟蹤的模式,應用技術與工作手段獲取讀者的學術動態,研究方向等信息,一方面可以提高學科服務效率,提升資源利用率;另一方面能夠針對讀者進行個性化服務。但是當前高校圖書館往往只注重服務手段,如在讀者畢業季的時候,通過采集讀者系統數據的方式,提供給書單等關聯信息等。缺乏規范性的讀者隱私保護策略措施,缺乏主動告知讀者權利和義務的宣傳。本文通過當前圖書館數據管理與利用的情況進行分析,提出了當前商業運行比較成熟的模型和策略,構建了高校圖書館隱私保護與數據應用模型,與廣大讀者共同探討完善。希望在不久的將來,高校圖書館技術工作者在通過技術提升服務的同時,也兼顧相關法律法規政策的制定,避免在工作中出現違規乃至違法事情出現。
參考文獻
[1]網絡時代如何守護個人隱私[OL].http:∥tech.gmw.cn/newspaper/2015-12/22/content110298677.htm,2016-01-11.
[2]銀行專家:央行新規意在保護網絡支付客戶個人隱私[OL].http:∥finance.china.com.cn/money/efinance/special/zfglbf/20151228/3518967.shtml,2016-01-11.
[3]歐洲多國擬增強網絡監控應對威脅 或犧牲民眾隱私[OL].http:∥news.163.com/15/1225/09/BBM22H2D00014JB6.html,2016-01-11.
[4]專家談2015網絡安全形勢 建議網友強化隱私保護意識[OL].http:∥society.people.com.cn/n1/2016/0105/c1008-28015257.html,2016-01-11.
[5]王政軍,董曉梅,俞小怡.基于旁路監聽的數字資源評估系統的設計與實現[J].圖書情報工作,2015,(9):52-57,35.
[6]沈奎林,邵波,杜瑾.基于網絡日志分析的數字資源監測系統的實現[J].圖書館學研究,2015,16:21-25.
[7]陸康.高校圖書館數字資源統計系統建設研究[J].現代情報,2015,(9):140-145.
[8]常雅紅.網絡信息監控環境下圖書館用戶隱私保護探究[J].圖書館學刊,2015,(11):36-38.
[9]張凌利.論我國個人信息在網絡環境下的法律保護[D].合肥:安徽大學,2010.
[10]王晗,張玲.面向個人信息管理的網絡隱私保護模型研究[J].情報科學,2015,(10):47-51.