林叢辰 方煒
【摘 要】2020年,新冠肺炎疫情的爆發迫使中國打響了阻擊疫情的全民戰爭。大數據技術在中國疫情防控中發揮了重要作用,但因為在使用的過程中涉及大量的個人數據隱私,從而引發了公眾對隱私泄露和被非法利用的擔憂。在此背景下,文章從信息收集、信息存儲、信息使用、信息發布的角度分析了疫情防控背景下數據隱私的挑戰,并對技術性、現實性、個體性等方面的問題根源進行了剖析,最后提出通過加強技術支持及應用、設置信息收集邊界、加強法律體系等方式實現疫情防控背景下的隱私保護。
【關鍵詞】大數據;疫情防控;隱私保護
【中圖分類號】TP309 【文獻標識碼】A 【文章編號】1674-0688(2020)10-0107-04
自新冠肺炎疫情暴發以來,中國采取了多樣化的措施進行疫情防控,其中大數據技術是重要抗疫手段之一。習總書記強調,要鼓勵運用大數據、人工智能、云計算等數字技術,在疫情監測分析、病毒溯源、防控救治、資源調配等方面更好地發揮支撐作用[1]??挂咂陂g,國家利用數據挖掘技術發現潛在感染源、用大數據分析精準摸排涉鄂人員的行蹤;公眾也可以利用大數據平臺,查看自己是否與患者接觸、獲取疫情科普知識。這些應用提高了抗疫的精準度和效率,減少了不必要的人員接觸和開銷,為公眾做好自身防護起到了積極的作用。
與此同時,在疫情白熱化階段,普通民眾對于政府緊急權力使用的片面解讀導致了民眾普遍的恐慌心理,這一心理在媒體不實報道的催化下持續發酵,導致網上隱私泄露事件頻發,例如小區住戶(醫護人員和患者)的個人信息被深度挖掘、公開,武漢的返鄉人員信息泄露等。隱私若被不法之人竊取利用,一方面可能造成普通群眾的經濟損失或者權利受到侵害[2],例如詐騙分子對患者售賣假藥、個人在工作和生活中遭受歧視;另一方面抗疫醫護人員隱私的泄露,不僅影響醫護人員的個人生活,而且可能造成社會輿論的混亂。因此,公眾產生了對數據隱私泄露的擔憂。
疫情防控背景為大數據隱私保護帶來了挑戰,主要體現在以下幾個方面:{1}個體信息授權、信息使用授權等級、隱私侵權行為難界定;{2}技術保護不全面;{3}公眾知情權和隱私權沖突。本研究以疫情防控背景為依托,分析大數據隱私保護的挑戰及深層原因,并結合中國國情提出具體保護方案,為隱私保護技術應用、公眾隱私保護、相關法律體系完善提供新的思路。
1 疫情防控背景下大數據隱私保護的挑戰
隨著大數據技術應用越來越多,隱私保護也變得更加困難,隱私管理的每個階段都會面臨更大的泄露風險。劉雅輝教授將個人隱私信息管理過程分為個人隱私信息的收集、存儲、使用及發布[3]。面向階段的全過程分析更具有邏輯性,能夠更全面地分析問題。因此,本文按階段順序分析疫情帶來的隱私保護挑戰:①在收集階段,如何收集信息才能保護隱私;如何界定侵權行為。②在存儲階段,如何選擇技術保證信息不被非法訪問、竊取。③在使用階段,如何保證用戶的授權,如何確定授權等級。④在發布階段,如何平衡公眾知情權和個人隱私權。
1.1 收集階段的挑戰
大數據的常見特征包括大規模和多樣性,意味著需要收集大量不同類型的個人信息,那么應該如何收集信息?政府收集的信息是否構成侵權行為?
如何收集信息,分為誰能收集信息和應該收集什么信息。現階段存在規定不明確、執行不徹底的問題?!蛾P于做好個人信息保護利用大數據支撐聯防聯控工作的通知》(簡稱《通知》)要求:除授權的機構外,其他任何單位和個人不得以疫情防控、疾病防治為由,未經被收集者同意收集使用個人信息;收集聯防聯控所必需的個人信息應參照國家標準《個人信息安全規范》,堅持最小范圍原則[4]。一方面,《通知》中只指出法律依據,并沒有指明哪些組織可以收集信息,查詢具體授權機構也費時費力,具有模糊性。另一方面,最小范圍原則限定了收集信息的方向,但并沒有建立一個可執行的標準。事實上,許多小區、個體商戶在疫情防控期間收集了進出人員的個人信息,包括姓名、手機號、身份證等,公眾對此產生了擔憂。如果公眾因擔心自身隱私安全而拒絕提供信息,將不利于后續信息采集和相關措施推進,人員的定位也將產生困難。
政府收集個人信息的行為存在倫理問題。疫情暴發以來,各省先后啟動重大突發公共衛生事件一級響應,為政府行使特殊權力打下了合法性基礎,政府在信息收集時擁有更大的主動權,根據《傳染病防治法》第一章第十二條規定,在中華人民共和國領域內的一切單位和個人,必須接受相關部門的調查并如實提供有關情況。與之相對應的公眾作為信息載體,對隱私的支配能力就受到了限制[5]。例如,國家收集了公眾交通出行、移動通信、在線支付等領域中涉及個人隱私的海量數據,為疑似病例的搜索提供技術支持[6],但是國家沒有告知信息擁有者。在這種情況下,存在公共利益與個人利益的矛盾,目前的法律難以準確界定是否侵權。
1.2 存儲階段的挑戰
隨著時代發展及技術進步,信息數據越來越重要,其潛在價值讓許多不法分子通過販賣個人隱私數據牟取暴利,數據庫被攻擊的次數陡增。同時,在疫情防控背景下數據存儲量成倍增長,不同層面都面臨著信息存儲挑戰。
政府層面,疫情防控期間信息量大、工作緊迫,政府從企業招募了大量的技術團隊進行大數據技術開發與運維,但存在培訓不完善、人員素質參差不齊的情況。在政府內部進行數據存儲的過程中,政府缺少專業團隊管理、安全維護意識差、管理經驗薄弱、隱私保護技術難以與時俱進。企業層面,雖然企業的隱私保護意識更高,也會主動選擇更好的隱私保護技術,但是企業中會有人為了個人利益,選擇了監守自盜。社會上關于“信息罪犯”的新聞很多,比如2016年“京東”內部員工私自登錄后臺數據庫,竊取數據庫存儲的大量客戶信息[7];2017年國泰君安某經紀人盜取存儲在銀行信息系統的百萬客戶信息。個人層面,信息的非法收集導致信息存儲渠道不合規。商家、小區物業收集的信息缺少合適的渠道存儲,信息收集后由各個門店負責保管,對于信息的處理,目前有關部門沒有明確的規定。同時,由于個人隱私保護意識薄弱,容易將數據泄露或售賣,所以具有極大的安全隱患。
以上分析中的漏洞,容易給黑客可乘之機,以各種攻擊手段非法入侵數據庫,從而獲得包括醫療數據、家庭住址、聯系方式等個人隱私信息,造成嚴重后果,例如患病記錄、過往病史等信息的泄露可能造成個人在工作和生活中受歧視、對身心健康產生影響。家庭住址、姓名、聯系方式等信息的泄露可能導致網絡詐騙、惡意要挾等非法行為,侵害公民的財產安全和生命安全。
1.3 使用階段的挑戰
在信息使用的階段,存在信息共享未征得個人同意、數據授權難界定的挑戰。
政府使用信息時,一般會將信息共享給技術團隊,但信息共享本質上也是一種個人信息的收集行為。在信息共享的過程中,政府難以獲得所有用戶的授權并讓用戶知情信息的具體使用場景,若實施全授權也會浪費大量的時間和精力,數據共享給企業后,難以追溯數據的具體使用場景。
隱私信息的界定困難,導致數據授權陷入困境。涉及標識性較強的信息例如身份證號、姓名等需要進行更高級別的數據脫敏。若只需要使用標識性較弱的信息,則進行低級別的脫敏。然而數據類型復雜多樣,隱私信息的范圍難以確定。例如:為結構性數據定義隱私范圍,需考慮個人性格、特點、背景等因素。對于非結構性數據,若隱私范圍定義不當,個體會被黑客通過數據挖掘定位,侵犯隱私。
個人授權困難、數據追溯不便、隱私難以界定等挑戰讓信息隱私層級和脫敏程度難以界定,信息使用階段的統一標準就很難建立。此時進行數據共享,會帶來隱私泄露的風險。
1.4 發布階段的挑戰
信息發布階段,政府保護個人隱私的義務和公眾知曉疫情信息的權力發生了沖突。
若注重保護隱私權,則侵犯了公民知情權,導致社會混亂。政府作為實現知情權的重要渠道,應擔當起信息透明的職責,向社會公布所掌握的信息,尤其是在疫情期間。一味地隱藏個人信息侵犯了公民知情權,政府需要承擔相應責任。同時對信息了解越多可以帶來更多安全感,若公民無法準確得知居住半徑內是否有疑似病患,將導致公民對信息的主動探尋,引發隱私泄露。
若注重保護知情權,則侵犯個人隱私權。政府迫于輿論,為了防止公眾不必要的恐慌,部分政府報告和公布疫情信息時同時發布了多類指向性的信息。這些信息很容易被關聯到患者本人,易被用于鎖定患者個體,侵犯隱私權。
沖突導致各省發布標準難以統一,出現亂象。例如,天津發布了88.4%確診病例居住區域信息,而上海、廣東等地不發布。青海發布了70.6%病例的重點地區接觸史信息,而湖北、西藏等地不發布;吉林發布了59.3%確診病例的交通工具概述,而北京、湖北等地不發布。
對于將要發布的數據,為了保護隱私就隱藏所有的數據是不明智的,數據價值則無法體現。如何兼顧數據效用和保護個人隱私的問題亟待解決。
2 疫情防控背景下大數據隱私泄露根源探究
以上提出大數據隱私新問題可能帶來信任、民生危機等嚴重后果,所以尋找問題的根源并對癥下藥尤為重要。本文從技術性、現實性、個體性等方面對問題根源進行剖析。
2.1 技術性原因:數據化與數據共享泛濫
事實上,數據化為公眾帶來生活便利的同時,人們也在各個數據平臺產生了更多數據,例如支付信息、購物信息、健康信息等,一方面,數據化帶來數據量的指數爆炸,越來越多的組織開始使用數據庫,但配套技術、維護團隊參差不齊,導致數據存儲階段存在漏洞,給不法之徒可乘之機,留下隱私泄露的隱患。另一方面,這為政府收集數據提供了更多渠道,降低了數據收集的難度。例如,政府會收集離鄂人員的通話記錄、交通工具乘坐記錄等,確定密切接觸者時,更隱私的信息有被調用的風險,如通話記錄、家庭地址、身份證號。
大數據本身意味著共享,數據時代的重要特征包括領域之間的數據共享,數據使用階段的隱私失控也從此開始。疫情防控期間政府與電信公司、阿里巴巴等數據平臺共享數據,定位確診患者及疑似病患。數據共享泛濫,放大了隱私界定、授權等問題,也放大了信息保護程度不一帶來的后果,即個人隱私數據也可能被共享,從而被利用。
2.2 現實性原因:數據具有潛在價值
大數據時代下的數據化與數據共享是隱私問題最直接的原因。但數據共享、隱私侵犯的行為需要社會中的主體完成,數據竊取利益鏈條上的各個主體是隱私泄露根源所在,也是數據存儲及數據使用過程中隱私被竊取利用的另一誘因。具有潛在價值是大數據的特征之一,為了追求更大的數據價值,有些人損害他人利益牟利,而他人的利益中可能涉及個人隱私。
進一步分析,用戶與組織的主體利益是矛盾的。用戶以享受個人權利為優先級,同時要求保留個人的隱私,不被他人利用。組織更加關注搜集數據產生的利益,以利益為優先級,因此往往忽略道德訴求,在數據挖掘技術、大數據產品的設計階段即留下了隱私泄露的隱患[8]。
2.3 個體性原因:隱私意識的淡薄
個體隱私觀的改變,是帶來隱私泄露的又一原因。在大數據時代,線上社交、線上娛樂讓人們更愿意分享自己的信息,主觀認為自己的信息沒有利用價值,公眾對于個人隱私的界定越來越開放。信息收集階段,每個人都需要填寫個人詳細信息,例如工作單位、學校、醫院會收集個人信息;信息發布階段,政府公告中常出現涉及隱私的信息。但是,人們對數據共享越認同,隱私意識就越淡、意識到隱私風險的公民就越少,個人隱私信息的泄露更加容易。
3 疫情防控背景下加強大數據隱私保護的實施途徑
既然數據的挖掘與共享不可避免,那么大數據廣泛應用的同時也應該深思:如何通過技術、制度等手段制約疫情防控期間的隱私泄露?
3.1 加強對隱私保護技術的支持及應用
解決數據共享泛濫及數據化帶來的隱私問題,可用更完備的技術保護體系支撐,體系的形成有利于社會隱私標準的統一,從根本上解決問題。疫情防控期間使用數據最多的組織是醫院和政府,從這兩者的角度分析能最大限度地改善技術環境。
醫院可以利用k-匿名模型提升隱私保護能力。k-匿名模型中的泛化、抑制方法可以有效地將直接標識符匿名化?;颊邫n案通常包括直接標識符,直接標識符屬性中的每一個數據都可以精準指向個體[9]。泛化將數據模糊化,例如將生日中的月、日消除。抑制是在發布數據時隱藏數據的屬性[10]。k-匿名模型處理后的每一個元組的主體信息和其他k-1個元組具有相同的準標識符屬性,無法區分,通過調節k參數控制隱私程度,達到保護隱私的目的。若對每一個屬性匿名程度要求較高,還可以采用l多樣化規則、k-map規則及(k,1)-anonymity模型[11]進行身份信息的精細保護[12]。
政府可以借助區塊鏈技術提升隱私保護能力。區塊鏈本質是一種塊鏈數據結構,具有可溯源、去中心化、不可偽造篡改等特點,為數據共享提供有效的保護機制。利用區塊鏈技術完善信息系統,推動政府各部門及合作企業的統籌兼顧,消除信息不對等的現狀[13]。同時,區塊鏈技術對數據訪問進行權限限制,只有有公鑰和私鑰才能進行數據庫訪問,公鑰是政府高層的訪問權,私鑰是政府工作人員或企業的訪問權,防止工作人員隱私保護意識不足導致信息泄漏。
3.2 設置信息收集與發布邊界
大數據時代帶給人們更多生活便利的同時,也記錄了每個人的生活軌跡,這是我們無法避免的。政府在數據處理的過程中可以進行加密,個人也可以在源頭上減少敏感信息的收集。例如,取消收集個人身份證號,降低收集定位、地址等數據的精度。政府在公布患者信息的同時也需限制邊界,可以選擇只公布返鄉人員流動數據,確診患者可選擇只公開確診日期、大致區域、發病癥狀等敏感屬性較弱的信息,而不應公開姓名、年齡、身份證號碼、電話號碼、家庭住址等。對于確診或疑似病例所在地區的公眾,可公開確診或疑似病例的大致居住區域,滿足此類公眾對防控需求的知情權,不必公開其具體的個人信息。邊界的設定不僅讓公眾具體了解了自己身邊的患病情況,也保護了個人隱私。
3.3 加強法律體系的建設
疫情防控期間國家對個人數據的收集增加,可能加重群眾的隱私擔憂,這個階段也是完善數據隱私相關法律的契機。法律的完善和普及將加強個人的隱私保護意識,法律條例的明晰能讓不法之徒認識到隱私竊取的嚴重后果。
國家可以在隱私保護法律的基礎上,構建出可以解決大數據技術發展挑戰的法律體系。例如,在信息存儲階段,加強信息盜竊的法律建設和監管力度,保證數據庫中的用戶信息安全。著重防止數據被商業利用[14],并保證任何工作場所都必須遵守這些數字隱私條款[15]。在發布階段,患者的個人信息會被收集為醫療大數據、被新聞報道,需要考慮到患病歷史可能影響患者的生活和就業等?!氨贿z忘權”的立法可以解決患者的后顧之憂[16],即用戶有權要求刪除關于自己的數據。相關法律的完善能阻止不法之人鉆法律漏洞,是防止隱私泄露最堅實的屏障。
參 考 文 獻
[1]肖擎.更好發揮數字化抗疫作用[N].人民日報,2020-03-19(5).
[2]尹裴.大數據云計算背景下保護個人隱私信息的重要性及安全協同保護機制的研究[J].中國集體經濟,2019(21):159-160.
[3]劉雅輝,張鐵贏,靳小龍,等.大數據時代的個人隱私保護[J].計算機研究與發展,2015,52(1):229-247.
[4]夏金彪.用大數據防疫要做好個人隱私保護[N].中國經濟時報,2020-02-13(2).
[5]宋藝秋.論突發事件中的個人信息保護[J].河南師范大學學報(哲學社會科學版),2010,37(5):131-133.
[6]陳鵬.大數據對打贏抗疫攻堅戰至關重要[N].學習時報,2020-03-18(6).
[7]王敏康.從京東與騰訊聯手破獲信息泄漏事件談大數據時代計算機科學在電子信息保護上的應用[J].中國戰略新興產業,2017(12):5-6.
[8]薛孚,陳紅兵.大數據隱私倫理問題探究[J].自然辯證法研究,2015,31(2):44-48.
[9]侯夢薇,蘭欣,邢磊,等.隱私保護技術在健康醫療大數據發布中的應用研究[J].中國數字醫學,2020,15(2):92-94.
[10]史婷瑤,馬金剛,曹慧,等.醫療大數據隱私保護技術的研究進展[J].中國醫療設備,2019,34(5):163-166.
[11]Machanavajjhala A,Kifer D,Gehrke J,et al.L-diversity:Privacy beyond kanonymity[J].ACM Transactions on Knowledge Discovery from Data,2006,1(1):3.
[12]Herber R H,Tonguc K,Jr J W I.Proceedings of the 2009 IEEE International Conference on Data Engineering[A].IEEE International Conference on Data Engineering[C].IEEE Computer Society,2009.
[13]牛宗嶺.利用大數據及區塊鏈技術構建“政府智慧大腦”[J].人民論壇,2019(33):74-75.
[14]Kerber,Wolfgang.Digital Markets,Data and Privacy:Competition Law,Consumer Law and Data Protection[J/OL].SSRN Electronic Journal,10.2139/ssrn.2770479,2016.
[15]Belanger F,Crossler R E.Privacy in the Digital Age:A Review of Information Privacy Research in Information Systems[J].Mis Quarterly,2011,35:1017-1041.
[16]楊立新,韓煦.被遺忘權的中國本土化及法律適用[J].法律適用,2015(2):24-34.