竇悅
摘?要:[目的/意義]大數(shù)據(jù)時代,數(shù)據(jù)價值的進(jìn)一步挖掘與利用對數(shù)據(jù)共享開放的深度和廣度提出了新要求。數(shù)據(jù)加速共享開放使得數(shù)據(jù)應(yīng)用與服務(wù)進(jìn)入到嶄新的階段,在發(fā)揮更大數(shù)據(jù)價值的同時,也暴露出新形勢下個人隱私數(shù)據(jù)的泄露現(xiàn)象。因此,如何保持?jǐn)?shù)據(jù)開放共享與個人隱私保護(hù)的平衡成為大數(shù)據(jù)價值發(fā)揮必須解決的難題。[方法/過程]本文采用文獻(xiàn)研究法總結(jié)近年來國內(nèi)外學(xué)者在數(shù)據(jù)開放共享與隱私保護(hù)領(lǐng)域的相關(guān)研究、主要問題與發(fā)展趨勢,創(chuàng)新性地從不同主體與不同數(shù)據(jù)形態(tài)的隱私泄露進(jìn)行歸納,提出更具操作性的對策建議。[結(jié)果/結(jié)論]針對數(shù)據(jù)共享開放、數(shù)據(jù)應(yīng)用與服務(wù)過程中數(shù)據(jù)的不同形態(tài),從技術(shù)實(shí)踐、管理制度層面提出基于“層次數(shù)據(jù)”與“算法問責(zé)”相結(jié)合的應(yīng)對策略,為探索兼顧數(shù)據(jù)共享開放與個人隱私保護(hù)提供新路徑。
關(guān)鍵詞:數(shù)據(jù)共享開放;個人隱私保護(hù);層次數(shù)據(jù);算法問責(zé)
DOI:10.3969/j.issn.1008-0821.2021.07.015
〔中圖分類號〕G203?〔文獻(xiàn)標(biāo)識碼〕A?〔文章編號〕1008-0821(2021)07-0146-08
Research?on?Strategy?of?Data?Open?Sharing?and?Personal?Privacy?Protection
——Hierarchical?Data?and?Algorithm?Accountability
Dou?Yue1,2
(1.Department?of?Information?Management,Peking?University,Beijing?100871,China;
2.Department?of?Big?Data?Development,State?Information?Center,Beijing?100045,China)
Abstract:[Purpose/Significance]In?the?era?of?big?data,data?value?mining?and?utilization?put?forward?new?requirements?for?the?depth?and?breadth?of?data?sharing?and?opening.The?acceleration?of?data?sharing?and?opening?makes?it?enter?a?new?stage?of?data?application?and?service?which?leads?to?a?new?form?of?personal?privacy?data?leakage.The?balance?between?data?open?sharing?and?personal?privacy?protection?has?become?a?problem?that?must?be?solved?to?play?the?value?of?big?data.[Method/Process]This?paper?summarized?the?research?status,main?problems?and?development?trend?of?domestic?and?foreign?scholars?in?the?field?of?data?open?sharing?and?privacy?protection?in?recent?years?by?using?the?literature?research?method?and?innovatively?summarized?the?privacy?leakage?from?different?subjects?and?different?data?forms?and?then?put?forward?more?operable?protection?countermeasures.[Result/Conclusion]According?to?the?different?forms?of?data?in?the?process?of?data?sharing,opening,application?and?service,this?paper?put?forward?a?strategy?based?on?the?combination?of“hierarchical?data”and“algorithm?accountability”from?the?aspects?of?technical?practice?and?management?mechanism.It?provided?a?new?path?to?balance?the?open?data?sharing?and?privacy?protection.
Key?words:data?open?and?sharing;personal?privacy?protection;hierarchical?data;algorithm?accountability
近年來,數(shù)據(jù)共享開放的重要性及數(shù)據(jù)應(yīng)用與服務(wù)高階應(yīng)用的潛在價值日趨顯現(xiàn)。大數(shù)據(jù)時代,社會生活中的產(chǎn)品和服務(wù)逐漸轉(zhuǎn)變?yōu)閿?shù)據(jù)形態(tài),數(shù)據(jù)資源的應(yīng)用與服務(wù)正在逐步滲透到國民經(jīng)濟(jì)的各個行業(yè)和領(lǐng)域。國家在戰(zhàn)略層面也對數(shù)據(jù)共享開放作出了明確部署:2017年,國家出臺《政務(wù)信息系統(tǒng)整合共享實(shí)施方案》《政務(wù)信息資源目錄編制指南(試行)》等多項(xiàng)政策文件,持續(xù)推進(jìn)政府?dāng)?shù)據(jù)匯聚、共享、開放等,取得了實(shí)質(zhì)性進(jìn)展。但同時,在大數(shù)據(jù)環(huán)境下,個人行為持續(xù)被全景式地記錄成數(shù)據(jù),導(dǎo)致隱私數(shù)據(jù)泄露影響不斷增大。因此,各方對隱私保護(hù)和數(shù)據(jù)安全問題也愈加重視。目前,一些單行的法律法規(guī)里均涉及網(wǎng)絡(luò)隱私權(quán)的保護(hù),例如:《計算機(jī)信息網(wǎng)絡(luò)國際聯(lián)網(wǎng)管理暫行規(guī)定實(shí)施辦法》《全國人民代表大會常務(wù)委員會關(guān)于維護(hù)互聯(lián)網(wǎng)安全的決定》《互聯(lián)網(wǎng)電子公告服務(wù)管理規(guī)定》《全國人民代表大會常務(wù)委員會關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》《計算機(jī)信息系統(tǒng)安全保護(hù)條例》等,2016年出臺的《中華人民共和國網(wǎng)絡(luò)安全法》和《國家信息化發(fā)展戰(zhàn)略綱要》等。特別是國務(wù)院辦公廳印發(fā)的《2018年政務(wù)公開工作要點(diǎn)的通知》明確提出,“要依法保護(hù)好個人隱私,除懲戒公示、強(qiáng)制性信息披露外,對于其他涉及個人隱私的政府信息,公開時要去標(biāo)識化處理,選擇恰當(dāng)?shù)姆绞胶头秶保瑸閿?shù)據(jù)隱私保護(hù)提出了要求,指明了方向,進(jìn)一步完善了個人信息保護(hù)的相關(guān)法律法規(guī)。2020年,第十三屆全國人大常委會第二十次會議發(fā)布《數(shù)據(jù)安全法(草案)》,明確規(guī)定任何組織、個人收集數(shù)據(jù),必須采取合法、正當(dāng)?shù)姆绞剑坏酶`取或者以其他非法方式獲取數(shù)據(jù)。隨著實(shí)踐的不斷深入,數(shù)據(jù)開放共享與個人隱私保護(hù)兩者既矛盾又統(tǒng)一的關(guān)系愈發(fā)凸顯,這就要求更要辯證看待、平衡處理,既充分釋放數(shù)據(jù)流動性價值,又有效控制數(shù)據(jù)流動中的隱私泄露隱患。
1?數(shù)據(jù)共享開放與個人隱私保護(hù)領(lǐng)域國內(nèi)外研究現(xiàn)狀及相關(guān)分析
大數(shù)據(jù)時代,數(shù)據(jù)需求和數(shù)據(jù)價值呈井噴式增長,其內(nèi)生動力推動各方數(shù)據(jù)開放共享的呼聲越來越高。但受制于數(shù)據(jù)安全與隱私保護(hù)等因素,大多數(shù)據(jù)閑置在政府、企業(yè)與社會主體手中,既無法有效開放,也無法釋放數(shù)據(jù)價值,更談不上更廣泛,更有深入的開放開發(fā)。因此,學(xué)界紛紛將焦點(diǎn)轉(zhuǎn)向數(shù)據(jù)共享開放過程中的個人隱私保護(hù)。對此,國內(nèi)外學(xué)者開展了一系列研究。
1.1?研究現(xiàn)狀
數(shù)據(jù)共享開放與個人隱私保護(hù)之間存在眾所周知的矛盾和悖論。在國內(nèi),數(shù)據(jù)共享開放如火如荼發(fā)展,國內(nèi)學(xué)者更多針對圖書館數(shù)據(jù)開放、政府?dāng)?shù)據(jù)開放、科學(xué)數(shù)據(jù)管理展開研究。陸康等[1]分析了數(shù)據(jù)共享與個人隱私之間矛盾與悖論產(chǎn)生的原因,以智慧圖書館為研究對象,提出建立數(shù)據(jù)公開共享機(jī)制,提升數(shù)據(jù)價值透明度、探索合理化權(quán)責(zé)與知情權(quán)利對等原則、加強(qiáng)用戶及館員的數(shù)據(jù)素養(yǎng)和數(shù)據(jù)倫理教育等數(shù)據(jù)倫理體系策略。在開放政府?dāng)?shù)據(jù)領(lǐng)域,陳美[2]總結(jié)了德國開放政府?dāng)?shù)據(jù)中個人隱私保護(hù)的特點(diǎn),提出構(gòu)建完善的個人隱私保護(hù)法律體系、設(shè)立個人隱私保護(hù)機(jī)構(gòu)和職務(wù)、提高個人隱私權(quán)利意識、平衡政府開放數(shù)據(jù)與個人隱私保護(hù)等建議。張曉娟等[3]研究了中美數(shù)據(jù)開放和個人隱私保護(hù)的政策法規(guī),從平衡我國政府?dāng)?shù)據(jù)開放與個人隱私保護(hù)方面提出政策建議。張聰叢等[4]基于開放政府?dāng)?shù)據(jù)生命周期理論,以數(shù)據(jù)流動過程為主線,分析開放政府?dāng)?shù)據(jù)共享階段、使用階段和管護(hù)階段的隱私侵犯問題。丁紅發(fā)等[5]進(jìn)一步基于數(shù)據(jù)生命周期理論,在厘清政府?dāng)?shù)據(jù)開放相關(guān)概念的基礎(chǔ)上,建立了政府?dāng)?shù)據(jù)開放過程模型,分析了各個環(huán)節(jié)存在的數(shù)據(jù)安全和隱私保護(hù)問題,從技術(shù)和管理相結(jié)合的視角,從數(shù)據(jù)安全治理的方面提出若干建議。在具體應(yīng)用領(lǐng)域,王換換等[6]針對區(qū)域健康醫(yī)療數(shù)據(jù)共享及其隱私保護(hù)問題,運(yùn)用隱私保護(hù)理論及系統(tǒng)建模理論,構(gòu)建區(qū)域健康醫(yī)療數(shù)據(jù)共享平臺,針對健康醫(yī)療數(shù)據(jù)的隱私保護(hù)進(jìn)行系統(tǒng)研究。在制度建議方面,也有很多學(xué)者進(jìn)行了研究:杜荷花[7]提出制定與完善平臺隱私保護(hù)政策、構(gòu)建政府義務(wù)告知制度、加強(qiáng)個人隱私安全管理、健全用戶信息權(quán)保障體系等有益啟示。王忠等[8]從利益相關(guān)者視角,針對平衡數(shù)據(jù)挖掘與隱私保護(hù),提出構(gòu)建多元主體協(xié)同治理機(jī)制,針對核心利益相關(guān)者建立競爭性治理機(jī)制,針對直接、間接利益相關(guān)者建立激勵性治理機(jī)制,發(fā)揮重要利益相關(guān)者的主導(dǎo)作用等建議。在科學(xué)數(shù)據(jù)管理方面,司莉等[9]對英美高校科學(xué)數(shù)據(jù)管理與共享政策進(jìn)行內(nèi)容分析,發(fā)現(xiàn)在數(shù)據(jù)安全與保護(hù)方面,只有英國少數(shù)高校科學(xué)數(shù)據(jù)政策對數(shù)據(jù)安全有所規(guī)定,且內(nèi)容較為籠統(tǒng),而美國高校很少出臺數(shù)據(jù)安全與保護(hù)規(guī)定。張閃閃等[10]表示科學(xué)數(shù)據(jù)一般分為禁止、限制、保密和公開4種類型,數(shù)據(jù)隱私保護(hù)應(yīng)當(dāng)根據(jù)數(shù)據(jù)類型進(jìn)行劃分,當(dāng)涉及人類受試者數(shù)據(jù)時,研究者要接受監(jiān)督并使用專門的數(shù)據(jù)搜集工具。
除上述國內(nèi)開展的各項(xiàng)研究外,國外針對數(shù)據(jù)共享開放與個人隱私保護(hù)也開展了較多研究,但整體上看,視角比較分散,主要涉及技術(shù)方法、系統(tǒng)平臺設(shè)計與政府政策監(jiān)管等方面。在Web?of?Science核心數(shù)據(jù)庫里以“Open?Data”和“Personal?Privacy?Protection”對近5年的論文進(jìn)行高級檢索,檢索到238篇文獻(xiàn)。其中部分學(xué)者探討了隱私泄露的風(fēng)險,例如,Kshetri?N[11]分析了數(shù)據(jù)在收集、存儲、分享和獲取過程中出現(xiàn)的安全和隱私問題,認(rèn)為隨著數(shù)據(jù)集規(guī)模擴(kuò)大、數(shù)據(jù)多樣性和復(fù)雜性增加,安全風(fēng)險也將隨之增加;部分學(xué)者則強(qiáng)調(diào)用戶數(shù)據(jù)的應(yīng)用價值,以及個人信息對醫(yī)療、教育等領(lǐng)域的重要意義。如Sánchez?D等[12]認(rèn)為,傳統(tǒng)的個人隱私保護(hù)機(jī)制未考慮個人隱私數(shù)據(jù)需要,提出了以用戶控制為主的個性化隱私保護(hù)的動態(tài)和異構(gòu)開放數(shù)據(jù)共享場景。目前,國外在數(shù)據(jù)開放與隱私保護(hù)方面多傾向于用技術(shù)與管理方案解決。Jaeger?P?T等[13]提出政府應(yīng)該采用中央集中的管理結(jié)構(gòu)來保護(hù)個人隱私,并在政府開放數(shù)據(jù)的背景下提出了7種政府監(jiān)管模式。Hamza?R等[14]認(rèn)為,一維數(shù)據(jù)的傳統(tǒng)加密方式不適用于醫(yī)療領(lǐng)域的數(shù)據(jù)和圖像,提出了一種基于混沌的隱私保護(hù)加密密碼系統(tǒng)。Pei?X等[15]基于區(qū)塊鏈構(gòu)建了UDPP(User?Data?Privacy?Protection)平臺,包括合用模塊和隱私工具集,提供實(shí)用工具。合規(guī)模塊可以幫助企業(yè)在APP和后臺服務(wù)中進(jìn)行隱私政策自檢和數(shù)據(jù)處理,工具集提供多種隱私保護(hù)方案組合,解決不同的隱私保護(hù)和用戶授權(quán)情況。還有一些學(xué)者聚焦數(shù)據(jù)開放與隱私保護(hù)平衡發(fā)展的視角開展研究,Wang?J等[16]提出利用數(shù)據(jù)量化隱私以防止數(shù)據(jù)隱私過度泄露的保護(hù)方案,該方法可有效地描述數(shù)據(jù)隱私在通信過程的實(shí)時波動,為隱私保護(hù)提供可靠判斷,做好數(shù)據(jù)隱私和通信效率之間的平衡。也有學(xué)者指出,目前,學(xué)界對個人隱私保護(hù)的認(rèn)知和范圍界定還不夠清晰明確。Lilian?E等[17]分析了社交媒體領(lǐng)域用戶對隱私的合理預(yù)期,認(rèn)為現(xiàn)有法律法規(guī)尚未給公開社交網(wǎng)絡(luò)提供足夠保護(hù),越來越多的個人數(shù)據(jù)在沒有明確界定隱私預(yù)期的情況下被收集和公開。
1.2?當(dāng)前數(shù)據(jù)共享開放與個人隱私保護(hù)研究的不足
近年來,數(shù)據(jù)共享開放、個人隱私保護(hù)兩個領(lǐng)域的研究都取得了一些進(jìn)展,但如何更好地平衡兩者關(guān)系、怎樣完善制度體系等問題仍存在不足。
從理論研究現(xiàn)狀看,數(shù)據(jù)共享開放與個人隱私保護(hù)存在偏重一方的趨勢。國內(nèi)外學(xué)者對數(shù)據(jù)開放與隱私保護(hù)的研究要么偏重數(shù)據(jù)共享開放,要么過分強(qiáng)調(diào)隱私保護(hù)的重要性,很少從數(shù)據(jù)共享開放與隱私保護(hù)的共生性、協(xié)同性、一體性角度來考慮頂層設(shè)計與具體實(shí)踐。研究重點(diǎn)多涉及政府?dāng)?shù)據(jù)開放、科研數(shù)據(jù)管理、針對某個領(lǐng)域的開放平臺以及圖書館數(shù)據(jù)等方面的隱私泄露與保護(hù)對策問題。研究視角方面,有些單純從政府?dāng)?shù)據(jù)開放的視角或者利用搭建技術(shù)平臺分析隱私保護(hù)問題,未能從數(shù)據(jù)不同掌控方的角度,結(jié)合數(shù)據(jù)階段性形態(tài)特征研究個人隱私數(shù)據(jù)價值的實(shí)現(xiàn)路徑。研究內(nèi)容方面,多從技術(shù)手段、平臺系統(tǒng)設(shè)計、隱私加密、管理機(jī)制以及保護(hù)策略等提出平衡數(shù)據(jù)開放共享與隱私保護(hù)的建議。多數(shù)學(xué)者從政府主導(dǎo)的政策法規(guī)與機(jī)制層面建立管理體系,這種自上而下的以監(jiān)督、審查為主導(dǎo)的設(shè)計在推動和落實(shí)方面存在體制機(jī)制障礙和困難。部分研究基于數(shù)據(jù)生命周期理論,或者與國外政策對比分析,對隱私保護(hù)的落實(shí)與執(zhí)行方面設(shè)計規(guī)劃相對不足。
從政策實(shí)踐進(jìn)展看,政府?dāng)?shù)據(jù)開放與個人隱私保護(hù)領(lǐng)域的制度體系尚不成熟。大數(shù)據(jù)人工智能等新技術(shù)的不斷進(jìn)步導(dǎo)致數(shù)據(jù)共享和開放范圍不斷擴(kuò)大,數(shù)據(jù)隱私保護(hù)等面臨著新形勢,進(jìn)入新的發(fā)展階段,需要新的技術(shù)方法和制度體系來應(yīng)對新問題。目前,我國已發(fā)布的政府開放政策中關(guān)于個人隱私的規(guī)定與具體舉措比較寬泛,如表1所示。多數(shù)政策內(nèi)容均為“在安全保密的前提下實(shí)現(xiàn)政府?dāng)?shù)據(jù)開放”“除涉及國家安全、商業(yè)秘密、個人隱私外,都應(yīng)向社會開放”,數(shù)據(jù)管理流程、技術(shù)及數(shù)據(jù)相關(guān)接觸者隱私保護(hù)等均處于在探索階段,尚未提出明確的具體做法。總的來看,想短期內(nèi)從制度體系與法律層面探索解決數(shù)據(jù)開放共享與隱私保護(hù)平衡問題的路徑困難較大。
綜上,傳統(tǒng)數(shù)據(jù)環(huán)境下,數(shù)據(jù)共享開放與隱私保護(hù)偏重于一方,主要是因?yàn)閿?shù)據(jù)共享開放與隱私保護(hù)的責(zé)任主體不一致,為了能夠免責(zé),很易出現(xiàn)“一刀切”現(xiàn)象。因此,平衡兩者關(guān)系,必須以新技術(shù)、新方法設(shè)計新路徑。筆者認(rèn)為,應(yīng)在頂層設(shè)計階段統(tǒng)籌平衡數(shù)據(jù)共享開放與個人隱私保護(hù)的關(guān)系,更多關(guān)注數(shù)據(jù)開放與隱私保護(hù)的共生性,將開放與保護(hù)緊密結(jié)合起來,不能機(jī)械地割裂開來。
1.3?新數(shù)據(jù)形態(tài)為平衡數(shù)據(jù)開放和隱私保護(hù)帶來更大挑戰(zhàn)
傳統(tǒng)數(shù)據(jù)形態(tài)下,如何平衡數(shù)據(jù)共享開放和個人隱私保護(hù)已經(jīng)是各方所要面對的難題。新數(shù)據(jù)形態(tài)的出現(xiàn)并延伸至數(shù)據(jù)應(yīng)用與服務(wù)階段,出現(xiàn)了很多新問題,也對平衡數(shù)據(jù)共享開放和個人隱私保護(hù)提出了更高要求,亟待探索新思路、新路徑、新模式。目前,數(shù)據(jù)共享開放已不單單局限于原始數(shù)據(jù)、脫敏數(shù)據(jù),開始逐步升級為模型化數(shù)據(jù)、數(shù)據(jù)應(yīng)用服務(wù)接口或數(shù)據(jù)資源集等。但隱私保護(hù)并未及時轉(zhuǎn)型,對升級后的新數(shù)據(jù)形態(tài)暴露出的新隱私泄露問題進(jìn)行匹配和規(guī)范。因此,隱私保護(hù)問題不僅僅存在于掌握數(shù)據(jù)資源的公共部門(即數(shù)據(jù)控制者),還不斷擴(kuò)散到平臺型企業(yè)和社會機(jī)構(gòu)等數(shù)據(jù)應(yīng)用者和數(shù)據(jù)服務(wù)提供者。例如:互聯(lián)網(wǎng)平臺型企業(yè)積累大量個人數(shù)據(jù)匯聚成有價值的數(shù)據(jù)集,卻頻頻被其他數(shù)據(jù)應(yīng)用開發(fā)者利用,導(dǎo)致數(shù)據(jù)濫用現(xiàn)象頻發(fā)。當(dāng)前,針對新發(fā)展階段的新數(shù)據(jù)形態(tài)面臨的問題,部分學(xué)者注重從法律法規(guī)與制度層面研究數(shù)據(jù)共享開放與隱私保護(hù)的政策建議,也有部分學(xué)者嘗試從管理機(jī)制與技術(shù)方法研究平衡二者關(guān)系的方法,這兩種“自上而下”的頂層制度管理設(shè)計在實(shí)踐執(zhí)行中都有一定難度,數(shù)據(jù)濫用與隱私泄露等在數(shù)據(jù)多方流轉(zhuǎn)過程中仍很難避免。數(shù)據(jù)共享開放過程中,個人隱私面臨數(shù)據(jù)控制者、數(shù)據(jù)處理者、數(shù)據(jù)應(yīng)用者等不同主體的泄露與濫用危機(jī)。
2?數(shù)據(jù)共享開放過程中面臨的隱私泄露危機(jī)
數(shù)據(jù)開放共享涉及政府、企業(yè)、信息系統(tǒng)商、用戶等多個主體,形成了基于數(shù)據(jù)采集、處理、存儲及利用等數(shù)據(jù)流轉(zhuǎn)環(huán)節(jié)。及時有效提供數(shù)據(jù)服務(wù)通常涉及政府與科研機(jī)構(gòu)、企業(yè)等主體之間數(shù)據(jù)共享和使用[18],因此,數(shù)據(jù)共享開放過程中的隱私泄露危機(jī)主要存在3個層面:一是政府部門等數(shù)據(jù)控制者對于原始數(shù)據(jù)的共享開放和使用;二是企業(yè)機(jī)構(gòu)等數(shù)據(jù)處理者對于用戶數(shù)據(jù)的爬取、采集與分析;三是個人作為數(shù)據(jù)產(chǎn)品使用者層面在智能APP或設(shè)備應(yīng)用時被默認(rèn)采集使用個人隱私數(shù)據(jù),以及數(shù)據(jù)應(yīng)用者在接觸具備自動處理數(shù)據(jù)功能的信息系統(tǒng),包括:計算機(jī)、手機(jī)、平板電腦、智能電器、網(wǎng)絡(luò)通信設(shè)備、自動化控制設(shè)備等,會無意接觸或泄露其中存儲的個人隱私數(shù)據(jù)。
2.1?數(shù)據(jù)資源所有者:政府?dāng)?shù)據(jù)開放共享引發(fā)個人隱私泄露
大數(shù)據(jù)時代,提高政府部門間協(xié)同運(yùn)轉(zhuǎn)效率,加快智慧政府建設(shè),推進(jìn)政府?dāng)?shù)據(jù)實(shí)現(xiàn)開放共享是一種必然趨勢。隨著開放進(jìn)程日益加快,個人隱私泄露的風(fēng)險和隱患不斷凸顯[19]。政府部門本身掌握大量原始的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)是未經(jīng)加工處理的海量、高質(zhì)量的信息,更新速度快且與社會公眾緊密相關(guān),存在大量高敏感度的個人隱私。2019年12月,山東省高密市住房和城鄉(xiāng)建設(shè)局在公示人員名單時,除公布了人員姓名、所屬居委會、街辦、類別(低保、低收入)外,還公布了公民完整的身份證號碼,明顯泄露了個人隱私。湖南一縣政府官網(wǎng)公示時,泄露危改戶數(shù)千條隱私信息。從數(shù)據(jù)控制者層面看,在數(shù)據(jù)共享開放過程中,政府部門對公民、企業(yè)和社會組織等有關(guān)社保、戶籍、疾控、政策及輿情等海量數(shù)據(jù)正進(jìn)行大規(guī)模的整合、存儲、開放、共享。數(shù)據(jù)一旦泄露,對個人而言可能造成隱私曝光、經(jīng)濟(jì)受損等影響,對政府則可能造成宏觀管理和調(diào)控混亂,甚至可能導(dǎo)致政府決策失誤。
2.2?數(shù)據(jù)應(yīng)用開發(fā)者:企業(yè)多源數(shù)據(jù)碰撞引發(fā)個人隱私泄露
隨著新技術(shù)進(jìn)步和數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,企業(yè)數(shù)字化轉(zhuǎn)型加速,社會數(shù)字化應(yīng)用逐漸興起。除政府?dāng)?shù)據(jù)開放外,掌握公民數(shù)據(jù)的企業(yè)在數(shù)據(jù)處理層面呈現(xiàn)出不同層次的開放水平和不同維度的開放內(nèi)容,存在導(dǎo)致脫敏化數(shù)據(jù)二次泄露的風(fēng)險。例如:運(yùn)營商掌握著大量公民的通信信息,信件、郵箱、電話、聊天記錄;征信機(jī)構(gòu)掌握著個人信貸、繳費(fèi)信息、信用交易信息以及公共記錄信息;公眾的水電等繳費(fèi)不再需要人工處理,而是通過與政府對應(yīng)部門關(guān)聯(lián)的第三方支付手段來處理,這些企業(yè)在處理數(shù)據(jù)時都有泄露個人隱私的風(fēng)險。伴隨互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算和人工智能等技術(shù)的快速發(fā)展,數(shù)據(jù)資源獲取的自動化程度不斷提高,降低人工獲取成本,也進(jìn)一步提升了不同數(shù)據(jù)資源交叉比對、融合關(guān)聯(lián)、深度加工和相互驗(yàn)證能力。因此,一些企業(yè)以商業(yè)利益為目標(biāo),通過搜集手機(jī)個人身份信息、職業(yè)信息、社會交往信息、消費(fèi)交易記錄信息、出行位置等多渠道多維度信息,在原始數(shù)據(jù)基礎(chǔ)上對碎片化數(shù)據(jù)進(jìn)行脫敏處理,形成大量加工后的數(shù)據(jù)。在數(shù)據(jù)共享開放過程中,企業(yè)可以根據(jù)定制個性化的應(yīng)用模型和算法需求任意將二次數(shù)據(jù)加工成為三次數(shù)據(jù)出售。然而,無論在政策層面還是法律層面均未對二次、三次數(shù)據(jù)的開發(fā)利用做出權(quán)益保護(hù)的明確界定。此外,大數(shù)據(jù)、云計算等技術(shù)的進(jìn)步也進(jìn)一步提升了數(shù)據(jù)智能分析層面的能力,二次、三次數(shù)據(jù)進(jìn)行多源匯聚時,用戶畫像、多種數(shù)據(jù)和場景數(shù)據(jù)不斷碰撞將識別出具有個人信息的數(shù)據(jù),存在再次泄露隱私的風(fēng)險。例如,卡內(nèi)基梅隆大學(xué)的Latanya?Sweeney將匿名化的GIC數(shù)據(jù)庫(包含每位患者的出生日期、性別和郵政編碼)與選民登記記錄相連后,可以找出馬薩諸塞州州長的病例[20]。因此,隨著數(shù)據(jù)量劇增和技術(shù)進(jìn)步,數(shù)據(jù)處理者層面的多源數(shù)據(jù)碰撞將給個人隱私保護(hù)帶來新挑戰(zhàn)。
2.3?數(shù)據(jù)服務(wù)提供者:智能化服務(wù)平臺引發(fā)個人隱私泄露
很多政府部門和企業(yè)采用大數(shù)據(jù)的技術(shù)和方法在公共政策的制定和市場運(yùn)營中依靠算法智能決策,例如:在教育、醫(yī)療、司法、保險、金融領(lǐng)域進(jìn)行信用評分評級、趨向分析判定、內(nèi)容推介和量化評價等[21]。個性化推薦算法和人工智能技術(shù)為人們帶來便利的同時也給個人隱私保護(hù)帶來新挑戰(zhàn)。目前,個性化推薦算法技術(shù)成為內(nèi)容網(wǎng)站或者內(nèi)容APP的標(biāo)配,推薦算法在數(shù)據(jù)應(yīng)用階段存在知情同意虛化的問題。社交軟件、商業(yè)購物、地圖導(dǎo)航等各類生活類數(shù)據(jù)需要用戶勾選數(shù)據(jù)獲取及手機(jī)號關(guān)聯(lián)才能進(jìn)行使用。這些數(shù)據(jù)應(yīng)用系統(tǒng)和應(yīng)用場景中內(nèi)嵌了大量個人數(shù)據(jù)。尤其是隨著社交媒體、支持GPS位置定位的應(yīng)用和追蹤、可穿戴設(shè)備的日益普及,多個數(shù)據(jù)平臺的聯(lián)結(jié)能夠使個人的身體狀況、健康信息、運(yùn)動情況等數(shù)據(jù)被鏈接、保留和共享用于其他用途。目前國內(nèi)外對數(shù)據(jù)共享開放與隱私的研究多停留在原始數(shù)據(jù)層面,例如:個人身份信息、職業(yè)信息等,數(shù)據(jù)脫敏僅能保障單一來源或者靜態(tài)數(shù)據(jù)個人隱私數(shù)據(jù)保護(hù),對不同階段數(shù)據(jù)接觸者的整體統(tǒng)籌考慮比較欠缺。隨著大數(shù)據(jù)的深入,動態(tài)信息的匯聚和多源數(shù)據(jù)關(guān)聯(lián)碰撞往往能夠拼裝和刻畫人物全貌,可能會導(dǎo)致新的個人隱私泄露。在個性化數(shù)據(jù)應(yīng)用階段將產(chǎn)生大量基于人工智能技術(shù)的基礎(chǔ)數(shù)據(jù)重點(diǎn)用于算法推薦、測試訓(xùn)練、用戶畫像與特征識別。但是人工智能技術(shù)存在算法黑箱風(fēng)險,算法引導(dǎo)將帶來算法偏見、數(shù)據(jù)權(quán)威等問題。人工智能基礎(chǔ)數(shù)據(jù)也面臨保護(hù)困境。人工智能基礎(chǔ)數(shù)據(jù)“獨(dú)創(chuàng)性”不突出,與原始數(shù)據(jù)區(qū)別度較低,多數(shù)人工智能基礎(chǔ)數(shù)據(jù)只是數(shù)據(jù)的集合與數(shù)據(jù)的簡單標(biāo)注,人工智能基礎(chǔ)數(shù)據(jù)無法進(jìn)入現(xiàn)行法律保護(hù)的客體范疇,數(shù)據(jù)本身也不是專利法保護(hù)的客體。因此,數(shù)據(jù)應(yīng)用階段個人隱私空間還存在未知地帶,用戶對個人隱私保護(hù)的預(yù)期也需重新界定。隱私數(shù)據(jù)不僅局限于傳統(tǒng)的原始數(shù)據(jù)、脫敏數(shù)據(jù)或者模型化數(shù)據(jù),更進(jìn)一步擴(kuò)展到三次數(shù)據(jù)等人工智能化數(shù)據(jù),但就用戶衍生的數(shù)據(jù)尚未形成明確的政策保障。
3?“層次數(shù)據(jù)與算法問責(zé)”:數(shù)據(jù)共享開放與個人隱私保護(hù)問題對策
基于新數(shù)據(jù)形態(tài)下數(shù)據(jù)共享開放與個人隱私保護(hù)問題在數(shù)據(jù)資源所有者、數(shù)據(jù)應(yīng)用開發(fā)者、數(shù)據(jù)服務(wù)提供者3個層面暴露出的風(fēng)險和隱患,本文從數(shù)據(jù)流與管控流同步考慮的視角,采取技術(shù)操作與新制度設(shè)計來平衡數(shù)據(jù)開放與個人隱私保護(hù),既充分利用技術(shù)方法保護(hù)隱私,也強(qiáng)化制度規(guī)則設(shè)計彌補(bǔ)技術(shù)無法解決的難題。具體而言,結(jié)合數(shù)據(jù)開放共享的階段,本節(jié)重點(diǎn)針對數(shù)據(jù)資源所有者、數(shù)據(jù)應(yīng)用開發(fā)者和數(shù)據(jù)服務(wù)提供者遇到的隱私泄露危機(jī),提供從技術(shù)手段與制度規(guī)則融合的視角提出“層次數(shù)據(jù)”與“算法問責(zé)”兩條路徑實(shí)現(xiàn)二者的平衡。在技術(shù)層面通過拆分?jǐn)?shù)據(jù)層次從數(shù)據(jù)資源所有者和數(shù)據(jù)處理者層面對個人隱私進(jìn)行保護(hù);在管理制度層面采取算法問責(zé)的機(jī)制對數(shù)據(jù)處理者進(jìn)行監(jiān)管,同時為數(shù)據(jù)受侵犯者提供算法問責(zé)的途徑,幫助數(shù)據(jù)應(yīng)用者在倫理與制度層面保護(hù)個人隱私。
3.1?新數(shù)據(jù)形態(tài)下層次數(shù)據(jù)與算法問責(zé)的有關(guān)概念
新數(shù)據(jù)形態(tài)是指數(shù)據(jù)共享開放從內(nèi)向外兩個階段下數(shù)據(jù)的不同形態(tài):第一階段包括數(shù)據(jù)共享開放涉及的數(shù)據(jù)和信息,表現(xiàn)為原始數(shù)據(jù)與脫敏數(shù)據(jù);第二階段包括數(shù)據(jù)共享開放的第二階段,涉及應(yīng)用和服務(wù)為主的知識和智能,表現(xiàn)為模型化算法數(shù)據(jù)和智能化服務(wù)數(shù)據(jù)。針對上述兩個階段,分別實(shí)施層次數(shù)據(jù)和算法問責(zé)兩項(xiàng)應(yīng)對策略。層次數(shù)據(jù)是指通過對數(shù)據(jù)的隱私保護(hù)強(qiáng)弱程度與數(shù)據(jù)價值生產(chǎn)進(jìn)行劃分,形成原始數(shù)據(jù)、脫敏數(shù)據(jù)、模型化數(shù)據(jù)與智能化服務(wù)數(shù)據(jù);算法問責(zé)是指為數(shù)據(jù)應(yīng)用和服務(wù)過程中受到不公平待遇的用戶提供問責(zé)路徑,重點(diǎn)通過對算法技術(shù)團(tuán)隊(duì)算法設(shè)計的流程、動機(jī)、應(yīng)用場景進(jìn)行審計,對算法團(tuán)隊(duì)的利益相關(guān)者進(jìn)行采訪,進(jìn)而發(fā)現(xiàn)潛在的算法歧視現(xiàn)象。
3.2?實(shí)現(xiàn)數(shù)據(jù)共享開放與個人隱私保護(hù)實(shí)現(xiàn)平衡發(fā)展的路徑分析
針對上述數(shù)據(jù)控制者、數(shù)據(jù)處理者與數(shù)據(jù)應(yīng)用者三方存在的隱私泄露可能,本文提出基于“層次數(shù)據(jù)”與“算法問責(zé)”的分層分類的應(yīng)對策略框架,如圖1所示。從技術(shù)操作層面來看,依據(jù)數(shù)據(jù)的利用程度及隱私保護(hù)能力將數(shù)據(jù)分為4層,即0次數(shù)據(jù)(原始數(shù)據(jù):數(shù)據(jù)庫訪問和數(shù)據(jù)包傳送)、1次數(shù)據(jù)(脫敏處理數(shù)據(jù):API數(shù)據(jù)市場)、2次數(shù)據(jù)(模型化數(shù)據(jù):用戶畫像、輿情監(jiān)控)和3次數(shù)據(jù)(智能化服務(wù)數(shù)據(jù):特征識別、自然語言理解、機(jī)器學(xué)習(xí)、風(fēng)險預(yù)警等)。層次數(shù)據(jù)重點(diǎn)把數(shù)據(jù)生產(chǎn)過程與數(shù)據(jù)共享開放的階段結(jié)合起來整體考慮。根據(jù)此前分析可知,數(shù)據(jù)共享開放中的隱私泄露主要存在于數(shù)據(jù)共享與開放、數(shù)據(jù)應(yīng)用與服務(wù)兩個階段。其中,數(shù)據(jù)應(yīng)用與服務(wù)階段是數(shù)據(jù)共享開放的第二階段。層次數(shù)據(jù)重點(diǎn)是側(cè)重于應(yīng)對共享開放數(shù)據(jù)過程中隱私泄露的策略,算法問責(zé)側(cè)重于應(yīng)對第二階段中的隱私泄露問題。
3.3?實(shí)現(xiàn)數(shù)據(jù)共享開放與個人隱私保護(hù)實(shí)現(xiàn)平衡發(fā)展具體實(shí)現(xiàn)路徑
3.3.1?數(shù)據(jù)開放與共享階段主要依靠層次數(shù)據(jù)
在個人隱私保護(hù)的第一階段,應(yīng)當(dāng)在數(shù)據(jù)開放與共享的過程中,基于原始數(shù)據(jù)和脫敏數(shù)據(jù)的開放共享制定標(biāo)準(zhǔn)與技術(shù)規(guī)則。首先,在數(shù)據(jù)開放過程前,明確數(shù)據(jù)監(jiān)管流程、數(shù)據(jù)共享開放標(biāo)準(zhǔn)、隱私數(shù)據(jù)備案和控制0次數(shù)據(jù)數(shù)量的條例,由數(shù)據(jù)審核官對可開放共享的數(shù)據(jù)進(jìn)行審核;其次,在開放共享中,應(yīng)當(dāng)明確運(yùn)用何種技術(shù)開放共享和脫敏處理數(shù)據(jù),不同層次和歸屬地的數(shù)據(jù)應(yīng)該開放到什么程度需要形成統(tǒng)一標(biāo)準(zhǔn),重點(diǎn)做好1次數(shù)據(jù)的脫敏處理與隱私保障技術(shù)研發(fā),重點(diǎn)開發(fā)利用新的技術(shù),例如:通過利用區(qū)塊鏈、多方安全技術(shù)等實(shí)現(xiàn)加密保護(hù),或者通過規(guī)范開放數(shù)據(jù)應(yīng)用接口,運(yùn)用模型化數(shù)據(jù)和智能化服務(wù)數(shù)據(jù)提供數(shù)據(jù)共享開放服務(wù);最后,在開放共享后,根據(jù)數(shù)據(jù)層次設(shè)計個人隱私的保護(hù)方法,嚴(yán)格限定此類涉公民個人隱私文件接觸人員范圍,根據(jù)不同層級、不同職責(zé)設(shè)定信息查閱權(quán)限。
3.3.2?數(shù)據(jù)應(yīng)用與服務(wù)階段主要依靠算法問責(zé)
在個人隱私保護(hù)的第二階段,應(yīng)當(dāng)在數(shù)據(jù)應(yīng)用與服務(wù)的階段,明確2次模型化數(shù)據(jù)和3次智能化數(shù)據(jù)使用范疇。根據(jù)保密和應(yīng)用需求開放不用層次的數(shù)據(jù),將二次、三次數(shù)據(jù)以及人工智能化數(shù)據(jù)納入保護(hù)范疇,擴(kuò)展隱私保護(hù)在人工智能時代新的范疇;允許此類數(shù)據(jù)應(yīng)用和服務(wù)于群體性現(xiàn)象以及社會輿情分析,減少對個人對象的分析。由于模型化數(shù)據(jù)與人工智能化數(shù)據(jù)產(chǎn)生于算法,而算法收集到的個人數(shù)據(jù)無法在公開透明的情況下了解原始數(shù)據(jù)的使用過程與處理方式,也無法通過層次數(shù)據(jù)的方法對個人隱私數(shù)據(jù)進(jìn)行模糊脫敏處理。因此,本文認(rèn)為可以通過“算法問責(zé)”控制新技術(shù)對隱私的侵襲。傳統(tǒng)的決策問責(zé)遵循“誰決策誰負(fù)責(zé)”“誰主管誰負(fù)責(zé)”,大數(shù)據(jù)算法決策是機(jī)器做出的決策,也要從“誰設(shè)計誰負(fù)責(zé)”和“誰主管誰負(fù)責(zé)”的原則出發(fā)追責(zé)。從算法層面進(jìn)行問責(zé)主要是針對利用和設(shè)計算法的情報人員,由于算法是由團(tuán)隊(duì)進(jìn)行編碼、評審和測試的,開發(fā)人員在創(chuàng)建算法時就能決定最終用戶將在決策中扮演的角色,因此,對算法開發(fā)人員的監(jiān)管比算法本身更重要。針對這一特點(diǎn),第一,在數(shù)據(jù)處理者層面開展算法審計,審查發(fā)現(xiàn)編碼為優(yōu)先級、排名、排序和分類算法的標(biāo)準(zhǔn),尋找它們在某種程度上被引導(dǎo)或產(chǎn)生偏見的程度;第二,要求算法研發(fā)人員必須留存在開發(fā)和訓(xùn)練過程中做出的決策的文檔;第三,在數(shù)據(jù)應(yīng)用者層面,可以通過揭示算法的產(chǎn)生背景,探究算法設(shè)計的目的和假設(shè),也可以考察包括技術(shù)團(tuán)隊(duì)之外的利益相關(guān)者以及與算法開發(fā)相關(guān)的文檔數(shù)據(jù)集,幫助數(shù)據(jù)被侵犯者提供問責(zé)渠道[22]。
4?結(jié)?語
本文在總結(jié)近年來國內(nèi)外關(guān)于數(shù)據(jù)共享開發(fā)與隱私保護(hù)的研究現(xiàn)狀與不足的基礎(chǔ)上,創(chuàng)新性地從數(shù)據(jù)資源所有者、應(yīng)用開發(fā)者與服務(wù)提供者等多元視角闡述不同層次數(shù)據(jù)可能存在的隱私泄露的風(fēng)險和隱患。針對這些問題,提出利用“層次數(shù)據(jù)”“算法問責(zé)”的新思路,幫助數(shù)據(jù)資源所有者、應(yīng)用開發(fā)者與服務(wù)提供者從數(shù)據(jù)開放共享的兩個階段規(guī)劃隱私保護(hù)路徑。“層次數(shù)據(jù)”明確了針對0次數(shù)據(jù)、1次數(shù)據(jù)在數(shù)據(jù)開放共享前中后的標(biāo)準(zhǔn)與技術(shù)保障規(guī)則,“算法問責(zé)”針對數(shù)據(jù)應(yīng)用與服務(wù)階段產(chǎn)生的2次數(shù)據(jù)與3次數(shù)據(jù)有針對性地設(shè)計了新的保護(hù)思路。未來將繼續(xù)將層次數(shù)據(jù)中2次、3次等過程數(shù)據(jù)的處理標(biāo)準(zhǔn)規(guī)范、權(quán)責(zé)范圍、權(quán)益保障,以及相應(yīng)的算法審計與問責(zé)具體實(shí)施辦法等作為平衡數(shù)據(jù)共享開放與個人隱私保護(hù)關(guān)系的研究重點(diǎn)。
參考文獻(xiàn)
[1]陸康,劉慧,任貝貝,等.智慧圖書館“數(shù)據(jù)共享”與“數(shù)據(jù)隱私”的悖論研究[J].圖書館理論與實(shí)踐,2020,(3):22-27.
[2]陳美.德國開放政府?dāng)?shù)據(jù)中的個人隱私保護(hù)研究[J].圖書館,2018,(8):15-20.
[3]陳朝兵,郝文強(qiáng).美英澳政府?dāng)?shù)據(jù)開放隱私保護(hù)政策法規(guī)的考察與借鑒[J].情報理論與實(shí)踐,2019,42(6):159-165.
[4]張聰叢,郜潁潁,趙暢,等.開放政府?dāng)?shù)據(jù)共享與使用中的隱私保護(hù)問題研究——基于開放政府?dāng)?shù)據(jù)生命周期理論[J].電子政務(wù),2018,(9):24-36.
[5]丁紅發(fā),孟秋晴,王祥,等.面向數(shù)據(jù)生命周期的政府?dāng)?shù)據(jù)開放的數(shù)據(jù)安全與隱私保護(hù)對策分析[J].情報雜志,2019,38(7):151-159.
[6]王換換,吳響,王輝.區(qū)域健康醫(yī)療數(shù)據(jù)共享及隱私保護(hù)策略研究[J].科技創(chuàng)新與應(yīng)用,2017,(31):181-182.
[7]杜荷花.國外政府?dāng)?shù)據(jù)開放平臺隱私保護(hù)政策的考察與借鑒[J].圖書館建設(shè),2020,(3):69-77.
[8]王忠,殷建立.大數(shù)據(jù)環(huán)境下個人數(shù)據(jù)隱私治理機(jī)制研究——基于利益相關(guān)者視角[J].技術(shù)經(jīng)濟(jì)與管理研究,2014,(8):71-74.
[9]司莉,辛娟娟.英美高校科學(xué)數(shù)據(jù)管理與共享政策的調(diào)查分析[J].圖書館論壇,2014,34(9):80-85.
[10]張閃閃,顧立平,蓋曉良.國外信息服務(wù)機(jī)構(gòu)的數(shù)據(jù)管理政策調(diào)研與分析[J].知識、學(xué)習(xí)與管理,2015,(5):99-109.
[11]Kshetri?N.Big?Datas?Impact?on?Privacy,Security?and?Consumer?Welfare[J].Telecommunications?Policy,2014,38(11):1134-1145.
[12]Sánchez?D,Viejo?A.Personalized?Privacy?in?Open?Data?Sharing?Scenarios[J].Online?Information?Review,2017,41(3):298-310.
[13]Jaeger?P?T,Mcclure?C?R,F(xiàn)raser?B?T.The?Structures?of?Centralized?Governmental?Privacy?Protection:Approaches,Models,and?Analysis[J].Government?Information?Quarterly,2002,19(3):317-336.
[14]Hamza?R,Yan?Z,Muhammad?K,et?al.A?Privacy-preserving?Cryptosystem?for?IoT?E-healthcare[J].Information?Sciences,2020,527:493-510.
[15]Pei?X,Li?X,Wu?X,et?al.UDPP:Blockchain?Based?Open?Platform?as?a?Privacy?Enabler[C]//2020?10th?Annual?Computing?and?Communication?Workshop?and?Conference(CCWC),2020.
[16]Wang?J,Wu?Z,Liu?Y,et?al.Computational?Data?Privacy?in?Wireless?Networks[J].Peer-to-Peer?Networking?and?Applications,2017,10(4):865-873.
[17]Lilian?E,Lachlan?U.Privacy?in?Public?Spaces:What?Expectations?of?Privacy?Do?we?Have?in?Social?Media?Intelligence?[J].International?Journal?of?Law?&?Information?Technology,2016,24(3):279-310.
[18]Benghabrit?W,Grall?H,Royer?J?C,et?al.From?Regulatory?Obligations?to?Enforceable?Accountability?Policies?in?the?Cloud[M].Cloud?Computing?and?Services?Sciences.Springer?International?Publishing,2015.
[19]賈旭楠.基于政府?dāng)?shù)據(jù)開放的個人隱私泄露風(fēng)險與保護(hù)策略研究[J].情報探索,2019,(5):67-72.
[20]Montjoye?Y?A?D,Hidalgo?C?A,Verleysen?M,et?al.Unique?in?the?Crowd:The?Privacy?Bounds?of?Human?Mobility[J].Scientific?Reports,2013,3(3):1-4.
[21]迪莉婭.大數(shù)據(jù)算法決策的問責(zé)與對策研究[J].現(xiàn)代情報,2020,40(6):122-128.
[22]Rosenbaum?H,F(xiàn)ichman?P.Algorithmic?Accountability?and?Digital?Justice:A?Critical?Assessment?of?Technical?and?Sociotechnical?Approaches[J].Proceedings?of?the?Association?for?Information?Science?and?Technology,2019,56(1):237-244.
(責(zé)任編輯:孫國雷)