摘要:相較于傳統侵權理論構建的法律關系,大數據侵權的侵權主體、侵權行為、損害結果均更為復雜多變,導致因果關系的證明和判斷陷入困境,不利于侵權法權利救濟功能的發揮。基于個人信息主體證明能力相對薄弱的情況,根據技術依賴性標準、風險控制責任標準,結合事實推定規則,在沿用規范說分配證明責任的同時,應對特定情形采用證明責任倒置的分配方式。
關鍵詞:大數據侵權;因果關系;證明責任;判斷標準
中圖分類號:D92 " " 文獻標識碼:A " " 文章編號:1003-1502(2024)06-0036-15
一、前言
黨的二十屆三中全會強調要完善社會主義市場經濟體制,這包括推動數據等生產要素的自由流動和高效配置。在大數據時代,數據的收集、處理和應用對于國家治理體系和治理能力的現代化具有重要意義。因此,有必要建立健全數據治理體系,確保數據的合規使用,同時激發數據創新活力。
大數據侵權指在大數據的形成、收集、存儲、處理、分析和使用等過程中,對個人、組織或社會的合法權益造成侵害的行為。所謂大數據侵權,是侵權主體利用或通過大數據方式進行侵權行為的簡稱,其主要種類包括:大數據算法侵權、數據泄露侵權、數據濫用侵權、數據不準確侵權、數據壟斷侵權。大數據侵權行為不僅會對個人的隱私權、名譽權等造成損害,也可能對企業的競爭優勢和社會的公平正義產生負面影響。在當前大力發展大數據產業的同時,需要同步加強數據安全和信息保護的研究,推動法治化國家建設。
旨在確定誰應承擔法律責任的傳統理論,是基于對人類知識的現成識別或歸屬,以及對相關設計和編程的控制,這是用來將賠償責任歸于相關法律的人,包括法人團體的依據[1],從而證明責任理論的發展歷程是一個不斷演進的過程。在羅馬法初期,人們對證明責任的認識僅限于提供證據的責任。隨著時間的推移,人們開始關注如何分配證明責任,并逐漸形成了“誰主張”“誰舉證”責任分配原則。這一原則得到了廣泛應用,并成為證明責任理論的基礎之一。此后,證明責任理論進一步發展和完善,并被廣泛應用于各種不同類型的案件中。然而,在當代司法實踐中,證明責任的分配仍然存在一些問題和挑戰,如在某些案件中,事實真相可能無法確定,或者存在多個可能的解釋。信息化社會,數據處理與運用變得愈發廣泛和重要,同時也帶來了一系列大數據侵權的證明責任問題。
大數據侵權行為的屢屢發生,給個人隱私、企業秘密和社會公共利益帶來了嚴重威脅。如,未經授權的數據采集、惡意攻擊、數據泄露以及數據錯誤①等行為,給個人、企業和國家帶來了巨大損失。但一個奇怪的現象是:大數據侵權致民事權利受損,在民事司法實踐中卻很難追究相關主體的侵權責任,反而多訴諸行政權力和公法進行管控和追責。2020年6月,人民數據(國家大數據災備中心)等公布《大數據風控與權益保護研究報告》,所列舉的十項大數據應用和權益保護典型案例中,雖然均存在個人信息權益(數據型權益)受損的事實,但多以行政手段進行規范和調整,個別案例則是依據經濟法或刑法追究相關責任②。這在一定程度上昭示了侵權法保護不足的窘境。在大數據侵權中,侵權法難以充分發揮作用的重要原因之一就是大數據侵權行為與民事權利受損事實之間的因果關系,難以證明和判斷。因此,以大數據侵權為視角對傳統理論中的因果關系證明進行研究,對于審判實踐中發揮侵權法在新型侵權領域中的保障作用具有現實意義。
二、大數據侵權具體因果關系證明責任的困境
在大數據侵權中,個人信息權益受損是最為基礎且出現頻次最高的一種損害結果。截至2021年12月,我國網民數量為10.23億人,其中22.1%的網民遭遇過個人信息泄露問題③,而在裁判文書網上檢索,卻僅查找到125件與個人信息相關的侵權類案件④。應當看到,任何法律秩序都不能容忍有責任的審判員拒絕審判,因為這種拒絕將使未解決的沖突變成公開的對抗。法院之所以“直接”或“間接”回避大數據侵權案件,很大程度上是因為被侵權人無法證明和判斷導致個人信息泄露的具體原因(特定侵權行為)。對于被侵權人而言,在絕大多數情況下,被泄露個人信息的開放性與具體因果關系的證明和判斷難度是呈正相關的。
(一)侵權主體多元化
在大數據模式中,個人信息的商業價值被充分挖掘,數據共享成為必然趨勢。以消費者隱私數據為例:消費者獲得個性化服務、電子商務平臺增收服務費用、賣家改進商品從而獲取更高的利潤,都依賴于具有較高共享價值的數據,且并非所有主體都具備分析、存儲數據的能力,一次大數據行為可能由多個主體共同完成。除此之外,商業價值還會刺激爬取、竊取等行為的發生,也將隱形地增加著個人信息實際控制主體的數量。因此,在大數據領域,信息處理涉及眾多主體,包括數據的收集者、使用者、管理者和投資者等,而個人信息實際控制主體越多,意味著潛在的侵權主體越多,不同類型的主體在侵權行為中的角色、責任能力和主觀故意等都不盡相同,這使得在認定侵權主體時需要考慮不同主體的特點和差異。不同主體的行為之間存在著相互影響的可能性,會進一步提升辨識侵權主體和侵權行為的難度。由于數據流動性和匿名性的特點,往往難以確定具體的侵權行為主體,即使能確定主體,也可能因為涉及多個環節和主體,導致因果關系的認定更加復雜。侵權主體難以確定進一步增加了因果關系證明的難度。
以“Jack基因檢測信息泄露案”[2]為例。Jack參加了直面消費者(direct-to-consumer)基因測試,且未向任何人告知檢測結果⑤。由于基因檢測公司的數據庫被黑客攻破,Jack的基因檢測信息隨之泄露。因被盜的基因檢測數據被用于廣告宣傳冊投遞,導致Jack的權益受損⑥。在Jack案中,損害結果為基因檢測信息泄露、安寧權益受損,而已知的大數據相關主體則包括基因檢測公司、黑客與廣告公司。Jack需要證明三個大數據相關主體的行為與損害結果之間存在具體因果關系。針對基因檢測公司,Jack需要證明,基因檢測結果被盜以及盜取后的使用方式,基因檢測公司是可以預見的⑦,而基因檢測公司在個人信息保護上未盡到安全保障義務,再據此證明其能夠預見到基因檢測信息泄露、安寧權益受損的結果。針對廣告公司,Jack則不但要證明廣告公司是依據被盜取的基因檢測結果,選取了特定的宣傳冊寄送對象,而且需要證明其寄送宣傳冊的行為與自己離婚、職位晉升失敗之間存在因果關系。而廣告公司可能會抗辯:并未獲得Jack的基因檢測結果,宣傳冊的發放對象是隨機選取的;或者僅是通過合法渠道獲取了已患病者的年齡、職業、居住地域等公開信息,再通過大數據匹配寄送對象,而Jack則恰好在同一時間段內進行了基因檢測。盡管Jack僅向一家基因檢測公司提供過基因樣本,并且未將檢測結果告知任何人,但是仍然無法充分證明,基因檢測結果與選取宣傳冊寄送對象之間存在著因果關系。畢竟,寄遞給Jack的物品只是治療疾病和追蹤非裔美國人家系的廣告宣傳冊,而非Jack的基因檢測結果⑧。因此,Jack若想證明基因檢測結果與選取宣傳冊寄送對象之間存在著因果關系,還需要證明其他參與了直面消費者基因檢測的人員,也收到了該廣告公司寄送且與基因檢測結果高度相關的宣傳冊。針對黑客,由于身份難以確定,導致基因檢測結果與選取宣傳冊寄送對象之間的因果關系,尤為難以證明。
(二)侵權行為具有隱蔽性
數據侵權行為往往具有隱蔽性,首先表現在行為人往往在數據使用過程中不留下痕跡,導致侵權行為難以被發現和認定。例如,美國最大的健康保險公司之一Anthem在2015年曾遭受黑客攻擊,引起數據泄露,導致8000萬名患者的記錄暴露,但是基于大數據侵權行為的隱蔽性特點,最終調查報告稱沒有證據表明敏感的醫療記錄被竊取[3]。大數據侵權行為的隱蔽性,首先源于大數據行為的運轉方式、使用目的、專業性等,復雜的個人信息擴散鏈條是較為關鍵的原因之一。一方面,在任一時間范圍內,個人信息主體通常會將相同的內容分享給不同的大數據主體;另一方面,大數據主體亦會分享、交互個人信息至產品(服務)關聯主體,以期達到數據使用效益最大化。并且在數據個人信息保存、分享過程中,爬取、竊取、倒賣等行為將使擴散鏈條更為復雜。相關的大數據行為會成為導致損害結果的條件或者介入因素。因此僅依據大數據主體搜集和使用個人信息的范圍、時間、方式等因素,將很難證明和判斷具體因果關系。
其次,大數據侵權行為隱蔽性表現為大數據主體利用技術優勢,故意隱藏侵權行為。大數據主體的目的是利用大數據技術分析、辨別個人信息主體的行為規律、需求變化等,并據此來提升效益。當大數據主體根據算法結果采取某些行動時,會嘗試掩蓋具有侵權可能性的行為。以“Target公司推送孕嬰用品廣告”⑨為例。Target公司依據合約搜集女性客戶購買商品的數據后,利用大數據分析結果來匹配、預測女性顧客懷孕周期,推送孕嬰用品廣告。同時,為了降低客戶的反感,Target公司還將客戶幾乎不會購買的產品的廣告混入其中一同發送,以此來掩蓋其推送孕嬰用品廣告的針對性。與商家單純根據客戶瀏覽商品頻次、時間等因素來推送商品廣告的行為相比,Target模式明顯超出了個人信息的獲取、使用范圍,甚至可能會侵犯女性顧客的安寧權益⑩。但由于信息之間的相關性、孕嬰用品廣告推送的針對性都較為隱蔽,且廣告推送已經成為生活常態,所以會增加因果關系的證明和判斷難度。
最后,大數據侵權行為的隱蔽性還表現為,大數據技術的漏洞易被忽略且不易證明。由于大數據行為受隱私服務協議規范,所以被侵權人一般多集中于關注大數據行為是否違反雙方約定,而不是判斷該行為是否存在侵權情況。實踐中被侵權人容易忽略掉大數據技術的漏洞與損害結果之間的因果關系。以“師生之友訴淘寶案”11為例。在該案中,導致師生之友公司商譽和收益受損的原因,被局限于淘寶公司的申訴條件及渠道不合理。而導致損害結果的直接原因,應是淘寶公司對于師生之友公司商品的誤判及處罰,不合理的申訴方式和渠道只是進一步擴大了該損害結果12。淘寶公司之所以形成誤判,是因為該案僅僅甄別了淘寶公司是否具有基于大數據進行排查的權利,卻忽略了大數據算法的漏洞與損害結果之間的因果關系。淘寶公司的大數據排查存在兩項明顯的疏漏:第一,對于師生之友產品的審核,淘寶公司的知識產權平臺與大數據排查之間得出了相悖的結果;第二,在對師生之友公司進行違規處罰的同時,其他公司仍在銷售該產品的盜版。這兩項疏漏指向了大數據算法中可能存在的漏洞。
(三)損害結果多元化
準確判斷和證明損害結果,是確定具體因果關系的前提條件之一。在大數據侵權中,損害結果呈現出多元化的趨勢,加重了被侵權人判斷和證明的負擔。大數據侵權損害結果的多元化表現:第一,大數據侵權行為直接造成了財產損失;第二,安寧權益受損正在成為大數據侵權損害結果的主要形式;第三,大數據侵權損害消費者的公平交易權和自主選擇權等消費者權。
財產損失對因果關系證明的消極影響在前文中已有論述,以下重點討論后兩項內容。在大數據侵權中,安寧權益受到侵擾,同時也是隱私權受損的主要表現形式。相較于隱私權的其他類型,安寧權益更加強調不受他人非法打擾、干涉、窺視,而不是非公開性[4]。在判斷和證明安定寧靜的生活狀態是否被打破的損害結果時,并不像隱秘信息是否被公開一般易于做出客觀的判斷。窺視、侵入行為必須達到一定程度,才構成侵犯安寧權益[5]。在大數據時代,搜集、分析用戶的數據并提供針對性服務,已經成為互聯網普遍的營銷運行方式。大數據運營者傾向于從各種來源收集大量數據,包括社交媒體、網絡流量,也可以將紙質材料數字化,比如醫療記錄、信用卡報告、警方記錄等。這種情況讓許多人除了參與大數據體制之外別無選擇[6]。權利人在接受大數據服務模式的同時,也在一定程度上開放了安寧權益的邊界。對于大數據算法得出的結果,是否完全符合個人利益或取向,被侵權人將很難依據對于不同信息的自我感受,來證明安寧權益受損的結果。
消費者權益受損是損害結果多元化的另一個表現,最為典型的例子就是大數據“殺熟”13。消費者普遍認為,大數據“殺熟”行為侵犯了公平交易的權利,集中表現為相同的產品或服務卻存在著價格差異14。然而,在具體案件之中,卻難以證明大數據行為與價格差異之間的因果關系。例如,“鄭育高訴攜程商務公司”案和“劉權訴北京三快科技有限公司”案15。在此類大數據侵權案件之中,存在著多種干擾因果關系證明的因素,包括數據脫敏、市場價格波動、明示的優惠發放標準差異等。隨著損害結果外顯性的降低,被侵權人準確判斷損害結果的概率將隨之下降,證明因果關系也會愈發困難。比如在打車軟件中,可能存在著“蘋果稅”[7]。“蘋果稅”的實質,是大數據主體利用信息發布的主導地位,侵犯消費者的自主選擇權16。在判斷損害結果時,對于車型選擇、等候時間等決定消費行為的因素是否公平、真實,被侵權人幾乎難以通過自我認知進行準確判斷。由于此類大數據侵權行為的對象是特定群體,被侵權人需要先論證大數據行為侵犯了特定群體的權益,才能證明該行為與自身權益受損之間存在因果關系。盡管被侵權人通常采用樣本分析法作為損害證明方法,但對于樣本容量、抽樣方式等內容的要求,往往又超出了被侵權人的舉證能力。
三、大數據侵權證明責任分配的考量要素
大數據侵權因果關系的證明是救濟法在大數據領域中的重要應用,也是大數據侵權責任解決的難點之一。在大數據背景下,信息處理環節的復雜性和不確定性使得侵權行為和損害結果之間的因果關系更加難以判斷。如在信息處理環節上,大數據處理涉及多個環節,包括數據的收集、存儲、處理、分析和利用等,這些環節中任何一個步驟都可能發生信息泄露和濫用。
在如此復雜的信息處理過程中,要證明侵權行為和損害結果之間的因果關系往往非常困難。首先,由于信息處理環節的復雜性,難以確定哪個環節導致了侵權行為的發生。其次,即使確定了侵權環節,也難以證明該環節的侵權行為與最終的損害結果之間的因果關系。
在大數據侵權案件中,法律規定的不足也是導致因果關系證明責任分配困難的一個重要原因。盡管已經出臺了《中華人民共和國個人信息保護法》《中華人民共和國數據安全法》等一些相關的法律法規,但在實際操作中仍然存在一些問題。例如,對于大數據侵權的賠償標準、證明責任范圍等方面的規定還不夠明確。由于判斷和證明具體因果關系的困難,以及個人信息主體與大數據主體之間不平衡的證明能力,應對大數據侵權因果關系證明責任之分配應予以重新檢視。
在大數據侵權案件中,涉及的利益主體可能包括個人、企業、社會和國家等多個方面,不同利益主體之間的利益關系錯綜復雜,需要在平衡各方利益的基礎上確定因果關系證明責任的分配方案。證明責任分為主觀證明責任和客觀證明責任,后者是證明責任的本質,并決定了前者的分配方式[8]。大數據侵權重在實現客觀證明責任的合理分配。影響大數據侵權證明責任分配的要素主要包括技術依賴性、風險控制責任、事實推定等三個方面。
第一,技術依賴性會削弱個人信息主體的證明能力。侵權主體多元化、侵權行為的隱蔽性、損害結果多元化,都表明個人信息主體的技術依賴性較高,在大數據侵權行為中處于弱勢地位。依賴是指“依靠某種人或事物而不能自立或自給”[9]。個人信息主體的技術依賴性越高,對其證明能力的削弱就越嚴重,其所能承擔的證明責任就越低。因為:其一,較高的技術依賴性導致個人信息主體缺乏辨識“因”的能力。大數據主體獲取個人信息的途徑較為龐雜,個人信息主體經常在毫不知情的情況下,就被強迫“參與”到大數據行為之中。如大數據主體利用“探針盒子”非法搜集MAC地址,并結合其他信息獲取手機用戶電話號碼,再精準投放廣告17;再如,大數據主體會通過獲取程序用戶通訊錄、短信讀寫權限等方式,獲取非程序用戶的個人信息。此外,部分大數據主體還會故意掩蓋侵權行為,進而增加因果關系的辨識難度。例如,Target公司推送孕嬰用品廣告的模式。其二,個人信息主體難以獲取證明因果關系所需的證據。對于大數據主體所提供信息與大數據服務之間關聯性的強弱、個人信息的實際使用和保存狀態、大數據算法的精確性和可信度等因素,個人信息主體只能根據制式的服務協議或清單列表進行分析和判斷,難以掌握實時動態或者做出客觀評價。自己的基因檢測信息被盜,而被侵權人卻毫不知情;對于淘寶公司所用大數據算法的精確性和可信度,被侵權人亦無法質疑。
第二,風險控制責任遷移應加重大數據主體的證明責任。風險控制責任是指個人信息主體和大數據主體對個人信息、數據的管理、保護責任。具體而言,風險控制責任的范圍應考慮以下關鍵因素:傷害發生的可能性、傷害的潛在程度和傷害的潛在嚴重度18。根據各類主體對于潛在風險的預判、抵御能力,大數據行為加重了個人信息主體管理、保護個人信息的負擔,但由于技術劣勢,個人信息主體無力抵御大數據模式下危害個人信息安全的潛在風險。盡管大數據主體是以知情同意的形式與個人信息主體達成了獲取個人信息的合意,但實際上個人信息主體并沒有做出選擇的余地。因為個人信息既是實現大數據行為時不可或缺的要素,又可以被看作個人信息主體為換取大數據服務而需要支付的對價。但個人信息被泄露、濫用的后果卻由個人信息主體承擔。因此,大數據主體獲取個人信息所需支付的對價,就不能僅限于提供大數據服務,還應當分擔個人信息主體的風險控制責任。風險控制責任與證明責任是緊密聯系的。因為個人信息的無序、無度擴散和大數據技術的深度計算能力,會進一步提升還原客觀事實的困難程度,進而導致對于案件事實的證明更容易陷入真偽不明的狀態,那么證明責任就更應該由擔負著風險控制責任的大數據主體來承擔。如,在“龐理鵬訴趣拿公司、東航公司隱私權糾紛案”中,對于個人信息泄露應歸因于他人(黑客、合作公司中航信、龐理鵬自身)的證明責任,就被分配至大數據主體一方。
第三,以適度的事實推定減輕個人信息主體的證明責任。事實推定是法官依據間接事實和經驗法則所做出的自由心證[10]。在大數據侵權中采用事實推定,能夠有效緩解個人信息主體對于事實因果關系的證明難度,如對于涉及大數據技術的客觀事實的證明、對于大數據主體是否知曉存在侵權行為的證明等。需要注意的是,事實推定只能減輕證明責任,并不導致證明責任倒置。以“成都九正科技實業有限公司買賣合同糾紛案”19為例,在該案之中,出現了特定主體否認知悉產品違法的情況。對此,法官推定,在訂立合同之時,相關主體就已經知悉產品違法。法官所依據的間接事實包括產品未經用戶同意就搜集MAC地址的事實,以及合同條款的內容;所依據的經驗法則,則是生產者對于產品功效和合同內容的一般認知程度。尤其在“多因一果”樣態的大數據侵權中,大數據主體可能會以否認知悉侵權行為為由來否定因果關系,因而事實推定更值得借鑒。由于經驗法則和自由心證的不確定性[11],事實推定也可能滋生出對于待證事實的錯誤認定,所以要在審慎態度下適度采用,且從規范性來講,經驗法則應局限于從判例中總結出的一般性認知,或者是符合高度蓋然性證明標準的生活經驗。
四、規范說是合理分配大數據侵權證明責任的理論基礎
我國民事訴訟中證明責任分配的一般標準,遵循了規范說理論20。規范說由德國法學家萊奧·羅森貝克提出,其核心觀點是:不適用特定的法律規范其訴訟請求就不可能得到支持的當事人,應當對該法律規范的構成要件承擔證明責任。具體來說,規范說基于法律規范的不同分類來分配證明責任。規范說旨在通過對法律規范的邏輯分析,為證明責任的分配提供一個清晰、明確且具有可操作性的規則體系,以避免在證明責任分配上的不確定性和隨意性。萊奧·羅森貝克認為,當事人應主張和證明對自己有利之規范的構成要件:由原告主張權利產生規范的構成要件,由被告主張權利妨礙規范、權利消滅規范、權利排除規范的構成要件[12]。證明責任的分配需要兼顧公平、正義、效率等要求[13]。萊奧·羅森貝克的證明責任分配理論建立在純粹的實體法結構的分析之上,從法律規范相互之間的邏輯關系尋找分配的原則,即根據實體法的法律規范進行分析,從而發現證明責任分配的規律。這與證明責任理論中誰主張誰舉證的分配原則有異曲同工之妙。
首先,大數據時代的侵權行為具有其獨特性,使得傳統的侵權證明責任分配方式面臨挑戰,原被告雙方實力懸殊,使得原告在舉證上處于不利地位。其次,規范說強調法律規范的制定和實施應當符合公平、正義等法律價值。在大數據侵權案件中,可以通過細化舉證責任的分配模式來實現適當減輕受害人舉證責任,同時加重侵權人的證明責任,實現公平和正義的法的價值。此外,規范說還強調法律應當與時俱進,適應社會發展的需要。構建符合大數據時代下細化舉證責任的分配模式以及完善侵權賠償責任的認定等路徑,能充分保障受害人的合法權益。
從效果上來講,以規范說作為大數據侵權的證明責任分配標準,實現了上述要求,即在一般情況下舉證責任分配:在大數據侵權案件中,被侵權人應承擔初步舉證責任,被侵權人需要證明侵權人未經授權使用了其數據,且該使用行為與自身受損存在因果關系。同時,侵權人需要證明其使用數據的合法性和必要性。這是因為,首先,根據民事訴訟法的訴訟權利平等原則,大數據主體與個人信息主體應享有完全平等的訴訟地位,二者各自擔負應當的證明責任,是應有之義。大數據主體與個人信息主體之間的技術地位差距,并不能直接轉化為對二者的民事訴訟地位的認定,而風險控制責任遷移所導致的大數據主體證明責任加重,也只是針對特定類型的大數據侵權下才會產生。其次,從已有判例來看,在較為頻發的大數據侵權類案件(如個人信息泄露、隱私受損等)之中,個人信息主體展現出了充分的舉證能力,足以支撐其擔負證明責任。如在“朱燁訴百度網訊公司案”中,個人信息主體充分證明了關鍵詞搜索與個性化服務推薦之間的因果關系,并以公證文書的有效形式鎖定了該證據21。再如,在“王淼訴北京淘友天下科技發展有限公司案”中,個人信息主體提供了IP、ICP、域名信息備案管理系統的截圖,以及大數據主體多次被媒體質疑存在侵犯安寧權益的情況,以此來證明大數據主體與安寧權益受損之間存在因果關系22。客觀地講,盡管大數據主體享有技術優勢,但若對特定用戶的具體受損害情況擔負證明責任,也非輕易之事。
在具體因果關系更為復雜且個人信息主體證明能力相對薄弱的情況下,規范說仍能發揮出預期效果,主要是因為當前的大數據侵權案件多圍繞個人信息權和安寧權益展開,且侵權行為和損害結果均較為直觀。例如,對敏感個人信息不當使用、泄露、未盡到安全保障義務,阻礙個人信息主體行使個人信息處理活動中的權利23,以較為直接的方式侵犯安寧權益等。對于侵權主體和損害結果多元化、侵權行為的隱蔽性等特征,在目前司法案例中還沒有過多的展現。其主要原因在于,對于一些特定的侵權行為和損害結果,個人信息主體還不具備成熟的認識和充分的維權意識。在論及大數據侵權時,個人信息主體并未涉及過于專業的技術性問題,技術依賴性對于個人信息主體證明能力削弱的效果有限。以“朱燁訴百度網訊公司案”為例,該案的因果關系與cookie技術的具體運行模式確有緊密關聯,但是二審對于cookie技術的證明責任并非由個人信息主體承擔24。個人信息主體證明的因果關系,僅限于搜索關鍵詞—百度運轉cookie技術—第三方發送了與搜索詞相關的商業性廣告,至于百度使用的cookie技術以及技術效果、cookie技術服務協議、技術算法等均不涉及。
因此,本文認為,凡是侵權行為、損害結果均較為直觀且技術依賴性影響有限的大數據侵權案件,應以規范說作為因果關系證明責任分配的標準,利于與當前民事訴訟證明責任分配體系銜接,又能夠兼顧大數據主體發展的需要。當然,大數據技術的隱蔽性和復雜性是客觀存在的。雖然技術依賴性對個人信息主體證明能力的削弱有限,但是仍會導致其在證明客觀事實時遇到一些困難,可通過司法認定中的事實推定和高度蓋然性標準予以有效彌補。
有學者提出大數據侵權應當降低蓋然性標準的程度,對于部分問題由高度蓋然性轉為合理蓋然性,以保證個人信息主體利益[14]。蓋然性標準意味著原告只有在被告的行為構成原因的可能性高于其不構成原因的可能性時才能夠勝訴[15]。大數據分析的速度和力量使尋找因果關系(causation)和機制成為過去,使相關性(correlation)成為這個新時代的一個足夠的屬性。在某些情況下,數據驅動的分析結果可以在沒有進一步審查基本事實和原因的情況下應用,換言之,實體依賴于純粹的相關性[16]。雖然大數據在顯示相關性方面可能非常有效,但不言自明的是,相關性不是因果關系。事實上,有了足夠大的數據集,人們通常可以發現一些無意義的相關性。這些所謂的“相關性”包括:在過去的美國總統選舉中,有18次,在選舉前如果華盛頓特區的職業足球隊贏得了最后一場主場比賽,現任的政黨將繼續擔任總統;如果球隊輸了最后一場主場比賽,“在野黨”就會把在位的黨趕下臺。其他虛假相關的例子比比皆是。如果公司在不了解相關性的潛在原因的情況下使用相關性來對人做出決策,這些決策可能是錯誤的,可能會對消費者和公司造成意想不到的后果或傷害[17]。因此,大數據侵權情況下,原告要履行蓋然性權衡的證明責任可能會比較困難。本文認為,降低蓋然性標準的程度會導致雙方證據的證明力差異顯示性弱化,也不符合公平、正義之要求,應當審慎對待。所謂蓋然性,是指“有可能但又不是必然的性質”[8],本身就已經降低了對于案件事實的證明標準。在因果關系中,若無特殊考量,“合理”的標準或是符合個人信息主體的普遍認知,或是符合一般因果關系或是兩者兼而有之,同時個人信息主體也有可能提出一個符合判斷標準的偽事實。正因如此,在“龐理鵬訴趣拿公司、東航公司隱私權糾紛案”中,即便行程信息不具有開放性,法官仍會將媒體報道的“趣拿公司、東航公司泄露個人信息情況”作為認定事實的因素之一,以此來進一步強化蓋然性的程度。大數據侵權中,只要原告證明被告的行為已經顯著增加了損害的風險即構成侵權。
五、證明責任倒置是大數據侵權證明責任的必要補充
應當看到,在大數據侵權案件中,傳統的證據收集和分析方法可能已經無法滿足需要。由于大數據侵權行為常發生在網絡虛擬空間,隱蔽性強,如果缺乏科學有效的證據收集和分析方法,很難證明侵權行為與損害結果之間存在直接的關聯性。此外,如果加害人是通過第三方間接獲取數據,則更加劇了受害人搜集證據的困難。因此,大數據侵權案件僅依據規范說會對證明責任的合理分配產生消極影響,凸顯證明責任倒置的必要性。
自20世紀60年代以來,規范說的通說地位受到挑戰,一些順應潮流的新興學說紛紛涌現,如危險領域說、蓋然說、損害歸屬說等在德國勃興[18]。這些學說的共同目標是克服規范說日漸暴露的一些局限性,在批判和反思基礎上主張摒棄抽象的形式標準,證明責任的分配要考慮權利救濟、公平、利益衡量等因素,合理地分配舉證責任,建立多元的分配標準或體系。其中代表性的學說是德國學者普霍斯(Prolss)提出的危險領域說[11]。普霍斯的危險領域說是在對一系列涉及合同違約的判決研究的基礎上提出的,主張在某些領域,損害原因可能處于真偽不明狀態,此時應由哪一方承擔證明責任是需要考慮的。依據待證事實屬于何方當事人控制的危險領域為標準,來決定證明責任的分配,即當事人應對其所能控制的危險領域中的事實承擔證明責任。這是因為,其一,受害人無從知曉在加害人控制的危險領域內所發生事件的經過,由此而使得受害人無從提供證據;其二,加害人對于在其控制領域內發生的損害原因有較便利的條件了解事實,在客觀上也更為接近證據;其三,只有令加害人舉證才能實現《民法》中關于預防損害發生的立法目的。危險領域說更多地考慮到了當事人距離證據的遠近、掌握證據的難易程度,體現了公平的價值判斷方法,有利于實現實體法的立法意圖。
借鑒普霍斯的危險領域說,可以在某些涉及危險領域的案件中,根據具體情況重新審視證明責任的分配。例如,在某些涉及公共利益或安全領域的案件中,可能需要更加嚴格地規定證明責任的分配,以保護公眾利益和安全。我國在因果關系證明上采用證明責任倒置的侵權之訴,包括環境污染侵權、醫療行為侵權、共同危險行為侵權25。在這三類侵權訴訟上采用證明責任倒置,多是受到了普霍斯主張的危險領域說的影響,即考量受害人證明危機、加害人對證明的接近、責任規范的預防目的。具體特征表現是:第一,侵權行為具有隱蔽性、復雜性。例如,環境污染侵權行為多具有間接性、累積性的特征,具體表現為化學品以自然環境為媒介,在累積到一定程度之后,才會對原告產生不利影響,因果關系不明顯、不直接[19-20],被侵權人很難從危險行為之中辨識出侵權行為。第二,待證事實具有高度專業性。例如,自然環境中的化學品殘留物來源、殘留物的累計程度、不同殘留物相互作用的結果等。再如,診療方案的適當性、及時性以及醫療損害鑒定可信度等[21]。第三,對于環境污染、醫療行為、危險行為,侵權人都承擔著更高的風險控制、防范責任。對比可知,部分大數據侵權符合危險領域說的形式要件,包括侵權主體和損害結果多元化、侵權行為的隱蔽性,以及大數據主體所承擔的風險控制責任等,也能達到危險領域說的實質要求。
大數據侵權中,因收集數據一方與個人信息主體在經濟實力和技術力量等領域往往具有明顯不對等的條件下,個人往往因自身的能力局限而使其難以及時發現侵權行為,即使發現了,也難以在訴訟程序中舉證那些數據挖掘或使用的機構是否超過了合理限度。而且,在一般的舉證責任中,大數據侵權的注意義務已經轉移到作為個人信息主體的一方,導致大數據主體在數據挖掘或使用時對個人信息保護的重視程度不高。應當看到,在實踐中認定算法是否具有“合理性”是一個技術問題,個人信息主體相對于大數據主體而言,其技術水平明顯處于劣勢。由大數據主體承擔其大數據算法是否具有“合理性”的舉證責任,是符合公平原則的,也有利于發揮大數據主體的技術優勢,實現節約司法成本的目的。因此,在確定大數據侵權采用證明責任倒置的具體情形時,應符合危險領域說的實質要求,不符合實質要求的大數據侵權之訴,宜遵循規范說。確定大數據侵權采用證明責任倒置的必要條件包括:第一,收集敏感個人信息不具有必要性,或實際使用目的與預設特定目的相悖,且個人信息主體無力舉證證明,導致受害人證明危機。第二,大數據算法得出的結果不準確或有違普遍認知。由于對數據量和數據的內容無法預測,大數據主體無法預先向個人信息主體說明算法結果的準確性26,亦不會在事后向個人信息主體反饋相關情況,因此,當個人信息主體對此產生質疑時,自然無力證明。第三,存在信息共享關系的數個大數據主體之一泄露了個人信息,致個人信息主體缺乏判斷侵權主體的直觀依據。
六、結語
由于大數據行為的特性,侵權中因果關系呈現出更為復雜的法律現象。當下,作為實現社會治理重要工具之一的法律制度,已經跨越了廣泛的領域——從終止福利支付到建立貨車的每日獎勵制度,從學校紀律到天然氣的價格。但問題總是一樣的——設計出既公平又可行的程序[22]。在破解因果關系證明和判斷的難題時,既要實現公平、正義,充分保障個人信息主體的權益,又要理性對待大數據主體和個人信息主體之間的技術差異性,不能主觀地分配給大數據主體過多的責任。以大數據侵權為視角對因果關系的研究還不充分,且實際案例也存在局限性,應當持續不斷地完善相關理論,為司法裁判提供學理支撐。此外,應當充分發揮司法裁判在國家治理、社會治理中的規則引領和價值導向作用。大數據侵權案件的審判質效也是目前應對當下大數據侵權理論和立法不充分、不完善的有效對策。因此,法官應加強對大數據被侵權人的訴訟指導和引導,通過提升其參訴應訴能力和水平,提高大數據侵權因果關系的關聯性,在司法裁判符合法律制度之間邏輯自足的同時,突破傳統的“誰主張,誰舉證”的舉證責任分配原則,以實現個人利益和社會公共利益的協調統一。
注釋:
①美國聯邦貿易委員會的一項研究發現,21%的消費者樣本在他們的三份信用局報告中至少有一份被證實存在錯誤。參見Big Data: A Report on Algorithmic Systems, Opportunity, and Civil Rights[EB/OL].[2023-12-27].https://obamawhit ehouse.archives.gov/sites/default/files/microsites/ostp/2016_0504_data_discrimination.pdf.
②在報告公布的典型案例中,證監會、國家網信辦、工信部網絡安全管理局對墨跡天氣、支付寶、陌陌公司、Wifi萬能鑰匙APP提出了整改要求,瑞智華勝公司及其主要成員被追究刑事責任〔(2019)浙0602刑初636號〕,飯友APP經營商復娛公司則被定性為不正當競爭〔(2019)京73民終2799號〕,而南京某高校與曠視科技公司合作的“人臉識別系統——課堂行為分析”,更是僅限于網民議論和教育部科學技術司回應。
③2022年2月25日,中國互聯網絡信息中心(CNNIC)在京發布第49次《中國互聯網絡發展狀況統計報告》。
④本文以“案由:網絡侵權責任糾紛”“案件類型:民事案件”為固定搜索條件,配以“全文:個人信息”“全文:個人信息泄露”“全文:泄露姓名”“全文:泄露電話”等搜索條件,分別進行檢索。當搜索條件為“案由:網絡侵權責任糾紛;案件類型:民事案件;全文:個人信息”時,可檢索到的案件數最多,為125件。檢索平臺為中國裁判文書網,最后檢索時間為2022年5月6日18:30。
⑤直面消費者基因測試(DTC genetictesting)由Jack與基因測試公司通過網絡直接聯系,并無第三方介入。基因公司分配給Jack一個專用賬號,并要求Jack自設密碼。同時,基因公司承諾基因信息會被加密,并只有Jack才能獲取。通過基因測試,Jack獲知自己為混血兒、攜帶鐮狀細胞基因,并且阿爾茨海默癥患病概率高達70%。
⑥在家中和公司,Jack均收到了廣告公司寄來的治療鐮狀細胞類疾病、阿爾茨海默癥以及追蹤非裔美國人家系的宣傳冊。并且,由于宣傳冊未經封裝,Jack的妻子、同事注意到了宣傳冊的內容,并猜測到Jack通過基因檢測所知曉的結果。最終,因Jack患病的潛在風險,妻子決定與其離婚,而且Jack因非裔美國人家系多次晉升失敗。
⑦在美國,Acosta案〔Acostav.Byrum,638S.E.2d246(N.C.Ct.App.2006)〕確立了未經同意披露醫療信息案件的因果關系證明標準:近因的檢驗是指傷害風險(不一定是以實際發生的確切形式)是否在被告的合理預見范圍內(The test of proximate cause is whether the risk of injury, not necessarily in the precise form in which it actually occurs, is within the reasonable foresight of the defendant)。
⑧對比“龐理鵬訴北京趣拿信息技術有限公司、中國東方航空股份有限公司隱私權糾紛案”〔(2017)京01民終509號〕,能夠更為清晰地認識到證明基因檢測結果泄露與寄送宣傳冊之間存在因果關系的困難程度。龐理鵬雖然亦無法直接證明趣拿和東航泄露個人信息,但是在收到的短信中包含準確的行程時間和航班號,并且飛機最終確實因機械故障取消。故而,法院認定趣拿和東航泄露個人信息。但是,在Jack案中,宣傳冊中并未顯示Jack的基因檢測結果或基因檢測行為。并且,基因檢測結果表明,Jack為非裔美國人的概率僅為15%—20%。因此,僅依未進行其他檢測或未向他人告知檢測結果,尚不足以證明基因檢測結果與寄送宣傳冊之間存在因果關系。
⑨20世紀80年代,加州大學洛杉磯分校教授艾倫·安德瑞森研究發現,消費者購買日常用品多出于慣性,營銷者很難說服消費者改變購買習慣。但是,部分消費者在經歷重大人生事件時,如上大學、工作、結婚、離婚等,則相對易受營銷者的干預。據此,Target公司瞄準孕嬰用品市場,嘗試預測女性客戶是否懷孕以及預產期等關鍵信息。通過合法方式,Target公司搜集到了臨近預產期女性的購物習慣。諸如,購買大量無味乳液,大量攝入鈣、鎂、鋅等補充劑等。最終,Target公司將25種商品列為女性顧客的“懷孕預測”分數的評價標準,據此分析女性顧客懷孕的具體階段,并發送優惠券。
⑩Target公司將嬰兒用品的廣告、優惠券寄送給未成年女性。一女孩父親向Target公司投訴,后證實該女孩確已懷孕。廣告、優惠券的投遞多通過電子郵件、信箱等保密性較差的渠道進行,假設這些信息被其他人獲取并擴散,有可能會侵犯女孩的安寧權益。此時,Target公司的廣告投遞行為與安寧權益受損之間是存在因果關系的。
11(2019)京0491民初38808號
12根據《淘寶市場管理與違規處理規范》,淘寶公司可對違規商家進行公示警告、經營權限管控、違規商品或信息處置,并扣除商家積分。商家則可對上述措施進行申訴,再由淘寶公司判定是否解除。因此,淘寶公司做出違規處理的依據是大數據研判結果等,但并不包括申訴結果。
13大數據“殺熟”是一種生活類流行用語,而非精準的學術概念。在行政法規中,多以規定大數據主體義務的形式規范大數據“殺熟”問題。例如,《在線旅游經營服務管理暫行規定》第十五條規定,不得基于旅游者消費記錄、旅游偏好等設置不公平的交易條件;《國務院反壟斷委員會關于平臺經濟領域的反壟斷指南》第十七條規定,不得基于大數據和算法設定差別待遇,包括根據交易相對人的支付能力、消費偏好、使用習慣等實行差異性交易價格或者其他交易條件,實行差異性標準、規則、算法,實行差異性付款條件和交易方式。
142019年北京市消費者協會發布大數據“殺熟”問題調查結果,83.74%的被調查者認為大數據“殺熟”侵犯了消費者的公平交易權。2022年北京市消費者協會再次發布互聯網消費大數據“殺熟”問題調查結果,85.38%的受訪者認為大數據“殺熟”主要體現為同一時間不同用戶購買相同商品或服務的價格不同,包括多次瀏覽后價格上漲、不同打折優惠形式、隱藏或不送老用戶優惠券等。
15在“鄭育高訴攜程商務公司案”〔(2020)滬0105民初9010號〕中,被侵權人提出侵權人利用大數據技術分析客戶需求,在短時間內大幅提升同一項服務的價格。而在“劉權訴北京三快科技有限公司案”〔(2018)湘0102民初13515號〕之中,被侵權人則主張侵權人利用大數據技術,對相近時間段內相同的業務實行區別定價。
16雖然并非網約車平臺的真實算法及策略,但是通過打車軟件實測,有學者提出確實存在大數據根據用戶特征提供差異化服務的可能性。例如,網約車平臺會根據手機的品牌、價格,為不同用戶分配車型,蘋果等高價位手機的用戶,會被更多地分派到車費更高的舒適型車輛。此外,蘋果手機用戶享受到的網約車優惠遠少于其他手機用戶,時間延誤比例也更長于其他手機用戶。
172019年央視“3·15”晚會曝光11家企業利用Wi-Fi、探針盒子、MAC地址,違法搜集個人信息主體的手機號碼。
18參見聯合國發展集團通過的“DATA PRIVACY, ETHICS AND PROTECTION: GUIDANCE NOTE ON BIG DATA FOR ACHIEVEMENT OF THE 2030 AGENDA(數據隱私、道德和保護指導說明:實現2030年議程的大數據)”第三款第四條。
19(2020)津01民終3291號
20最高人民法院關于適用《中華人民共和國民事訴訟法》的解釋第九十一條:人民法院應當依照下列原則確定舉證證明責任的承擔,但法律另有規定的除外:(一)主張法律關系存在的當事人,應當對產生該法律關系的基本事實承擔舉證責任;(二)主張法律關系變更、消滅或者權利受到妨害的當事人,應當對該法律關系變更、消滅或者權利受到妨害的基本事實承擔舉證證明責任。第九十條:當事人對自己提出的訴訟請求所依據的事實或者反駁對方訴訟請求所依據的事實,應當提供證據加以證明,但法律另有規定的除外。在作出判決前,當事人未能提供證據或者證據不足以證明其事實主張的,由負有舉證證明責任的當事人承擔不利的后果。
21在“朱燁訴百度網訊公司案”〔(2014)寧民終字第5028號〕中,被侵權人選取了減肥、人工流產、隆胸作為試驗詞匯。詞匯特點鮮明,試驗結果不易與非搜索就推送的廣告內容相混淆。并且被侵權人十分注重試驗的準確性,隔絕了瀏覽歷史記錄影響試驗結果的可能性。同時,選擇通過公證的形式鎖定證據,也避免了因大數據主體調整推送模式而導致證據喪失。
22在“王淼訴北京淘友天下科技發展有限公司案”〔(2018)京0108民初25154號〕中,被侵權人通過公開途徑獲取了IP、ICP等大數據主體的網絡身份證明。而媒體報道情況類的證據,在其他案中也發揮過相同的證明作用。例如,在“龐理鵬訴趣拿公司、東航公司隱私權糾紛案”中,媒體報道情況是法官認定東航公司和趣拿公司泄露龐理鵬個人隱私信息存在高度可能的因素之一。
23《中華人民共和國個人信息保護法》第四章規定了個人在個人信息處理活動中的權利,包括知情權、決定權、限制或拒絕處理的權利、查閱和復制的權利、更正和補充的權利、刪除的權利、要求解釋處理規則的權利。
24二審與一審之間最大的差異,就是法院更加細致地查證了cookie技術的具體運行方式。經查證,確定了cookie技術所用個人信息不具有可識別性、未定向識別使用該瀏覽器的網絡用戶身份、檢索關鍵詞的海量數據庫以及cookie信息未向第三方展示。在裁判文書中,雖未具體言明對于cookie技術具體運行方式的查證方法,但是證明責任必然不在個人信息主體一方。
25《最高人民法院關于民事訴訟證據的若干規定》第四條規定了采用證明責任倒置的侵權訴訟類型,以及各自不同的證明內容。
262016年3月微軟公司發布過一款名為Tay的人工智能聊天機器人。預期效果是通過大數據技術與深度學習,使Tay實現智能化。然而,實際結果卻是,在Twitter用戶刻意提供特定信息的情況下,Tay形成了反猶太人、性別歧視、種族歧視的認知。大數據技術是深度學習的基礎。正是大數據技術收集、分析的信息與預期出現巨大差異,才導致了運算結果與預期效果嚴重不符。由此可見,大數據主體也無法完全控制大數據技術的最終效果。
參考文獻:
[1]JONATHAN BEACH.Causation: The Interface Between the Scientific and Legal Methods[J]. University of Western Australia Law Review,2022(1).
[2]AJUNWA, IFEOMA. Genetic Testing Meets Big Data: Tort and Contract Law Issues[J].Ohio State Law Journal,2014(6).
[3]ROBERT L RABIN.Perspectives on Privacy, Data Security, and Tort Law[J].DePaul Law Review, 2017(2).
[4]王利明.生活安寧權:一種特殊的隱私權[J].中州學刊,2019(7).
[5]張民安,林泰松.隱私權的界定——Samuel D. Warren, Louis D. Brandeis, William L. Prosser, Judith Jarvis Thomson,以及W. A. Parent等學者對隱私權作出的界定[M].廣州:中山大學出版社,2017.
[6]JOAN DONOVAN.Redesigning consent: Big Data, Bigger Risks[J].Harvard Kennedy School Misinformation Review,2020(1).
[7]復旦青年創業家教育與研究發展中心.2020打車軟件出行現狀調研報告[R].上海:復旦大學,2020.
[8]胡學軍.證明責任制度本質重述[J].法學研究,2020(5).
[9]中國社會科學院語言研究所詞典編輯室,編.現代漢語詞典[Z].北京:商務印書館,2016.
[10]張衛平.自由心證原則的再認識:制約與保障——以民事訴訟的事實認定為中心[J].政法論叢,2017(4).
[11]漢斯·普維庭.現代證明責任問題[M].吳越,譯.北京:法律出版社,2006.
[12]萊奧·羅森貝克.證明責任論[M].莊敬華,譯.北京:中國法制出版社,2018.
[13]江偉,肖建國,主編.民事訴訟法[M].北京:中國人民大學出版社,2018.
[14]田野,張耀文.個人信息侵權因果關系的證明困境及其破解——以相當因果關系理論為進路[J].中南大學學報(社會科學版),2022(1).
[15]彼得·凱恩.侵權法解剖[M].汪志剛,譯.北京:北京大學出版社,2010.
[16]COHEN I GLENN, LYNCH HOLLY FERN-ANDEZ , VAYENA EFFY ,et al. Big Data, Health Law, and Bioethics[M]. Cambridge: Cambridge University Press, 2018.
[17]FEDERAL TRADE COMMISSION. Big Data: A Tool for Inclusion or Exclusion?[R]. Understanding the Issues, FTC Report, 2016.
[18]畢玉謙.民事證明責任研究[M].北京:法律出版社,2007.
[19]王盛航.環境侵權因果關系證明的價值判斷[J].法學論壇,2020(4).
[20]王秀衛.我國環境民事公益訴訟舉證責任分配的反思與重構[J].法學評論,2019(2).
[21]李博.證明責任倒置在醫療侵權訴訟中的適用[J].中國法律評論,2021(3).
[22]CRAWFORD KATE,SCHULTZ JASON M.Big Data and Due Process:Toward A Framework to Redress Predictive Privacy Harms[J].Boston College Law Review,2013.
Allocation of Burden of Proof in Big Data Infringement: Improvement Strategies from the Perspective of
Rule of Law in National Governance
QI Enping
Abstract: Compared with the legal relationships constructed by traditional tort theories, the subjects, acts, and damage outcomes of big data infringement are more complex and variable. This complexity complicates the proof and judgment of causality, hindering the remedial function of tort law. Given the relatively weak ability of individuals to provide proof, and based on standards of technological dependency and risk control responsibility, along with the rules of factual presumption, it is advisable to adopt a reversed burden of proof in specific situations while continuing to apply the normative approach for allocating the burden of proof.
Key words: big data infringement; causality; burden of proof; evaluation criteria
責任編輯:翟 " 祎