焦俊章 張勇



關鍵詞:數據采集,標準,認證機制,演化博弈
0 引言
隨著數字技術的不斷發展和日趨精進,我國已將數字經濟視為驅動我國現代化的重要力量。習近平總書記在黨的二十大報告中指出:“加快發展數字經濟,促進數字經濟和實體經濟深度融合,打造具有國際競爭力的數字產業集群”。目前,數字經濟在我國是拉動內需的重要抓手;是提升GDP的重要引擎;是經濟發展的重要增長點。中國信息通信研究院發布的《中國數字經濟發展研究報告(2023年)》顯示,2022年中國數字經濟規模已達50.2萬億元,其占GDP的比重高達41.5%,增長速度已連續11年顯著高于GDP增速。
但是,數字經濟能夠一直保持高速發展嗎?數據隱私保護已經向數字經濟的發展提出了挑戰。Verizon發布的《2022數據泄露調查報告》(DBIR)顯示,2 0 22年共統計了23, 89 6個安全事件,其中5212個已確定是數據泄露事件,其中82%的違規行為涉及人為因素,勒索軟件泄露時間增加13%,超過去5年總和。ISO 2022《展望報告》表示,消費者的信任將成為一個有關數字經濟發展的越來越重要的問題。對個人數據隱私的擔憂使消費者質疑數字經濟是否會繼續高速增長。個人數據,指的是可以對本人進行識別的全部數據[1],該信息包含消費者的姓名、位置數據、IP地址和cookie等諸多內容,其中有些數據是應用軟件運行所必須要獲取的,可稱為必要采集數據;其中可能又存在敏感性數據,是需要被平臺企業嚴格保護的,這些數據可稱為必要采集敏感性數據。此外,有些數據不是平臺企業必須要獲取的,但平臺企業可以利用這些數據優化自身運營或者形成數字產品,從而獲得額外的收益,這些數據可稱為非必要采集數據,其中用于優化運營的可稱為非必要優化性數據;用于形成數字產品再出售的可稱為非必要可轉讓數據。
本文以政府制定的個人數據采集流程標準并建立認證為背景,構建了平臺企業和消費者雙方演化博弈模型,探究其動態演化規律,分析了個人數據采集流程認證對數字經濟健康持續發展的影響,驗證了個人數據采集流程認證機制的可行性。通過模擬仿真,進一步探究了雙方博弈的演化路徑,完善了認證機制。并為平臺企業個人數據采集流程認證的建立提供了理論依據,為政府制定相關政策提供了參考,對于數字經濟的健康發展具有重要的理論意義和實踐價值。
本文創新性提出了平臺企業個人數據采集流程認證機制。該認證通過國家認可的機構制定數據采集流程標準,由國家認可并批準的第三方機構依據標準對平臺企業完成認證,認證完成后向平臺企業頒發證書和標識。標準和認證內容包括平臺企業秉持最小化收集數據原則,簡單清晰地向消費者展示必要采集數據和非必要采集數據的內容;接受消費者對必要采集敏感性數據保護的監督;允許消費者拒絕授權非必要采集數據且不影響正常使用。當消費者授權非必要采集數據后,平臺企業要向消費者準確告知這些數據的用途,并保留消費者訪問和刪除的權利。平臺企業完成認證后可展示標識,消費者看到標識后便可消除掉一定有關數據隱私保護的顧慮。
1 文獻綜述
隨著數字化進程的不斷深化,數字要素成為第五大生產要素,學界愈發關注個人數據與隱私保護之間的關系。首先,有學者經常會將個人數據等同于個人信息,這其實有悖于法學思想,實際上,兩者在具體內涵、權利話語等方面存在較為明顯的差別,不應等同視之[2]。個人數據更是個人信息的載體,承載著個人信息的內容。同一個人數據對于不同的主體來說始終是個人數據,但同一種個人數據是不是個人信息,不同的主體可能有不同的認識[3]。個人信息與個人隱私亦有區別。凡是能夠唯一的確定某一個體屬性信息的都叫做個人信息;“個人隱私”是指那些私密、保密、隱藏、不愿意公開的個人信息[4]。與此同時,大數據挖掘技術的主動分析特征改變了隱私權的具體結構[5],實際中,消費者缺乏驗證自己的隱私是否被平臺侵犯的能力,平臺企業對于消費者個人數據的收集就如同一個運行機制神秘的系統[6,21],這使得消費者隨時都有可能受到“無感傷害”[7]。簡單來說,消費者缺乏了維護隱私權的前提,即缺乏知情權[8]。因此,“公共數據開放”與“個人隱私保護”之間存在悖論[9],而筆者認為,解決悖論的關鍵在于消費者能有足夠的知情權,使消費者能更加簡單便捷地知道平臺企業收集了哪些個人數據以及如何處理這些個人數據。此外,數據交易產生的數據商品化現象將對個人隱私帶來極大傷害,并產生難以預計的信息安全問題,大范圍失控的數據交易也將為違法活動提供溫床[10]。個人數據采集流程認證機制可以在數據交易之前,即數據采集階段解決掉數據流動與隱私保護的矛盾,極大地避免了數據交易的失控。
學者們在個人數據收集與保護方面做出了諸多有價值的研究成果,然而,大部分學者都是以法學視角針對個人數據收集與保護的問題展開研究,鮮有學者從標準、認證的視角來討論對平臺企業的規制。競爭會增加平臺企業隱私保護投資水平,政府一定程度的監管也能加強競爭帶來的效果[11],個人數據采集流程標準是數字化浪潮下的產物[22],必然會加劇不同平臺企業之間的競爭,進而提高平臺企業對于消費者個人數據的保護水平,這不失為一種解決數據治理問題,防范“隱私疲勞” [23]的新路徑。
此外,還有學者圍繞數據權屬[12]、數據分配[13]、數據交易[14]、數據屬性[15 ]等問題進行研究,但尚未關注到主要利益相關方之間的策略互動機理,忽視了博弈隨時間的演化規律和博弈的動態均衡,難以呈現出該過程的內在邏輯[16 ]。當前我國對于數據治理問題還處于初期探索階段,許多方法觀點還都停留于理論層面。實際中,演化博弈基于平臺企業和消費者的有限理性和獲取不完全信息的條件,不僅能夠得出雙方的穩定策略,還能找出其演化路徑,目前已被眾多學者在知識共享[17 ]、獎懲機制[18]、問題治理[19]、輿情傳播[2 0]等諸多方面所應用。
綜上所述,本文以標準、認證的視角,討論個人數據采集流程認證機制是否能夠有效應對當下數據采集侵權的問題,希望探索出一條關于數據治理的新道路,從而為數字經濟的蓬勃發展貢獻一份力量。
2 基本模型構建
假設在政府已經出臺個人數據采集流程標準,并實施個人數據采集流程認證的背景下,平臺企業和消費者之間形成了一種博弈關系。因為信息不對稱,平臺企業出于成本和收益的考慮,消費者擔心個人數據安全,從而在平臺企業和消費者的博弈過程中,平臺企業有兩種選擇策略:遵從個人數據采集流程標準,并完成個人數據采集流程認證;另一種是不遵從個人數據采集流程標準。此外,消費者也有兩種選擇策略:相信平臺企業不會泄露消費者的個人數據,將全部數據授權給平臺企業;另一種是不相信平臺企業不會泄露消費者的個人數據,僅將部分數據授權給平臺企業。
假設1:因為平臺企業和消費者的能力和所獲信息有限,因而在真實的決策過程中是有限理性的參與主體,需要通過學習和試錯來實現效用最大化。
假設2:平臺企業的策略空間為認證或不認證,選擇認證的概率為x,選擇不認證的概率為1-x,x∈[0,1];消費者的策略空間為全部授權或部分授權,選擇全部授權概率為y,選擇部分授權的概率為1-y,y∈[0,1]。
假設3:平臺企業完成個人數據采集流程認證,所需付出的額外成本是C1。
假設4:平臺企業完成個人數據采集流程認證后,所采集的數據量的變化是ΔS,所采集數據為真實數據的概率是α1,α1∈[0,1];平臺企業不進行個人數據采集流程認證,所采集的數據量是S,所采集數據為真實數據的概率是α2,α2∈ [0,1]。
假設5:消費者選擇部分授權平臺企業個人數據時,所付出的成本是C2;消費者選擇全部授權平臺企業個人數據時,所付出的成本是C3;因為消費者無論選擇部分授權個人數據還是全部授權個人數據,并不影響其對于應用軟件的正常使用,故兩種選擇的收益均為P,其中C3﹥C2。
假設6:平臺企業完成個人數據采集流程認證后,通過展示認證標識會提升消費者的信任度,進而提升平臺企業形象I;平臺企業不進行個人數據采集流程認證,無法展示認證標識時,消費者會懷疑其無法通過的真實原因,故而會對平臺企業造成聲譽損失L;平臺企業完成個人數據采集流程認證后,消費者出于保護個人數據的考慮,更容易不授權全部的個人數據,而企業為激勵消費者授權全部個人數據,所給予的獎勵是J;平臺企業不進行個人數據采集流程認證,消費者授權個人數據所需承擔的數據泄露風險是R。
根據上述假設,建立平臺企業和消費者之間的博弈收益矩陣,見表2。
3 演化博弈模型分析
3.1 均衡點分析
Ux,U1-x分別代表平臺企業選擇完成個人數據采集流程認證、未進行個人數據采集流程認證的期望收益, 代表平臺企業平均期望收益;分別代表消費者選擇全部授權個人數據、部分授權個人數據的期望收益, 代表消費者平均期望收益。根據以上定義,平臺企業和消費者的各個狀態下的期望收益和平均收益如下。
根據上述兩參與主體的期望收益和平均收益,得到平臺企業和消費者策略選擇的復制動態方程(7)和(8)。
將均衡點帶入矩陣,如果同時滿足跡和矩陣行列式即說明該復制動態方程的均衡點是穩定的,是博弈的演化穩定策略。
將4個均衡點帶入矩陣 J,矩陣的跡和行列式的結果見表3。
3.2 均衡點穩定性分析
由表3可知,在平臺企業和消費者所組成的演化博弈模型復制動態系統中,雙方的穩定演化策略是多種因素共同作用下的結果,針對表3中矩陣J的跡和行列式的結果展開如下分析。
此外,除上述3 種情況外,無論何種條件,(0,1)即(不認證,全部授權)都是一種不穩定的演化策略。企業不進行個人數據采集流程認證,逃避政府監督,希望采用冗長和模糊的協議形式,低成本且強制獲取消費者全部個人數據,消費者如不授權,便不可使用平臺的應用軟件。消費者出于理性考慮,便會采取授權虛假個人數據等形式來應對平臺企業,逃避平臺企業的“大數據監控”,博弈結果最終向(0,0)演化;相反,如果在此時政府及時介入,鼓勵平臺企業完成個人數據采集流程認證,公開認證流程和所依據的標準,讓消費者相信該項認證的效力,這將提升消費者所授權數據的準確性,從而提高企業效益,博弈結果將會向(1,0)和(1,1)方向演化。
4 仿真分析
為了驗證模型的準確性并且更加直觀地展現雙方博弈的演化過程,本文將采用Matlab R2020b軟件進行模擬仿真,探究平臺企業與消費者之間演化博弈的深層邏輯與規律。此外,本文還會進一步探究(1,1)情況下,平臺企業認證成本對雙方博弈演化路徑的影響。
4.1 不同初始策略選擇對雙方博弈演化路徑的影響
令C1=5,C2 =3,C3= 6,S =5,ΔS =2,α1= 0.8,α2=0.7,I=5,L=6,J=4,該參數組合滿足(1,1)為唯一穩定均衡點的條件分別取x,y的初始值分別為(0.2, 0.8)、(0.5,0.5)和(0.7,0.3),結果如圖1所示。結果表明,若政府部門制定個人數據采集流程標準,并對認證采取合理定價,平臺企業為了提升企業聲譽同時獲取更多更準確的數據,會積極選擇完成個人數據采集流程認證,向消費者簡單清晰地展示數據采集清單和用途,同時為消費者提供充分的激勵;消費者會在平臺企業的激勵下,授權全部的個人數據,實現雙方共贏。
此外,平臺企業初始策略選擇概率越傾向于“不認證”穩定策略,消費者越傾向于授權部分個人數據,原因在于平臺企業完成認證后,平臺企業向消費者簡單清晰列出所需收集的個人數據的清單,同時為消費者提供了可以部分授權個人數據的選擇,消費者出于之前的自我保護意識,則更傾向于授權部分數據。但是平臺企業如果在這時給予消費者一定的激勵,誘使消費者授權全部的個人數據,那么在群體效應的影響下,會有更多消費者同意授權全部個人數據,從而改變最終的演化穩定策略。
令C 1 = 5 ,C 2 = 3 ,C 3 = 6 ,S = 5 ,Δ S = 2 ,α1= 0 . 8 , α2 = 0 . 7,I = 5,L = 6 ,J = 2 ,該參數組合滿足(1 , 0)為唯一穩定均衡點的條件(s + Δs) + I + L > s + c + J 1 2 1 α α , 。分別取x,y的初始值分別為(0.2,0.8)、(0.5,0.5)和(0.7,0.3),結果如圖2所示。若平臺企業對于消費者的激勵機制設置得不合理,對消費者的吸引力過低,達不到預期的效果,再加上消費者授權全部個人數據的成本遠遠高于授權部分個人數據,這時消費者會出于希望保護個人數據的心理僅僅向平臺企業授權部分個人數據。
令C1=8,C2 =3,C3= 6,S =5,ΔS =2,α1= 0.8,α2=0.7,I=2,L=3,J=4,該參數組合滿足(0,0)為唯一穩定均衡點的條件 。分別取x,y的初始值分別為(0.2,0.8)、(0.5,0.5)和(0.7,0.3),結果如圖3所示。若平臺企業完成個人數據采集認證的成本過高,同時社會對于個人數據采集侵權問題不夠重視,平臺企業則會繼續以冗長條款,不公開所收集信息清單等形式收集大量個人數據;而消費者因為與平臺企業信息不對等,社會不夠關注和自己維權難等問題,只能選擇關閉電子設備的部分權限或者被迫填報虛假的個人信息,以此來保護自身的隱私安全。
當時,所有的均衡點均不穩定,此時系統不存在穩定演化策略ESS。當外界社會對于個人數據采集侵權問題的關注度低,平臺企業可以通過激勵手段輕易誘導只擁有不充分信息的消費者授權全部的個人數據時,平臺企業完成個人數據采集流程認證所獲得的綜合收益很低,而消費者卻承擔了高額的風險成本,因此整個博弈處于如圖4所示的不穩定狀態。
根據以上仿真結果,可以看出:雙方初始策略選擇概率的高低均不會影響博弈最終的穩定策略,但會影響其演化到穩定策略的時間。(1, 1)和(1,0)情況下,平臺企業初始策略選擇概率越傾向于“認證”穩定策略,演化達到穩定狀態所需的時間越短;而(0,0)情況中,平臺越傾向于“不認證”穩定策略,演化達到穩定狀態所需的時間越短。對于消費者來說,(1,1)和(1,0)情況下,消費者的初始策略選擇概率是影響演化到達穩定狀態所需時間的關鍵因素,消費者越傾向于選擇“全部授權”穩定策略,其(1,1)中所需的時間越短,在(1,0)中所需的時間越長,反之亦然。而(0,0)情況下,無論企業初始策略選擇概率如何,消費者演化達到穩定狀態所需的時間幾乎相同。
4.2 進一步討論:平臺企業認證成本對雙方博弈演化路徑的影響
在C1=5,C2=3,C3= 6,S =5,ΔS=2,α1= 0. 8,α2= 0.7,I=5,L=6,J=4,該參數組合的基礎上,令C1分別為5、7、9,仿真結果如圖5所示。由此可以看出,平臺企業認證成本的增加會降低其演化的速度,從而使達到穩定策略所需的時間變長。平臺企業認證成本變高,擠壓了企業為消費者提供的激勵,導致消費者的演化速度也隨著認證成本的增加而減慢,甚至當C1=9時,出現了U型曲線,表明此時企業為保證利潤對于消費者的激勵已經出現了一定困難。如果認證成本繼續變大,平臺企業無法給予消費者激勵,消費者穩定策略則會變為部分授權。這揭示了平臺企業和消費者雙方博弈過程中,認證成本會影響系統最終的穩定均衡點。由此,合理地降低平臺企業的認證成本,會更有利于平臺企業選擇認證策略,帶動消費者向平臺企業授權全部的個人數據,從而使得行業實現良性循環發展。
5 結論與建議
5.1 研究結論
在數字經濟快速發展的進程中,文本以政府已經出臺個人數據采集流程標準,并建立個人數據采集流程認證為背景,以參與雙方是有限理性的為前提,采用演化博弈理論與方法建立了平臺企業是否完成個人數據采集流程認證的博弈支付矩陣,系統分析了平臺企業是否會完成個人數據采集流程認證和消費者會如何授權個人數據的決策過程和穩定策略。此外本文還利用Matlab仿真驗證了所建模型的準確性,討論了博弈雙方不同初始策略選擇概率和平臺企業的認證成本對博弈系統演化的影響,發現認證成本會影響系統的最終穩定均衡點。研究得到的結論如下。
(1)該演化博弈模型具有3個穩定均衡點,即(1,1)、(1,0)和(0,0)。其中(1,1)是政府建立并推廣個人數據采集流程認證,平臺企業完成個人數據采集流程認證的最理想狀態,即平臺企業選擇認證,消費者選擇全部授權個人數據。演化策略的穩定性主要受到平臺企業的認證成本、平臺企業所獲數據的量和準確性、平臺企業完成認證后的形象提升和消費者的授權成本等因素的影響。
(2)理想穩定策略(1,1)的仿真結果表明,平臺企業初始策略選擇概率越傾向“不認證”穩定策略,消費者出于自我保護心理,越傾向于授權部分個人數據,但在平臺企業的激勵措施和群體效應的影響下,消費者最終會改變初始選擇,轉而選擇授權全部個人數據,并趨于穩定,從而形成了U型曲線。
(3)在3個穩定均衡點之中,不同初始策略選擇概率的選擇不會影響系統最終的穩定演化策略,但是會影響系統演化到達穩定狀態所需要的時間。大多數情況下,參與方的初始策略越傾向于該情況下的穩定策略,則演化達到穩定所需的時間越短。
(4)平臺企業的認證成本會影響其演化的速度,從而影響其達到穩定策略所需的時間,尤其當認證成本過高時,平臺企業為保證利潤會降低對消費者的激勵,進而使消費者僅授權部分個人數據,當平臺企業意識到問題后,降低利潤加大激勵,促使消費者改變選擇并趨于穩定。但如果當認證成本繼續加大,平臺企業不足以支撐激勵時,授權部分個人數據便會是消費者的穩定均衡策略,由此揭示了平臺企業的認證成本是影響系統最終穩定于(1,1)或(1,0)的關鍵因素。
5.2 政策建議
依據以上研究結果,文本從促使數字經濟健康發展的角度出發,提出以下政策建議。
(1)政府部門應盡快制定個人數據采集流程標準,并建立個人數據采集流程認證,引導平臺企業合理合法地采集消費者的個人數據。博弈結論顯示,政府部門的及時介入,能夠有效避免行業陷入惡性循環,防止“零和博弈”的產生。建議相關部門,在參考歐盟《通用數據保護條例》(GDPR)和《加州消費者隱私法案》(CCPA)的基礎上取其精華去其糟粕,并結合我國的實際情況和當前國情加以改進,形成符合我國當前數字經濟發展情況的個人數據采集流程標準和認證。未來,隨著數字技術的發展,平臺企業對于消費者個人數據的采集措施一定會更加先進,標準制定部門還要根據數字技術的新發展,及時更新個人數據采集流程標準,使其能夠不斷適應新環境、新需求,充分保護消費者的合法權益。
(2)社會層面上,一方面應當盡快讓有關個人數據采集侵權的問題引起足夠的重視;另一方面也要盡快培育出一批愿意以合理合法的形式采集消費者個人數據和樂于遵從個人數據采集流程標準的樣板中小企業,以此來凸顯完成個人數據采集流程認證的平臺企業的企業形象和名譽。因為,較高的企業形象和名譽收益能夠為平臺企業帶來充足的收益空間,彌補了平臺企業在完成認證的前期可能會出現的數據收益損失,使得平臺企業最終的綜合收益大于其認證前的收益和認證成本之和。此外培育能起到示范作用的樣板中小企業的成本遠遠小于培育大型企業的成本,中小企業反而會對大企業起到示范作用,讓大企業看到完成認證后所帶來的客觀的綜合收益,從而加大大型平臺企業的認證意愿。
(3)在個人數據采集流程認證建立完成后,一方面平臺企業要根據自身實際情況,優化企業內部的運營流程,盡可能以較少的調整來滿足標準要求,完成認證;另一方面,政府相關部門也要提高自身的認證效率,降低平臺企業完成認證所需要的費用,以此讓平臺企業能夠針對消費者采取充分的激勵措施,減少消費者演化到“全部授權”穩定策略的時間,快速實現個人數據采集新業態的目標。