嚴 宇,孟天廣
清華大學 社會科學學院,北京 100084
隨著數字化浪潮席卷全球,數字技術正深刻影響著人們生活的方方面面。數字化已然成為各國經濟社會轉型的必然方向。為此,處于數字化發展核心地位的數據要素受到了國際社會的普遍關注。2017 年,習近平總書記指出“要構建以數據為關鍵要素的數字經濟。建設現代化經濟體系離不開大數據發展和應用”①習近平主持中共中央政治局第二次集體學習并講話[EB/OL].(2017-12-09)[2022-01-20].http://www.gov.cn/xinwen/2017-12/09/content_5245520.htm.。同年,《經濟學人》封面文章也提出“當今世界最有價值的資源不再是石油,而是數據”②The world’s most valuable resource is no longer oil,but data[EB/OL].(2017-05-06)[2021-06-23].https ://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data.。美國2019 年發布的《聯邦數據戰略與2020年行動計劃》更是將數據視為“戰略資源”(strategic asset)③2020 Action Plan[EB/OL].(2020-05-14)[2021-06-23].https://strategy.data.gov/action-plan/.。2020 年,中共中央、國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》更是將數據視為一種新型生產要素,與土地、勞動力、資本、技術等傳統生產要素處于并列地位④中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見[EB/OL].(2020-04-09)[2021-06-23].http://www.gov.cn/zhengce/2020-04/09/content_5500622.htm.。
數據要素的價值已經得到廣泛認可,但如何厘清數據要素的產權歸屬、明確數據權利保護和構建數據治理體系是世界各國面臨的共同難題,直接制約著數據要素價值的最大化開發與釋放。目前,有關數據要素的產權歸屬存在多種競爭性觀點,如個人所有、企業所有、企業與個人共有、國家所有、公眾共有等。對于數據要素的產權保護,學者們已經從人格權、財產權、知識產權角度展開討論,但上述問題尚未形成共識。為此,本文擬聚焦數據要素的權屬界定與治理規則,從數據要素的概念、特征、類型和價值等方面展開論述,辨析不同類型數據要素的產權歸屬與保護路徑,為充分挖掘數據要素價值、構建數據要素市場提供理論基礎。
本文的框架安排如下:首先,討論數據要素的定義與特征,辨析數據與信息、原始數據與衍生數據的區別。其次,闡述數據要素在經濟、社會與政府治理三方面的價值,擬說明數據要素的價值形成不僅依賴數據采集與匯聚,更依賴數據流通與利用。再次,針對現有數據要素的分類方法,提出新的類型學分類,從“數據誰持有”與“數據誰生成”兩個維度切入,區分政府和企業作為數據持有者所管理的四類數據。隨后,基于數據要素的類型學分析,界定數據要素的產權歸屬,并結合人格權和財產權視角討論四類數據要素的治理邏輯。最后,就數據要素治理提出相關思考與建議。
對數據要素的定義需從數據和要素兩部分切入。首先,何為數據?我國與世界其他國家通常將數據定義為信息的數字化表現形式,后者是前者的主要內容。2021年發布的《中華人民共和國數據安全法》將數據定義為“任何以電子或者其他方式對信息的記錄”①《中華人民共和國數據安全法》[EB/OL].(2021-06-11)[2021-06-28].http://www.xinhuanet.com/2021-06/11/c_1127552204.htm.。“淘寶訴美景案”中,一審法院也明確承認信息與數據是內容與形式的關系②(2017)浙8601民初4034號民事判決書。。國際標準化組織(ISO)將數據視為信息的形式化體現,便于后者的交流、理解和處理③ISO 10782-1:1998(en),Definitions and attributes of data elements for control and monitoring of textile processes—Part 1:Spinning,spinning preparatory and related processes[EB/OL].[2021-06-28].https://www.iso.org/obp/ui/#iso:std:iso:10782:-1:ed-1:v1:en.。歐盟2018 年頒布的《通用數據保護條例》(General Data Protection Regulation,GDPR)將個人數據(personal data)定義為能夠直接或間接識別自然人的任何信息,可見該條例對個人數據的定義也是聚焦于其內容——信息④歐盟《通用數據保護條例》[EB/OL].(2016-04-05)[2021-06-28].https://eur-lex.europa.eu/eli/reg/2016/679/oj.。由此可見,信息是數據的內容,數據是信息的表現形式,信息以數據的方式生成、傳輸、儲存、分析和處置[1]。因此,數據是信息的載體,掌握數據并不僅僅只是掌握了信息,還影響著信息的權屬、流通、使用、收益和處置的整個生命周期。
其次,何為要素?“要素”一詞來自經濟學,指的是生產經營活動所需要的各類資料,譬如被視為三大生產要素的資本、勞動、技術。當前,以移動互聯網、大數據和人工智能為代表的數字技術正深刻改變著社會生活和生產方式,由此誕生了數字經濟、數字政府、數字社會等全新現象和領域。在此過程中,數據不再是冰冷的數字,而是推動經濟社會發展的關鍵要素,其中數據的經濟價值尤被重視。數據社會經濟價值的存在使得數據“有利可圖”,從而引發現階段對數據產權的諸多爭論。因此,將數據視為要素能更好凸顯其經濟價值和社會意義。也正是以此為基礎,本文展開對數據要素產權歸屬和治理邏輯的探究。
數據所承載的信息,就其內容而言,可以是關于政府或企業的,也可以是關于個人的。在此,本文著重討論關于個人信息內容的數據,即個人數據。個人數據可以分為兩類:個人信息與個人數字痕跡。兩類數據的差別在于它們能否直接體現自然人身份,即可識別性。首先,個人信息,主要指能夠直接識別個人身份的信息,如姓名、身份證號、家庭住址、手機號碼、銀行賬號、生物信息等。這些信息能夠單獨或與其他信息相結合,用來識別個人身份。其次,數字痕跡,也被稱之為非個人信息數據[2],指的是個人使用數字化服務與設備設施時留下的使用痕跡,如瀏覽、搜索、購買、對話、運動等在數字設備上留下的記錄。單獨使用數字痕跡時,尤其是脫敏加密的狀態下,其所承載的信息是難以識別個人身份的。胡文濤[3]將個人信息與數字痕跡視為敏感和非敏感數據。但這一分類受到質疑,原因在于大數據技術日益發達的今天,任何數字痕跡都可能具有將非敏感數據轉化為敏感數據以識別個人身份的能力[4]。黃锫[5]甚至認為并不存在絕對不可識別個人身份的個人數據。在這種情況下,對數字痕跡的利用也必須考慮對其承載的個人身份信息進行隱私保護。
數據也可分為原始數據與衍生數據,其中原始數據又被稱為“原生數據”或“基礎數據”,而衍生數據由于其一般具有更高的社會經濟價值,也被稱為“增值數據”[6-7]。原始數據指的是未經加工、編輯的數據,例如政府收集的政務數據、公眾在互聯網上留下的個人信息與使用痕跡(如瀏覽記錄、購買記錄)。原始數據通常具有體量大、結構復雜、來源眾多等特點,在未經整理和分析的情況下,其價值通常難以體現與釋放。衍生數據則指基于特定目標、通過數據分析和計算對原始數據進行加工處理所提取的結果,例如企業通過計算消費者線上購物行為所得出的消費者畫像、消費模式等,前者可以為企業個性化服務提供依據,后者則反映了消費者行為的普遍規律,從而為企業改善經營提供依據。在“淘寶訴美景案”中,淘寶開發的“生意參謀”數據產品就屬于衍生數據,能夠為淘寶、天貓店鋪商家提供商品銷售行情,為其改善經營提供參考。
數據作為一種無形要素,與資本、勞動、技術等三大傳統生產要素相比,具有虛擬性、非競爭性、排他性和非均質性等顯著特征。對這些特征的理解不僅體現了數據要素的獨特性,還有助于厘清這些特征如何影響數據要素的產權歸屬問題。
一是虛擬性。數據要素的虛擬性使其無法獨立于數字技術與設備而存在,而這直接影響數據要素所有權的判定。數據的生成、采集、存儲、分析與處理都必須依托數字技術與設備,因此虛擬性被視為數據要素的核心特征之一[8]。例如,平臺企業的消費者數據(包括消費者個人信息與消費記錄等)不僅需要消費者的行為付出(如使用平臺、提供信息),還需要平臺企業使用其技術與設備采集、整理和存儲這些信息。數字技術與設備是數據得以生成、存續與價值發揮不可或缺的基礎,因而成為數據要素產權界定需要考慮的因素之一。
二是非競爭性。非競爭性指的是物品被生產后可以被多人消費、使用,某一使用者對該物品的使用不會減少對其他使用者的供應。這意味著增加該物品消費者的邊際成本為0。典型的例子如國防,人口的增加并不會使得國家對每個人的安全保障有所降低。數據要素也同樣具有非競爭性,且這一特征在數據要素的使用權上表現得尤為明顯。數據要素一旦生成,就可以同時被多個主體使用,新增使用主體并不會影響到原有主體對數據要素的使用效用,即數據要素的使用邊際成本為0[9]。因此,數據要素的使用效率高、潛在價值大。
三是排他性。排他性指的是當某一物品被某一主體擁有后,其他主體就無法再使用該物品。數據要素的排他性指的是數據的生成、收集和利用通常會由某些主體控制,其他主體則被排除在使用該數據要素的范疇之外。可見,排他性主要與數據要素的所有權相關聯。例如,科技企業所擁有的用戶個人信息與數字痕跡通常只服務于其自身的經營活動,其他企業則會被排斥在外。數據要素的體量越大、信息量越豐富、結構越復雜,數據要素的經濟價值越會持續增長,其排他性則越明顯。因此,數據要素日益被科技企業視為核心資產,其排他性也日益凸顯。
四是非均質性。并不是所有的數據都有較高的社會經濟價值。例如,個體擁有的關于自身信息的數據,雖然受到法律嚴格保護,但因為體量有限,其社會經濟價值并不高。再如,平臺企業持有體量龐大、結構復雜、維度多元的用戶數據,但運用專業知識對數據進行深度挖掘與分析之前,這些數據的價值或是較低,或是難以體現[10]。此外,不同主體會從不同角度對數據要素進行挖掘和分析,其所產生的社會經濟價值也不盡相同。數據價值的非均質性既取決于數據體量、結構、維度等方面的豐富程度,也取決于對數據進行分析利用的程度與方式。受這一特征影響,數據要素的產權界定不僅要考慮數據自身的質量,還需要考慮分析利用數據可能帶來的衍生價值。
2020 年,中共中央、國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》將數據作為新型生產要素,這充分肯定了數據要素的經濟價值。與此同時,數據要素還具有巨大的社會與治理價值。這些價值無疑體現了數據要素對促進經濟社會發展、強化國家治理的重要作用。數據要素價值的實現依賴數據要素的采集、匯聚、分析和利用,因此理解數據要素的價值對于界定數據權屬和提出數據要素的治理邏輯至關重要。
數據要素的經濟價值體現在以下三方面:第一,數據要素分析能夠為企業刻畫消費者的個人偏好[11],為滿足消費者需求提供個性化服務,例如有針對性的信息推送與產品推薦。第二,數據要素能為企業提供消費者群體的信息。通過對數據分析,企業能更好地掌握消費需求和市場動向,發揮數據輔助經濟決策的功能,改善其經營策略,優化企業資源配置,提升產品與服務質量,幫助企業擴大市場份額。在這方面,淘寶的“生意參謀”數據產品最為典型。第三,通過為企業經營決策提供數據依據,數據要素能夠在市場層面加快資源流通速度、優化資源配置效率,進而推動經濟增長[12]。
數據要素的社會價值體現在三個方面:第一,數據,尤其是在政府、社交媒體等非經濟平臺采集的數據,是數字時代社情民意的傳聲筒。數字技術的發展讓普通個體在社會議題上擁有了選擇、制作和傳播信息的能力[13]。當反映個體意見的數據匯聚起來時,就形成了社會輿論,而這些數據也成為感知社情民意的重要指標。第二,數據能夠助力社會風險的識別和預測[14]。當前,我國正處于全面深化改革的關鍵時期,各種社會矛盾相對比較突出,社會風險呈現出新的特點。通過對政府網站、微博、微信、論壇、新聞網站等的數據進行解析、關聯關系挖掘、風險指數計算和可視化展示,構建地區社會風險指數,不僅可以為政府管理和決策提供參考依據,還可以反映政策的實施效果,幫助政府及時評估政策的正確性和有效性[15]。第三,數據要素的創新應用能賦權社會組織[16]。數字時代,社會組織必須依靠互聯網思維,實現網絡化、全球化、平臺化的轉變[17],數據要素是實現上述轉變的必備基礎。數據的海量積累與分析運用是社會組織重塑組織結構、提升自治能力的重要依托。
數據要素對政府治理具有三方面價值:第一,數據培育政府數字治理能力。在“一切皆可數”的數字化浪潮中,數據成為政府融合數字空間與現實社會的重要橋梁。以數據要素為基礎,運用大數據、人工智能等方式分析數據,政府能夠更加全面地掌握經濟社會運行規律,預測、研判潛在社會風險,增強政府的社會監督管理能力[18]。第二,數據要素優化政府內部工作流程。借助數字技術,對數據要素的分析與利用可以改善政府的決策流程,優化政府的決策目標,提升政府治理效率和精準度,判斷政府治理效果,便利政府施政評估[17]。第三,數據要素提升政府科學決策水平。數據要素精準、動態地反映社會生活的運行狀態,提高了政府對社情民意和社會風險的敏感度和反應度,為科學決策提供數據依據[17]。
通過梳理數據要素的經濟、社會與治理價值,不難發現數據要素的價值實現需要兩個必要條件:海量數據的收集匯聚和依托專業知識的數據分析。第一,只有數據要素總量達到較大規模的時候,數據要素才具備反映經濟規律和社情民意的能力。即便是利用消費者消費行為所計算出的用戶畫像,也需要依靠海量數據來提高計算結果的準確度。第二,數據要素必須依賴專業的數據分析才能從信息轉化為相應領域的知識,助力經濟、社會和治理活動。淘寶的“生意參謀”之所以有較高的經濟價值,被商家所青睞,就是因為其投入大量智力勞動,通過深度開發將大量用戶消費行為轉化為能夠反映市場行情的知識。北京市“接訴即辦”改革之所以能取得顯著成效,是因為北京市政府對海量政務熱線數據進行深度挖掘分析以理解城市運行。由此生成的數據分析結果一方面系統、精準、動態地展現出社情民意的熱點和社會風險的潛在分布,另一方面也有效推動了北京市對其治理結構、制度和機制進行重構,進而提升其風險感知能力、民意回應能力和科學決策能力。
現有研究通常將數據要素分為政府數據、企業數據與個人數據。這一分類方式最主要的不足在于混淆了“數據誰持有”與“數據誰生成”這兩個基本問題。例如,已有文獻提到的個人數據通常指的是包含個人信息與數字痕跡的個人數據,且是涉及眾多個體、帶有群體性質的個人數據集合。如此體量龐大的個人數據在現實中主要是被政府和企業所持有。
針對現有分類的不足,本文提出新的數據要素類型學,從數據要素持有者與數據要素生成方式兩個維度劃分數據要素的類型。數據要素持有者或管理者,指的是數據要素被誰持有,或者數據要素的使用被誰管理。這里的持有與管理并不能等同于所有,尤其不等同于法律意義上的所有權。即便在現實世界中,數據要素被某些主體(如企業)持有或管理,即這些主體掌握了數據要素的“實際”所有權,但這也并不意味著法律上也是如此,或者就應該由這些主體所有。現階段數據要素持有者主要有兩類:政府與企業。數據要素持有者一般具有兩個特征:一是持有者通過其數字技術與設備采集和匯聚數據,數據體量雖或大或小,但數據內容的豐富程度要遠超個人所擁有的數據。二是持有者能夠通過運用專業數據分析方法或購買服務的方式,挖掘數據的經濟、社會與治理價值,即持有者通過投入各類資源來挖掘數據價值。
本文并未將個人視為數據要素的持有者,因為雖然個人擁有自身信息,但其并非是唯一的擁有者,同時也不擁有其在政府網站、企業平臺、移動客戶端等設備設施上的數字痕跡。例如,姓名、身份證號、手機號這些信息并非只存儲于個人手中,政府、企業都或多或少持有這些信息。而個人的數字痕跡,如購物、瀏覽、搜索等記錄,個人甚至并不全部持有,這些數據被完整地存儲于生成這些數據的網站、平臺和客戶端等設施,被擁有這些設施的政府或企業主體所控制著。因此,實際上,這些數據雖與個人有關,但并不被個人持有。
數據要素生成方式指的是數據通過何種方式實現從無到有的創造和價值實現,具體包括四種:自有數據、用戶授權、用戶使用和加工創造。本文以數據要素持有者和數據要素生成方式為維度,提出了新的數據要素類型學劃分,具體分類見表1。

表1 數據要素的類型學劃分
第一類“自有數據”指的是數據持有者自身存在與運行過程中所生成的數據。對于政府,自有數據指的是有關政府履行職責過程中生成的數據,或稱之為政務數據①國務院印發的《政務信息資源共享管理暫行辦法》第二條規定,政務信息資源,是指政務部門(即政府部門及法律法規授權具有行政職能的事業單位和社會組織)在履行職責過程中制作或獲取的,以一定形式記錄、保存的文件、資料、圖表和數據等各類信息資源,包括政務部門直接或者通過第三方依法采集的、依法授權管理的和因履行職責需要依托政務信息系統形成的信息資源等。,如財政收支、規劃文件、執法記錄等政府運作過程中生成的數據。對于企業,自有數據指的是企業生產或經營數據,如生產管理數據、運營數據、財務數據等企業經營過程中生成的數據。
第二類“用戶授權”數據要素是指通過用戶授權,數據持有者在授權范圍內記錄所生成的個人信息,例如個人在數據持有者網站和移動客戶端上注冊成為其用戶時所提供的姓名、手機號和身份證號等信息。個人信息與其他數據要素不同的是,其存在并不依賴數據持有者所擁有的數字設備設施。這些身份信息在個人使用網站、移動客戶端等數字設備設施之前就已經存在。這意味者個人信息與數字設備設施是可以獨立存在的。而將二者連接在一起的關鍵在于用戶授權,即用戶個人通過簽署服務協議同意提供其身份信息。政府和企業作為數據持有者則在用戶授權范圍內管理、使用和保護這類數據。
第三類“用戶使用”數據要素指的是基于用戶使用行為生成的數字痕跡,包括用戶瀏覽、搜索、消費等使用數字產品與設備時產生的記錄。數字痕跡有兩大特點:一是數字痕跡的生成雖然源于用戶的主動行為,但其行為目標主要是為獲取服務,而非創造價值。以用戶搜索行為為例,用戶對于信息的搜索旨在獲取相關信息,而非創造信息。二是不同于個人信息,數字痕跡的存在必然需要數據持有者所提供的數字產品、服務與設備,后者無法獨立存在。結合上述兩大特點可以發現,在一定意義上,數據持有者的貢獻更為重要,因為用戶的主動行為是使用數據持有者的服務,并從中獲益。個人信息與數字痕跡這兩類數據是目前社會各界爭議的焦點,然而現有文獻大多并不加以區分,而是將二者混為一談來討論產權界定與歸屬的問題。基于上述討論,本文對個人信息與數字痕跡這兩類數據分開討論,區分二者的差異,并提出不同的產權歸屬與治理原則。
第四類“衍生數據”指的是數據持有者運用相關專業知識、數據分析技術對其持有的各類數據進行加工與分析所創造出的數據分析結果。這類數據要素之所以能夠存在的關鍵在于加工創造,對數據加工創造出具有經濟、社會與治理價值的知識,推動社會經濟發展。例如,政府對公民通過政務熱線所反映的訴求數據進行分析,數據分析結果反映了社情民意,為政府科學決策提供數據依據。企業通過對用戶的消費行為進行數據分析,探究經濟規律,了解市場行情,從而為企業優化經營提供數據支持。
當前,有關如何優化配置數據要素的討論中,最關鍵的問題是如何界定數據的產權。產權制度被視為市場經濟的基石,是優化資源配置、推動經濟增長的重要條件[19]。有關數據產權的界定同樣影響著數據要素的價值發揮、數據保護制度的建立以及數據要素市場的培育與發展。
有關產權的定義,經濟學界與法學界歷來存在差異。一方面,經濟學者通常將產權定義為對“物”的占有和使用過程中形成的權利。例如,常修澤[20]認為廣義的產權包含三大要義:廣領域(覆蓋領域廣泛)、多權能(以所有權為基礎的權利體系)、四聯動(產權界定、產權配置、產權交易和產權保護),包括所有、占有、支配、收益和處置等權能。另一方面,法學家則多采用狹義理解,將產權視為物權。產權在法學領域是指財產所有權和與之相關的權利,具體包括經營權、使用權、采礦權和承包經營權[23]。本文所說的數據產權借鑒了經濟學對產權的廣義定義,將數據產權界定為數據占有、使用過程中形成的權利,具體包括所有、使用、收益、處置等產權權能[21]。
數據產權的界定與保護有兩大路徑:一個是人格權路徑,另一個是財產權路徑。人格權路徑一般聚焦個人數據,尤其強調個人數據中涉及可識別個人身份的信息數據。人格權路徑強調個人的隱私權,重視個人信息與人格尊嚴的關系[22]。與之相對的,財產權路徑則提出數據產權歸屬應該采取財產權方式。這樣做不僅僅是出于提高數據挖掘分析水平、充分釋放數據價值的目的,而且還被認為能夠更好地保護個人利益[23]。財產權界定的基礎是以洛克為代表的勞動權理論。洛克[24]認為當勞動使得某一物品脫離了自然狀態,那么這一物品就屬于勞動的付出方。勞動權理論對勞動與財產權歸屬關系的論斷,為判定數據產權歸屬提供了借鑒。在對數據采取財產權路徑進行產權歸屬界定時,其根本在于界定數據是由誰的勞動生成的。
上文提到數據的主要持有者——政府與企業,它們都持有四類數據:自有數據、用戶個人信息、用戶數字痕跡和衍生數據。本文運用人格權和財產權兩種產權界定路徑,對這四類數據進行分類討論,其數據類型與產權歸屬如表2所示。

表2 數據類型與產權歸屬
政府與企業自身的數據——政務數據與企業運營數據,其產權歸屬較為明確,理論界也基本達成共識。首先,應當明確將政務數據界定為政府所有,對社會公開[1]。政務數據由政府所有的依據來自于政務數據收集和生成的主體是國家行政機關,它們在履行法定職責所收集和生成的數據由它們所有具有正當性。政務數據政府所有的界定,不僅要實現政府部門之間的數據共享,還要將其視為公共資源,對社會公眾開放①數據對社會公開也存在例外情況,如按照《政府信息公開條例》等法律法規的規定,依法確定為國家秘密的政府信息,法律、行政法規禁止公開的政府信息,以及公開后可能危及國家安全、公共安全、經濟安全、社會穩定的政府信息。。將政務數據視為政府所有的做法目前已經在福建省、重慶市等地進行實踐。其次,對于企業自身經營數據,理論界與法律界普遍認為該類數據歸企業所有。企業對其自身開展經營活動所需要、所生成的信息,如企業名稱、經營成本與收入,享有數據產權。
對于個體在政府和企業的網站、移動客戶端等數字設備設施上留下的個人信息,理論界普遍認為應該歸個人所有。雖然已有研究多關注企業持有的用戶個人信息,但政府持有的用戶個人信息與之相同,不僅都會直接涉及個人隱私,還都是用戶授權政府與企業持有,因此個人信息都應被視為個人所有。用戶個人信息劃歸個人所有后,其保護主要依靠人格權路徑,重在保護個人隱私信息。人格權保護路徑的典型案例如歐盟頒布的GDPR,對個人數據(在我國語境下即個人信息)設定了八項權利:知情權、訪問權、更正權、被遺忘權、限制處理權、反對權和不受制于自動化決策。我國2021年正式頒布實施的《中華人民共和國個人信息保護法》,與《中華人民共和國網絡安全法》《中華人民共和國數據安全法》共同構成我國網絡法律體系的核心,為個人信息保護提供制度保障。
對個人信息采取人格權保護在我國已有一定實踐經驗。例如,2018 年江蘇省消費者權益保護委員會(以下簡稱“江蘇消保委”)訴百度公司民事公益訴訟案中,江蘇消保委指出百度公司旗下“手機百度”“百度瀏覽器”兩款手機軟件在用戶安裝前,均未告知用戶其信息獲取的權限和目的,且在未經用戶同意的情況下,獲取諸如“監聽電話、定位、讀取短彩信、讀取聯系人、修改系統設置”等涉及用戶個人信息安全的權限。這些權限被江蘇消保委認為已經超出合理范圍,侵犯了消費者個人隱私。江蘇消保委在兩次約談百度公司無果后,認為百度公司無法有效保障消費者知情權和選擇權,因此向南京市中級人民法院提起公益民事訴訟②涉嫌“監聽”侵犯用戶信息江蘇消保委起訴百度[EB/OL].(2018-01-06)[2021-08-13].https://www.chinacourt.org/article/detail/2018/01/id/3148467.shtml.。
除對個人信息進行人格權保護之外,也有學者提出要考慮財產權保護的方式。隨著數字經濟的發展,個人信息開始出現商品化現象,例如信息盜賣。在個人信息的經濟價值日益顯現的今天,僅僅使用人格權對其進行保護,已經無法完全應對個人信息遭受侵害的問題。為此,對個人信息的保護應加入財產權保護路徑,構建“個人信息資料權”③吳韜.法學界四大主流“數據權利與權屬”觀點[EB/OL].(2016-10-24)[2021-07-10].https://www.sohu.com/a/117048454_481893.,將人格權和財產權兩種保護路徑相結合。人格權保護重在保護個人信息的精神利益,維護人的尊嚴與自由;財產權保護聚焦個人信息的財產利益,當受到侵害時,損失應按照市場價格計算。
對于用戶在政府、企業的網站、移動客戶端等產品設備設施上留下的數字痕跡,其產權界定則不像個人信息那么清晰明確。目前,理論界對政府持有的用戶數字痕跡討論相對較少,對企業持有的用戶數字痕跡已多有討論,本文認為雖然政府與企業性質不同,但對后者的討論能夠為判定不同情景下用戶數字痕跡的權利歸屬提供借鑒。
目前,對于企業持有的個人數字痕跡的產權歸屬問題,至少存在四種觀點:個人所有、企業所有、企業與個人共有、社會共有[25]。數據歸個人所有的觀點聚焦個人作為用戶、消費者所生成的數據,認為這些數據是個人合法且不可讓渡的權利;數據歸企業所有的觀點認為個人在企業網站、移動客戶端等渠道留下的數據屬于企業,企業通過個人在使用其服務時簽署的服務協議獲得個人數據的使用、收益與處置權;個人和企業共有的觀點認為個人數據屬于企業與個人共同所有,這一觀點在我國法院判決中較為常見;個人數據社會共有的觀點認為在互聯網企業平臺上的個人數據具有公共屬性,不能簡單歸為個人或企業所有。
本文認為用戶數字痕跡的產權界定應當采取政府與個人共有、企業與個人共有的方式,其保護路徑應以人格權和財產權相結合的方式。這種方式主要來源于用戶數字痕跡的生成機制與信息特性。一方面,用戶數字痕跡的生成來自用戶在數據持有者網站、移動客戶端等設備設施上的使用,而這些都需要數據持有者的資源投入,因此數字痕跡的生成需要用戶和數據持有者的共同貢獻。將用戶數字痕跡劃歸為個人與數據持有者共有產權符合該類數據要素的生成方式。另一方面,在大數據時代,用戶數字痕跡同樣可能具有識別個人身份的能力。此前,多數人認為用戶數字痕跡并不能直接用于識別用戶個人身份,但學者發現數字痕跡在與其他數據結合、在巧妙算法的計算下,也可能具有識別個人身份的功能[4]。某些類型的數字痕跡,如醫療健康、宗教信仰等,更容易被挖掘出具有識別個人身份的能力。因此,對數字痕跡的使用應當遵循人格權和財產權保護相結合的方式,堅持底線原則,在個人隱私最大化保護的基礎上開發利用數字痕跡,釋放其價值。
對數字痕跡采取人格權和財產權保護相結合的方式在我國司法界已有判例基礎。例如,2018年法院在“淘寶訴美景案”中,就專門針對淘寶收集和使用其用戶信息的正當性進行了界定。涉案的數據產品名為“生意參謀”,是淘寶通過收集、整理、計算和提煉用戶瀏覽、搜索、收藏、加購和交易等數字痕跡所生成的衍生數據產品,能夠幫助商家實時掌握相關商品的市場行情變化,改善其經營水平。法院認為雖然用戶的數字痕跡不具備單獨或者與其他信息結合識別個人身份的可能性,但數字痕跡仍然會涉及個人或商家的敏感信息,有可能暴露個人隱私或經營秘密。經過法院審查,淘寶在開發其數據產品時所使用的信息均符合隱私政策所宣示的原則、范圍。法院最終認定淘寶在研發其數據產品時滿足了保護用戶信息安全的要求,其行為具有正當性①淘寶(中國)軟件有限公司訴安徽美景信息科技有限公司不正當競爭糾紛案[EB/OL].(2019-04-02)[2021-08-13].http://www.zjsfgkw.cn/art/2019/4/2/art_80_16841.html.。
衍生數據一般來源于政府與企業對自身數據、用戶個人信息、用戶數字痕跡的單獨或結合分析,可見其生成離不開數據持有者的“加工”。在對數據加工的過程中,數據持有者不僅需要投入設備、資金等有形資源,還非常依賴數據分析人才及其專業知識。甚至后者更加重要,因為人才依靠專業知識制定出的算法才是釋放數據價值、生成高價值衍生數據產品的關鍵因素[10]。
在這個意義上,衍生數據應被視為數據持有者(在本文即政府和企業)所有。政府持有的衍生數據不僅是反映政府運行、社情民意的重要指標,也是政府優化治理體系、提升治理能力、完善服務能力的重要依據。這類數據劃歸國家所有才能真正發揮上述功能。相似的,企業持有的衍生數據,針對商品制造、銷售、購買形成的市場行情報告,對于優化市場資源配置、提升資源配置效率具有重要參考價值,劃歸企業所有才能釋放其經濟價值。
上述觀點在法院對“淘寶訴美景案”的判決中得以體現。淘寶在訴狀中稱美景公司招攬、組織、幫助他人獲取淘寶“生意參謀”數據產品中的數據內容,從中牟利。淘寶認為其對“生意參謀”數據產品中的原始數據和衍生數據享有財產權,而美景公司惡意破壞淘寶的商業模式,其行為構成了不正當競爭。法院認為淘寶在開發涉案數據產品時,投入大量人力、設備等資源,通過深度開發與系統整合,最終生成了與原始數據無直接對應關系的衍生數據產品——“生意參謀”。因此,淘寶對該數據產品享有獨立的財產性權益,可以為其所實際擁有。此外,美景公司在未經授權也未付出勞動的情況下,直接將涉案數據產品占為己有,作為自身獲利的工具,有悖于商業道德,對激發開發者創造性、提高消費者福祉、推動數據產業發展都有負面影響。最終法院判定美景公司構成了不正當競爭行為②淘寶(中國)軟件有限公司訴安徽美景信息科技有限公司不正當競爭糾紛案[EB/OL].(2019-04-02)[2021-08-13].http://www.zjsfgkw.cn/art/2019/4/2/art_80_16841.html.。
在社會生活數字化不斷加深的今天,作為數字化基石的數據要素一直備受關注。數據要素的經濟價值已多有討論,但本文提出數據要素的價值遠不限于經濟領域,其社會、治理價值同樣重要。同理,數據要素市場的構建,不僅能為數字經濟新產業、新業態、新模式的發展“添磚加瓦”,還能起到賦權社會、賦能政府等多種作用。為充分釋放數據要素的經濟、社會與治理價值,如何確定數據要素產權歸屬成為關鍵性問題。本文聚焦數據要素的類型學劃分,提出了與已有研究有所不同的分類方式。以數據要素持有者和數據要素生成方式為維度,提出政府和企業作為數據持有者,二者都持有四類數據:自有數據、用戶個人信息、用戶數字痕跡和衍生數據。根據這四類數據的生成方式與信息特性,結合人格權和財產權方式對其進行產權界定,以期實現保護個人隱私與利益,促進數據要素共享流動,釋放數據的經濟、社會與治理價值,推動數據要素市場培育等多重目標。
當前,數字化轉型已然成為全球浪潮,深刻影響著世界各國的社會經濟發展與國家實力,甚至將改變世界權力格局。作為其核心“燃料”的數據要素無疑在其中扮演著重要角色。多年來,我國通過數字技術的研發與推廣,在經濟、政治與社會等領域已經持續積累了海量數據,如何充分釋放這些數據要素的價值成為進一步推動社會經濟發展、提高民眾福祉、提升國家實力的重要議題。因此,我國應結合各地在數據要素確權、共享、開放、交易與應用方面的經驗教訓,構建數據要素市場,旨在保護個人隱私的同時,增強社會各主體對挖掘數據要素價值的積極性,持續推進數字化、現代化的轉型與發展。推動數據要素市場良性發展,我國應依據以下原則加快相關制度建設:
第一,遵循數據要素的分類原則,搭建精細化的產權界定體系。數據要素的產權界定與保護是數據要素市場得以良性發展的必要基礎,根據本文的研究發現,數據要素存在多種類型,因此其產權歸屬需遵循分類原則。通過分類可以明確不同類型數據要素的生成主體與方式,從而判定數據要素產權歸屬與保護機制,進而發揮數據要素的價值,推動數據要素市場的快速發展。
第二,堅持隱私保護的底線原則,在釋放數據價值時保護個人信息。數據要素市場的主要目標是發揮數據要素的經濟、社會與治理價值,但價值的釋放并非唯一目標。由于數據要素的生成通常會涉及個人信息與數字痕跡,前者能夠被直接用來識別個人身份,后者在一定條件下也具有相似功能,因此個人隱私保護是挖掘與釋放數據要素價值過程中不可忽視的議題。為此,應遵循個人隱私保護的底線原則,在充分發揮數據要素價值的同時,強化對個人隱私信息的保護。
第三,落實經濟社會數據(數字痕跡)的強監管原則,強化政社協同監督作用。數據要素中有關經濟社會的數據價值重大,尤其受到企業等市場主體青睞,但在價值巨大的另一面則是潛在的數據安全隱患。為此,應堅持經濟社會數據的強監管原則。政府與社會作為監管主體,發揮政社協同的作用;在監督內容上,既要保證數據在使用過程中個人隱私保護的原則,又要確保數據的使用符合相關倫理標準,如透明、公開、人類尊嚴等。
第四,倡導數據融合與協同開發原則,鼓勵多元數據互通匯聚,釋放聚合作用。得益于數字技術的快速發展與廣泛應用,我國在政府、經濟、社會等各領域已經積累了海量數據。然而,這些海量數據目前仍被不同主體所持有,并各自為戰,不同類型數據之間的互聯互通仍未實現。這是數據要素市場快速發展必然需要解決的問題之一。為此,應堅持多元數據融合、多主體協同開發的原則,創新性地將政務數據、經濟數據與社會數據相結合,建立政府、市場、社會等多主體協同開發的工作機制,充分利用各主體的專業知識與技能,最大化釋放數據要素的經濟、社會和治理價值。