□葉宣含
(浙江大學 光華法學院,浙江 杭州 310058)
自數據的經濟和社會價值逐漸凸顯開始,設立“數據財產權”、“數據信息財產權”、“數據生產者權利”、“數據用益權”、“數據新型財產權”等數據財產權利的呼聲就不絕于耳。不同于以往的數據庫作品保護,設立數據財產權的目的是保護數據本身,無論其編排方式如何。并且,這種呼聲隨著《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》(下文簡稱“《意見》”)等文件將數據作為一種新的生產要素而愈發高漲。特別是《意見》中“研究根據數據性質完善產權性質”的表述似乎為數據財產權利理論提供了重要的依據。然而“產權”并非法定的權益,也不具有明確的規范含義。數據財產權這一解讀方式或許與中共中央和國務院的意旨相距甚遠。與其將此視為一種定論,不如將此視為有待研究的未決問題,否則《意見》中直接提及數據財產權即可,并且“數據“一詞也不具有清晰的內涵和外延。當然,因為筆者對數據法律性質以及保護規則的研究是在財產權體系中展開的,不涉及人格權益,所以將數據限定于具有經濟價值的非個人數據,而且這些數據本身不構成現有法定財產權的客體。
無論數據“產權”如何界定,數據保護的最終目的是實現數據自由流通與共享。這一目的在《意見》的總體要求部分就開宗明義地確定下來。中共中央和國務院希望“破除阻礙要素自由流動的體制機制障礙”以及“充分發揮市場配置資源的決定性作用,暢通要素流動渠道,保障不同市場主體平等獲取生產要素”。《中共中央國務院關于加快建設全國統一大市場的意見》又再次強調“加快培育統一數據要素市場”“建立健全數據交易流通、開放共享制度”,更明確地提出“破除平臺企業數據壟斷等問題,防止利用數據、算法、技術手段等方式排除、限制競爭”。因此任何阻礙數據自由流動,阻止市場主體平等獲取數據的障礙都應當被破除。數據配置制度設計也應當圍繞此目標展開,否則容易被各種群體的不同利益所裹挾,甚至成為某一群體的獨家保護傘。
不僅如此,新型數據財產權對財產權法定原則的挑戰應當以堅實的理論基礎為武器。但是數據所具有的經濟利益或價值只是新型財產權設立的必要條件,而非充分條件。若要證成數據作為新型財產權的客體,還需要其他正當理由。畢竟具有經濟價值但不作為財產權客體保護的例子比比皆是,例如數學公式、單純的事實性新聞、科學發現等。對數據產權的界定應當回歸理論基礎。拋開理論基礎的數據法律性質研究皆為空中樓閣。當前主張設立數據財產權的理論基礎主要有兩種:一為洛克的勞動財產論;二為數據收集激勵原則。然而勞動財產論本質上是一種自然法思想,產生于農業社會階段,主要限于物資豐饒的自然時期。洛克觀念形成的背景與當下的數字經濟時代截然不同,其能否適用于數據這一無形客體值得懷疑。至于數據財產權的潛在激勵作用則是不明確的:它有可能加強或抑制數據經濟中的創新活動。應該仔細審查創造額外的激勵措施促進數據收集和流通的正當性和合理性。
再者,對數據保護的探討不應脫離算法保護。在數字時代,大多數據集是通過算法而非自然人直接收集的,這不同于以往勞動密集型的數據匯編。盡管人也參與數據收集,但人的智力勞動通常體現為對收集數據的機器設備和算法的開發設計。并且,被收集的數據本為無序、混亂的原始數據,只有通過大數據挖掘算法的分類、聚類、關聯規則發現等處理,才能成為有序、有使用價值的數據資源。這個算法挖掘數據過程被稱為“數據資源化”。在這個意義上,算法提升了數據的經濟價值,數據是算法的副產品。同時,算法的優化又需要大量有效數據的支撐。算法所得結果的質量取決于其和數據的擬合程度。如果沒有足夠的數據支撐、檢驗,設計算法無異于閉門造車。因此,算法和數據之間存在極為密切的互動關系。為了實現數據資源化和流通,應當設計正當合理的算法保護規則。但“算法解釋權”“算法公開透明”等觀點與數據保護之間的激烈矛盾卻少為人所注意:若算法保護薄弱,數據挖掘和價值提升也將受阻?;蛟S從算法和數據的關系出發,一個研究數據配置規則的新視角將被打開。
基于防止“不勞而獲”“食人而肥”等傳統社會道德理念,洛克的勞動財產論非常容易被接受并作為設立數據財產權的正當性基礎。針對財產起源的條件,洛克認為:“所以只要他使任何東西脫離自然所提供的和那個東西所處的狀態,他就已經在那個東西中摻進他的勞動,加進了他自己的某種東西,因而使它成為他的財產”,“財產權是對勤奮勞作的一個合理的報酬”。在此種思想影響下,許多學者將數據分為原始數據和衍生數據,或稱之為基礎數據和增值數據并且認為自然人或企業對自己參與社會活動所產生的可識別原始數據享有權利,數據處理者則對原始數據收集、加工、融合形成的衍生數據享有財產權,因為他們投入了大量人力物力。
實踐中,一些法院也通過適用勞動財產論,將他人收集整理的數據視為財產權客體。例如在“青島市氣象科技服務中心等訴青島東岳時通電訊公司天氣預報侵權糾紛案”中,法院即認為天氣圖、雷達資料、衛星云圖、實況資料等各種氣象數據,經各自專業人員會商、分析整理而加工制作得出,屬于通過智力勞動得到的技術產品,具有無形財產的屬性。對該技術產品,兩原告共同享有民事權利,應當享有占有、使用、收益、處分的權利。在“深圳市谷米科技有限公司與武漢元光科技有限公司不正當競爭糾紛案”中,法院認為公交實時類信息數據經過人工收集、分析、編輯、整合并配合GPS 精確定位,具有實用性并能夠為權利人帶來現實或潛在、當下或將來的經濟利益,其已經具備無形財產的屬性。原告對這些信息數據的占有、使用、收益及處分享有合法權益。不僅將勞動作為財產的基礎,這些裁判還具有財產物化思維,將物權作為設立數據財產權的模板。
然而,以勞動為理論基礎的數據財產權突破了財產權法定原則。財產權法定原則是指財產權的種類和內容由法律明確規定和限定。該原則的主要針對對象是絕對權。一般認為,法律對絕對關系必須采取權利法定原則,并且,一切絕對權利必須公示;對于相對關系來說,因其僅限于當事人之間,法定原則與公示性則無必要。該原則排除了當事人通過約定、法官通過判例創設絕對權之內容與類型的可能性。物權法定、知識產權法定是財產權法定原則中的一部分,任何絕對權性質的財產權均須遵守該原則,數據財產權也不例外。也有法院基于物權法定原則,否認數據產品財產所有權,認為財產所有權系絕對權利。如果賦予網絡運營者享有大數據產品財產所有權,則不特定多數人將因此承擔相應的義務。限于我國法律目前對大數據產品的權利保護尚未規定,法院對原告大數據產品財產所有權的主張不予支持。該法院雖然遵守了物權法定原則,但違背了財產權法定原則,認為大數據產品自身已成為市場交易的對象,已實質性具備了商品的交換價值,是原告的勞動成果,其所帶來的權益應由原告享有。這實質上是將數據作為一種可以在市場中自由流轉的無形財產,數據處理者對此享有保護期限不明的排他權。
冠以“民事權益”“無形財產”之名,具有絕對權性質的數據財產權益也突破了財產權法定原則??v觀上述案件,雖然法院并不直接確認數據處理者的合法權利,卻以權益之名賦予數據處理者絕對權。因為這些數據財產權益可以對第三人產生普遍的排他效力,并且沒有權利范圍、保護期限制,幾乎具有和知識產權、物權等相同的效力。但我國《民法典》并未設定相應的數據權,僅在第一百二十七條規定:“法律對數據、網絡虛擬財產的保護有規定的,依照其規定?!痹摋l文間接確認了數據保護應當遵從財產權法定原則,依照已有的法律規定,若沒有規定的,則不得任意創設新型權利。在沒有依照相應法律規定的情況下,一些法院僅因數據可以產生經濟利益將其作為無形財產,賦予當事人新型財產權。這嚴重損害了法的安定性,破壞了財產權制度的體系結構。
除了維護法的安定性,財產權法定原則還包含了其他價值考量。若要證成數據財產權的正當性基礎,至少其創設不應妨礙財產權法定原則所保護的各種實質性價值。財產權法定原則保障的實質性價值包括:一般人的行為自由、市場經濟秩序以及立法者重視的其他利益等。因為財產權會對不特定的第三人發生效力,關系到第三人的利益和行為自由。如果不對財產權的種類、權利內容、保護期間加以限制,第三人將無法合理預測自己的行為。但數據類型多種多樣,具有經濟價值的時間也長短不一,其保護期間極難通過法律加以確定。這就會影響第三人合理利用數據的行為自由。不僅如此,健康的市場經濟秩序也鼓勵經營者自由競爭。一味強調數據保護,創設具有強大效力的數據財產權會損害市場公平競爭機制。
如果說數據財產權在實然層面突破了財產權法定原則,那么其可否依據勞動財產論在應然層面獲得正當性基礎呢?雖然勞動財產論體現了一種“勞有所得”的樸素社會道德觀念,但法律的邏輯并非如此簡單。財產權制度中充斥著各種價值,“勞有所得”只是其中之一。僅依據勞動創設數據財產權的正當性是需要被質疑的,因為這可能與財產權制度中的其他價值相沖突。下文就以兩種主要的絕對性財產權——物權和知識產權為例,考察勞動財產論在我國財產權制度中的應用情況以及探討財產權制度所保障的首要價值。
勞動財產論并非知識產權的理論基礎。勞動財產論以保護個人財產作為目的本身,但是我國知識產權法以“促進社會主義文化和科學事業的發展與繁榮”“促進科學技術進步和經濟社會發展”等公共利益為目的。保護個人財產、利益只是一種實現這些公共利益目的的手段。在知識產權領域,當公共利益和私人利益發生難以彌合的沖突時,前者往往優先于后者。即便他人付出了勞動,也會因為有礙公民基本經濟、文化權利和自由而無法獲得保護。例如對于某一種商品通用名稱,即使經營者付出勞動,投入大量人力物力提高其知名度,也不得基于商品化推廣中的貢獻主張商標專用權。否則將導致其他市場主體無法準確注明其商品名稱以及展開正常推廣活動,進而不合理地限制市場競爭。甚至智力勞動也不一定受知識產權保護,現有知識產權專門法僅對部分智力勞動成果予以保護。權利人對智力勞動成果所享有的權利不是與生俱來的,而是將可以保護和應當保護的智力勞動成果作為知識產權專門的權利客體,依法確定。權利客體的種類和數量雖然始終處于不斷發展變化當中,但具體的種類和數量仍須以現行法為依據,司法裁判標準也須遵守現行法。而且知識產權法對某些智力勞動成果的保護只是激勵文化、科學和經濟發展的手段。
勞動財產論在數據保護中的復興令人聯想到曾被放棄的“額頭淌汗”理論?!邦~頭淌汗”這一理論源于抽象的公平觀念,由適用《安妮法令》的英國法院首先提出,強調在后作者不能利用他人的勞動而獲得利益。這一理論也隨之被美國版權法吸收,一度成為保護勞動的理論基礎。但是在Feist 案中,美國最高法院否認了原告付出勞動所收集的電話號碼簿(本質上是一個數據集合)構成作品,認為作品需要體現作者創作性的選擇和安排。而且即使數據匯編構成作品,他人仍然可以自由地使用該作品中的數據,只要不復制其中的獨創性部分。至此,Feist 案結束了一些法院基于勞動而提供版權保護的傳統。通過放棄“額頭淌汗”理論,美國最高法院強調其價值位階立場:不受限制地獲取事實和信息的公眾利益高于他人因勞動而獲得的個人利益。無論是英美版權法還是我國的著作權法,都允許在后的作者站在前人的肩膀上創作作品,利用那些處于公共領域的材料來節約時間和精力,從而避免不必要的重復性勞動。而今以勞動為基礎的數據財產權學說卻重拾“額頭淌汗”理論,忽視了數據流通的公共利益,允許數據處理者對數據本身的合法壟斷。
勞動財產論也并非物權的理論基礎?,F代社會中的財產權均“由法律直接創設”,與“勞有所得”自然法思想無關。即便是誕生于農業社會的物權,也逐漸剝離其自然法屬性。“洛克和盧梭都認為物權是基于誰創造誰所有這一‘正當’的自然法則的,后來的物權法不過是對這種正當的、符合道德和公義的自然法則的確認。”這一理念或許可以適用于農業經濟社會,但卻無法適用于紛繁復雜的現代經濟社會。物權的正當性基礎已經從勞動取得財產權的自然法思想逐漸轉變為保證財物流通交易安全、維護市場經濟秩序和國家的基本經濟制度等公共利益。物權法是落實憲法規定的“公有制為主體、多種所有制經濟共同發展”基本經濟制度的民事法律?;谖覈鐣髁x國家性質,專屬于國家所有的不動產和動產,特別是土地,禁止任何組織或者個人侵占,無論他人是否對此付出過勞動。這從根本上排除了他人通過勞動將國有財產轉化為私人財產。此外,物權法除了保障公民的財產自由之外還兼顧分配正義的價值追求。分配正義體現了與勞動財產論相反的價值取向——保護弱勢群體。若按照勞動財產論的邏輯賦權,結果必然是強者更強,弱者更弱。但為了實現共同富裕這一社會主義的本質要求,物權法的諸多制度設計向弱勢群體傾斜,例如建設工程價款的優先受償權等。這些權利的理論基礎顯然與勞動無關,而是為了保障有序的人類共同社會生活。
由是,物權和知識產權都以保障公共利益作為最高的價值位階和理論基礎?!皠谟兴谩彪m然符合傳統社會道德觀念,卻需要讓位于公共利益,而且勞動的報酬也不必以設立財產權的方式收回。所以當某一勞動成果不屬于法定權利客體時,對于未經許可使用他人勞動成果的行為,不能當然地認定構成侵權或者不正當競爭,這是因為“模仿自由”。使用或利用不受法定權利保護的信息是基本的公共政策,也是一切技術和商業模式創新的基礎,否則將在事實上設定一個“勞動成果權”。所以,以勞動為基礎的數據財產權不僅在實然層面突破了財產權法定原則,在應然層面也違背了我國財產權制度所確保的核心價值。
除了正當性基礎不牢固,以勞動財產論為基礎的數據財產權還將面臨難以克服的制度設計難題。任何一個完整的權利制度應當包含以下幾個方面內容:權利的主體、權利的內容、權利的客體以及權利的限制。但以勞動為基礎的數據財產權將在權利主體、客體、內容與權利限制方面產生太多的不確定性。
首先,享有數據財產權的權利主體難以通過抽象的勞動行為加以確定。不同于作品創作行為、專利發明行為以及商標注冊申請行為,“勞動”的含義是抽象和模糊的。立法者無法對產生數據財產權的勞動設定一個法律標準。勞動語義的泛化將導致任何實施與數據收集、處理有關行為的人成為數據財產權的主體。并且,正如亞當·斯密在《國富論》中所述,勞動分工增進了勞動生產力。在生產力發達的現代社會,勞動分工的細化已經超出常人想象。任何個人的勞動必然要依賴于他人的勞動,而數據的收集處理也是許多不同主體共同的勞動貢獻。如果按照勞動財產論的邏輯,將得出這樣的結論:一些數據集合的財產權因共同勞動而被集體擁有。這與一些學者主張的由特定數據控制主體享有數據財產權的觀點背道而馳。為了解決這一問題,歐盟創設了數據庫特別權利(sui generis database right),嘗試通過按照實質性的勞動投入確定權利主體。《關于數據庫的法律保護的指令》第7條第1款將受保護的勞動限定為“在數據庫內容的獲取、檢驗核實或選用方面,經定性/定量證明做出實質性投入”。但是這個嘗試也是失敗的,因為無法確定“實質性投入”所需達到的數量或質量。加之,如今大多數據集是由人工智能、算法直接采集生成的,人對數據的直接勞動投入更難以達到實質性的數量或質量。
其次,勞動財產論無法準確地界定數據財產權的客體范圍。勞動與數據財產權客體之間建立的聯系并不是直截了當的。在著作權領域,作者的創作行為和作品之間存在一一對應的關系。但是數據處理者的勞動和數據財產權客體卻無法建立一一對應的關系。并非所有勞動都可以產生數據財產權客體。何種數據才能受財產權保護?對此,存在衍生數據、數據集合、數據信息、“價值增值”的數據等客體觀點。這些觀點的核心是具有經濟價值的數據集合才能成為數據權客體。然而,數據所具有的價值由市場中其他人的需求所決定。如果這個價值不是由勞動所決定,而是由他人的需求所決定,勞動如何能夠把自然權利建立在市場價值的基礎上?更重要的是,這些學說也無法精確劃定數據財產權客體范圍,將導致數據財產權客體不合理地擴大。
再者,勞動財產論也不能界定數據財產權應具有何種權利內容與多大程度的權利范圍。權利內容和范圍的設計往往需要綜合性衡量各種價值因素和各方利益,尋求一個巧妙的平衡點。這些價值和利益衡量已經超出了勞動財產論的范疇,進入了更廣闊的公共利益的層面。至于數據財產權主體能否禁止他人對數據的復制、傳播以及其他利用方式,勞動財產論也無法提供指引。
最后,遵循勞動財產論的邏輯所設立的數據財產權將沒有保護期間的限制,產生永久有效的財產權。勞動財產論所確認的個人財產在社會形成之前就已經存在。因為是個人勞動而不是法律將共有物轉化為私人財產,國家的主要任務是確保個人財產權,而不是干涉它。這種理論應用于數據保護,將會導致一個荒誕的結論:數據財產權應被特定主體永久擁有。這顯然會造成一個社會無法接受的制度成本。即使適用一種“修正”的勞動財產論,確定數據財產權的保護期限,保護勞動仍會導致權利擴大以及保護期限延長。因為數據處理者可以通過更新、添加和修改已有數據集合的勞動,對數據財產權進行新的拓展以及延長保護期。
洛克勞動財產論形成的時代背景與現在截然不同,但是仍然有許多學者熱衷于引用該理論作為數據財產權等新型財產權的理論基礎。這主要出于兩方面原因:一是為了獲得“思想體系上的正統性”;二是受一種傳統社會道德觀念的普遍影響。但將勞動財產論作為數據財產權的理論基礎是站不住腳的。在財產權所保障的價值體系中,勞動財產論所強調的“勞有所得”這種以個人利益為目的的價值往往處于底層,劣后于公平競爭秩序、信息自由以及科學文化事業發展等公共利益。即使設立數據財產權,勞動財產論也無法劃定正當和不正當使用數據的邊界,達到公平和效率的平衡。
除了勞動財產論之外,一種功利主義下的激勵原則也是數據財產權支持者所依據的理論基礎。這種理論建立在“數據市場失靈”的擔憂上。他們擔心如果不直接保護公開數據,社會只接受叢林規則,數據收集者為了維持自己的商業模式,就必須不斷收買隨時會出現的真實的或偽裝的復制者以消除他們的“搭便車”行為。最終,數據收集者的動機會因此受損,市場失敗很可能出現。因此需要創造數據財產權這一額外的激勵措施促進數據收集和處理。上述論斷其實包含三重條件:其一是存在一個真實的數據市場;其二是數據處理者已無法通過各種手段收回自己的投資;其三是數據財產權的設立會對數據收集和處理產生良好的激勵作用。只有這三重條件均成就,“數據市場失靈”這一命題才可能成立。否則,該命題不能成立或無法判斷真偽,進而影響激勵原則的正當性。以下即從這三重條件出發,檢視數據財產權設立所依賴的“數據市場失靈”這一命題能否成立。
“數據市場失靈”命題成立的前提必然是存在一個真實的“數據市場”,但“數據市場”的界定并不明晰。數據市場及市場主體交易形式的界定對后續的規范討論尤為重要,這決定了數據是以何種性質流通的:是作為無形財產還是作為服務合同的內容。受傳統商品交易市場的影響,“數據市場”往往被認為是一個商品化數據的交易市場,數據作為一種商品在市場中進行交易流通。可商品化數據是市場主體可以自由將其用于商業活動的數據類型,財產屬性是可商品化數據的最大特征。然而此種“數據市場”觀點已經默認數據是作為一種無形財產在市場上流通,若再以此為基礎論證數據財產權的正當性未免陷入了循環論證的泥潭。
實質上,根據當前主要的市場交易形式,數據在規范意義上更適合被認定為服務合同所提供的內容而非直接交易的無形財產。我國“數據市場”中數據交易的主要形式是由數據控制主體對他人提供一種以數據為內容的服務,并且二者之間形成服務合同。首先,以提供數據為內容的服務與以數據為對象的無形財產交易存在重要的區別。前者形成的是繼續性合同,后者則多是一時性合同。繼續性的數據服務合同須經持續的給付才能實現合同目的,時間因素在合同履行上居于重要地位。例如在“安徽美景信息科技有限公司、淘寶(中國)軟件有限公司不正當競爭糾紛上訴案”中,淘寶公司與商戶之間簽訂了《生意參謀零售電商大數據軟件服務協議》?;诖耍詫毠緸楹贤鄬Ψ教峁槠谝荒甑睦^續性數據提供服務,商戶可以在合同期限使用生意參謀零售電商大數據軟件獲得的各項數據內容。數據服務之所以成為數據交易的主要方式,是因為數據具有很強的時效性。許多數據的經濟價值會隨著時間推移而顯著降低。這就要求數據控制主體不斷地對數據集合進行更新,提供繼續性的數據服務。因此,在當前甚至是今后,數據多是作為服務合同的內容進行流通。將數據視為一種無形財產,甚至是一種物的觀點,忽視了數據市場的主要交易形式并非一次性的數據轉讓或使用許可。所以,“數據市場”應當是一個以數據服務為核心的數據流通市場。在該市場界定下,數據流通不以數據作為無形財產為前提。
面對未經許可的數據獲取和使用行為,數據處理者并非毫無還手之力,實際上他們可以通過各種手段收回自己的投資成本。否則,為什么在同樣不提供數據財產權保護的美國,數據處理和提供商如此成功,行業如此有利可圖?如今,即使沒有數據財產權保護,數據處理者也已經以提供有償數據服務的方式逐漸填補數據收集和處理的成本。同時,數據處理者通過技術手段、持續更新數據以及限制性合同保護其認為具有商業價值的數據。這些手段使數據處理者對數據享有“事實上的排他性(factual exclusivity)”,排除他人未經許可擅自獲取和使用其數據。以下將論述數據處理者如何在沒有數據財產權的情況下利用這三種措施控制數據流通。
第一,數據處理者可以利用加密、識別訪問行為特征與復雜的驗證碼等技術手段排除擅自訪問和獲取數據的行為。如果數據庫處理者是通過軟件、數據庫等提供數據服務,其可以設置一套復雜的加密系統,只允許掌握密鑰的用戶登錄該系統并獲取數據。此外,許多網絡數據庫一次只提供少量數據,因此用戶難以復制整個數據庫。而且數據處理者可以通過技術識別訪問行為特征,以辨別訪問主體是否為正常用戶。對于那些頻率高且有規律的機器自動訪問行為,網絡服務器會自動切斷數據提供服務。復雜的驗證碼技術也有助于限制網絡爬蟲以較低的成本和較高的效率獲取數據。由此,數據處理者可以保留對數據的控制,并在合同基礎上提供數據服務。甚至,在數據只有唯一來源時,數據處理者的技術手段不僅能夠克服市場失靈的威脅,甚至還能使其擁有異常的市場支配地位,導致過度的數據保護狀態。
第二,數據處理者可以通過持續更新數據集合具有區別于其他經營者的競爭優勢,從而贏得更多的商業機會。數據的時效性導致數據處理者更新數據集并提供繼續性的數據服務。這種數據持續更新行為既增加了數據處理者的競爭優勢也增加了他人獲取數據的成本。即便他人可以復制數據并以更低價格提供數據,若用戶認為數據已經喪失時效性,他們就不愿意購買此種數據服務。由于獲利降低,擅自獲取并使用數據的行為也會隨之減少。
第三,數據處理者還可以與交易相對人簽訂限制性的數據服務合同,約定具體的數據獲取和使用方式。一旦合同相對人違反該約定,將承擔違約責任,數據處理者只需依據合同關系就可以獲得充分保護。以“淘寶訴美景案”為例,淘寶公司與美景公司間形成的協議明確約定賬號購買者禁止將賬戶提供給第三方使用,并且禁止將通過生意參謀軟件獲得的各項數據向第三方提供。因美景公司違反該約定,淘寶公司有權請求其賠償損失。既然違約損害賠償請求權可以填平損害,數據處理者就無須借助額外的數據財產權實現數據保護。
如此,以數據服務為核心的數據流通市場就可以在沒有法定數據財產權的情況下蓬勃發展起來。認為數據處理者在沒有財產權依據的情況下往往不敢開展數據共享和交易的觀點忽視了他們憑借各種手段對數據享有“事實上的排他性”。在實踐中,“事實上的排他性”足以保障他們在服務合同基礎上有償提供數據,并收回投資成本。然而,通過設定額外的數據財產權利來干預并未失靈的數據服務市場的運作,并不能保證市場秩序改善。相反,它可能會帶來擾亂當前數據服務市場秩序的風險。
基于激勵數據大規模收集和處理以增加社會福祉的美好設想,一些學者主張設立數據財產權。此種功利主義下的激勵原則或許可以成為設定數據財產權的理論基礎,但問題是:數據財產權的激勵作用是否如此有效?它的設定真的可以增加整體社會福祉嗎?如果比較國家“完善數據要素市場化配置”的目標和數據財產權設定的后果,這個回答很可能是否定的。
一方面,數據財產權的設定并不能有效地實現“數據資源化”的目標。“數據資源化”是國家“完善數據要素市場化配置”的重要目標之一。不管是在《意見》,還是在《“十四五”規劃》等政策性文件中,國家都特別強調“數據資源化”,要求“提升社會數據資源價值”以及“激活數據潛能”等。該目標的本質是提升數據質量,激發數據使用價值。數據處理者所收集的數據一開始可能是無序、混亂的,需要通過大數據處理算法進行分類、聚類、關聯關系挖掘等整理,轉化為高價值的數據資源。然而,數據財產權的激勵作用未免過于單一,只能增加數據產出的數量,卻無法提升數據產出的質量。因為按照現有的數據財產權理論,無論數據的質量以及價值高低,只要企業為收集和整理、分析數據付出了實質性的勞動投資,即可獲得排他性的保護。高保護程度的數據財產權不一定能促進數據資源化,反而容易導致“劣幣驅逐良幣”。如此,數據財產權的激勵功能則十分有限,并不符合現有政策性文件所強調的“數據資源化”目標。
另一方面,數據財產權的設立也可能與促進“數據資源流通和共享”的目標背道而馳。功利主義所追求增加社會福祉的目標在數據經濟領域可以被解釋為“數據資源的流通和共享”。具體而言,即數據資源可以流通至有迫切需求且有能力處理數據的需求者處。對于數據財產權和數據流通之間的關系,一些學說意圖通過引用科斯的產權理論,證明前者對后者的正向促進作用。因為界定清晰的數據財產權可以降低交易成本,促進數據流通。但是數據財產權的制度構建本就面臨主體、客體以及保護期限不明等重重困難,難以達到所謂的產權清晰。更為關鍵的是,交易成本是雙方的,一方交易成本的降低很可能是以另一方交易成本的增加為代價的。數據財產權的設定或許降低了數據處理者的交易成本,但增加了數據需求方的交易成本。由于議價能力和信息的不對稱,數據服務合同通常有利于數據處理者而非數據需求者。數據財產權的設定則將加劇二者在議價能力方面的不平衡。特別是一些擁有大量用戶的平臺可以收集海量數據,并從中獲得非同一般的競爭優勢。數據競爭優勢所帶來的市場支配力可以讓大型平臺經營者制定規則,單方面對數據的訪問和使用施加條件。但目前的反壟斷制度還沒有考慮到這樣一個事實,那就是擁有集中數據控制權的公司可以系統性地使市場傾向于他們的利益,從而戲劇性地重塑這個行業。是以,一向注重保護企業數據的歐盟也察覺到此,在《歐洲數據戰略》中強調通過《數字服務法案》解決或預防該問題,以確保市場保持開放和公平。因此,數據財產權等額外制度的激勵作用極為有限,反而可能會干擾數據服務市場運作,阻礙數據資源流通和共享。
要而論之,“數據市場失靈”是一個偽命題。在不提供數據財產權保護的情況下,數據處理者仍然有各種方法實現對數據“事實上的排他性”并收回投資成本。而且實際上,企業在不斷地收集和處理數據,數據不足的預測更像是一個臆想。僅谷歌公司每天就處理20PB(20000TB,1TB=1024GB)的數據,而且全球的數據收集正以指數級的速度增長。此外,數據財產權的激勵作用也非常有限,既不符合“數據資源化”目標,也不一定能促進“數據資源流通和共享”。
即使不考慮財產權法定原則,數據的時效性和復雜性也決定了其不適合成為財產權客體。數據的時效性將導致數據財產權保護期間的不確定。不同于一般財產權客體,數據的經濟價值會隨著時間流逝而逐漸削弱直至完全喪失。甚至,許多數據的經濟價值就在于較強的即時性,例如每日天氣預報數據、實時新聞數據和即時金融數據。正是因為數據處理者在第一時間提供了相關的數據服務,他們才具有區別于其他經營者的競爭優勢。當此類信息公布后一段時間,就不再具有經濟價值,不應再受法律保護,大眾可為科學研究目的或其他目的任意使用。如果數據需求方非常在意數據的時效性(例如只關注當天的金融數據),獲取并直接使用上個月甚至上周數據的行為并不會損害數據處理者的利益,也不會破壞市場秩序。數據的時效性特點還引發了對歐洲數據庫特別權利15年保護期的批判乃至完全廢除的質疑,認為在如此快速創新循環的動態環境中,15年的保護期過長。此外,不同數據經濟價值的存續期間又千差萬別,由是,立法者無法確定一個統一且合理的數據財產權保護期限。
數據的復雜性還導致數據財產權客體的不特定。因為數據類型復雜多樣,難以對數據抽提規范意義上的公因式。面對這種立法技術上的障礙,當前數據財產權支持者放棄對數據本身的分類,設想出一個客體標準——數據規模化。規模化的“數據集合”“大數據”就成為數據財產權的客體。但即使是數據財產權的支持者也無法回答“數據集合”需要達到多大規模才構成財產權的客體。更何況并非所有規?;臄祿伎梢猿蔀樨敭a權客體,例如不具真實性和準確性的虛構數據集合就不值得保護。其實,強調數據財產權客體“規?;睒藴实脑蚴侵挥写罅繑祿e聚才普遍產生經濟價值,單個數據一般不具有經濟價值。所以數據財產權的客體標準本質上就是“經濟價值”標準。然而,正如霍爾姆斯所言:“財產,是法律的創造,不是由價值產生的,可以交換僅是一種事實?!苯洕鷥r值不直接產生財產,也無法準確劃定一個清晰的數據財產權客體標準。當數據財產權客體難以特定時,第三人對自己獲取和使用數據行為的預測和信息成本仍然無法降低。由此,面對任何數據集合,第三人都可能以為無法使用,從而引發“寒蟬效應”。
雖然數據的特性決定其不適合作為財產權的客體,但具有經濟價值的數據的確可以賦予數據處理者競爭優勢,故而可以構成《反不正當競爭法》中的競爭利益。競爭利益是經營者相對于其他經營者的合法權益,包括交易機會和市場競爭優勢。存在值得保護的競爭利益是不正當競爭的前提,它類似于侵權法中的權利,沒有權利存在,就不可能存在侵權行為。但是與絕對性的財產權利相比,數據競爭利益具有相對性,只存在于具有競爭關系的經營者之間。所以,數據競爭利益所產生的排他性是有限的,無法波及消費者以及不具有競爭關系的其他經營者。不僅如此,數據處理者競爭利益受到損害的結果也不必然導致《反不正當競爭法》的適用,除非他人獲取和使用數據的行為同時擾亂市場競爭秩序。原則上,《反不正當競爭法》不推定擅自獲取或使用數據的行為構成不正當競爭。因為,在自由競爭的市場中,經營者無權要求對其競爭利益保護像絕對權一樣,絕對排除競爭者損害,而是必須將部分損害作為自由競爭的結果加以容忍。根據科斯的損害相互性原理,當數據處理者A 的競爭利益因經營者B的行為受損時,《反不正當競爭法》的處理邏輯不是制止B保護A,因為制止B保護A也會導致B的利益受損?!斗床徽敻偁幏ā氛嬲枰鉀Q的問題是:在具體市場場景中,A 和B 誰的利益更值得保護。這涉及“模仿自由”“公平競爭”“數據自由流通和共享”等多種價值的取舍和平衡。
在綜合考慮多種價值的基礎上,鼓勵其他經營者以增加數據價值的方式使用數據,與數據處理者展開“效能競爭”是一個較為合理的解題思路?!靶芨偁帯崩碚?,即經營者是否以自己的商品或服務的優質優價或自己經營活動的業績展開競爭。如果其他經營者以與在先數據處理者相同或相似的方式使用數據,提供同質化的數據服務,則無益于數據要素市場的培育,除非在先數據處理者構成“數據壟斷”。盡管市場經濟鼓勵經營者在數據的收集、處理和使用等方面進行自由競爭,但是競爭行為應當以增加原有數據集的價值為前提。只有如此,其他經營者的行為才會惠及社會公眾,并促進數字經濟發展。同時,其他經營者的競爭行為也不會實質性替代在先數據處理者提供的數據服務。
在堅持“效能競爭”的前提下,《反不正當競爭法》可以提供程度適當的保護:保障數據處理者收回投資成本,填平其損害,但又不給予過多的救濟。這既能使數據處理者在合同法缺位的場景下不遭遇市場失敗,也能防止其議價能力過高而阻礙數據流通。具體到數據獲取和使用行為正當性的判斷上,應當綜合考慮多種因素:(1)數據的性質以及商業價值;(2)競爭者獲取和使用的數據量;(3)數據處理者最初需要多少付出成本才能獲得這些數據;(4)競爭者從其他渠道獲取這些數據的難易程度;(5)競爭者使用這些數據的目的;(6)競爭者在后續數據使用中付出的投資以及是否增加數據價值;(7)競爭者提供的數據服務與在先數據處理者的相似程度以及二者所在市場的重疊交叉程度;(8)競爭者向市場其他主體提供數據服務的時間。另外,單純的數據獲取行為并不干擾市場秩序,除非行為人非法侵入、破壞計算機信息系統,一般不予制止。上述的不正當競爭考量因素表明,法院可以適當地制止競爭者以相同、近似方式使用他人收集處理的數據,直至數據商業價值消失。數據處理者因此獲得了所需的救濟:足夠的市場領先時間,使其能夠收回投資。數據競爭利益保護期間取決于不同數據的時效性,與傳統財產權的固定保護期間相區別。由此,市場中的競爭者可以相對自由地采取對數據處理者損害更小,并能實現積極社會效果的方式使用數據。數據自由流通的目標因而能夠得到保障。
不過《反不正當競爭法》對數據的保護因救濟的被動性和缺乏清晰的界限而受到質疑。盡管如此,它仍然是比數據財產權等更理想的法律調整方式。首先,即使是數據財產權對數據的保護也主要是被動的、事后的,因為數據財產權最重要的權利內容是對他人某些數據使用行為的禁止權或排他權。這種排他權同樣是在特定數據獲取、使用行為發生后才真正產生效力。其次,《反不正當競爭法》對數據的保護雖存在抽象性,但也體現了一定可預期性。至少,擅自以相同方式使用他人收集、處理并產生競爭優勢的數據,又未增加數據價值的低效能競爭一般具有不正當性。而且在快速變動的數字經濟時代,《反不正當競爭法》的抽象、模糊屬于一種恰到好處的“留白”而非“空白”。因為它以更加靈活的方式調整數據處理者和其他市場主體之間的關系。最后,《反不正當競爭法》以減少直接市場干預的方式保護作為競爭利益的數據。目前數據服務市場正在蓬勃發展,沒有證據表明市場已經或者即將失靈。過度的數據財產權保護反而會干擾市場自身的調節能力,對數據流通造成不合理的障礙。
數據所產生的競爭優勢不是固有的,而是依賴于收集、分析它的算法。因為幾乎所有數據都是算法的副產品:經營者能夠利用算法從各種信息來源收集和匯總數據并處理和分析數據。為了獲得長期的競爭優勢,數據處理者需要開發和培訓算法以促進數據資源化。同樣,算法也是其他經營者增加數據價值,與在先數據處理者展開效能競爭的關鍵。以搜索引擎為例,搜索引擎算法越成熟,搜索結果越精準,使用該引擎的用戶越多,經營者獲取的數據也就越充分。算法因而成為經營者在數據服務市場上展開競爭的核心工具。
基于算法對數據價值的決定性作用,數據的保護可以溯源至算法的保護。積極的算法保護規則可以促進企業開發出更成熟的數據收集和挖掘算法,進而間接激勵其收集和處理數據。也有學者注意到算法和數據之間的關系,但仍然強調通過規制算法或設置算法的責任清單來界定數據財產權的邊界,而非給予算法積極的保護。該觀點似乎只將算法作為規制的對象,而非保護的對象。一般認為,算法無法構成知識產權的客體。因為算法在此被理解為一套逐步解決問題的規則、方法,區別于算法的具體表達,例如對收集或分析數據的步驟和應用標準的描述。所以算法不屬于著作權法保護的作品,否則會將保護范圍拓展至思想的范疇。算法本身也不能受到專利法的保護,因為通過算法處理數據被認為是非技術性的。算法目前主要是被作為商業秘密進行保護的,但不能排除合法的獲取、使用或披露行為,例如允許以公共利益為由而進行披露。這意味著在涉及公共利益的情況下,算法很容易被強制性披露而喪失保護資格。然而,如果作為算法副產品的合法數據可以獲得財產權保護,為何產生數據的合法算法不享有財產權保護呢?因論文文本范圍的有限性,合法算法的法律性質暫且不在本文討論范圍內。但可以確定的是:如果收集和挖掘數據的算法無法得到充分的保護,企業就無法持續地從數據中獲得競爭優勢。
為了實現數據的資源化和流通,應當對算法提供正當合理的保護。然而當前盛行的“算法解釋權”“算法公開透明”等算法規制學說與算法和數據保護之間存在激烈矛盾,危及算法的創新和優化。“算法解釋權”最早由Goodman和Flaxman提出,二人認為歐盟《通用數據保護條例》創設了“算法解釋權”。由此用戶可以要求數據控制主體解釋與他們相關的算法決策,以此確保算法不僅高效,并且透明、公正。我國一些學者也主張對個人賦予算法解釋權,并認為算法的邏輯、意義、設定的目的和一般功能都將成為被解釋的對象。但歐盟《通用數據保護條例》并未明確規定“算法解釋權”,只在序言第71 條提及個人可以獲得算法決策的解釋。序言無法設立權利和義務。與算法難以構成知識產權法客體的觀點相比,“算法解釋權”“算法公開透明”等學說目前已成為阻礙算法獲得合理保護的最大障礙,甚至采取保密措施,作為商業秘密保護的算法都無法應對“算法公開透明”的侵蝕。因為公共利益對商業秘密的限制鋪平了算法透明的道路,在實踐中,有法院在對算法決策進行司法審查的路上走得更遠,認為平臺行使算法權力應當公開透明,事先披露治理機制、管理規則以及相關技術原理。用戶有權對自動化決策提出質疑和申訴,進一步知曉算法邏輯構造。平臺依據算法對用戶個人的自動決策未觸及公共利益,但法院卻要求平臺披露算法,有侵犯平臺商業秘密之嫌。盡管平臺應當對涉及用戶重大利益的決策結果予以說明,但不必以披露算法的形式。仍然有其他方式解釋算法,保障結果公平公正。若“算法公開透明”落實為法律制度,可以想象屆時競爭對手將借公共利益之由破壞數據處理者的算法。而作為算法副產品的數據也將遭受毀滅性的打擊,皮之不存毛將焉附?由此,“算法透明”與國家所規劃的數字經濟發展政策是沖突的,應當破除“算法透明”的迷障。至少在找到合適的保護方式之前,大數據收集、挖掘的算法不應當真正透明。
在“算法開發—數據收集處理—算法開發”的環路中,數據對于算法也有重要意義。數據保護規則的設計不得不考慮算法優化對數據自由流通的強烈需求。數據是算法的“原料”:算法的開發和優化需要大量有效數據,算法所得結果的質量隨輸入數據多樣性而變化。特別是監督學習算法需要在標記的數據上進行訓練,以形成算法模型,即人工智能系統。為了促進算法更好地發展,應避免設立絕對性的數據財產權利,使數據獲取原則上是開放的。正如谷歌首席科學家彼得·諾維奇(Peter Norvig)所說:“我們沒有比別人更好的算法,我們只是有更多的數據。”此言雖夸大了數據的競爭優勢,但基于大數據的算法的確陷入“強者愈強”的循環。數據處理者控制的數據越多,就越能開發出高效的算法,隨之吸引更多的用戶貢獻數據。如此循環往復,控制大數據的經營者將進化為“人工智能寡頭”。數據財產權的設立不會激勵他們與(潛在的)競爭對手分享數據。相比于獲得有償數據服務的對價,他們更愿意囤積數據、優化算法,獲得更長久的競爭優勢。將數據定性為競爭利益的保護方式,則可以綜合納入多種價值考量因素,既保障數據處理者收回投資,又促進數據流通。所以各市場經營者均能以相對較低的成本獲得訓練算法模型的數據集,從而在發展算法方面具有公平競爭的機會。
當然,算法在社會生活中的廣泛應用也產生了許多問題,應該對算法濫用所產生的風險和危害加以預防和消除,但是披露、解釋等算法規制方式不是唯一正解。算法治理需要同時包含算法規制和算法保護的雙重維度。結合數據自由流通的構想,算法在獲得保護的同時,也可以受到合理的規制。這一種規制來自當前以數據為驅動力的算法技術原理對算法自身的約束,也來自充分市場競爭對算法開發者“技術權力”的約束。隨著深度學習、自主學習等技術的演進,一些算法脫離了人類全過程的開發和設計,可以在輸入經過處理的數據后,通過大量數據集的訓練加以自主演化。人類干預較少的無監督算法,甚至可以在沒有持續性數據輸入的情況下自主演化。此種技術原理導致特定數據集合的選擇對算法的開發具有關鍵影響。大量的案件表明,訓練數據集的選擇、數據挖掘以及關聯等數據處理行為的偏向性是算法決策結果不公正的重要原因。就此,數據的自由流通可以促進算法另一種意義上的“透明”,起到監督算法的根本性作用。獲得開發算法的數據,并進行數據審查已成為監督算法的關鍵性措施。例如,美國眾議院提出的《2022年算法責任法案(草案)》,要求將訓練、測試、開發算法的數據和相關信息記錄為文件,并加以更新和維護。這一要求的目的就在于評估數據對算法開發的影響,從而評估算法是否存在歧視、侵犯個人信息或隱私等危害。再者,對于此種數據驅動、具有一定自主性的算法,算法解釋權、算法公開的可行性也受到質疑。由于算法中存在的隨機性及其學習過程中自主積累的算法邏輯,算法開發者難以對算法的運行過程和結果進行解釋。所以,數據自由流通及隨之可行的數據審查為評估和監督算法另辟蹊徑。數據的自由流通還能促成多方主體利用相同數據開發相互競爭的機器學習算法,能更有效地識別被采用算法的缺陷,并實現算法工具的不斷優化。在充分競爭的市場中,其他經營者會比公權力機構更有激勵性去監督那些憑借算法獲得優勢競爭地位的大型互聯網企業。即使大型互聯網企業因在先收集大量數據而開發出效率更高的算法,他們也會因為擔憂自己的優勢地位不再穩固而努力改進算法和防范算法決策風險。因此,數據自由所帶來的市場競爭得以防止任一經營者通過算法實現“技術統治”,肆意地侵犯個人權益和無視社會倫理規范??傊?,盡管數據自由和算法保護結合的構想并不完善,但是可以被發掘為算法治理的一個新方向,增加全社會福祉。
當“勞有所得”在財產權制度所保障的價值體系中劣后于公共利益,當數據市場失靈成為一個“偽命題”時,增設數據財產權的正當性基礎搖搖欲墜。實際上,經營者,尤其是平臺經營者,一方面能憑借其平臺基礎設施便捷地收集數據,另一方面能憑借其技術手段及現有的法律制度阻止他人不正當獲取并使用數據的行為。另外,數據所產生的競爭優勢不是固有的,而是依賴于收集、分析它的算法。如果收集和分析數據的算法獲得積極的保護,經營者也能間接被激勵收集和處理數據。如此,數據收集者和處理者可以在一段市場領先時間內獲得充足保護。若額外設立數據財產權,反而可能損害競爭自由和數據流通的公共利益,甚至產生“平臺企業數據壟斷問題”。數據壟斷又將進一步導致其他經營者因數據不足而喪失公平競爭機會。所以,“數據自由”更加符合我國促進“數據流通和資源化”的目的。當然,數據自由是相對于絕對權性質的數據財產權的自由,并非絕對的自由。這意味著數據處理者不應長期、絕對排除任何獲取和使用數據的行為。