劉志鴻
(華東師范大學法學院,上海市 200241)
在Web3.0 時代,隨著大數據、人工智能、云計算等信息科學技術的革命性突破,數據作為核心生產要素,其財產價值得到充分彰顯,成為企業競相爭奪的關鍵資源。互聯網企業對數據爬取、利用、交易等行為漸趨頻繁,由此引發的糾紛呈幾何倍數增長。數據的利用和保護是處于相反維度的兩個變量,在各自的數值區間愈加呈分離的發展曲線,兩者沖突及其協調的難度進一步加劇,并引起社會各界高度關注。為回應關切并引領數字經濟發展,2022年4月10日發布的《中共中央國務院關于加快建設全國統一大市場的意見》明確提出加快培育數據要素市場、推動數據資源開發利用以及加強對平臺經濟、共享經濟等新業態領域不正當競爭行為的規制。①企業公開數據是鏈接數字經濟產業上下游的核心要素,是破解數據資源開發利用與保護時代困境的關鍵載體,創新企業公開數據的利用與保護范式成為數字經濟社會治理與法治建設過程中亟待解決的時代課題。以具體實踐為檢視,《中華人民共和國民法典》(以下簡稱《民法典》)第一百二十七條的簡約表達,以引致條款的立法技術將此難題推向理論界和實務界,理論界由此展開了賦權路徑與行為規制路徑的學理爭鋒,而實務界則在能動司法主義中積極探尋破解難題的普適化標準,試圖做出前瞻性司法回應。在這個問題上,應跳脫數據權利化——權屬問題的窠臼,厘清企業公開數據權益糾紛背后的裁判規則與理論共識,在現行法律框架內勾勒數據保護與利用的合法性邊界。
企業數據的多重屬性構成了不同類型的分類標準,②[1]為我們深入理解企業數據的豐富內涵提供了多維視角。數據分享和流動是數字經濟的基石,也是數據傳播和利用的基礎。[2]數據分享、流通能使相關主體獲得價值并促進數據增值,數據經濟必須建立在數據公開基礎之上。不同類型的數據劃分都應統攝于一個目標導向,即有利于數據的公開,并對不同價值考量后安排順位。鑒于此,遵循問題意識和目標導向,本文將企業數據分為非公開數據和公開數據。
企業公開數據是指處于公開狀態下可為公眾獲取的數據。最具代表性的公開數據是互聯網企業平臺聚集的大量公開數據。互聯網改變了傳統的交互設計與用戶行為,在自媒體(We Media)時代,崇尚個性化的用戶在通過企業平臺實現社會交往功能的同時,在企業平臺留下了行為痕跡,如領英(LinkedIn)、臉書(Facebook)、抖音(TikTok)、新浪微博等互聯網頭部企業每天均有無數的用戶通過登錄、發布、瀏覽等行為實現在網絡空間內的活動。《第49 次中國互聯網絡發展狀況統計報告》指出,截至2021年12月,我國網民規模已達10.32億人。[3]如此大體量的網民在企業平臺形成網絡規模效應,成為現代商業模式競相爭奪的基礎資源。
與公開數據相對應的非公開數據,通常是指企業通過設置登錄規則或通過技術措施來限制第三方訪問的數據。非公開數據具有事實上的排他性,如軟件注冊填寫的用戶個人數據,物聯網上各種穿戴設備收集的用戶體表數據,電商企業平臺后臺生成的物流數據、交易數據,導航地圖軟件后臺的實時行程軌跡數據等,都因企業平臺設置了加密技術措施排除公開獲取的可能性。此類數據類似反不正當競爭法框架下的商業秘密,若符合商業秘密的構成要件,可通過商業秘密獲得有效保護,本文不再贅述。
與封閉的非公開數據相比,流向公共領域的企業公開數據裸露在開放、流動的互聯網架構之中,更容易產生糾紛。就完善數據權益保護制度和解決實踐難題而言,企業公開數據的保護始終是一個持續的研究課題和法律實踐調整的對象,如在大眾點評訴百度案③中的用戶公開評價、新浪微博訴今日頭條案④中的用戶發布內容等均為此類數據。本文將研究范圍聚焦于企業控制下的處于公開狀態的數據集合。為表述方便,以下所稱數據均指代此類數據。
企業公開數據構成企業重要的運營資源,其法律特征尚不明晰,但數據之上的主體、權利義務較清晰,能做出具有法律意義上的判斷。
1.企業公開數據體現企業平臺的強控制性。在企業平臺中,用戶對其數據的掌控以及能力漸趨分離。企業平臺以在用戶協議中的強勢地位和技術上的優越性而在事實上控制著數據,客觀上形成對用戶數據權益的反噬,使用戶數據在企業平臺的裹挾下沿著企業平臺既定的軌跡運行。為進一步糾偏,強化用戶意志在數據流動中的體現,歐盟《通用數據保護條例》(General Data Protection Regulation,GDPR)第二十條創設數據可攜帶權,⑤旨在保障用戶對數據的控制權能,充分尊重用戶在不同平臺自由切換的自主意志,強化用戶數據的多棲性。[4]
2.企業公開數據存在三元利益的交疊與沖突。企業公開數據交織著用戶、企業和社會三元利益主體,可能存在利益疊加與沖突的情形:一是企業公開數據并非如石油一般天然存在,其生產過程依賴用戶行為、互聯網架構等要素。在內容層面,數據可機讀轉變為信息,而信息可關聯至用戶時,易引發個人信息權益與企業數據財產權益之間的利益重疊。二是作為核心經營資源,企業公開數據意味著流量、競爭優勢與機遇。在商業競爭過程中,勢必造成爬取者與被爬取者之間的零和博弈。三是企業數據的公開程度決定數據流通的難易程度,在客觀上形成企業利益與社會利益之間的緊張關系。[5]
3.企業公開數據承擔著容忍他人合法獲取和使用的義務。[6]自由、開放、共享是互聯網成立之初的精神。有學者就互聯網的運行機理做出經典論述,將企業平臺視為類似商店的公共領域,店主通常對潛在客戶持開放歡迎態度,即便當店主不在時,只要商店不鎖門或者門上沒有“僅限員工進入”的限制,客戶均有權利進入商店查看、挑選商品,因為進入商店是完成雙方交易的前置性條件。[7]同理,企業平臺只要接入互聯網,就可以查看互聯網內的其他主體的數據,同時允許其他主體對自己的數據進行訪問。企業公開數據就是這種互聯網運行邏輯的產物,彰顯著互聯網的開放性與公共性。在此背景下,從私人領域流向公共領域的企業公開數據,需要承擔容忍他人合法獲取、使用的義務。但與商店禁止同行進入的原理一致,容忍他人獲取、使用行為也是有邊界的,這將在后面展開詳細論述。
學界對企業公開數據作為應當成為受法律保護的合法財產已經達成共識,但對于構建何種性質、類型的保護路徑存在分歧。究其緣由,其本體屬性是一種尚未成型的權利還是財產性利益,有待進一步深化認識。權利是法學研究中最成熟的核心范疇,與之相關的新問題、新案例的出現不斷推動著權利理論的發展。
傳統權利論以既有的法律規制路徑,如著作權、數據庫特殊權利、商業秘密、合同權等路徑保護數據,但均存在一些弊端。
1.著作權法無法保護非獨創性的企業公開數據。相較于傳統物權,企業公開數據的無形性、非排他性、非消耗性等屬性與著作權保護客體的屬性具有高度相似性。立法者曾在《中華人民共和國民法總則(草案)》第一次審議稿第一百零八條將“信息數據”納入知識產權客體的范圍,但隨著對數據認識的不斷深化,立法者發現這種做法非但難以覆蓋數據的豐富類型,反而會破壞知識產權自身邏輯體系,使之淪為體系龐雜、無所不包的超級知識產權。鑒于此,該規定在后續修訂過程中被刪除。在實踐中,也有將企業公開數據納入著作權保護的情形:一是企業公開數據構成文本、圖片等作品時,受到著作權保護。二是企業對數據的選擇或者編排具有獨創性時,可主張作為匯編作品加以保護。但并非所有的企業公開數據均可滿足著作權保護的構成要件。在多數情況下,企業公開數據作為經營積累的數據集合,其本身及其編排很難達到獨創性作品的標準。同時,作品獨創性的標準存在主觀因素,達到何種程度才具有獨創性需要法官進行自由裁量。
2.以數據庫特殊權利對不具有獨創性的數據集合予以保護,同樣存在適用難題。歐盟在《數據庫保護指令》(Database Directive)提出數據保護的雙層架構:在內容選擇或者編排達到獨創性標準時受著作權保護;對非獨創性數據庫給予數據庫特殊權保護。在“數據庫制作者在質量和/或數據量上對獲取、核實與呈現數據庫內容進行了實質性投資”⑥時,可適用數據庫特殊權利保護。應當說,數據庫特殊權旨在保護不具有獨創性的數據,這一思路具有前瞻性。但如何認定“實質投資”存在模糊地帶,極大地限制了數據庫特殊權利的司法適用。如在Ryanair Ltd 訴PR Aviation BV 案⑦中,被告爬取原告網站上的航班安排以及機票價格,呈現在自己網站供用戶查閱,法院以“原告對航班數據庫的創建不具有實質性投資”為由,駁回了原告主張適用數據庫特殊權利的訴求。通常認為,企業實質投資的是數據產品與數據服務,而企業公開數據作為用戶免費使用數據產品或者數據服務過程中的副產品,很難被劃入“實質投資”的范圍。
3.商業秘密無法適用。商業秘密在《中華人民共和國反不正當競爭法》(以下簡稱《反不正當競爭法》)第九條中被定義為“不為公眾所知悉、具有商業價值并經權利人采取相應保密措施的技術信息和經營信息”,適用商業秘密保護必須同時滿足秘密性、價值性和采取相應保密措施三個構成要件。企業公開數據的價值性不言而喻,但無法滿足“秘密性”和“采取保密措施”兩個要件。如前所述,企業公開數據處于開放的互聯網架構中,顯然無法滿足“不為公眾所知悉”的構成要件。此外,“采取保密措施”要求權利人采取與其商業價值相符合的合理保護措施,而企業采取技術措施是否合理,需要在個案中進行判斷。
4.合同規則無法適用。數據合同作為數據供求雙方意思自治的表達,發揮著靈活的作用。雙方可就公開數據的使用范圍、使用目的等事項進行約定,以開放應用端口(API)或者數據交易的方式實現數據在供求雙方之間的流轉,是連接數據利用和價值實現的橋梁。[8]但企業公開數據糾紛往往發生在合同一方當事人超權限獲取、使用數據或者合同關系之外的第三人侵害數據權益。對于前者,當事人往往選擇適用反不正當競爭法尋求救濟,因為違約損害很難計算且即使追究違法責任也不能阻止已公開數據的流通;后者受合同相對性約束,無法抵御合同之外第三人侵害數據權益的情形。[9]
傳統民法學者主張以權利范式為切入口,以納入或突破的形式賦予數據新型財產權利,如數據經營權[10]、數據用益權[11]、公開傳播權[12]、數據生產者權[13]、數據產權[14]、數據使用權[15]等抽象的集合性權利,通過新型財產權利的初始配置,實現權利主體之間的利益分配、使用加工、交易流轉、處分等功能,達到數據保護和利用并重的效果。最具代表性的觀點是雙層財產權利理論。有學者考察數據經濟互動結構中用戶與企業之間的動態關系,提出為處于底層的用戶配置數據人格權益和財產權益,為處于頂層的企業配置數據經營權與數據資產權。[10]數據經營權是一種新型財產權利,旨在保護企業對數據收集、利用、挖掘等行為的實質投資。新型數據財產權強調企業對數據控制、開發、許可、轉讓等積極權能,試圖設立一種絕對、排他的新型財產權利,使企業獲得一種有關數據開發利益的安全性法權基礎的刺激和保障,從而使數字經濟置身于高效穩定的財產權結構性的驅動力和交易安全的保障之中。[10]
1.強理論支撐:基于勞動賦權理論、激勵理論的法理證成
在新型財產權的證成過程中,勞動賦權理論和激勵理論起到中流砥柱的法學理論支撐,兩種理論分別從不同視角對新型財產權的證成提供論據。
著名經濟學家洛克(John Locke)提出勞動理論(Labor Theory),該理論被賦權論者視為獲得財產權的正當性法理基礎,即“我的勞動使它們脫離原來所處的共同狀態,確立了我對于它們的財產權”。[16]數據并非自然存在,而是形成于互聯網的架構之中。這些架構包括底層的物理基礎設施、通信信息技術、平臺搭建等要素。實現這種架構,需要企業投入大量的人力成本與經濟成本。此外,企業在收集數據和提供用戶補貼等方面同樣付出了實質勞動,按照勞動賦權理論,應賦予企業財產性權利。
激勵理論也是新型數據財產權證成的重要理論依據之一。考慮到數據流通方能實現價值,只有賦予數據主體一定的數據權利,才能激勵其收集、開發、利用和交易的積極性。[17]作為數據市場的重要參與者,企業的數據權益能否得到保障直接關系到企業對數據產業投入的積極性。如果在市場競爭中允許任何類型的搭便車行為,企業公開數據可被他者隨意攫取,將會導致數據生產的動力枯竭。企業喪失繼續投資、創造、公開數據的積極性,不再獨立收集、生產數據,轉而通過爬取、搶奪現有已公開的數據資源,勢必影響和減少社會整體成員享受數據所帶來的福利。
2.可遷移構建:基于明晰產權的效率證成
為解決使用稀缺資源造成的利益沖突,制度經濟學創設了產權規則。科斯(Ronald H. Coase)提出:“如果沒有對權利進行初始界定,就不存在權利轉讓和重新組合的市場交易”。[18]明晰的產權可為市場交易內的各方主體建立穩定、清晰的預期,使具有稀缺性、價值性的資源進入市場交易,實現從靜態歸屬轉向動態流轉,提升資源的配置優化程度與利用效率。新型數據財產權希望借助產權理論,以法律方式確認企業公開數據的財產屬性,調整數據的權屬關系與利用秩序,鼓勵企業生產、分享數據,提升數據的流通效率。
賦權論者認為,正是由于當下產權規則的缺位,致使數據開發利用、交易等產業畏葸不前。無論是大量涌現的企業數據爬取糾紛,還是數據交易市場的滯緩發展,均繞不開關于數據產權的討論。如上所述,賦權論者試圖借助產權理論,通過雙層權利結構分別對用戶和企業配置初始權利,進而實現數據在市場內的自由流轉。有觀點認為,為實現企業在數據生產、交易過程中的驅動功能,鼓勵企業收集、利用、交易數據等行為,應當承認企業對合法收集包括個人信息在內的全部數據享有支配性權利。[19]
新型數據財產權理論確為企業提供了較為穩定的法權激勵,但從現行法律框架、權利結構、數據自由流通的邏輯看,均存在難以克服的障礙,成為企業公開數據賦權保護模式建構時需要面對的基本法理問題。
將數據定位為權利還是利益,是我國數據立法中的重中之重。我國《民法典》采用個人信息與數據二元分立的保護思路,在第一百一十一條明確規定自然人對其個人信息享有權益的基本內容,⑧在第一百二十七條規定數據和虛擬財產的保護問題。相比第一百一十一條規定詳實的權利義務,第一百二十七條規定略顯簡約:“法律對數據、網絡虛擬財產的保護有規定的,依照其規定。”盡管該條從立法技術上設置引致條款為未來數據保護留下廣闊空間,但已經明確將數據納入法律保護框架的態度。有學者從體系解釋角度出發,認為立法者在《民法典》民事權利章節中緊接著人格權、物權、債權和知識產權之后規定數據,暗含著對數據的保護應屬于權利保護或者類似權利的保護。[19-20]
但僅從《民法典》第一百二十七條的文意解釋以及“民事權利”章的體系解釋,便得出數據屬于民事權利這一結論,顯然缺乏理論依據。首先,第一百二十七條在文意上并未出現“權”“權利”等字眼,僅含混地指出法律對數據的保護有規定的,依照其規定。草率地將數據推定為一種權利,突破了對文意解釋的基本要求。其次,僅因數據落在“民事權利”章節無法直接推論數據一定獲得“權利”身份。[21]在本章節體系中,第一百零九條至第一百一十二條是對人格權的保護;第一百一十三條至第一百二十五條是對廣義財產權的規制與保護;第一百二十六條不再用“財產權”字樣,改用“民事權利和利益”的表述;第一百二十八條是關于弱勢群體的特殊權益保護。該章節多為宣示性條款,有不少條款針對的是能否權利化尚存爭議但值得保護的民事利益。綜上,在現行立法框架下無法直接推定數據是一種嶄新的民事權利類型,只能暫時得出數據為值得法律保護的民事利益這一結論。
權利客體獨立明確、權利歸屬清晰是受法律保護的利益轉換為法定權利的基礎前提。若不假思索地賦予利益以權利外衣,可能會存在權利體系內部邏輯難以自洽、權利設定目標與實際效果背離等問題,造成新興權利泛化。本文逐一分析新型財產權可能存在的結構性障礙。
1.權利客體證成邏輯存疑。權利客體是權利和義務共同指向的對象。在新型財產權中,數據能否成為權利客體存在爭論。企業公開數據處于不斷生產過程中,隨著業務拓展而動態變化,無法準確劃定企業公開數據的范圍。有學者認為,數據天然具有流通性,缺乏民事客體所具備的獨立性和確定性特征。[22]可以設想,即便企業公開數據被設置為權利客體,權利主體也無法直接控制企業公開數據。即便控制了存儲數據的載體,仍無法控制他者的復制、爬取等行為。
2.權利分配難題。權利確有定分止爭的功能,但將權利賦予何方主體值得商榷,企業公開數據的公共性和主體多元性決定了該難題的復雜性。在數據生產周期中,用戶、網絡服務提供商、軟件程序制造商或其他主體都參與其中,將數據權利單獨配置給某一主體,還是共同配置給用戶與企業,抑或是直接歸入公有領域,[23]均存在難以調和的矛盾。一是對用戶單獨配置數據財產權。這種做法的優勢是賦權將顯著提高用戶的議價能力,迫使有需求的企業主動與用戶進行協商,[24]改變企業以往的強勢地位,但存在用戶對數據在事實上控制力不足、收益價值低和維權成本高昂等問題,[25]缺乏實際可操作性。二是對企業單獨配置數據財產權。將數據財產權賦予企業看似解決了數據的權屬問題,但排他性或支配性權利可能為數據自由流通和利用設置了隱形壁壘。三是將數據財產權利配置給用戶與企業共有。該方案雖能緩和用戶和企業之間的緊張關系,但當企業轉讓部分權利時,面臨獲得用戶同意的難題,數據共有提高了數據流通的制度成本。四是將數據財產權利歸公共所有。該做法忽視了用戶利益和企業的合法權益,無法對數據的生產主體進行市場激勵,反而會消減社會公共福利。
如前所述,信息自由流通是互聯網成立之初的價值理念,即使在設立知識產權后,法律也僅對表達方式進行保護,對事實信息和思想不予保護。作為信息的載體,數據一旦被權利化后將與信息自由流通形成內生性矛盾。[26]可以預見,先進入市場的頭部企業憑借數據的鎖定效應會進一步加劇數據的壟斷,并利用其市場支配地位搶占關鍵的數據資源,將數據視為私物,限制或禁止他人獲取與利用數據,將他人完全排除在權利壁壘之外,抑制互聯網市場的自由競爭,阻礙數據流通價值目標的實現。
與有體物的排他性和絕對性特征不同,數據具有非競爭性的固有屬性。往往一個數據經營者使用數據時,另一數據經營者同時使用該數據并不減損前者的利益,這決定了數據天然的分享性和流動性。但數據權利化忽視數據的固有屬性,會限制數據的自由流動與互聯互通。唯有自由流動,數據方能到達真正有需求的地方,這是數據流通的要義。此外,企業公開數據的生產和商業化利用并不需要賦權保護作為內在激勵。事實證明,賦權保護與數據生產并無正相關聯系,即使在沒有引入數據財產權的今天,數據都在以爆炸性速度增長。
綜上,脫離現有法律框架、憑空創設新型數據財產權、試圖從整體上重新制定統一規則的思路過于激進,可能會造成新型權利與現有法律框架的不協調,背離互聯網行業競爭自由、信息自由的價值理念。
從功能主義角度出發,賦權保護路徑與行為規制路徑并非涇渭分明,甚至并無實質區別,兩者的共同面向是保護企業的勞動和禁止不勞而獲等搭便車現象。基于上述針對數據權利化的詰問與反思,數據保護應當跳脫賦權路徑的固有思維定勢。賦權路徑行不通并不意味著企業公開數據無法受到法律保護,許多受法律保護的利益囿于對象不確定、支配地位弱或排他性不足而不具備轉化為法定權利的客觀條件。[27]相反,以反不正當競爭法的行為規制為進路不失為一種較優的法律救濟路徑。反不正當競爭法不預設權利客體及其邊界,避開數據權屬的認定難題和權利構成要件的理論沖突,通過建立具體的行為規則來控制他者的行為,為利益主體提供消極保護,這種弱于權利保護的模式,更有利于促進數據的流通和利用。
司法實踐多采用反不正當競爭法對數據糾紛進行規制,這一傾向并非偶然。反不正當競爭法保護的市場競爭秩序、經營者利益和消費者利益與數據上承載的三元利益相吻合。同時,運用反不正當競爭法調整數據糾紛具有較強的兼容性和延展性,可有效紓解賦權模式的封閉性與民事規范調整開放性之間的沖突。但具體裁判規則的缺失使裁判者認定數據獲取與使用行為的正當性存在困難,司法裁判者以泛化的誠實信用原則或商業道德作為具體案件的裁判準繩時,缺乏穩定的法律預期,有“向一般條款逃逸”之嫌。[28]為此,有必要從以下兩個維度進行完善:恪守一般條款適用的謙抑性;構建數據競爭行為不正當性認定的雙階審查標準。
對數據財產利益的追逐催生企業的不正當競爭行為,破壞或扭曲市場良性的競爭秩序。在互聯網數據競爭秩序中存在數據鎖定現象,用戶一旦選擇進入某種企業平臺,就會沿著平臺預設的既定軌跡發展,形成鎖定效應。用戶于在先平臺付出的沉沒成本造成用戶轉換到其他平臺的困難,先行進入市場的互聯網企業往往占據競爭優勢,而后進入的互聯網企業則希望打破數據鎖定效應,獲得自由競爭。企業之間出現大量不正當爬取數據資源或阻止競爭對手獲取數據資源的行為,由此引發訴訟(參見表1)。

表1 近年來數據要素市場典型案件的法律適用情況
本文通過梳理相關案例發現,囿于市場涌現的新型數據競爭類型不能被《反不正當競爭法》第二章規定的具體競爭行為所涵蓋,司法裁判者只能援引“一般條款”?作為裁判依據。最高人民法院曾在海帶配額案?中明確了一般條款的適用條件:一是法律對該競爭行為未做出專門規定;二是該競爭行為導致其他競爭者合法利益受損;三是該競爭行為違反誠實信用原則和公認的商業道德。盡管該三要件為司法裁判者提供了指導性意見,但寬泛的誠實信用原則、商業道德飽受詬病,缺乏具體適用的制度剛性,無法為企業提供穩定的法律保護預期。[29]誠實信用原則作為倫理哲學范疇的概念,其內涵與外延無法準確界定。因此,司法裁判者往往對誠實信用原則的判斷轉嫁至公認的商業道德標準。[30]與傳統行業不同,數據行業正在形塑過程中,新的公認的商業道德標準尚未形成。法官在判斷競爭行為時往往依靠既有的商業道德標準,即主要考慮數據控制者的利益,強調避免搭便車、不勞而獲的現象,而很少提及用戶利益和數據控制者對潛在競爭者的限制。以侵害經營者利益作為判定不正當競爭的唯一標準時,無疑簡化了正當性競爭行為的認定,將動態的競爭束縛在靜態化有罪推定的誤區。[31]在互聯網行業不斷創新的背景下,競爭的本質是交易機會的爭奪,競爭者之間的利益格局變化是常態。正如反不正當競爭法旨在保護市場公平、自由的競爭關系,而非保護單一競爭者或者經營者利益,法官應在新型數據案件中保持寬容態度,留給數據領域更多模仿創新、商業模式創新的空間,防止過度干預市場競爭。
應當說,反不正當競爭法的一般條款為難以法定化的法益提供嘗試性、實驗性或過渡性的保護,可作為未來權利的孵化器和暫居之地。[32]在數據是利益還是權利存在巨大分歧的情況下,法院運用一般條款填補法律漏洞只是權宜之計,不應成為企業公開數據保護的固定方式。為強化裁判規則的制度剛性,避免“向一般條款逃逸”的危險,司法裁判者在適用反不正當競爭法一般條款時應持謙抑態度。
司法能動主義要求在實體法律規范闕如的情況下,發揮在個案中凝聚共識的能動性。通過對以上案例梳理與研判,企業公開數據的競爭行為的核心要件、違法性界限已經漸趨明晰。本文在歸納裁判共識的基礎上,提煉數據競爭行為不正當性的雙階審查標準(如圖1)。

圖1 企業公開數據競爭行為不正當性認定的流程
1.在數據獲取階段
首先,數據獲取是否避開、破壞技術措施。通常而言,企業出于數據安全、商業利益等考量,會設置技術措施強化對數據的控制力度。而爬取者獲取數據時需要避開或者攻破被爬取方的技術設施門檻,該行為侵害的法益具有雙重性,除構成反不正當競爭法規制的不正當競爭行為,嚴重者還有可能觸犯《中華人民共和國刑法》第二百八十五條和第二百八十六條規定的非法侵入計算機信息系統罪、非法獲取計算機信息系統數據罪、破壞計算機信息系統罪。[33]
其次,數據獲取是否違反機器人協議?。在司法實踐中,機器人協議能否作為爬取企業公開數據的正當性邊界存在探討空間。通說認為機器人協議是互聯網行業普遍遵循的道德法則,?如若爬取者違反機器人協議爬取數據,可能會被認定為違反公認的商業道德,進而構成不正當競爭行為。在互聯網行業不斷迭代創新的商業模式中,沿用只要違反機器人協議就必然構成不正當競爭行為的線性思維缺乏理性思考,有必要對設置機器人協議本身的正當性進行拷問。如在奇虎訴百度案?中,被告在機器人協議中允許國內外主流搜索引擎進行爬取,僅針對性限制原告的爬取行為,妨礙數據自由流通,降低用戶體驗,該限制行為構成不正當競爭;而在微博訴今日頭條案?中,二審法院認為原告在機器人協議中將被告設置為唯一的黑名單,禁止被告的爬取行為,屬于自主經營權的范疇。可見,在審查網站設置機器人協議的正當性時,有必要嚴格區分機器人協議的適用場景。在日臻成熟的搜索引擎行業場景下,機器人協議的排除設置應受到嚴格限制。而在其他新興的互聯網行業場景下,在新的行業規則、公認的商業道德尚未形成時,經營者在不損害社會公共利益、消費者利益、市場競爭秩序的情況下,合法設置的機器人協議應得到市場主體的一致遵守。
最后,數據獲取是否取得用戶授權。如前所述,企業公開數據體現了用戶控制的個人意志,故在獲取階段應將用戶授權作為主要考量因素。在微博訴今日頭條案?中,字節跳動主張在獲得用戶授權下,將用戶在微博上發布的內容同步在今日頭條的行為具有正當性。遺憾的是,在司法實踐確立三重授權原則?后,法院未能支持被告關于數據可攜帶權的抗辯意見。法院認為,本案中數據遷移的發起不是基于用戶的主觀意愿,而是基于競爭對手的意志。持不同意見的學者認為,為打破數據鎖定效應,實現數據市場的充分競爭,當經營者獲得用戶對爬取其公開數據的授權后,不必再取得在先平臺經營者的許可。[34]在未來的裁判中,司法機關應更重視用戶意志在數據流動中的體現,積極探索數據可攜帶權的適用規則。
2.在數據使用階段
首先,數據使用是否構成實質性替代。實質性替代標準最初產生于版權行業,隨后被司法實踐應用于判斷數據不正當競爭行為的核心標準。如果數據爬取方因爬取后的使用行為增加用戶流量,造成被爬取方損失這部分用戶流量,即爬取方對被爬取方構成了實質性替代。[35]作為一種客觀事實,實質性替代需要結合競爭關系進行判斷。在數字經濟時代,互聯網企業競爭的本質是對用戶資源的爭奪,對競爭關系的認定不能局限于領域、行業、業態等傳統要素,還應結合經營者實際經營行為,當經營者之間在客觀事實上爭奪相同的網絡用戶群體,即可認定二者之間存在競爭關系。[36]對于非競爭關系的市場主體,經營者不得通過技術措施、使用規則等方式差別對待,限制或者禁止爬取、利用其公開數據。
其次,數據使用是否妨礙市場創新。企業公開數據的流通不僅是互聯網公開性與開放性的基石,更是他人利用數據實現市場創新的重要渠道。在數據驅動邁向縱深發展時,企業創新的程度越高,則對數據的需求越大。[37]剛塵埃落定的HiQ Labs 公司訴領英公司案?對企業公開數據的使用標準判斷具有里程碑式的意義。美國第九巡回法院再次重申,在權衡爬取方和被爬取方利益的同時,有必要從社會公共利益角度考量該行為是否會妨礙市場創新,如賦予領英公司以概括性權利,使其能以任何理由禁止他者訪問可公開獲取的數據時,將對言論自由以及互聯網信息自由流通的精神造成實質破壞,因此判令領英公司不得禁止HiQ Labs公司訪問、復制、利用其網站的公開數據。如果他人爬取公開數據后,直接照搬使用、替換其市場份額,在使用目的上未能體現任何創新,那么該行為具有不正當性。相反,如果數據使用者通過對合法獲取的數據深度加工,有益于市場創新和社會福祉,那么該行為應予以鼓勵。
在數字經濟的浪潮中,企業公開數據成為企業生產經營的核心生產要素。互聯網行業圍繞著企業公開數據展開白熱化競爭,將涌現更多樣態的數據糾紛。賦權理論試圖創設一種穩定格局的新型數據財產權利一勞永逸地解決數據利用與保護的問題,但其靜態的權利結構和權利配置難以適應數字經濟動態的運行邏輯。可以預見,未來數據糾紛的解決仍需倚重反不正當競爭法的行為規制模式。相較于新型數據財產權理論探索,深化反不正當競爭法一般條款的認識對解決糾紛具有現實意義。盡管數據領域的行業規則、公認的商業道德仍在摸索之中,但相信隨著學術研究成果的不斷豐碩和司法實踐經驗的積累,利用逐漸清晰的學理脈絡和裁判共識來構建一套邏輯自洽的規則體系指日可待。
注釋:
①詳見《中共中央國務院關于加快建設全國統一大市場的意見》,載中華人民共和國中央政府網,http://www.gov.cn/zhengce/2022-04/10/content_5684385.htm.
②企業數據按照是否“經過企業的增值處理”的標準,可分為基礎數據和增值數據;按照是否“關聯到個人”的標準,可分為底層數據、匿名化數據和衍生數據。
③參見北京百度網訊科技有限公司與上海漢濤信息咨詢有限公司不正當競爭糾紛案,上海知識產權法院(2016)滬73民終242號民事判決書。
④參見北京字節跳動科技有限公司與北京微夢創科網絡技術有限公司不正當競爭糾紛案,北京市海淀區人民法院(2017)京0108民初24530號民事判決書。
⑤歐盟《通用數據保護條例》(General Data Protection Regu?lation)第二十條規定,數據主體有權獲取其提供給數據控制者的相關個人數據,其所獲取的個人數據形態應是結構化的(Structured)、通用的(Commonly Used)和機器可讀的(Machine-readable),且數據主體有權將此類數據無障礙地從該控制者處傳輸至其他控制者處。
⑥Directive 96/9/EC,Article 7.
⑦Ryanair Ltd v PR Aviation BV,[2015]2 CMLR 36,C-30/14.
⑧《民法典》第一百一十一條規定,自然人的個人信息受法律保護。任何組織和個人需要獲取他人個人信息的,應當依法取得并確保信息安全,不得非法收集、使用、加工、傳輸個人信息,不得非法買賣、提供或者公開他人個人信息。
⑨參見北京淘友天下技術有限公司與北京微夢創科網絡技術有限公司不正當競爭糾紛案,北京知識產權法院(2016)京73民終588號民事判決書。
⑩參見淘寶(中國)軟件有限公司與安徽美景信息科技有限公司不正當競爭糾紛案,杭州鐵路運輸法院(2017)浙8601民初4034號民事判決書。
?參見北京奇虎科技有限公司與北京百度網訊科技有限公司不正當競爭糾紛案,北京市高級人民法院(2017)京民終487號民事判決書。
?參見湖南蟻坊軟件股份有限公司與北京微夢創科網絡技術有限公司不正當競爭糾紛案,北京知識產權法院(2019)京73民終3789號民事判決書。
?參見北京微夢創科網絡技術有限公司與北京字節跳動科技有限公司不正當競爭糾紛案,北京市高級人民法院(2021)京民終281號民事判決書。
?《反不正當競爭法》第二條規定,經營者在市場交易中,應當遵循自愿、平等、公平、誠實信用的原則,遵守公認的商業道德。本法所稱的不正當競爭,是指經營者違反本法規定,損害其他經營者合法權益,擾亂社會經濟秩序的行為。本法所稱的經營者,是指從事商品經營或者營利性服務(以下所稱商品包括服務)的法人、其他經濟組織和個人。
?參見山東省食品進口公司等與青島圣克達誠貿易有限公司等不正當競爭糾紛再審案,最高人民法院(2009)民申字第1065號民事判決書。
?Robots 協議(Robots Exclusion Protocol),又稱爬蟲協議、機器人協議等,是一種存放于網站根目錄下的ASCII 編碼的文本文件,它通常告知網絡機器人(Spider)可以爬取哪些頁面,禁止爬取哪些頁面。
?《互聯網搜索引擎服務自律公約》第八條規定,互聯網站所有者設置機器人協議應遵循公平、開放和促進信息自由流動的原則,限制搜索引擎抓取應有行業公認合理的正當理由,不利用機器人協議進行不正當競爭行為。
?三重授權中第一重授權指用戶同意新浪微博收集、利用用戶數據,第二重授權指微博同意脈脈的爬取行為,第三重授權是用戶同意脈脈爬取用戶在微博上的數據。第三重授權旨在保護用戶的知情同意權利。
?HiQ Labs,Inc.v.LinkedIn Corporation,https://cdn.ca9.us?courts.gov/datastore/opinions/2022/04/18/17-16783.pdf.