薛其宇
(華僑大學法學院,福建 泉州 362021)
數字經濟時代是一個以數據為核心競爭力、資源共享的時代,數據資源的取得與利用成為這個時代極為重要的一種資源配置。特別是對互聯網企業而言,數據逐漸成為其生存和發展的重要要素。伴隨而來的數據競爭則給法學和經濟學研究帶來了諸多問題和挑戰。國內外已經產生了大量與數據相關的爭議。如,2015年的新浪微博訴脈脈非法抓取使用微博用戶信息案、2016年的大眾點評訴百度案、2017年的華為與騰訊的數據之爭、順豐與菜鳥的數據之爭以及國外的hiQ訴LinkedIn案等。這些案件或爭議都與數據的抓取或分享相關,不僅共同凸顯了數字經濟時代企業對數據資源的重視與爭奪,更顯現出數據競爭中共同的法律爭議、利益沖突。在現有的互聯網商業模式下,用戶數量是互聯網企業經營之根本。本文結合新浪訴脈脈不正當競爭案探究互聯網企業數據使用行為的規制路徑。
在大數據時代隨著數據重要性的愈漸凸顯,有學者稱其為“企業提升競爭力的核心資產”,對數據權屬的爭論如火如荼。數據資源具有體量大、動態性和多樣性三個特征,經過算法的計算,數據資源可以產生巨大的商業價值。與以往的數據資源相比,大數據技術與數字經濟背景下的數據資源,具有如下新的特征。
1.海量性?;ヂ摼W領域數據的海量性,系由大數據時代互聯網數據搜集的便捷及數據分析與加工的多方面、多層次所導致?;ヂ摼W領域的數據不僅包括用戶單獨的個人信息,還包括瀏覽記錄、發表的動態、評論等用戶行為產生的衍生數據,這些數據與個人信息數量相比更為客觀;并且,海量原始數據經算法分析、加工,又可產生出與初始數據迥然不同的全新數據。
目前理論界,有學者將數據的權利分置為個人信息權與數據權,將個人信息與其他數據區分,[1]也有學者依據是否匿名化將數據分為三類:含有個人信息的底層數據,不含個人信息的匿名化數據以及經數據清洗、算法加工后的衍生數據。[2]不過筆者更贊同依據獲得數據時付出的成本的分類方式,即在數據保護中以獲取方式的不同,可以將互聯網領域的數據主要分為以下三類:一是直接獲取的個人信息;二是依群體行為產生的衍生數據;三是原始數據經加工后產生的全新數據。前二者系獲得的直接數據,最后一種系間接獲得的數據,其中獲取數據付出的成本投入依次增加。依不同獲取方式對數據加以分類,可以區別經營者在獲得數據時付出的成本,在數據保護中更具意義。
2.脫離原始主體。互聯網領域的數據是集中在互聯網企業手中的,而現有的關于數據的不正當競爭糾紛亦是因企業而起。從互聯網企業角度而言,數據之爭涉及的是不正當競爭問題,因其涉及的是經個人同意后搜集的個人信息及其衍生信息以及經加工后的全新信息?;ヂ摼W企業所擁有的個人信息系經個人同意獲得,由互聯網企業進行管理與使用,與信息的原始主體分離,而在此基礎上獲取的衍生數據及經加工后的全新數據自不待言。這就是為何個人信息與數據資產存在區別[3],前者從個人角度出發,后者則從互聯網企業角度出發。
然而,正是因為互聯網企業所擁有的數據與原始主體分離,才導致數據的權屬之爭。互聯網領域的數據是屬于原始主體還是數據控制者?互聯網企業經個人同意后是否就可隨意處置所獲數據?這些均無定論。這也是互聯網領域數據不正當競爭的根本緣由。
互聯網企業的商業模式是雙邊市場①“一邊對普通消費者提供低價甚至免費服務,以吸引龐大用戶;另一邊則是收費較高的特定對象,如廣告商。”,始終要以龐大的用戶群為基礎。比如餓了么與美團的價格補貼戰,其目的便是為增加其用戶數量,但數量達到一定程度之后,互聯網運營往往并不局限于用戶本身的消費,還依賴于對用戶數據的分析與利用。比如購物平臺不僅會滿足用戶搜索商品的需求,還會利用用戶的瀏覽痕跡所得出的數據為其推薦相關商品,此種手段既能刺激用戶的消費欲望,也能為平臺帶來廣告的收入。
近年來發生的無論是違反robots協議非法抓取信息,還是對數據的過度復制的案例,均涉及互聯網企業間數據爭議問題。數據是互聯網企業競爭的核心因素之一。以新浪微博為例,其用戶數據是其吸引用戶、賴以盈利之根本。并可以利用算法對微博數據加以分析,得出用戶群的偏好,并以此確定企業將來的調整方向,或者調整對用戶的推薦內容。
總體而言,數據是互聯網企業運營的核心之一,在其運營中具有舉足輕重的地位,在互聯網企業中,誰能具備數據優勢,往往就能在互聯網企業競爭中先人一步。數據在互聯網企業競爭中舉足輕重,加之數據權屬不明,互聯網企業數據的處分及流通問題至今未有定論。致使近期互聯網企業間數據不正當競爭問題層出不窮,而數據的海量性及與原始主體分離等特點又決定了其保護方式需區別于以往對單獨的個人信息的保護方式。如何解決互聯網企業間的數據不正當競爭問題,是理論與司法實踐均亟待解決的問題。
筆者將以“北京淘友天下技術有限公司等與北京微夢創科網絡技術有限公司不正當競爭糾紛案”②北京淘友天下技術有限公司等與北京微夢創科網絡技術有限公司不正當競爭糾紛案,(2016)京73尾終588號判決書。(以下簡稱“新浪訴脈脈案”)為例對互聯網企業間數據不正當競爭的司法實踐的做法加以探析。新浪訴脈脈案開啟了我國數據不正當競爭的先河,也被稱為“數據不正當競爭第一案”。其中關于數據不正當競爭部分頗具研究意義。
在新浪訴脈脈案中,新浪與脈脈達成合作并簽訂《開發者協議》,其中規定“用戶數據是指用戶通過微博平臺提交的或因用戶訪問微博平臺而生成的數據?!鼻移涫俏⒉┑纳虡I秘密。根據該協議,第三方開發者獲得微博上的用戶數據時需取得用戶同意,且在與微博合作結束后必須立即刪除其從微博獲得的數據。據此,新浪與脈脈合作期間,允許脈脈獲取新浪微博平臺上的用戶名稱、性別、頭像、郵箱等相關用戶信息,結束后須立即刪除。然而,在合作期間,脈脈非法抓取了不在協議范圍內的用戶的職業、教育信息;合作結束后,脈脈仍然從新浪平臺上抓取數據并顯示在脈脈平臺上。故此,新浪控告脈脈存在四項不正當競爭行為,其中與用戶數據相關的有兩項:一是非法抓取、使用用戶數據,二是非法獲取并使用脈脈用戶手機通訊錄聯系人與新浪用戶的對應關系。
對此,一審法院首先認定雙方存在競爭關系。其次脈脈未經用戶同意獲取用戶數據并使用,而在合作結束后又未依協議刪除從新浪微博平臺所獲得的用戶數據。盡管脈脈辯稱所獲取的超出協議范圍的職業、教育信息系通過協同過濾算法獲得,但法院根據脈脈遠高于協同過濾算法的精確率反駁了該種說法。故最終依據《反不正當競爭法》第2條認定,脈脈違背了誠實信用原則及商業道德,構成不正當競爭。二審法院則在不正當的認定上,從OpenAPI開發合作模式出發,依據《開發者協議》歸納得出在該模式中,第三方獲取用戶數據時應遵守的“用戶授權”+“平臺授權”+“用戶授權”三重授權原則,得出脈脈違反三重授權原則,故而違反了誠實信用原則和互聯網行業的商業道德。
從新浪訴脈脈案中可以看出,數據作為一種重要商業資源已然得到法院認可,數據對互聯網企業競爭的重要影響亦不容忽視。兩審法院均首先認定新浪與脈脈的競爭關系,再依違背用戶同意角度及平臺授權出發,推論脈脈違反誠實信用原則及互聯網商業道德,進而得出脈脈構成不正當競爭行為。不過二審法院較之一審法院更進一步歸納得出“用戶授權+平臺授權+用戶授權”的三重授權原則。本質上均是從用戶同意及平臺授權角度出發,均未承認新浪微博所持商業秘密說,盡管二審承認用戶數據是一種商業資源,但其與商業秘密相去甚遠。
由此可見,在新浪訴脈脈案中,從根本上而言,法院在審判該案時,系以個人信息保護以及合同法為基礎,遵循的是一種民法上的私法自治原則。依據我國《消費者權益保護法》等相關法律規定,經營者收集用戶信息須明示收集、使用信息的目的、方式和范圍,并經其同意,①《中華人民共和國消費者權益保護法》第29條規定:“經營者收集、使用消費者個人信息,應當遵循合法、正當、必要的原則,明示收集、使用信息的目的、方式和范圍,并經消費者同意。經營者收集、使用消費者個人信息,應當公開其收集、使用規則,不得違反法律、法規的規定和雙方的約定收集、使用信息”?!蛾P于加強網絡信息保護的決定》第2條規定:“網絡服務提供者和其他企業事業單位在業務活動中收集、使用公民個人電子信息,應當遵循合法、正當、必要的原則,明示收集、使用信息的目的、方式和范圍,并經被收集者同意,不得違反法律、法規的規定和雙方的約定收集、使用信息”。在該案中,法院嚴格遵循法律規定,由于法律對數據交流共享的具體方式缺乏明確規定,法院以個人信息保護及合同法為基礎,從用戶同意角度出發并結合本案雙方簽訂的《開發者協議》,創造性地提出三重授權原則。由于法律規定不明確,倘若無雙方協議,僅依法律規定的個人信息收集時需用戶同意結合誠實信用原則及商業道德,無法得出數據流通、共享的具體規則。
新浪訴脈脈案中法院在確定競爭關系的前提下,結合誠實信用原則與互聯網商業道德,并結合市場主體間協議判斷不正當競爭行為的邏輯思路,無疑為判斷數據不正當競爭行為提供了一種可供借鑒的路徑。而新浪提出的商業秘密亦不失為數據之爭的又一種解決路徑。兩審法院對數據在互聯網企業競爭中的重要作用以及對數據流通、共享的認可,也使得互聯網企業間的數據之爭大有可能。但以個人信息保護結合合同法對數據不正當競爭加以規制的方法是否可行,還有待進一步探討。
從新浪訴脈脈案,可以看到我國司法實踐對數據不正當競爭行為規制的邏輯思路,即首先確定競爭關系的存在,再以《反不正當競爭法》第2條作為大前提,結合個案分析是否造成實際損害,是否違反商業道德與誠實信用原則。對互聯網數據是否具有商業價值并非當然確定,而需結合互聯網企業的成本投入,一般而言,足以引起糾紛的數據大多具備商業價值,尤其在大數據時代。而商業道德與誠實信用原則的確定則需結合個案具體分析。比如新浪訴脈脈案中依據對雙方約定的違反確定其違背誠實信用原則。
數據不正當競爭逐漸興起,但一直以來由于數據權屬不明,對互聯網企業間的數據不正當競爭如何規制問題尚不明確。從新浪訴脈脈案中,可以總結出規制互聯網企業數據不正當競爭的幾種規制路徑,即商業秘密、個人信息保護及反不正當競爭法規制路徑。
在新浪訴脈脈案中,新浪作為數據獲取者提出用戶數據屬于其商業秘密,借此規制該數據不正當競爭行為。兩級法院對用戶數據是否屬于商業秘密問題采取了回避態度,并未加以探討。我國新修訂的《反不正當競爭法》第9條對侵犯商業秘密行為進行了明確規定,若能證明互聯網領域的數據屬于商業秘密,便可直接據此加以規制。那么,數據是否符合商業秘密的特征呢?有學者認為數據符合商業秘密的三性,僅因其與立法、司法旨意相抵牾,故法院方不予討論,筆者不贊同這種觀點。筆者更贊同的觀點是:法院不予支持商業秘密的說法并非因立法與司法的原因,而系由于數據本身不完全符合商業秘密的特征。
依照我國法律規定,商業秘密具有秘密性、價值性和保密性特征。①我國現行《反不正當競爭法》第9條第3款規定:“本法所稱的商業秘密,是指不為公眾所知悉、具有商業價值并經權利人采取相應保密措施的技術信息和經營信息?!彪S著數據在互聯網企業經營中的重要性日益凸顯,加之互聯網企業在收集數據時的經濟投入,數據的價值毋庸贅言,但其秘密性及保密性仍有待商榷。在互聯網企業運行模式中,用戶的數據有一部分是公開的,任何人都可以看到的。這種可見性意味著互聯網企業難以做到保密性并保持其數據的秘密性。比如新浪微博的用戶數據,其中與用戶身份有關的電話此種私密信息具公開性,但此類信息屬于隱私權范疇,互聯網企業并無公開使用的權利。但昵稱、頭像等此類個人信息以及其賴以經營維持所涉及的用戶行為數據如微博動態更必然具有一定公開性。當然,也有部分數據具有秘密性,比如經大數據技術加工處理后的全新數據,往往由互聯網企業內部控制,但此類成果依然具有創造性,與其說是商業秘密,毋寧說是創作性勞動成果,屬于知識產權調整范疇。諸如此類公開作為吸引用戶、促進交易機會的數據絕不符合商業秘密的特性,故而用商業秘密作為規制不正當競爭的手段無法實現對數據的全面保護。
個人信息保護是針對數據不正當競爭的又一種規制思路,在新浪訴脈脈案中,法院確立的“三重授權原則”,即系結合個人信息保護及合同法對數據的保護。在對數據的三種分類中,用戶的直接個人信息及由用戶行為產生的衍生數據是與個人密切相關,即便是經大數據技術分析加工得到的全新數據,也需以前兩類數據作為基礎。若直接從隱私權出發,則直接從源頭解決數據流通共享中的問題,如在三重授權原則中,缺少了一重用戶授權,則證明脈脈的數據使用行為缺乏正當性。故而,個人信息權保護也是數據不正當競爭的一種規制方法。尤其隨著《中華人民共和國民法總則》頒布,個人信息保護進一步得到重視,這種規制方法難免引人注意。
但是個人信息權保護的規制方法存在難以規避的問題。首先對單獨的個人信息而言,此法無疑是一個很好的規制思路,但是,在新浪訴脈脈案中涉及的個人信息是一種海量個人數據的集合體,其自用戶同意由新浪使用其信息開始,已經成為一種與原始主體脫離的商業資源,成為一種與個人信息相區別的經營者信息[4]。在此種情況下,在互聯網企業進行數據流通共享時,要求取得用戶的再次同意無疑忽視了這種特性,將單獨的個人信息與作為商業數據的個人信息混為一談。最后,數據不正當競爭往往發生在互聯網企業之間,若從個人信息角度出發加以規制,盡管可以從源頭解決,但戰線拉得太長,反而會令此種規制缺乏動力及張力,也背離了維護競爭秩序的目的。加上我國法律并未規定在數據流通使用時需用戶再次同意,此類規則系互聯網企業自己設置,用戶在現實中對此知之甚少,故而依據個人信息權設立的三重授權原則缺乏實質意義。
因此,個人信息保護規制的方法缺乏可行性及可操作性,難以有力規制數據不正當競爭行為。并且混淆了單獨的個人信息與作為商業資源的個人信息的區別。因此,新浪訴脈脈案中的三重授權模式在數據不正當競爭的規制中并不合適。
綜上所述,作為商業資源的互聯網數據缺乏足夠的秘密性,又不具排他性,無論是利用商業秘密保護路徑,還是依個人信息保護的路徑,或多或少缺乏足夠妥當性。因而要規制互聯網企業間的數據不正當競爭行為,還需要尋找其他更合適的方式。
新浪案最終選擇《反不正當競爭法》一般條款①也有學者認為《反不正當競爭法》第2條不是一般條款,但司法和學術界中多將之稱為一般條款,筆者在此處暫不討論該問題,將其視為一般條款。的規制路徑,在目前數據權屬不明,對數據使用、流通缺乏具體法律規定的情形下,充分利用反不正當競爭法一般條款的兜底功能,并結合具體個案對數據不正當競爭行為加以規制,不失為一種可行的選擇路徑。但目前法律規定較為模糊,僅有一個一般條款可供利用,具體如何適用還需進一步明確。
前文已經論述,無論是從商業秘密保護角度,或是以個人信息保護為基礎,均或多或少存在不妥當性。并且這兩種規制方式均是以數據作為立足點。由此可見,以數據為立足點規制數據不正當競爭的路徑難以施行,因此可以以不正當競爭行為作為立足點,探究數據不正當競爭行為的規制路徑。此外,在互聯網領域有關數據的不正當競爭案件出現伊始,多數學者關注的對象是數據,試圖從數據本身出發,尋求突破。然而,《反不正當競爭法》規制的是不正當競爭行為,其是一種行為規制法而非對象規制法,就如同經濟法規制的是經濟行為而非其他對象[5]。故而,對數據不正當競爭行為的規制,不應以數據為中心,而應當以不正當競爭行為認定為立足點。
在新浪訴脈脈案中,法院在認定數據不正當競爭時,就是從行為的正當性角度出發。盡管在新浪訴脈脈案中,曾涉及商業秘密及用戶同意問題,但法院只是以此作為不正當性的認定基礎。故而在對數據不正當競爭行為認定時,其重心應放在“行為”而非“數據”上,在法律適用中完全可以先將數據歸屬問題置于一側,利用一般條款,從不正當競爭行為認定方面入手。
從新浪案中,可以看到司法實踐對數據不正當競爭的競爭法規制邏輯,遵循一般互聯網不正當競爭的規制路徑,又具有其獨特性。具體包括以下幾個方面:(1)雙方具有競爭關系;(2)法律無特別規定;(3)存在實際損害;(4)違反誠實信用原則或商業道德。最后三點是適用《反不正當競爭法》一般條款的條件[6]。在互聯網數據不正當競爭的判斷中,還需將這幾項標準再進一步明確化。
1.競爭關系的確定。對于是否以競爭關系作為不正當競爭規制的前提,目前有少數國家不再使用競爭關系加以考慮,但多數國家仍堅持以競爭關系為前提。[7]筆者認為在數據不正當競爭規制中對一般條款的適用,應以存在競爭關系為前提,而一些以違反一般條款反推存在競爭關系的做法有違法律適用的一般邏輯[8],競爭關系的判斷理應在一般條款適用之前。在新浪訴脈脈案中,法院首先以存在競爭關系的論證作為邏輯展開。
對互聯網領域的數據不正當競爭應如何確定其是否存在競爭關系?首先,互聯網領域的競爭具有跨界性、全網絡性的特點,一個互聯網企業往往經營多項業務,互聯網經營模式的雙邊性特點更使得同行業判斷極為困難,以往依“同行業競爭”等判定競爭關系的標準難以適用。其次,對互聯網中的數據競爭而言,其必然涉及流量攜帶問題,若從流量競爭角度而言,幾乎所有互聯網企業都存在競爭,若從此種角度界定競爭關系,無疑太過寬泛。流量截取可以作為一種不正當競爭效果,但不能作為競爭關系判斷標準。
判斷互聯網經營者之間是否存在“競爭關系”不應該以身份為標準,而應著眼于行為;從具體行為出發,判斷互聯網經營者之間是否具有經營性、競爭性。而其行為的目的就是對用戶的爭奪。比如脈脈不正當使用數據是為吸引更多用戶關注,本質上是對用戶的爭奪。
互聯網中數據的競爭背后是對用戶的爭奪,故而將相同用戶群作為數據不正當競爭中競爭關系的判定標準,既符合數據不正當競爭的實質,又使得競爭關系的判斷更為明確。
2.誠實信用原則和商業道德的具體化。從司法實踐來看,因法律無具體規定,對互聯網數據競爭的不正當性判斷通常依照一般條款,以違反誠實信用原則和商業道德為判斷標準。不僅本文提到的新浪訴脈脈案,其他涉及的案件,法院亦均采用該標準,依一般條款確定數據不正當競爭的不正當性亦與立法目的相符。但由于一般條款的模糊性,如何將商業道德與誠實信用原則具體化還需繼續探究。
首先可以依據協議判斷。在數據權屬未明的情況下,一般而言,經營者會針對數據使用及處分制定相關協議,確定數據使用及處分方式,而這種協議通常經過用戶同意。此種情況下,無論數據權利歸屬于用戶還是經營者,此種協議均會對數據使用及處分產生約束效力。這種情況下,只要經營者告知第三方后,第三方知道或應當知道依據協議其不能未經同意使用相關數據,則可以認為各競爭者之間達成了協議,若第三方競爭者在此種情況下未經經營者同意擅自抓取并使用經營者的數據,構成對誠實信用原則的違反,具有不正當性。如新浪訴脈脈案中,脈脈在結束與新浪的合作后,明知未經同意不能抓取并使用相關數據,但仍舊擅自抓取并使用新浪用戶數據,就屬于明知但故意違反的情形。即便此前雙方并無合作,只要新浪作出了聲明通知第三方不得抓取并使用新浪用戶的數據,同樣違反誠實信用原則,具有不正當性。
其次還可依成本投入判斷。互聯網企業對其控制支配的數據往往付出了較多的時間及經濟成本,不勞而獲的行為往往會損害這種經勞動投入所獲得的成果,影響經營者的積極性。而第三方幾乎未付出任何據成本,僅僅依靠簡單的技術抓取即獲得其他經營者的勞動成果,并據此在競爭中獲得競爭優勢,無疑違反了合理公正的商業交往規則。故此在司法實踐中可以將嚴重損害他人勞動成果,并據此獲得競爭優勢,爭奪他人交易機會的行為認定為違反商業道德,具有不正當性。
總體而言,不正當性的判斷需結合具體案件,以違反誠實信用原則和商業道德為基礎,結合違法性問題,綜合認定互聯網企業間數據競爭行為的不正當性。
3.實際損害。存在實際損害是互聯網數據不正當競爭判斷的另一要件,只有行為對經營者造成反不正當競爭法所指的損害,法律才有規制的必要,否則會造成干預過度的問題?;ヂ摼W數據不正當競爭的實際損害后果往往包含兩種,一種是直接后果,一種是間接后果。直接損害后果是對流量的截取,間接后果是交易機會的減損,其中交易機會的減損才是不正當競爭法規制的根本原因。
數據在互聯網中流通的表現形式就是流量,流量的多少表明互聯網企業受到的用戶關注度,而這種關注度影響著互聯網企業的價值。數據不正當競爭最直接的后果就是對流量的截取。流量背后是用戶關注,這種關注間接地影響著互聯網企業的交易機會,關注度越高交易機會越多,反之則越少。由于競爭者對數據的不正當利用,導致流量被截取,無形中交易機會間接減損。而這種間接減損往往難以證明,但這卻是互聯網數據不正當競爭的本質,若無法證明對交易機會的損害,則無需由競爭法規制。故此,筆者認為,認定數據不正當競爭的損害,須先證明競爭者對數據的不正當利用存在流量截取,并以此切入點,結合經營者的營業模式,探討是否對交易機會產生減損,若存在交易機會減損,則屬于反不正當競爭法所指的損害。若僅有流量減損而無交易機會減損,則需判斷流量是否為經營者的主要營業方式,若是,則屬于由不正當競爭造成的損害,否則,不屬于不正當競爭法所指的損害,如新浪訴脈脈案則屬此類。
故而對互聯網數據不正當競爭實際損害的衡量,既要考慮直接的流量損失,又要考慮間接的交易機會損失。若僅有流量損失而無交易損失,判定是否屬反不正當競爭法所指的損害時,還需結合經營者的營業模式分析。
綜上所述,互聯網數據不正當競爭行為的規制應當選擇競爭法規制路徑,以確定相同用戶群為判斷標準確定競爭關系,結合誠實信用原則、商業道德與違法性判斷數據競爭行為的不正當性,并根據直接的流量損失與間接的交易機會損失確定競爭者對經營者的損害,據此依《反不正當競爭法》一般條款對數據不正當競爭行為加以規制。