高富平 冉高苒
(華東政法大學法律學院,上海 200042)
在諸如人工智能、云計算、區塊鏈等紛繁復雜的新興技術之中,爬蟲技術(Data Scraping)似乎難以“新技術”自居。簡單說來,爬蟲技術就是從一個或多個網站上掃描和提取大量數據副本的過程。[1]從起源時間來看,早在20世紀90年代末,美國出現的賬戶聚合服務(Account Aggregation)中就已經使用了早期的屏幕爬蟲(Screen Scraping)技術,使客戶能夠在一個地方查看自己來自不同機構的賬戶信息。[2]而我們慣常使用的谷歌搜索引擎也是在這個時期出現,它也是爬蟲技術的早期技術形態。[3]2-3從技術普及情況來看,爬蟲技術已經在眾多互聯網領域開始普遍使用。有機構統計,目前有將近二分之一的網絡流量來自爬蟲技術。[4]爬蟲技術已經成為被普遍使用的網絡技術之一。
新技術會提高生產力,促進經濟發展,會帶來巨大的社會進步,但同時也會帶來在政治制度、社會制度以及經濟制度之上的不平等。[5]對于爬蟲技術而言,由于其獲取散落數據的便捷性與低成本性,一方面成為需求者高效獲取數據的主要途徑,其重要性之于特定網絡商業模式不言而喻,但另一方面又因為其近似“盜竊”“掠奪”的資源獲取方式,給被爬者帶來了極大的防范成本和經營困局,甚至由于其違背Robots協議(1)等“君子協定”而成為網絡世界人人喊打的“害蟲”。因此,對于技術與法律的研究者來說,需要謹慎、客觀地推進我們對新興技術領域的連續性觀察,及早發現既有模式存在的問題并加以改進,從而探索出符合人類社會普遍認知與行為準則的途徑。[6]
本文將按照如下邏輯展開討論。首先,爬蟲技術呈現出從表層內容爬蟲到底層原始數據爬蟲的流變趨勢。爬蟲技術的原始性、寄生性等特質導致了目前的巨大爭議,而實踐中單純依靠現有法律規范并不能完全化解這些爭議。其次,從生產性的維度來看,爬蟲技術的流變是互聯網生產活動由內容生產向數據生產深化的結果與體現。其中網絡運營者(或稱網絡平臺)發揮著重要的組織核心作用。(2)但現有法律并未對代碼層面的數據生產活動進行必要的規范,這在一定程度上導致了以爬蟲技術為代表的數據生產、利用秩序的混亂。理性對待爬蟲技術負面影響的同時,我們必須認識到其本質是獲取數據生產活動所需的生產要素,核心目的系為實現數據重用。最后,通過對于各國探索與中國實踐的經驗總結,本文將討論如何超越數據權屬爭論,從數據利用秩序上解決爬蟲爭議的問題。網絡運營者基于數據生產活動事實上控制了數據,法律應當承認并尊重這種事實上的財產性權益。為防止“反公地悲劇”的出現,法律還需要賦予網絡運營者一定的數據分享義務,以實現數據要素的充分流通和利用,從而從根本上實現對于非法爬蟲的科學規制。
從技術目的上來說,爬蟲技術主要是為了方便、快捷地獲取網絡上海量的數據/信息應運而生的。網絡可以承載傳輸海量的信息,為了獲取相關的有價值的信息,有許多公司專門雇用員工從互聯網上手動收集相關內容。(3)這樣的方式看起來似乎原始至極,但卻是爬蟲技術的初始形態。隨著技術成本的降低,爬蟲技術很快擺脫了人工的束縛,進入程序/代碼或者機器爬蟲的階段。(4)
爬蟲技術從人工走向機器,其爬蟲對象也從淺層信息走向了底層數據。從數據/代碼角度來說,網絡提供的以任何形式呈現的內容,包括網頁、超文本語言、文字、照片、視頻等等都是由結構化、半結構化和非結構化的定量或定性數據組成。[7]這些數據,首先是用澤字節(Zettabytes)測量的海量數據;其次,這些數據存儲有各種各樣的格式,并依賴于各種技術和標準;再次,這些數據并不是靜態的,它是以極快的速度生成、流通和修改變化的。[8]為了應對上述的技術挑戰,現階段的爬蟲技術開始被廣泛地定義為一種數據收集技術,包括從一般的屏幕輸出中收集數據,或從大多數網站顯示的HTML代碼中提取數據,更為流行的是在通過解析對底層網絡數據進行訪問時,在沒有數據主機許可甚至感知的情況下爬取大量數據。[9]也正因此,如今爬蟲技術已經從獲取網頁數據轉移至底層數據,成為許多所謂的大數據公司獲取數據、從事大數據挖掘的最主要的手段[10]8,因此也被稱為數據爬蟲。
一開始,爬蟲技術看起來是一種簡單的信息獲取技術,或者更接近于一般的傳播媒介技術,而“媒介是人的延伸”[11],爬蟲技術為網絡用戶提供了器官與思維上獲取半徑的擴展,這種技術對任何網絡用戶而言具有積極意義。后來,人們逐漸發現如果爬蟲技術應用于以信息聚合為代表的互聯網新興產業中,就不難看出其技術價值已經由簡單的信息獲取走向新的聚合價值的生產,由此,爬蟲技術成為了一種基礎數據資源的獲取(或者采集)工具。隨著網絡用戶開始習慣通過這種方式接受網絡服務,傳統的(或者擁有先發優勢的)網絡服務提供商就難以繼續沿用一般的網絡服務模式和生產模式開展商業活動。因為爬蟲技術開始妄圖成為一個一般性的商業模式基礎技術進入已有的網絡生產組織系統,并妄圖以改變現有的法律態度以使得自身可以獲得合法的生產性地位。在這一階段,兩者之間的張力開始顯現,傳統的生產商渴望揭示其背后的原始性與侵入性,削弱技術本身的合法性與正當性,從而對其使用場景和空間進行壓縮。
爬蟲技術帶來的爭議可以從數據生產機制本身與法律規范兩個維度來分析。
一是數據生產機制層面的爭議。網絡運營者的構架設計是一種面向長期的市場性的激勵機制,還為這種機制找到了穩定的市場和法律環境,通過各種方法來組織維護它,以確保“平臺經濟”的各參與方可以得到確定的收益。這種機制的生產性成本和“交叉收益”[12]都是巨大的,但爬蟲技術“寄生蟲”般的技術邏輯卻打破了這一平衡。首先,爬蟲技術具有原始性。此處與原始性相對應的概念是市場性,就是指遵循所謂“市場的邏輯”,即“以利人之行,實現利己之心”。(5)在成熟的市場性生產機制中,為生產作出貢獻的主體都恰當地獲得了相應的貢獻對價。從用戶角度來看,作為UGC(User Generated Content)的貢獻者,用戶一方面獲得了來自網絡運營者的激勵補貼,同時也可以直接獲取源于自身IP的廣告利益;而網絡運營者則在“交叉收益”的機制下獲得了源自廣告商的收益,同時也可以直接向消費型用戶收取平臺服務的相關費用作為提供內容產品的對價。對于爬蟲技術來說,由于獲取目標數據是不需要向被爬者支付對價的,利益的獲取方只有爬蟲者。作為原始數據的生產者和控制者,用戶和網絡運營者在整個爬蟲的生產流程中處于利益缺位的狀態。這樣的數據生產方式類似于“掠奪式”的原始積累,具有生產要素獲取機制上的原始性。
其次,爬蟲技術具有寄生性。此處與寄生性相對應的概念是共生性,體現在各個機制主體(即共生單元)之間可以進行物質、信息和能量的雙向交流,這種交流是否存在或是否順暢是共生關系得以實現的基礎條件。[13]具體來看,就是用戶、平臺、廣告商之間可以實現資金、技術、信息的流通,可以構建維持一個共生環境和共生界面。因此,有學者曾言,“共生,是運用科技增加社會福祉,用社會訴求推動科技創新的基本法則。”[14]而爬蟲這樣的數據獲取方式是寄生性的,它的存在完全依賴于被爬平臺,甚至給被爬者以破壞。爬蟲程序可以在未經用戶和平臺同意的情況下爬取數據,并可以依靠數據的重用來獲取具有競爭性的用戶和廣告收入,以削弱被爬平臺的收入。此外,爬蟲技術可能收集、侵害用戶的隱私信息,甚至可能直接損害被爬者的數據主機。[3]3這樣一種數據資源的獲取是單向度的,是缺乏生態持續性的。
最后,爬蟲技術具有不穩定性。生產要素供給的穩定帶來產品供給的穩定,這樣的穩定既體現在產品的質量上,同時也體現在供給的持續性上。而爬蟲面臨著技術與法律的雙重挑戰,反爬蟲技術可以阻礙、中斷數據獲取,法律的立場和態度也可以從市場規范和商業模式的合法性上阻礙、中斷數據獲取。在數據要素市場中,數據要素的供給需求是動態持續且穩定的,而爬蟲技術是獲取靜態數據的,且隨時面臨持續性挑戰,其獲取的數據質量低,穩定性低,持續性差。這既是爬蟲技術天生的缺陷,也是數據生產機制自我保護的體現。由于網絡數據中存在大量虛假或不完整、不標準化數據,當通過爬蟲技術手段獲取的數據呈現多源異構性時,數據資源的時效性、關聯性、準確性無法保障,當其被再利用后,不但造成數據分析計算價值的下降,還會造成數據資源的“污染”,嚴重危害數據要素市場的健康運行。
二是現行法律的局限性導致了爬蟲技術規制問題上的巨大爭議與不確定。首先,版權制度無法解決數據權益問題。平臺數據來源具有多樣性,以微信公眾號為例,平臺所管理的數據就包括用戶登記的賬號信息、用戶發布的信息內容以及平臺產生的用戶與平臺互動數據,當平臺因為這些數據被爬而提起版權訴訟時,基本無法得到支持。因為,微信公眾號平臺不“擁有”其網站上的所有數據,特別是當它是用戶生成的內容時,平臺并沒有得到權利的專有許可或者轉讓。更為重要的理由是,思想不能受到版權法保護——只有這些思想的具體形式或表達可以,原創性成為平臺不可能達成的舉證義務,而且,這種爬蟲技術所得數據的再利用,很可能構成版權法上的合理使用。
其次,Robots協議的效力存在巨大爭議。對于訴諸合同法(典型的如用戶服務協議、Robots協議)的案件來說,針對任何使用網站的用戶來說,都會被要求簽署一份“用戶服務協議”。這樣的協議通常面臨兩個方面的質疑。一是關于協議效力的問題,是否屬于“格式條款”(6);二是協議對象的問題,用戶服務協議往往只是針對自然人用戶,而爬蟲技術是以機器人的身份出現的,這就導致爬蟲技術者事實上并不是所謂“用戶服務協議”的相對人,因為它并不是用戶。也正是由于后者的原因,網絡運營者專門針對機器人/腳本設計了專門的Robots協議,但針對Robots協議的法律性質和強制力效力的問題也爭議不斷。一些學者認為其系一種集體協議,一些認為其是一種寬泛的契約關系,一些認為其是網站所有者與搜索引擎間是一種事實上的信息服務合同關系,還有一些認為Robots協議是體現了相關細分領域公認商業道德的行業慣例。因此,當被爬者希望通過合同法的路徑取得利益保護的時候,受制于合同主體、效力等問題,并不總是能得到法律積極的反饋。
最后,技術控制面臨巨大的成本和合法性挑戰。在缺失法律從社會層面保障的情況下,網絡運營者自身的技術防御措施也會面臨成本和法律的挑戰。對于反爬蟲技術來說,網絡運營者為了實現對于其平臺上數據的控制,愿意付出一定的技術成本來采取反爬蟲技術。更為嚴峻的現實是,網絡運營者的技術措施并不一定會得到法律的積極認可。例如,美國在HiQ與Linkedln的案件中,HiQ主動提起訴訟,認為LinkedIn的技術手段系違反信息自由的基本原則,要求通過法律手段強制允許自己繼續持續爬取LinkedIn的數據,而該請求在地區法院和巡回法院獲得了初步禁令的支持。由此,被爬者單方意思和技術措施不再能發生法律上禁止他方數據爬取的效果,其對數據的封閉將面臨反不正當競爭法、憲法第一修正案、開放互聯網之公共利益的挑戰。[15]正如本案所反映的,網絡運營者的反爬蟲技術同樣需要法律的確認,而在法律缺失明確態度的情況下,這樣的方式與爬蟲技術一樣會面臨合法性的質疑,例如信息自由價值、市場競爭價值等。
以互聯網為基本載體的數字經濟已經成為國民經濟的重要組成部分,各產業的數字化改革推動著國家數字經濟的發展,也成為我國未來數字經濟的主要方向。互聯網的這種特殊的創造力被稱為:生產性(Generativity)。這種依靠網絡從事的生產性活動被概括性地稱為互聯網生產活動。互聯網的生產性被認為是一項技術的總體能力,它能夠在大量、多樣和不協調的網絡用戶的推動下產生非預期的變化。[16]特別是對于商業互聯網平臺而言,當用戶消費需求異質化、技術分散、整體市場軌跡不確定的時候,這種生產能力尤為重要,甚至成為某一商業互聯網平臺得以生存的技術支撐架構。這也就形成了諸如微信公眾號、頭條號、知乎、抖音等相對獨立、封閉,卻又生產異質性內容的網絡運營者,并成為支撐我國數字經濟的重要力量。
從網絡分層理論來看,上述這樣的互聯網生產活動表面上是一個獨立的生產行為,卻在不同的層級具有不同的生產機制和生產結果,當然也會產生不同的市場作用與價值。(7)它揭示了網絡生產活動可以在內容層(具有一定信息意義的內容)、代碼層(原始數據和數據集的產生),或者通過物理載體,以不同的產品形式予以呈現。這三個層次當然是聯系在一起的,因為物理層承載代碼層,代碼層蘊含內容層意義。然而,從生產性的法律角度來看,每一層都代表著定義一定“產品”和生產活動的相對獨立。
因此,除去物理層之外,可以在內容層和代碼層中分別定義互聯網生產活動。對于內容層而言,互聯網生產的活動價值在于信息與知識的加工創造。互聯網內容生產者通過創造性的思維結合標準化的過程來更便捷地創造內容和信息商品。這樣的生產活動起源于非常早期的人類歷史,隨著生產技術的不斷推進,從打字機、攝影、電報、電話、錄音錄像到廣播電視,最后是互聯網信息技術,產品的呈現以文字、圖片、音頻、視頻等出現,本質仍是直接生產人類可以識讀的,以降低人類活動不確定性為價值的信息。
對于代碼層而言,互聯網的生產活動就是數據生產活動。數據是對客觀世界的數字化映射,是信息和知識的數字化表達。隨著互聯網、人工智能等技術的發展,數據的價值開始逐漸被人類發覺。首先,人類通過網絡實施的各種行為活動越來越多地被數據化。例如,網絡用戶的Cookies等“數字痕跡”開始被數據化記錄。其次,聯網的智能設備(物)可以產生、存儲和傳輸數據,成為大數據主要的來源。例如,智能汽車、智能電話、智能家居和可穿戴設備等等。再次,數據自身也被當作某種類“資源”進行交易。因此,數據經濟不僅是指數據驅動或數據控制的經濟,還是一種以數據為基本生產要素的經濟模式。正是基于這種具有機讀性,非人類可直接識讀的數據的價值爆發,才使得傳統的互聯網內容生產具有了數據生產的價值意味。
可見,之前停留在內容層的互聯網生產活動已經突破了語義、信息的界限,在代碼層完成了數據生產的價值創造過程。網絡運營者為了創造激發互聯網生產的活力,為了在內容層創造差異性、功能分化的競爭價值,在代碼層生產更多可供計算分析的數據,更多地擔負起中介與組織的雙重功能,它們的供給支持創新和創造力,為內容生產提供了構架和行為模式上的基礎,但同時也限制了參與,并將其引導到有利于平臺創造者的生產活動中。[17]正是在此種數據生產理論的視域下,爬蟲技術具有了一種生產性意義上的表征,需要得到法律的正視與回應。
盡管當下數據的生產要素性質已經得到了政策制定者和產業界、學界不同程度的認同。但如何實現數據要素的生產性價值,人們似乎并無定論。“這些數據最好是結構化的,但不一定是結構化的”,因此“實現大數據的潛力需要從所有來源進行更多的數據重用”[18]。數據(或者信息)的創生性、涌現性、相互性與共享性決定了相同的數據用于不同的場景(或者與不同的數據進行匹配),會創造不同的價值。(8)因此,與數據(一次)使用相對應,數據重用就成為數據生產與數據價值創造的重要途徑。數據重用主要有數據循環(Data Recycling)、數據目的重用(Data Repurposing)和數據場景重用(Data Recontextualization)三種主要形式[18],而爬蟲技術是實現后兩者數據重用的重要技術手段。
從技術機制來看,將爬蟲技術的技術過程進行細致劃分,現階段的爬蟲技術一般包含網站解析(Website Analysis)、網站爬行(Website Crawling)和數據組織(Data Organization)三個步驟。首先,網站解析就是通過檢查一個網站(或多個網站)或網絡存儲庫(例如在線數據庫)以了解所需數據的網絡架構和存儲方式。其次,通過開發和運行一個程序腳本,自動瀏覽網站和檢索所需的數據來進行對于底層數據的爬取。具體使用怎樣的代碼語言與這些語言在數據科學的可用性有關,它們的目的是自動抓取和選擇數據。最后,從選定的網絡存儲庫中爬取出必要的數據后,需要對其進行清理、預處理和組織,以便能夠對這些數據進行進一步分析。[8]
結合數據生產和重用理論的分析,上述三個過程可以清晰地體現出爬蟲技術的技術邏輯。一方面,網站解析和網站爬行實現了數據網絡存儲庫(就如同蘊含資源的礦藏)和數據(資源本身)的分離,實現了初始的數據要素獲取的過程,即通過對網站代碼層的數據化解析、篩選和復制,實現對于網絡內容、網絡活動的數據化映射,從而為數據本身成為資源或者商品[19]進行流通,提供了基本的可能。另一方面,隨著技術的深化,爬蟲技術也不單單扮演“搬運工”的角色,數據組織過程讓爬蟲技術具有了價值創造和價值添付的功能,組織標準、組織范圍、組織語言等的選擇與確定[8],使得數據的可攜性與互操作性的統一成為可能,更是實現了“基于需求的數據供給”成為可能。[20]這一階段,爬蟲者通過將爬蟲得到的數據以某種標準進行分類、組織,甚至還涉及不同數據源的數據要素匹配和融合的過程,以生產出新的數據要素。事實上,這一過程已經完成了數據不同語境的變換,實現了場景化(或者語境化)重用與價值添付的過程。加之,若被爬數據的最終用途與數據源不同,則又實現了數據目的的重用。(9)
從生產對象來看,如前所述,用戶利用平臺主動生成的數據和網絡行為的“數字痕跡”都是數據資源的重要組成,但不可否認的是,如同原始采集來的能源資源未經“清洗”難以高效使用一樣,上述兩種原始數據由于質量、用途、采集方式、使用目的等各方面因素的差異性,直接用于數據分析/挖掘的可用性并不高。打破不同類型原始數據的孤立性,實現原始數據的互通、再提煉,將原始數據匯集成為更有價值的數據集(Dataset)的過程同樣具有價值創造上的重要意義。[21]
從爬蟲技術的結果來看,爬蟲的過程就是通過不同的數據匯集與重用,以形成新的數據集。爬蟲技術的價值就在于發現這些海量數據的某些特征,為特定目的、以可識別標準創建不同的原始數據之間的聯系,將它們匯聚起來。基于特定的標準和意圖,出于效率和良好系統運行的考慮,當這些原始數據在大多數情況下以一種標準類型的“數據包”的形式存在時,它們所包含的計算價值通常才是特定的(或者說是可以量化的),才可以用以支持收集、創建它們的直接目的。因此,對于商業數據競爭而言,真正的競爭優勢往往來自那些生產出的具有獨特性的數據集,而不是原始數據。[22]“數據生產實現數據從無到有,數據集生產則實現關于某個對象的數據匯聚和優化。”因此,爬蟲技術在原始數據“數據集化”的過程中扮演了極為重要的角色。[21]
綜上,爬蟲技術是一種典型的數據重用技術,具有一定意義上的生產性意涵。但需要強調的是,本文把爬蟲技術定義為數據重用行為,這里的重用只是事實判斷意義上的,因為其確實付出了生產上的勞動,實現了從1到多(或者從分散到聚集、從粗放到優化)的價值創造的跨越。[23]但這樣的行為或者技術能否得到價值判斷上的正當性確認,則是另一個層面的問題。因此,在法律上如何對待爬蟲技術需要更為系統的分析論證。
從生產性的視角來看,作為數據生產者的網絡運營者,希望其生產性貢獻得到法律的確認和保護,這種合法性的確認既是商業模式的考量,也是利益分配的考量。從現實來看,網絡運營者對于自身生產行為的控制存在于技術與法律兩個維度。
從技術維度來看,自發的技術控制是網絡運營者自力救濟(自我保護)的體現。網絡運營者對于自身生產活動控制是高度依賴技術構架的。以微信公眾號為例,微信公眾號設置有登陸限制、IP訪問限制、驗證機制等技術措施。諸如此類網絡運營者設置的登陸機制,其目的就是在于通過限制非真人的訪問。對于IP頻率訪問限制而言,網絡運營者會設置IP訪問頻率限制。如果一個訪問者訪問太快了,網絡運營者就會認為你不是一個人,而是一個機器人或者其他腳本程序。除了上述對于訪問者主體身份的控制外,對于平臺內容來說,網絡運營者也會通過分享控制、編輯限制、“白名單”、原創聲明等方式,在不違背信息自由的基本前提下,一定程度上實現對內容生產的技術控制。
從法律維度來看,內容層的法律規范是網絡運營者的社會性保護,同時也是對平臺內容生產技術控制的確認。通過知識產權保護由人類思想創造性的信息,如發明創造、藝術作品或專利設計;通過合同(典型的如用戶服務協議等)實現與平臺用戶的法律關系的確認并明確兩者之間的權利義務關系;通過反不正當競爭實現對于市場競爭者、競爭利益與競爭環境的規范等等。因此,法律通過對于平臺技術的規制和確認,從人類的網絡行為規范層面實現了對于內容生產活動正當性的保護,確認了這種知識生產的新模式及其背后所代表的商業利益與價值。
而對于代碼層或者數據來說,法律的應對體現出了其自身固有的保守性和滯后性。當可被人直接識讀的信息、知識,被數據化為僅機器可讀的數據時,其價值也從單純的信息價值向更復雜的計算價值跨越,由此,網絡運營者相應地用于生產和管理數據并據此控制數據生產過程的邏輯也發生了變化。因此,正是代碼層法律的缺失導致了數據生產活動的混亂。一方面,網絡運營者自發的技術控制未得到法律的認可,典型的體現如美國《計算機欺詐與濫用法案》(CFAA)對于突破技術防線訪問計算機系統是否構成“未經授權訪問”的爭議,Robots協議性質與效力的爭議等。另一方面,無論是因為法律的體系局限性還是法律適用的有限性,傳統法律(如前述知識產權、競爭法等)又無法像規范內容生產一樣應對數據代碼層面的爭議。因此,以數據爭議為表現的數據生產活動秩序的混亂由此產生。
綜上,限于時間、技術或者其他眾多原因的影響,人們對于內容層的探討與思考較多,而對于代碼層面的數據生產認識尚淺。而用喬納森·齊特林(Jonathan Zittrain)的話來說,“入侵者可以在一層工作,而無需了解另一層工作,和另一層工作之間不需要任何協調或關系。”[24]隨著大數據、傳感等技術的深化,內容(信息)可以輕松實現數據化的轉化,從而使存在于內容層的問題延伸、擴展至代碼層。(10)由此,當爬蟲技術出現時,現行法律在代碼層面的不完善成為網絡運營者對于數據生產活動法律上控制的難題,這也導致了未經授權的爬蟲技術被大量應用,成為網絡運營者眼中人人喊打的“害蟲”。
為化解爬蟲技術的爭議,世界各國都進行了各具特色的制度創新與嘗試。其中,美國法律在面對爬蟲技術時的,動用了幾乎法律“武器庫里”任何可以想象到的“武器”。其中最具美國特色的法律就是《計算機欺詐與濫用法案》(以下簡稱CFAA)。CFAA是一項聯邦法規,規定任何“在未經授權的情況下故意訪問計算機或超出授權訪問范圍”的主體都應承擔刑事責任。與合同法的理論沒有很大的差異,適用CFAA的案例通常取決于用戶是否對網站用戶服務條款的限制性條款有實際或建設性的了解(即明知爬蟲是“未經授權的”)。在過去二十年中,大量的爬蟲技術案件涉及CFAA的適用問題,但法院并未達成共識,特別是針對“未經授權訪問”的理解與解釋問題上仍存在巨大分歧。[25]372-415但總體的趨勢是,對于構成CFAA所描述的“未經授權”,美國法院的態度越來越謹慎,以防止其適用范圍的無限擴大,對正常的網絡信息流通產生不利影響。典型如備受關注的HiQ與Linkedln的案件,經過初審、上訴和重審的立場搖擺,美國第九巡回法院的第二次裁決,依然堅持并重申了其最初的裁決意見,認為爬取互聯網上已公開的數據并不違反CFAA,并強調“未經授權”的概念不適用于公共網站。(11)由此可見,美國法院對于爬蟲技術是否適用CFAA的看法動搖。正如安德魯·塞勒斯(Andrew Sellars)教授所言,“爬蟲技術的法律地位經歷了二十年的不確定性——這不是像一些學者所說的那樣一片混亂,而是在不同時刻搖擺的狀態。”[25]412
最具歐洲特色的法律應對是通過“數據庫權(Database Right)”來實現對于爬蟲技術的規制。為了對“數據庫”施加保護,歐盟在既有知識產權法的體系框架之下設置了一種特殊的專有權——數據庫權,并通過頒布《關于數據庫法律保護的第96/9/EC指令》(以下簡稱“數據庫指令”)確認了該項專有權,該項權利旨在保護以系統或方法方式排列并通過電子或其他方式單獨訪問的獨立作品、數據或其他材料的集合。(12)在數據生產的語境下,數據庫權所保護的數據至少需要具備兩個條件,第一個是該數據必須是以系統或有條理的方式排列并通過電子或其他方式單獨獲取的數據,即結構性。第二個條件是在獲取、驗證或呈現內容方面的質量和/或數量上的大量投資,即投入性。盡管《數據庫指令》的出發點不可謂不積極,但在實際的運用中還是出現了巨大的爭議。很明顯,《數據庫指令》忽略了對于非結構化數據和經營行為衍生數據(即經營副產品)的保護,這使得當下真正占據大多數的網絡活動的“單一數據源數據庫(Solo-source Database)”無法被視為《數據庫指令》保護的對象。這就導致目前大多數網絡運營者在面對爬蟲技術時,依然不能依據確定的財產權路徑進行保護。2017年歐盟頒布《構建歐洲數據經濟》(Building a European Data Economy)文件,提出構建“數據生產者權”(Data Producer's Right)的財產權保護路徑以解決機器生成數據的權屬問題,是否可以有效解決爬蟲技術所帶來的沖突問題,還需要更多的研究與思考。(13)
結合我國的司法現狀,我國法院采用最為常見的路徑是通過反不正當競爭法和刑法來對爬蟲技術行為進行規制。對于法院認定爬蟲技術構成反不正當競爭行為的案件不勝枚舉。但總體看來,法院并沒有直接對于爬蟲技術本身做出任何價值判斷,而是堅持從反不正當競爭行為的一般判定要件出發,對于利用Robots協議或者爬蟲所得數據進行的市場活動,(14)進行行為性質的合法性判斷。這就導致行為人對于爬蟲技術行為的行為預期始終處于不確定的狀態。盡管很多案件的原告都取得了勝訴判決,但在法律適用問題上的爭議并不鮮見。[26]因此,適用《反不正當競爭法》來規制爬蟲技術行為總體上是一種“曲線救國”的應對方式。
在“谷米公司訴元光公司不正當競爭案”中,元光公司為提升本公司的APP軟件“車來了”的服務質量,利用網絡爬蟲技術爬取了谷米公司“酷米客”APP軟件上的公交信息數據,將之用于“車來了”APP并提供給公眾查詢。法院認為,“元光公司利用網絡爬蟲技術大量獲取并無償使用‘酷米客’APP實時公交信息數據的行為,是一種不勞而獲的行為,破壞他人的市場競爭優勢,具有主觀過錯,違反了誠實信用原則,擾亂了競爭秩序,構成不正當競爭。”(15)在“新浪微博訴蟻坊公司不正當競爭案”中,由于新浪微博與蟻坊公司之間并無明顯的商業模式和用戶對象的競爭關系,法院在認定兩者的競爭關系,明顯擴大了解釋與適用的范圍,認為“只要經營者的行為不僅具有對其他經營者利益造成損害的可能性,且其同時會基于該行為獲得現實或潛在的經濟利益,則可以認定二者具有競爭關系”,“在當前的市場環境下,這種競爭并不限于同業競爭,顯然也包括非同業競爭但仍對交易機會、交易能力存在爭奪的情形;因此,如一方經營者為了提高自己的交易能力而直接侵占或損害另一方經營者的合法權益,即便雙方并非同業競爭者,仍然構成了競爭關系。”(16)
由此可見,互聯網反不正當競爭法的保護已經明顯向市場主體合法利益的侵權法方向發展。[27]針對爬蟲技術來說,就是指網絡運營者所主張的數據權益,這種權益除其對數據本身所享有的權益之外,還包括運營網絡平臺,維護數據安全而產生的成本控制,以及基于所享有權益的數據進行衍生性利用或開發所獲得經營利益等。(17)
另一條重要的路徑是刑法路徑。據不完全統計,爬蟲技術涉案主要罪名為侵犯公民個人信息罪、侵犯著作權罪、非法獲取計算機信息系統數據罪與破壞計算機信息系統罪等。(18)罪名的多樣性,也意味著對于爬蟲技術本身性質的模糊性。總體看來,《刑法》對于爬蟲技術非法與合法的判斷,重點是從形式層面進行的。[28]因此,有學者提出要從實質的法益侵害性來進行罪與非罪的判斷。[28]以關系最為緊密的非法侵入計算機系統罪來看(19),我國是否會陷入如CFAA一樣對于“入侵”和“非法”等關鍵概念的解釋困境,爬蟲技術能否被認定為黑客行為,還需要司法的實踐以于驗證。[29]
事實上,不論是從哪個側面進行的探索,都體現了法律制度本身對于爬蟲技術外部性的積極回應。法律還應當發揮出一種具有導向性的作用,從而尋找和確定我們面對爬蟲技術的應然態度和價值取向。因此,有必要將爬蟲技術放置于更大更宏觀的整個數據生產與數據要素資源市場化配置的體系之中予以分析和討論,才可以擺脫單純的技術主義視角,對爬蟲技術做出全面而恰當的法律應對。
通過對我國司法實踐的觀察,我們不難得出以下結論:利用反不正當競爭法來規制爬蟲技術行為,表面上是對于市場競爭性秩序的保護,但實質上卻有明顯的數據財產性權利保護的趨勢。現行法雖然暫時缺乏有名財產性權益來明確,但在案件裁判上仍然會不知不覺地借用財產性權益的分析框架來完成判斷與說理。所以,不論是理論上還是現實需要,為數據構建相應的財產性利益保護規則是解決爬蟲技術爭議的根本路徑。只是這種財產性價值的利用與分配規則最終會以何種形式被法律體系表達出來需要探討。本文主張的制度方案主要包括“控制”與“分享”兩個方面。
爬蟲技術之所以爭議巨大,究其根本是數據權屬的爭議問題。無論是傳統的法學理論還是經典的經濟學理論,解決產權問題一直都是資源配置、利益分配的基礎與核心問題。[30]但由于數據這一權利客體本身的非競爭性與非排他性[31],加上數據利益相關者的多樣性,導致在數據權屬這一重大學術議題的討論中往往無法形成基本共識。在筆者看來,超越傳統的權利范式,從數據資源的利用角度,為網絡運營者配置數據持有者權,以實現資源的有序利用是切實可行的制度路徑。
1.技術視角。其一,數據持有者權的正當性在于數據生產活動。如前所述,網絡運營者通過內容層的組織架構和內容生產機制客觀上實現了代碼層的數據生產活動,一方面實現了數據源對于原始數據的自主性供給,另一方面通過分離數據源和數據,實現元數據的生產和處理,數據價值的添付。從這個數據生產活動的意義上來說,數據持有者權就是生產組織者對于生產過程全流程的管控,其當然性地包括生產者與生產要素。關于數據生產與內容生產前文已具體論述,此處不再重復。
其二,數據持有者權的邊界是平臺。數據資源的流動性問題,直接關系互聯網的生產機制和過程的成敗。[32]流動性既是數據價值產生、匯集的關鍵,但也客觀上成為數據控制基本難題。而平臺相對意義上的封閉性就成為實現數據控制技術上的關鍵。基于前文對于互聯網生產機制中網絡運營者的組織核心地位,我們不難看出,互聯網的開放是建立在各個平臺的相對封閉性之上的,從架構技術上來說,平臺內部的通用標準和架構模塊往往只在本平臺內部使用,要想實現跨平臺的互通往往具有使用標準上的復雜性和困難度,這也不難解釋諸如阿里、騰訊、谷歌總是被認為進行事實上的“壟斷”。從網絡運營者主觀上來看,這種構架上的差異性是內容異質性和商業活動競爭性的要求。他們希望通過控制核心構架和標準上的差異,來滿足不同的市場需求。而且隨著各種新技術、新的組織和人類行為模式的共同發展,這種持續的相對封閉性可能會繼續下去。而這種相對的封閉性就成為數據持有者權相對清晰的邊界,一面為財產劃定的邊界,一面可以匹配數據的供求關系。例如針對爬蟲技術的“反爬蟲”訴求的實質是要求構建一種新的生產秩序,并由在先的、往往擁有大量信息內容的平臺主導。
其三,數據持有者權的實現途徑是訪問控制。由于數據的非物質性,技術上實現對于數據的控制就是訪問控制,它的意義相當于有形財產中占有的價值。從互聯網生產性活動的視角來看,訪問控制就是限制對資源的訪問。通過訪問控制,可以識別個人(或計算機),驗證他們的身份,授權他們擁有所需的訪問級別,然后針對用戶名、IP地址或其他識別信息記錄他們的操作,以實現流程的可追溯。訪問控制最大限度地降低了授權訪問平臺或者數據庫,接觸到數據的風險,構成了信息安全、數據安全和網絡安全的基礎部分,同時也是實現數據有效控制的基本手段。
2.法律視角。其一,數據持有者權是對于平臺生產性投入的確認。目的是法律的創造者,而目的本身就是利益……利益是權利構成的本質要素。[33]而分配權利的標準之一可以是考慮已完成的投資和用于創建數據的資源。這一點與歐盟《數據庫指令》的立法思想基本一致,但其內涵應該是廣義的。此類投資通常由兩方進行:配備傳感器的機器、工具或裝置(生成數據)的制造商,他們投資于機器、工具或裝置的開發和市場商業化,以及使用此類機器的經濟運營商,支付購買價格或租賃的工具或設備,并必須攤銷機器、工具或設備。這也符合數據生產理論中為價值創造者配置權利的邏輯。因為只有這樣才能平衡網絡運營者對于組織數據生產的成本,保證數據的有效供給,才可以促進數據的后續分析與利用。
其二,數據持有者權旨在實現一定程度的排他性。典型的財產權必然包括三個核心特征:對世、排他和追及。其中對世是自動創設與全世界所有其他人之財產關系;排他為物權人與他人之間的法律關系之內容,即他人有不侵犯財產權的義務;追及則是在同一物上的多個權利人之間發揮作用。[34]由于數據的非物質性和非獨占性,不能排除他人對合法取得的同樣數據的使用,因此數據控制不應包括完全的對世性。由于數據的范圍和能產生的價值都具有不確定性,如果賦予數據持有者無限的追及效力,會導致權利界分與識別的復雜化,讓數據流通產生極高的交易成本。因此,該權利沒有追及力,喪失控制即喪失權利。綜上,數據持有者權實際上主要的權利效果是有限的排他效力,以防止無權使用數據的第三方首次使用數據,包括因未經授權訪問和使用數據而要求損害賠償的權利。
其三,數據持有者權負有數據合法管理義務。法律上得以確認的數據控制必須是合法的。這既是數據生產的前提,也是數據流通的前提。對于數據生產活動來說,要想取得對于數據的合法控制,就要在生產過程中遵守《民法典》《網絡安全法》《數據安全法》等規范數據處理行為的法律規定,只有這樣生產/獲得的數據才是合法的財產。反之,不遵守法律會導致侵權責任、行政處罰甚至刑事責任,導致數據持有喪失法律基礎。[35]而對于后續的流通供應來說,合法性同樣是數據進入流通環節的前提。因為數據上存在的利益多樣性,即使合法取得的數據也并不能消滅或忽視數據上存在的合法利益。[35]因此,數據使用環節仍然需要維護數據上所承載的利益主體的利益,只有每個環節都保證自己的數據控制合法合規,且可以追溯到流通前手,才能保證整個數據流通過程的合法合規性,保證數據要素市場的運行秩序。又由于這樣的財產權是純粹的防御性權利,它也可以通過增加防御元素來增強平臺對于數據的控制,從而更好地實現數據的流通共享。
當多重專有權導致公共資源的低效利用時,“反公地悲劇”就會發生。[36]因此,我們在構建數據持有者權時,有意地限制了傳統所有權的對世、排他、追及權能,并使權利人盡量明確,但這還遠遠不夠。由于龐大的網絡運營者事實上控制著用戶的網絡活動和海量的數據,其性質已經越來越接近具有公共性的基礎設施,因此,解決數據資源供給問題的另一條途徑,就是讓數據資源的控制者分享(Data Sharing)或開放其數據資源,從而使更多的數據需求者得到滿足,而不是“自產自銷”。
1.基于公共利益的數據分享(開放)。賦予網絡運營者數據開放義務的正當性理由主要有以下兩個方面。一方面,很多網絡平臺已逐漸具備準公共基礎設施的屬性。要滿足傳統的公共基礎設施的定位,一般需要滿足雙重條件:一是“自然壟斷(Natural Monopoly)”[37],二是“受到公眾利益的影響”。[38]這兩種要件完全可以適用到目前的大型網絡平臺,因為它們的作用往往是“嵌入的,大部分是不可見的,通常被認為是理所當然的、高度標準化的信息傳播系統”[39],具有自然的壟斷地位和高度的社會依賴性。結合我國實際來看,對于網絡平臺的準公共基礎設施地位的討論也有涉及,在《個人信息保護法》第58條(也被稱為互聯網“守門人條款”)[40]“互聯網平臺個人信息保護特別義務”規定中的三個條件“基礎互聯網服務”“用戶數量巨大”和“業務類型復雜”,就從平臺規模、力量、持續性與生態影響等幾個方面事實上劃定了一個網絡平臺是否為準公共基礎設施的標準,在實現從“開放資源到基礎服務”[41]的過程中,事實上接受了一種公共信任和公共責任。
另一方面,很多具有公共利益的數據存在“私人控制”的情況。由于數據價值的凸顯,數據開放帶來的好處已經得到了世界各地政府的普遍承認,受益于政府信息公開制度的借鑒價值[42],政府數據開放率先成為國際社會的熱潮,并逐漸掀起一項開放政府數據運動。我國也于2015年印發《促進大數據發展行動綱要》將“加快政府數據開放共享”作為大數據發展的主要任務。顯而易見,公共利益因素是早期數據開放,尤其是政府數據開放的重要出發點。結合近年各地方政府紛紛出臺相關的“公共數據管理辦法”,其中的一個重要目的旨在“加強公共數據管理,促進公共數據應用創新……保障數字化改革……推進省域治理體系和治理能力現代化”(20)。簡單而言,就是出于公共管理、社會治理等公共利益的目的而推進公共數據的分享與開放。
但上述舉措都沒有解決一個基礎性的缺陷,即具有公共利益的數據的私人控制的問題。在我國,無論是政府數據還是公共數據都依據“數據控制者”標準,被界定為被政府或者公主體實際控制的數據。這就造成很多作為私主體的網絡運營者,特別是典型的“互聯網巨頭”們,即使由于其業務類型和用戶數量,事實上控制了很多涉及公共利益的數據,卻無法在滿足特定條件的情況(如環境惡化、疫情防控等突發事件)下被分享使用,以滿足公共利益的目的。因此,為化解“公益數據的私人控制”問題,網絡運營者被賦予一定意義上的數據分享(開放)義務具有正當性與合理性。事實上,在歐盟委員會最新立法建議《關于公平獲取和使用數據的協調規則(數據法)》(Data Act)中,已經明確規定,基于突發公共事件、重大自然災害以及重大網絡安全事件等公共利益的目的,使用數據的公共利益將超過數據持有者自由處置其持有數據的利益。在這種情況下,私人的數據持有者有義務根據公共部門、工會等相關機構的要求向其分享(開放)數據。(21)
2.基于市場需求的數據分享。嚴格意義上來說,基于市場需求的數據分享更具有鼓勵數據控制者積極參與數據流通(包括數據開放、共享、交換、交易等形式)的意味,這不是一般意義上的賦予社會責任或義務。從獲取數據資源的數據生產角度出發,市場化的數據分享是獲得生產要素,規范數據流通的必由之路和主要途徑。隨著越來越多的網絡運營者開始進行數據市場化的數據分享時,其對于削弱爬蟲技術的需求具有不可替代的作用。因此,本文亦對此部分作簡要論述。
由于前述數據持有者權的存在,(除公共數據外)網絡運營者應當自主決定自身所管理的數據資源的開放方式。[10]5-16,254最大的可能是為了服務于網絡運營者的利益,會決定自愿與其他市場主體進行合作。為此,應向這些網絡運營者提供適當的激勵措施,以鼓勵這種自愿的合作與分享。事實上,作為開放數據運動的深化,很多政府在激勵、推廣、普及數據分享方面取得了重大進展,而這些網絡運營者(包括企業、社會組織、學術機構等等)通過免費開放、共享和數據交易為更多的數據市場利益相關者帶來切實的利益。(22)另一種形式的激勵措施可以包括建立相關的稅收政策。推動包含激勵因素的稅務制度設計,探索實施“以數抵稅”政策,對于積極開放、共享數據并產生較大經濟價值的網絡運營者,在因數據帶來的增值性收入中,給予適當比例稅收減免,對于具有較大社會公益價值的,給予一定的稅收優惠。綜上,政府可以通過培養和傳播機構數據能力、闡明價值并建立影響證據庫、支持新的數據中介機構、建立治理框架、創建可重用的技術基礎設施等方式實現對于數據市場化流通的激勵。[20]
此外,具有我國特色的“公共數據授權運營”制度也為公共數據參與數據要素市場分享活動提供了重要的制度途徑。公共數據除了前述公共性價值,同時也具備了無限的經濟價值與商業利用可能性。為了激發這部分數據價值的轉化,以市場化的方式實現公共數據的分享與流通,“公共數據授權運營”可以說是一種極具中國特色的數據要素分享模式。授權運營單位通過取得公共數據管理機構的授權,對授權運營的公共數據進行加工,形成的數據產品和服務,以實現向市場化的主體提供符合標準要求的數據要素的目的。這種具有“特許經營”性質的市場化數據分享模式[43],一方面協調了公主體及其他社會主體之于公共數據之上的利益關系,同時也在可控、可監督的數據安全監管范疇內實現了高質量數據要素產品的供給,實現了市場化價值與效率的提升。包括上海、浙江、成都等在內的地方政府都在積極進行“公共數據授權運營”的實踐層面的探索與嘗試。這一制度與公共數據開放、共享制度相結合,將完整構建關于公共數據分享利用的制度框架,對化解爬蟲技術所面臨的數據“獲取難”問題大有裨益。
互聯網不僅僅是通信和活動開展的工具,還是感知和記錄客觀世界的系統。由此形成的數字化記錄(數據)正成為新的知識生產方式的原料。人類文明所呈現出的“數據→信息→知識→智慧”的遞進式結構[44],已經隨著數字技術發展而發生了重要變化,人類認知世界的對象也由人類觀察和描述的信息、知識向底層數據——可機讀數據、語義元數據,不斷地深化,關于客觀世界的機讀數據、語義元數據開始成為數字時代的生產要素。
正因為互聯網產生的數據具有巨大的重用價值,以爬蟲技術為代表的“代碼層”爭議不斷出現。對此,本文論證了爬蟲技術的兩面性。顯然,目前的理論與司法實踐都更加關注其負面影響,而未正視其生產性的數據重用價值。爬蟲技術對于便利要素流動,擴展要素重用場景、拓展要素使用目的,實現數據要素計算循環價值有著與生俱來的特殊技術優勢。因此,爬蟲技術的問題本質是對于數據要素市場主體合法利益分配治理的制度性問題,是解決創制數據和添附價值的數據生產者對數據重用權益保護問題。
通過“控制”與“分享”的二元路徑,既可以實現對于數據利益的合理分配,促進數據要素市場的穩定供給和生產,又可以幫助促成更加公平的數據利益分享機制,為全社會主體有效獲取利用數據開辟道路。推而廣之,數據要素的“控制”與“分享”應當是所有數字經濟社會主體圍繞數據流通使用的“社會契約”,以保障公平實現社會主體參與數據價值的轉化,共同探索建立數據治理的信任框架。
注釋:
(1)Robots協議,也稱爬蟲協議、爬蟲規則等,是約定俗成的規范,不具有強制力。指網站通過建立robots.txt文件來告訴搜索引擎哪些頁面可以抓取,哪些頁面不可以抓取。
(2)《網絡安全法》規定:網絡運營者是指網絡的所有者、管理者和網絡服務提供者。另外需要說明的是,網絡可以實現各種社會活動,在實現或組織實現這些活動過程會形成數據這種“副產品”,內容平臺或者具有內容生產功能的社交平臺只是其中典型。本文以內容平臺為例進行相關分析論述,相關結論同樣適用于其他的網絡運營者,特在此予以強調說明。
(3)一些公司主要是依靠員工手動瀏覽網站,并每天將數據從一個或多個網站復制/粘貼到電子表格或表單中。這種方法有許多缺點,包括支付人工費用、數據準確性較低以及時間限制等。
(4)相關研究參見劉艷紅:《網絡爬蟲行為的刑事規制研究——以侵犯公民個人信息犯罪為視角》,《政治與法律》2019年第11期;Myra F.Din.Breaching and Entering:When Data Scraping Should Be a Federal Computer Hacking Crime.Brook.L.Rev.2015,(81)等。
(5)參見張維迎.理念的力量[M],西安:西北大學出版社,2014.本書中張維迎教授具體區分了“市場邏輯”與“宗教邏輯”。
(6)關于網絡服務協議、服務政策效力的相關研究參見王葉剛:《論網絡隱私政策的效力——以個人信息保護為中心》,《比較法研究》2020年第1期;姚黎黎:《網絡服務協議中動態條款的異質性規則與權利平衡》,《學習與實踐》2017年第4期。
(7)參見L.Lessig.The Future of Ideas:The Fate of the Commons in a Connected World,New York:Random House,2002.在談到現代網絡信息技術中的信息傳遞時,萊斯格教授(Lawrence Lessig)所提出的這三個層面區分的經典理論至今起著至關重要的作用。
(8)參見王天恩:《信息及其基本特征的當代性開顯》,《中國社會科學》2022年第1期。信息既不是物質也不是能量,而是一種基于物能的感受性關系,其成熟形態即信宿和信源間的感受性關系過程。
(9)相關案例參見杭州鐵路運輸法院(2021)浙8601民初309號民事判決書。事實上,在我國的司法審判中,數據的用途與數據源的用途是否具有實質性替代的效果,成為判斷爬蟲技術是屬于不正當競爭行為的重要考量因素。
(10)內容生產活動一方面創造了UGC數據,一方面也基于用戶的生產活動客觀產生了觀測數據和衍生數據。從數據生產角度來說,進行內容生產就是一種數據生產活動。
(11)參見HiQ Labs,Inc.v.LinkedIn Corp.No.17-16783 D.C.No.3:17-cv-03301-EMC.
(12)參見Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the Legal Protection of Databases.
(13)參 見P.Hugenholtz.Against‘Data Property’.Kritika,2018,(3).對于數據生產者權,學界質疑的聲音比較大。
(14)參見(2017)京民終487號民事判決書。
(15)參見(2017)粵03民初822號民事判決書。
(16)參見(2019)京73民終3789號民事判決書。
(17)參見(2019)京73民終3789號民事判決書。
(18)據蘇青教授統計,截至2020年12月31日,網絡爬蟲涉罪刑事案件共有31件,涉案主要罪名為侵犯公民個人信息罪、侵犯著作權罪、非法獲取計算機信息系統數據罪與破壞計算機信息系統罪,案件數量分別為13件、8件和7件。參見蘇青:《網絡爬蟲的演變及其合法性限定》,《比較法研究》2021年第3期。
(19)《刑法》第285條規定了非法侵入計算機信息系統罪,非法獲取計算機信息系統數據與非法控制計算機信息系統罪,提供侵入、非法控制計算機信息系統程序、工具罪。
(20)參見《浙江省公共數據條例》第1條。
(21)參見REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on Harmonised Rules on Fair Access to and Use of Data(Data Act),{SEC(2022)81 final}-{SWD(2022)34 final}-{SWD(2022)35 final},Brussels,23.2.2022,COM(2022)68 final,2022/0047(COD).
(22)例如,美國專利商標局(USPTO)也可能為聲稱從數據池獲得新創新的專利申請者提供快速途徑,從而激勵平臺公司參與數據池。