鄭宗金
(海南大學法學院,海南 海口570228)
有著“大數據時代預言家”之譽的著名學者維克托·邁爾-舍恩伯格指出:人類社會正在進行著一場生活、工作與思維的大變革[1]。在不久的將來,大數據將會滲透到人類生產生活的方方面面。目前我國有關大數據的立法仍處于空白狀態,立法者尚未對大數據的法律屬性做出界定。隨著大數據技術的迅速發展和廣泛應用,如何準確界定大數據的法律屬性,并為之配套相應的法律制度,已是立法者所面臨的一個不可回避的問題。
早在20 世紀80 年代,美國著名學者阿爾文·托勒夫就在其著作中提及了“大數據”一詞[2]。2011年6 月,美國麥肯錫管理咨詢公司在其報告中首先正式提出了大數據的概念:“大數據指的是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。”[3]而高德納咨詢公司認為:“大數據是需要新的處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。”[4]上述兩個公司分別通過從不同角度對大數據進行定義,均具有一定合理性,被越來越多業內人士和學者所認同。
不管對大數據如何定義,都不難發現,大數據與傳統的數據之間存在著明顯的區別。首先,大數據的數據量是隨著計算機技術的發展而不斷增長的,如今的數據量已上升到了PB(拍字節)量級[5],這一規模已經遠遠超出了傳統數據的規模;其次,大數據中包含結構化、半結構化、非結構化以及復雜結構等多種類型的數據,而傳統數據庫中的數據主要是結構化數據,常常只是單一的數據類型;最后,對大數據而言,在數據出現之前是不能確定數據模式的,其模式也會隨著數據規模大小而變化。而傳統數據庫先有產生模式,才會產生數據,且產生模式是固定的[6]。
大數據區別于傳統數據,其有著顯著的特征。目前公認的的大數據特征包括四個,即所謂的4V特征。但不同研究機構之間對4V 所代表含義的理解有所不同。國際數據公司認為大數據的4V 特征分別是指:數據規模大、數據種類多、處理速度快以及價值密度低。這能較全面地反映大數據的特性,具有代表性。具體而言:(1)數據規模大。這是大數據的基本屬性。大數據的數據量由傳統TB 級(太字節)迅速增長為PB 級(拍字節),并將向ZB 級(澤字節)發展,規模龐大。(2)數據種類多。與傳統數據所不同的是,大數據呈現出的類型是多元化的。其中不僅有結構化數據模型,還包括半結構化數據模型、結構不規則或不完整的非結構化數據模型,以及其他一些復雜結構數據模型,甚至是各種數據模型的組合。(3)處理速度快。大數據的傳輸方式包括批處理傳輸、實時傳輸、近似實時傳輸和流傳輸等,其處理數據的速度極快。在具有時延的情況下,數據依舊需要以較高的速率被分析、處理、存儲和管理,并遵循一秒定律。(4)價值密度低。大數據當中包含著海量數據,其中有用信息量的增長比例與數據量的增長比例不成正比。數據量越大,所包含的無效數據則越多,而獲取有用信息的難度也更大,需要更為先進的算法在海量數據中有效地提取具有價值的信息,因而其價值密度較低。
在建立大數據權利法律制度過程中,準確地界定大數據的法律屬性是一項基礎而又關鍵的任務。此前,我國立法者對大數據權利屬性的關注并非沒有。在制定《民法總則》過程中,立法者就對此進行了一定的立法思考,如二審稿曾經試圖將數據資產納入到新型知識產權客體中,但是最終鑒于該問題的復雜性,且學者間分歧較大,沒有形成立法定論[7]。最后,《民法總則》第一百二十七條簡單地做出了立法授權規定,沒有進一步對大數據進行定性。此外,有學者認為,大數據并非財產,不能成為民法意義上的客體[8]。筆者對此觀點持否定態度。大數據具備民事權利客體的各項特征,大數據權利當然屬于財產權。
在界定大數據是否為財產權客體之前,應先探討其作為一種客觀存在是否成為民法上的客體,如具備民事客體性,才有對其進行下一步探討的必要和可能。
民事客體性要求對象必須是確定的,并且是獨立的。首先,大數據是二進制代碼的特定組合形式,其并非思想,也并非虛構物,而是客觀存在的。大數據雖不具實體性,它必須依賴于一定的載體而存在,但不可就此否定它的確定性。大數據載體所承載的數據的內容與數量都是可以為人類所進行控制和管理的。盡管大數據可以復制、刪除、上傳和發送,但這僅僅是加大了對大數據保護和控制的難度,并不會妨礙權利主體對其行使相應的權利。因此,大數據具備了民事客體所要求的確定性。其次,大數據是獨立的。一方面,大數據獨立于權利主體而存在。大數據以代碼的形式存在于載體當中,其本身就與權利主體相分離。不可否認的是,可能部分大數據包含人類身體的某些信息,如某一器官的具體參數等,但這些數據已經作為信息,脫離了人類而獨立存在。另一方面,大數據獨立于其他民事客體。大數據自身具有無體性,其存在和運用都需要借助一定的工具。但值得注意的是,我們不可將大數據和輔助工具混為一談。輔助工具的作用僅僅在于幫助大數據展現出其內容,但其不是大數據的組成部分,二者是可以相互分離的。大數據的價值在于其內容,而并非大數據自身的表現形式。大數據的內容可自為一體,通過一定的程序處理呈現出來,為人們所獲取,其本身是具有獨立性的。因此,大數據既是確定的,又是獨立的,符合民事客體性的要求。
大數據欲成為財產權客體,還需具備財產性這一特征。筆者認為,大數據符合民事客體財產性所要求的各項條件,其具備財產性。首先,大數據具有經濟價值。如果說某項客體具有經濟價值,其必須具有價值或使用價值,能夠滿足主體的需求。在運用大數據技術過程中,通過對大數據進行一系列的開發、檢索和分析等,能夠獲得大數據背后的海量信息,這些信息是具有價值和使用價值的,可以運用到相應的領域當中,能滿足人們的需求。因而大數據是一種具有經濟價值的信息資源。在“信息為王”的商業環境下,能存儲和反映大量信息的大數據更是現代企業的制勝法寶。從這一層面而言,大數據的經濟價值無疑是巨大的。實踐中,權利主體可以通過出售大數據來獲利,也可以通過對大數據進行各種程度的開發來獲取具有經濟價值的信息。比如,專門設計旅游路線的軟件開發商可以通過客戶端收集大量客戶所搜索和瀏覽的內容,匯集成海量的數據,再根據一定的算法進行整理和分析,從而得出符合大部分游客所鐘情的旅游路線,最終可自行推出各大熱門旅游路線以投放市場,或將這些信息出售給各個旅行團以獲利等。可見,權利主體可以通過對大數據進行開發或轉讓,享有大數據權利的各項權能,憑借這些權能獲取經濟利益,這正體現了大數據的財產性。其次,大數據可以進行轉移。大數據的轉移通常是通過交易完成的。2015 年國務院印發了《促進大數據發展行動綱要》的通知,明確了發展大數據、促進大數據交易的要求等。
物權的客體主要是物。民法上的物,是指能夠滿足民事主體的需要并且能夠為民事主體所支配的物體或自然力。所謂的物體,是指占據一定空間、具備一定形體、能夠被人眼看到的物質實體[9]。大數據依賴載體而存在,不占據任何物理空間,也不具備具體形體,亦不能為人們肉眼所見,其并非客觀存在的物質實體。與此同時,基于大數據的非物質化形態,對大數據的支配在客觀上不具有排他性,此與物之支配的排他性相異。且在占有方面,大數據可被多個主體同時占有,這與一般物質實體在客觀上的物理壟斷性也存在差異。因此,大數據與物權法上的物體存在著明顯差異,現有的關于物體的物權制度無法適用于大數據。與此同時,大數據也不是物權法意義上的無形物。無形物主要指人類無法直接觀察、感知其具體存在狀態的物,主要包括熱、電、光等無形物。大數據雖然與熱、電、光等一樣在物理意義上具有無形性,但是從多個方面比較而言,二者都具有本質區別。首先,大數據的本質是二進制代碼的組合,其包含特定信息,具有內容性;光、電、熱是物質,其本質是自然界中能量產生、耗散、傳輸的過程。其次,大數據具有可復制性,可以重復利用,不會消損;光、電、熱則不可復制,使用過程就是消耗的過程。最后,人們對大數據的控制方式多種多樣,可以通過各種端口復制、刪除、修改數據內容;而無形物不具有內容性,人們對光、電、熱等無體物的控制方式則非常有限,只能增加或減少光、電、熱的數量或強度。綜上所述,大數據與光、電、熱等無形物存在著諸多方面的差異,不能直接將其等同于物權法意義上的無形物。
知識產權是一種無形財產權,與物權和債權一同構成了傳統財產權體系。筆者認為,雖然可能大數據部分權利與知識產權相類似或交叉,但大數據權利與知識產權之間仍存在著巨大的差異,大數據并非知識產權的客體。大數據以二進制代碼組合形式存在于載體中,在物理意義上具有無體性,其確實具有類似于知識產權客體的特征。但是知識產權制度保護的是人類的智力勞動成果,保護的對象必須與人類智力活動有關。但是大數據僅僅只是各類信息的集合,并非產生于人類精神領域,與人類智力活動并不直接相關。因此大數據不能成為人類智力勞動成果,也無法成為知識產權制度的保護對象。除此之外,大數據可能不具獨創性。不少學者認為大數據權利歸屬于著作權,可以適用著作權法來調整。但是著作權所保護的對象,必須具備獨創性。獨創性不是依既定程序、程式、手法推理、運算而來[10],強調選擇和編排的獨創性。實踐中,即使部分大數據經過編排,但很有可能只是遵循一定的程式進行機械式的編排,并非均具有獨創性,不符合著作權制度當中所規定的條件。因而大數據權利并非著作權或其他知識產權,不能直接采用知識產權法對其進行調整。另外,還有學者指出,如果貿然將大數據納入知識產權的保護范圍,會極大地降低了知識產權的保護門檻和標準,今后一些不具創造性的新生事物也要求獲得知識產權的保護,這將帶來一些列不良后果,會對知識產權制度產生根本性沖擊[11]。筆者對此觀點持肯定態度,將大數據權利定性為知識產權,勢必會對知識產權制度的發展帶來不利影響。
信息財產是指固定于一定載體之上能夠滿足人們生產和生活需要的信息。廣義的信息財產,應該包括紙面信息、電子信息兩大類,狹義的信息財產僅指電子信息[12]。本文所講的信息財產是指狹義的信息財產。信息財產所對應的權利是信息財產權,這是一種以獨立存在的、具有一定財產價值的、可交換的信息(數據)為客體的新型財產權[13]。在立法層面上,最早關注到信息財產的國家是俄羅斯。俄羅斯1995年通過的《信息、信息化與信息保護法》第六條中規定了信息資源是財產,法律關系歸民法所調整。俄羅斯法律當中的信息財產指的是廣義的信息財產。美國1999 年通過的《統一計算機信息交易法》確立了計算機信息的法律概念,對電子信息予以特別關注。盡管俄羅斯法律和美國法律在信息財產概念的定義和所采用的保護模式上有所區別,但客觀上都促進了信息財產立法的發展,同時也提升了各國對信息財產的重視程度。同時,學術界有關信息財產和信息財產權的理論研究也開始進一步加深。
數據與信息原本是兩個不同的概念。在現代技術背景之下,大數據與其所承載的信息是緊密聯系、不可分割的一個整體。基于數字化技術特點,大數據既是信息媒介,又可以與信息直接對應,從而帶有信息本體性的特點。“信息是數據的內容,數據是信息的形式,在大數據時代,無法將數據與信息加以分離而抽象地討論數據上的權利。”[14]因此而言,大數據與信息并非異質,大數據可成為信息財產。
信息財產作為一類新的財產權客體,其具有確定性、獨立性、可控制性、價值性和稀缺性五大法律特征。大數據具備上述信息財產的法律特征,可構成信息財產。第一,大數據具備確定性,其符合可以進行確定和反復調取使用的要求。大數據以二進制代碼的形式存在于載體中,并且可以通過具體的設備進行訪問和再現。權利主體可以通過一定的技術手段對大數據進行多次使用,也可以反復調取。大數據不會因時間的經過而損耗和消亡,故而其具有確定性。第二,大數據具備獨立性。毫無疑問,大數據可以獨立于權利主體而存在。同時,其雖憑借輔助工具才能發揮作用,但其本身能夠獨為一體,反映出具有價值的信息內容,能獨立地滿足人們的需求,因而其具有獨立性。第三,大數據具備可控制性。大數據以代碼的形式存在于一定的載體之上,并且能夠形成穩定的存在。人們可以對其進行控制、管理和運用,因此大數據具有可控制性。第四,大數據具備價值性。大數據包含海量的信息,人們通過對大數據進行檢索、組合、分析等,能夠獲得具有價值和使用價值的信息內容。這些信息可以應用到相應的領域當中,滿足人類生產或生活的需求,所以大數據具有價值性。第五,大數據具備稀缺性。一方面,大數據包含巨大的數據總量,收集和分析過程是復雜的,人們并不能輕易或自由地獲取大數據背后的信息;另一方面,與一般的公開信息不同,只有大數據權利主體才能獲取大數據。他人要想獲得大數據,則需要請求權利主體對大數據進行轉移。但大數據的供應也并非無限的,相對于需求而言,此種信息資源是有限的。因此大數據具有稀缺性。
大數據背后是海量的信息,其與信息不可分割而談。大數據完全具備了財產信息的基本法律特征,大數據是信息財產。大數據權利是區別于民法當中傳統財產權的一種新型財產權——信息財產權。在大數據時代,合理且適時地擴張財產權的外延,積極引進新的財產權類型,構建新的財產權體系,既可以滿足現代科學的發展需要,又可以充分保持民法的先進性。●