郭振華+劉君婕+劉佳欣+游美玲+韓喬亞+陳昱晗
摘要:隨著互聯網技術的不斷發展,大數據已經成為互聯網產業中新的價值金礦,互聯網企業在挖掘大數據產業價值的同時也對大數據的司法保護提出了迫切的需求,尤其是知識產權對大數據的保護。大數據案件的增多,也給司法審判帶來了新的挑戰。中關村法庭課題調研組在走訪多家企業,并與行業專家座談后,撰寫了這份調研報告。該報告從大數據知識產權保護概述、大數據司法保護實踐現狀、現有知識產權法律框架下對大數據的保護、大數據類知識產權案件疑難問題分析、大數據司法保護的價值判斷五個方面介紹了調研成果內容。
一、大數據知識產權司法保護概述
1、引言
隨著智能信息技術的不斷發展,數據已經成為一種新的商業資本和一項重要的經濟投入,可以為人類創造出新的經濟利益和商業價值。大數據(big data)作為無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,需要通過新處理模式才能成為具有更強決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產2,因而催生著人類歷史上的又一次信息革命,人類的生活方式、價值體系與社會模式也因此發生了重大的改變。2011年,美國麥肯錫公司發布的報告中顯示,各國政府已經逐漸將大數據的發展上升到了國家戰略的層面,包括美國政府的“大數據研究發展創新計劃”(Big Data R&D Initiative)、歐盟“歐盟數字化議程和挑戰”(The Digital Agenda for Europe and Challenges for 2012)、日本發布的“活躍ICT日本”綜合戰略以及澳大利亞和韓國發布的“公共服務大數據戰略”等各種大數據國家戰略,都標志著大數據的研發及產業應用已經引起了各國政府的重視,全球的“大數據”時代已經到來。全球領先的咨詢分析機構Wikibon于2014年2月發布的《大數據企業營收和市場預測(2013-2017)》報告顯示,2013年全球大數據企業(軟件、硬件及服務)營業收入為186億美元,同比增長58%;2014年全球大數據市場增長速度達到53%,總體規模為285億美元;到2017年,全球大數據市場收入將達到500億美元,這意味著從2011年起連續6年年復合增長率達38%。中國市場情報中心有關統計顯示,2012年中國大數據市場規模為4.5億元,同比增長40.6%。到2018年,中國大數據市場規模將達到46.3億元。
2015年9月,我國國務院印發《促進大數據發展行動綱要》,力圖全面推進大數據的發展和應用,將我國建設成為數據強國。2017年1月17日,工業和信息化部發布《大數據產業發展規劃(2016-2020年)》,該規劃以強化大數據產業創新發展能力為核心,明確了強化大數據技術產品研發、深化工業大數據創新應用、促進行業大數據應用發展、加快大數據產業主體培育、推進大數據標準體系建設、完善大數據產業支撐體系、提升大數據安全保障能力等7項任務,明確了“十三五”時期大數據產業的發展思路、原則和目標,將引導我國大數據產業持續健康發展3。
大數據系統和大數據產業給人類生活帶來了諸多的益處,但隨著智能信息技術的不斷深入和創新,數據也呈現出體量日益龐大、類型愈加復雜的趨勢。知識產權領域呈現資源急速增長且數據量龐大的特點,在此種情境下,為保障數據產業的發展,保護大數據集合表現形式及其實質內容的價值,究竟該如何基于法律自身的價值追求扮演社會規范的角色,運用知識產權相關法律制度來為大數據提供恰當的司法保護,實現大數據與知識產權法律制度的平衡,探究出新的數據知識產權保護模式,是一個值得探討的問題。
2、大數據與知識產權法律制度的交叉
數據本身的可復制傳播性和可重復利用性等特點,致使其客觀上與知識產權有著千絲萬縷的聯系。在知識產權法域內而言,其應當是具有財產價值的排他性權利而產生的法律關系。雖然有些大數據產業中的原始數據是否屬于知識產權法律制度中保護的客體有待厘清,但是如經過相關主體利用技術開發或智力創造加工后轉化成為一種新的分析數據或者匯編集合,賦予其一定的獨創性,則應當被視為可以受到法律保護的知識產品。具體而言,與大數據相關的主要知識產權應當包括數據信息的著作權、相關商業模式及操控分析數據的專利權、經由數據轉化成為數據產品的商標權以及含有技術信息或經營信息中的商業秘密等。因此,我國知識產權法律體系中的《著作權法》、《專利法》和《反不正當競爭法》均可在一定程度上為大數據信息和大數據產業提供相關的法律保護。在適應新技術革命的基礎之上,充分發揮司法保護知識產權的主導作用,從而真正地做到協調與平衡技術創新激勵與個人權利的保護之間的關系。
3、知識產權制度對大數據信息和產業的司法保護概況
鑒于大數據集合的復制成本低廉的特征,圍繞著大數據的產生和取得方式以及運用和維護的過程,現行知識產權司法保護制度充分發揮著其明確創新權屬、協調大數據創新成果各主體利益分配機制的作用。
就數據本身而言,因其難以滿足《著作權法》中關于“具有獨創性并能以某種有形形式復制的智力成果”的規定,而難以通過《著作權法》進行保護。但“數據”的集合往往在其選擇或者編排中具有獨創性,由此可以通過《著作權法》中的“匯編作品”予以保護。世界貿易組織、世界知識產權組織、《伯爾尼公約》以及《TRIPs協議》都已經明確規定可以將數據信息作為匯編作品予以保護,我國《著作權法》也做出了類似規定。對于大數據信息而言,不為公眾所知悉且能為經營者獲得利益或者競爭優勢、具有潛在商業利益的信息可以歸入屬于該公司的技術信息或經營信息,從而作為商業秘密4通過《反不正當競爭法》予以保護。我國《反不正當競爭法》第二章第十條明確規定了三種不得采用的手段侵犯商業秘密的行為。由于我國對不正當競爭行為的界定采用舉例加概括的形式,因此有些難以成為商業秘密的數據信息還可以《通過反不正當競爭法》中的一般性條例進行保護。
大數據產業和技術的意義和價值不僅僅在于掌握龐大的數據信息本身,更體現在對具有意義的數據進行專業化的處理,從而實現數據的賦值、增值和價值顯現。大數據通過挖掘、整理、計算等方式進行加工之后形成的特定算法或是計算機軟件工具,以及通過軟硬件與網絡結合的系統解決一定的技術問題,此類具備鮮明技術屬性的數據處理方式可以通過申請方法專利的方式進行保護5。endprint
4、知識產權司法保護對大數據的促進意義
雖然我國現行的知識產權制度實行的是“雙軌制”保護模式,即權利人可以通過知識產權行政主管機關主張權益保護,同時也可以通過法院訴訟的方式來維護自身合法權益,但由于知識產權保護的客體作為一種私權以及司法制度本身的制度優勢,決定了司法保護知識產權是維護相關權益最重要的方式。
隨著互聯網、物聯網等現代網絡技術的發展,大數據作為能夠廣泛帶動各行業向信息化、智能化、網絡化發展的力量,已然成了企業乃至國家的核心競爭力。將符合知識產權特征的數據納入知識產權體系,建立相關完善的知識產權數據保護模式,運用知識產權司法保護為大數據產業的發展保駕護航,保障數據產業的發展,能夠形成一個良性的產業生態圈,促進社會經濟的發展。
二、大數據司法實踐中的現狀
我國司法實踐中有關大數據的案例,按照案由來分類,主要有以下幾種類型:
1、民事案件
(1)隱私權糾紛
①原告王刃與被告北京奇虎科技有限公司隱私權糾紛案。6本案中,原告的手機號被被告的360手機衛士安卓版標記為“維特網絡信息有限公司(合肥分公)”,因此被人懷疑為騙子。法院經審理認為,被告出示的證據可以證明原告所使用的號碼已經在企業黃頁被公開披露,原告在工商行政管理機關登記企業信息時亦將該手機號碼予以登記,以備信息查閱,被告通過大數據比對功能,確定該手機號碼與浙江維特網絡信息有限公司合肥分公司相對應并進行標記,其信息并無錯誤,且軟件標記的是企業信息,而非公民個人信息,庭審過程中也顯示原告手機號在被告所有的軟件上已再無此標記,據此,法院最終認定被告不構成侵權。
②原告朱燁訴被告北京百度網訊科技有限公司隱私權糾紛案。7原告認為被告利用網絡技術,未經原告的知情和選擇,記錄和跟蹤了原告所搜索的關鍵詞,將原告的興趣愛好、生活學習工作特點等顯露在相關網站上,并利用記錄的關鍵詞,對原告瀏覽的網頁進行廣告投放,侵害了原告的隱私權。一審法院經審理認為,被告未經原告同意通過cookie技術收集和利用原告搜索信息,并根據原告的上網信息在被告合作網站上展示與原告上網信息有一定關聯的推廣內容,進一步利用了他人隱私進行商業活動,且該利用并非cookie技術使用的必然結果,已經構成侵犯他人的隱私權。二審法院經審理認為,網絡用戶通過使用搜索引擎形成的檢索關鍵詞記錄,雖然反映了網絡用戶的網絡活動軌跡及上網偏好,具有隱私屬性,但這種網絡活動軌跡及上網偏好一旦與網絡用戶身份相分離,便無法確定具體的信息歸屬主體,不再屬于個人信息范疇;被告利用網絡技術通過百度聯盟合作網站提供個性化推薦服務,其檢索關鍵詞海量數據庫以及大數據算法均在計算機系統內部操作,并未直接將被告因提供搜索引擎服務而產生的海量數據庫和cookie信息向第三方或公眾展示,沒有任何的公開行為,不構成侵權。
(2)名譽權糾紛
原告浙江攜銀在線網絡科技有限公司訴被告大公信用數據有限公司、大公國際資信評估有限公司名譽權糾紛案。8本案中,被告根據其收集整理的P2P網絡借貸企業信用數據在大公資信上發布有關原告攜銀網的相關不利信息,原告認為構成侵權。法院經審理認為,根據被告大公數據對原告平臺的持續跟蹤監測,發布的報告涉及的事實基本屬實,不構成侵權。
2、知產案件
(1)著作權糾紛
①原告中經網數據有限公司訴被告中華網國際網絡傳訊有限公司侵犯著作權糾紛。法院經審理認為,只要圖表所表達的內容能體現制表人員獨立的判斷,則該圖表就具有獨創性。本案中,正是因為原告帶有主觀性的差值填補、季節調整,才使圖表中某些“點&”的位置的安排體現了與其他公司所制作的圖表的區別。橫縱坐標軸刻度的選擇,雖然受制于此類圖表的特點,無論何人繪制,曲線走勢圖的大體走向可能會相似,但是因為坐標軸刻度選擇上的主觀性,使整個圖表的形態會因繪制者不同的判斷而呈現出區別。顏色背景的選擇,雖與數據無關,但卻亦屬于繪圖者針對其所繪制圖表的美感所做的選擇。因而本案所爭議的曲線走勢圖圖表具有獨創性。故而被告在其網頁上使用了原告網頁上的“中經宏觀經濟預警信號&”圖表10幅,“中經景氣動向&”、“中經先行合成指數&”等曲線走勢圖68幅的行為,構成著作權侵權。
②原告上海漢濤信息咨詢有限公司訴被告北京搜狐互聯網信息服務有限公司侵犯著作權糾紛案。9法院經審理認為,原告大眾點評網以及《北京餐館指南》、《上海餐館指南》二書所載涉案11家餐館商戶簡介中的引號內文字,系由原告選摘自網友上傳于大眾點評網的關于各地餐館的評論,引號內文字均系簡單的日常用語,并非具有獨創性的文字表達而不能成為《著作權法》所保護之作品,因而原告將該些文字融入到對餐館的簡介中不需要獲得用戶的許可。原告對涉案餐館所做的商戶簡介具有獨創性,可以成為《著作權法》所保護的作品,原告對涉案11家餐館的商戶簡介享有著作權。
③原告濟南白兔信息有限公司訴被告佛山鼎容軟件科技有限公司著作權糾紛案。10法院經審理認為,原告對國家商標局商標公告中的商標信息內容進行了提取、分類和整理,并對商標標志中所含的文字、數字等進行了進一步提取和整理,同時還對商標信息后續的變更情況進行匯總,加入了自定義的字段信息等。原告對商標數據的編排和整理體現出獨創性,涉案數據庫構成匯編作品,原告對此享有著作權,可受《著作權法》保護。由于被告數據庫中存在多個含有原告暗記的商標標志,在被告不能證明前述數據來源于其他地方的情況下,可以認定被告實施了復制原告數據庫多個商標的數據的行為。
(2)不正當競爭糾紛
①原告北京陽光數據公司與被告上海霸才數據信息有限公司技術合同、不正當競爭糾紛一案。11法院經審理認為,《SIC實時金融》信息作為一種新型的電子信息產品,應屬電子數據庫,在本質上是特定金融數據的匯編,這種匯編在數據的編排和選擇上并無《著作權法》所要求的獨創性,不構成《著作權法》意義上的作品,不受《著作權法》的保護。但原告作為特定金融數據的匯編者,對數據的收集、編排,即對《SIC實時金融》信息電子數據庫的開發制作付出了投資,承擔了投資風險。該電子數據庫的經濟價值在于數據信息的即時性,原告正是通過向公眾實時傳輸該電子數據庫的全部或部分內容而獲取收益,原告對于該電子數據庫的投資及由此而產生的正當利益,應當受到法律保護。被告未經原告許可,其行為違反了經營者在市場交易中應當遵循的誠實信用原則和公認的商業道德,損害了原告的合法權益,已構成不正當競爭。endprint
②原告上海漢濤公司訴被告北京愛幫公司不正當競爭案。12法院經審理認為,大眾點評網的商戶簡介和用戶點評,是原告搜集、整理和運用商業方法吸引用戶注冊而來。原告為此付出了人力、財力、物力和時間等經營成本,由此產生的利益應受法律保護。對于大眾點評網的商戶簡介和用戶點評,雖然被告愛幫網注有“在大眾點評發表”字樣和鏈接標識,但愛幫網已對全部商戶簡介內容和絕大部分點評內容進行了充分展示,網絡用戶一般不會再選擇點擊大眾點評鏈接標識。因此,愛幫網的商戶簡介和用戶點評已經構成對大眾點評網相應內容的實質性替代,必將不合理地損害漢濤公司的商業利益。被告的這一經營模式違反公平原則和誠實信用原則,違反公認的商業道德,構成不正當競爭。
③原告北京集奧聚合科技有限公司訴被告劉國清、北京青稞厚成科技有限公司不正當競爭糾紛案。13法院經審理認為,大數據系互聯網技術高速發展的產物,表現為通過網絡技術無差異地收集網絡用戶上網信息,根據需要對數據進行整理、挖掘和分析,形成一定的數據庫,用于投放廣告或者其他用途。原告與青稞公司均從事大數據服務,向客戶提供精準廣告服務,二者間具有競爭關系,劉國清將其技術資歷作為公司的業績向投資人進行廣告宣傳,故劉國清的行為顯然違背了其對原告應負的競業禁止義務,損害了原告的權益。青稞公司在知曉劉國清的競業禁止義務情況下,接受劉國清出資并聘任其擔任公司的首席技術官,從事與原告相同業務,該行為違反了公認的商業道德及誠實信用原則,損害了原告的合法權益,應承擔賠償責任。
④原告北京微夢創科網絡技術有限公司與被告北京淘友天下技術有限公司等不正當競爭糾紛案。14法院經審理認為,淘友技術公司、淘友科技公司并沒有基于《開發者協議》,在取得用戶同意的情況下讀取非脈脈用戶的新浪微博信息,其獲取前述信息的行為沒有充分尊重《開發者協議》的內容,未能尊重用戶的知情權及自由選擇權,一定程度上破壞了OpenAPI合作開發模式,違背了在OpenAPI開發合作模式中,第三方通過OpenAPI獲取用戶信息時應堅持的“用戶授權+平臺授權+用戶授權”的三重授權原則,違反了誠實信用原則和互聯網中的商業道德;同時淘友技術公司、淘友科技公司未經新浪微博用戶的同意及新浪微博的授權,獲取、使用脈脈用戶手機通訊錄中非脈脈用戶聯系人與新浪微博用戶對應關系的行為,違反了誠實信用原則及公認的商業道德,破壞了OpenAPI的運行規則,構成不正當競爭行為。
⑤原告上海鋼聯電子商務股份有限公司與被告上海縱橫今日鋼鐵電子商務有限公司不正當競爭糾紛案。15法院經審理認為,原告通過組建資訊團隊形成的鋼鐵行業內完整的鋼材、特鋼、爐料等各項數據庫的數據信息系原告付出大量勞動所獲得,該數據信息能夠為原告帶來利益,體現了原告的競爭優勢,故原告對其數據信息享有合法權益。兩被告關于原告的數據信息是市場公開的信息、不具有獨創性的抗辯意見,缺乏事實和法律依據,不予采信。
⑥原告衢州萬聯網絡技術有限公司訴被告周慧民等侵害商業秘密糾紛案。16法院經審理認為,原告主張保護的“BOX網絡游戲社區”網站數據庫中的用戶信息,能為原告帶來經濟利益且具有實用性,且該50多萬個注冊用戶名、注冊密碼和注冊時間等信息不易為相關領域人員普遍知悉和容易獲得,且原告對上述信息采取了保密措施,故上述信息符合商業秘密的構成要件,是原告擁有的商業秘密,依法應受法律保護。
(3)技術服務合同糾紛
原告上證所信息網絡有限公司與被告新華富時指數有限公司合同糾紛案。17法院經審理認為,被告未經原告許可與新加坡交易所共同開發上市了“中國A50指數期貨”,在此過程中被告雖未將上海證券交易所實時股票行情直接提供給他人使用,但“中國A50指數期貨”的基礎即是上海證券交易所編制的中國A50指數,其成份股包含了在上海證券交易所上市的38種股票,被告根據這些實時股票行情和深圳證券交易所的12種實時股票行情編制了動態的、即時的中國A50指數,故被告開發、上市“中國A50指數期貨”的行為,實質就是利用原告按約提供的上證所實時股票行情開發了衍生產品,該種行為顯屬違反合同約定。
表一:涉大數據案件的類型分布圖18
上述案件涉及到民事和知識產權領域,我們之所以將民事案件納入到案例中,是因為這類案件對我們研究大數據企業的商業模式有重要作用,有助于理清行業中存在的一些問題。大數據目前仍屬于一種新興事物,IBM對大數據給出了“4V特征”的定義即:大數據量(Volume)、快速變化(Velocity)、內容龐雜(Variety)和(不)精確性(Veracity)。也正因為大數據擁有的這些屬性,導致大數據作為一種新興事物目前在我國法律中找不到對應的權利類型。大數據從其產生、收集到整合、利用,各個階段都有可能產生法律糾紛。目前司法實踐中涉及到大數據的案例除卻隱私權、名譽權等民事案件外,知產領域主要涉及著作權、不正當競爭、技術服務合同糾紛。
三、現有知識產權法律框架下對大數據的保護
大數據的基本處理流程包括采集、存儲、分析和結果呈現等環節。采集到的數據因存在語義模糊、數據缺失等問題而無法直接使用,所以采集環節還應包括數據的預處理。19數據存儲的同時亦進行著數據管理,經分析和處理所得數據成果需通過應用而發揮其最終價值。因此,可以將數據的處理流程大概劃分為數據采集與預處理、數據存儲和管理、數據處理與分析、數據成果呈現與應用四個階段。20在當下現實語境下談及的大數據并非僅是數據本身,而是指數據和大數據技術的綜合。
在現有知識產權法律法規框架內,可以通過《著作權法》、《專利法》以及《反不正當競爭法》對大數據及其成果進行保護。根據數據處理流程和階段的不同,對數據以及數據成果的保護路徑又各有所偏重。
1、數據采集與預處理階段的保護
該階段涉及數據的取得、匯總以及初步的篩選工作,該階段中采集到的數據內容大多可以通過《著作權法》予以保護,但是其中包含的一些來源于客觀的信息或是用戶的網絡留痕數據不符合《著作權法》所要求的獨創性要件,因此難以通過《著作權法》進行保護。endprint
該階段數據中的以文字、圖片和視頻等形態呈現的內容可以通過《著作權法》予以保護。司法實踐中較為常見的數據內容有以下三類:第一類,軟硬件服務商自行收集、整理后上傳至自有平臺的數據,比如某門戶網站房產頻道中關于某樓盤的介紹性文字和圖片;21第二類,網絡媒體自行或委托創作以及經授權可以使用的資訊類內容,比如新聞資訊類網站中資訊新聞;第三類,網絡用戶自行制作和提供的內容,比如社交平臺中用戶發布的文字、圖片以及視頻,電商網站中的用戶評價、旅游網站中旅友的游記等。22作品受著作權保護的前提條件是具有一定的獨創性且能夠構成《著作權法》意義上的作品。這三類數據內容在具有一定的獨創性且能夠構成《著作權法》意義上的作品的情況下,即可以通過《著作權》法予以保護。
在司法實踐中,第二類的資訊類內容通過《著作權法》進行保護的難度不大,但是第一類和第三類數據類型想要通過《著作權法》進行保護,不僅要滿足構成作品的前提條件,還需要確認其權利歸屬情況。尤其是在第三種數據類型中,數據內容的產生基于用戶自行制作和提供,在數據賦權仍未在法律層面進行確認的情況下,平臺商對該部分數據享有何種權利或者權益,平臺商以何種身份維權,仍是司法實務中的一個難點問題。從另一方面而言,采集數據同樣不能侵犯他人的權利,不僅包括不侵犯他人的著作權,同樣包括不侵犯他人的商業秘密以及不違反網絡爬蟲類“君子協定”。其中商業秘密以及“君子協定”所涉及的誠實信用原則以及商業道德原則將在下文加以詳細闡述。
2、數據存儲和管理階段的保護
對于收集來的海量的結構化和非結構化數據,收集者需要運用手段和技術對其進行存儲和管理,在該階段中多涉及數據的集合和匯總,比如數據庫、數據倉庫、云數據庫等。23該部分內容也可以通過《著作權法》予以保護。
《伯爾尼公約》明確將數據信息作為匯編作品予以保護,《與貿易有關的知識產權協議》第10條第2款規定:“數據或者其他材料的匯編,無論采用機器可讀形式還是其他形式,只要其內容的選擇或安排構成智力創作,就應該給予保護。”我國《著作權法》第十四條規定:“匯編若干作品、作品的片段或者不構成作品的數據或者其他材料,對其內容的選擇或編排體現獨創性的作品,為匯編作品,其著作權由匯編人享有,但行使著作權時,不得侵犯原作品的著作權。”在數據的存儲和管理階段中形成的數據庫,如果在內容的選擇或者編排上體現出了一定的獨創性,即可以將該數據庫作為匯編作品通過《著作權法》予以保護。前述濟南白兔信息有限公司訴佛山鼎容軟件科技有限公司著作權糾紛案,法院即認定了原告對商標數據的編排構成匯編作品。
大數據要在《著作權法》上獲得保護,首先需要滿足獨創性的要求,但現實中多數數據來源于客觀事實,數據的收集也多來自公開領域,基于某些用戶的使用習慣或是行業慣例,故而收集到的數據信息可能無法給予數據采集者太多的個人創作空間,而對于那些缺乏獨創性的數據集合則無法通過著作權給予保護。由此,如何界定某一數據集合是否具有一定的獨創性,也成為通過著作權對其進行保護的一個難點。需要著重指出的是,著作權保護的是數據的選擇或編排方法,而非數據選擇或編排的內容,對于大數據而言,他人可輕易改變編排方法,但實質性內容可能仍然一致,該種情況下對于大數據本身的保護也是一個難題。
3、數據處理與分析階段的保護
對龐大數據集合進行處理和分析能夠得到具有應用價值的數據或者數據產品。在此階段數據的價值得到了巨大程度的提升,具有商業價值的數據可以通過商業秘密予以保護,為分析處理數據所使用的方法可以通過方法專利予以保護。
通過數據處理和分析獲得的數據成果一般都具有相當的經濟價值,由此該類數據成果的實用性要件不難滿足,在司法實踐中該類數據成果的秘密性和保密性才是論證其構成商業秘密的難點。前述北京陽光數據公司與上海霸才數據信息有限公司技術合同、不正當競爭糾紛案中,法院認定原告陽光公司的《SIC實時金融》數據分析格式符合商業秘密的構成要件。本案中涉及了兩種常見的與數據資產相關的商業模式——租售數據模式與租售信息模式。租售數據模式是指售賣或者出租廣泛收集、精心過濾、時效性強的數據。24。而信息與數據不同,是指經過加工處理,承載一定行業特征數據集合。25
上述案例中,陽光公司的上游權利人——向其有償出售行情數據的商品交易所和證券公司采用的就是租售數據的模式。該種模式中,經營者通常掌握大量的客戶數據,而這類數據最為顯著的特征是實時性,經營者在租售數據前通常已經完成對數據的預處理。租售數據模式的另一種形式表現為掌握數據的公司利用數據為客戶提供增值服務,如銷售導航儀的公司,同時為客戶提供即時交通信息服務。26租售數據的商業模式同時催生出專業的數據交易平臺,如貴陽大數據交易所等。由于經營者尚未對這些數據進行分析處理,權利人也通常不會對其采取保密措施,所以此時的數據無法通過商業秘密予以保護,且若數據本身無法構成《著作權法》意義上的作品,權利人也不能通過《著作權法》尋求保護。故而,對此類數據往往只能通過雙方之間的合同條款加以保護,或通過《反不正當競爭法》第二條所規定的一般的誠實信用原則或商業道德原則加以約束。與實時性的數據不同,法院認定陽光公司將從交易所處獲取的單個的、分散的行情信息源進行統一編排、加工整理,形成了再生信息源性質的綜合行情信息,并認為此類信息具有較強的實用性和價值性。27陽光公司所采用的即為租售信息模式,其特點是權利人對收集而來的數據進行深度整合萃取,并通過龐大的數據中心及專用渠道加以傳播。28與原始數據不同,此時的信息往往經過深入的整合和處理,因而更容易滿足商業秘密的構成要件,進而通過商業秘密的方式加以保護。
專業化處理實現使數據“賦值”和“增值”,專業化處理過程中所使用的挖掘、整理、計算等方式方法可以形成特定的算法,甚至是計算機軟件工具,再通過軟硬件以及與互聯網的結合解決一定的技術問題,這些都具備鮮明的技術屬性,可以劃歸到計算機程序的發明專利之列,通過申請方法專利予以保護。但是,專利權的產生不同于著作權的自動產生,要求具有相當的新穎性且需要通過行政機關的審查才能取得,所以作為專利權進行保護的前提即為專利權的獲得。目前,我國關于專利權的審查標準相對嚴格,是否能夠順利通過審查取得專利權亦成為是否能夠獲得知識產權保護的先決性條件。endprint
4、數據成果呈現與應用階段的保護
數據成果呈現與應用是數據處理流程中的最后一個環節,也是數據“賦值”后數據價值的變現階段,該階段不僅會將較為抽象的數據轉化為相對具象的成果,更會將該具象成果與具體的商業活動相結合,促使數據成果商業利益最大化。
從數據處理與分析到數據成果呈現與應用,這一過程不僅需要投入大量的時間,更需要投入大量的人力和物力,這其中離不開開發人員的大量智力性投入。從現有情況來看,數據成果的具象化多以應用軟件的形式出現,而該種類型軟件的開發和運行均依托于大量相關數據的收集和分析,這一點有別于傳統的應用軟件。現階段開發的一些具有人機交互功能的軟件即屬于這種類型,比如微軟公司開發的人工智能軟硬件“小冰”、亞馬遜開發的智能音箱以及還在研發完善階段的無人駕駛技術。該類數據成果的具象化如果以軟件的形式存在,則可以通過軟件著作權予以保護。涉軟件案件的審理過程中,關于軟件的比對往往是案件審理的重點和難點,加之大量開源軟件的存在,如何在軟件開發過程中的自由再發布原則與軟件著作權作為一種絕對性權利予以保護之間進行平衡,對通過軟件著作權保護數據成果提出了挑戰。
在數據呈現與應用階段,相關主體還可能將數據成果通過構架運營某種商業模式的方式進行應用。在現有法律法規框架下,商業模式暫時還無法在整體上通過知識產權進行保護,但這并不影響將該商業模式內的某些構成要素通過知識產權進行保護。
在四個數據處理階段中還會產生一些無法通過特別法進行保護的內容,例如違反“爬蟲協議”的君子協定或者開放接口協議等采集數據的行為,該部分內容的保護可以通過《反不正當競爭法》第二條的遵循誠實信用原則和公認的商業道德原則予以保護。前述上海漢濤公司訴被告愛幫公司不正當競爭糾紛案中,即通過認定愛幫公司的經營模式有違公平和誠實信用原則、有違公認的商業道德而構成不正當競爭,對大眾點評網中的內容予以知識產權法意義上的保護。
四、大數據類知識產權案件疑難問題分析
大數據類知識產權案件中可能涉及的知識產權問題相對其他案件更加全面,在大數據采集、應用、交易、保護等多個階段均可能涉及個人信息保護、著作權保護(含軟件著作權保護)、方法專利的保護、商業秘密保護及不正當競爭的保護,還有可能受到《反壟斷法》的調整等,有時更是多個問題的融合。其中個人信息由于屬于《網絡安全法》、《侵權責任法》的調整范圍,不在本章關于知識產權的討論內進行探討。
(一)著作權的保護
依據著作權法基本理論,思想與表達二分法是區分某一客體能否成為著作權法上保護客體的方法,因此,有觀點認為UGC(User Generated Content)即用戶提供的內容,如某些評價等可以作為著作權法中的“作品”而受到著作權法的保護29。但某一用戶提供的單一內容并不能構成“大數據”,認識此類數據時,應全面考慮用戶提供的內容,因平臺在獲取相關數據時無法確認其創作者的真實性,故整體去認知相關內容能否成為大數據,還應有所區分。此類問題在實踐中較易區分,基本的著作權法理論即可成為指導。因此,從《著作權法》角度保護的大數據內容,疑難問題體現在兩個方面:一是對數據庫的保護;二是對使用軟件進行數據采集時,軟件的著作權法保護。
1、數據庫的著作權法保護
著作權法保護與反不正當競爭法保護是目前兩種主要的數據庫保護模式。司法實踐中選擇《著作權法》進行保護的案例相對較多,數據庫的保護在國際上的法律依據已經明確:《TRIPs協議》第10條第2款規定:“數據或其他材料的匯編,無論采用機器可讀形式還是其他形式,只要其內容的選擇或安排構成智力創作,即應予以保護。這類不延及數據或材料本身的保護,不得損害數據或材料本身已有的版權。”《世界知識產權組織版權條約》第5條也明確規定:“數據或其他資料的匯編,無論采用任何形式,只要由于其內容的選擇或排列構成智力創作,其本身即受到保護。這種保護不延及數據或資料本身,亦不損害匯編中的數據或資料已存在的任何版權。”因此,數據庫的著作權法保護是基于匯編作品產生的,其獨創性體現應在于數據的選擇、編排,數據庫的體系和結構等,而不是對數據本身的保護。
2、大數據軟件的著作權法保護
大數據軟件可能遭受的侵權行為表現為兩種類型:一是抄襲行為,即大數據軟件作品源代碼直接雷同;二是第三方惡意修改大數據軟件作品,對大數據軟件服務進行屏蔽、修改界面等。此類案件中,通常涉及如下問題:
一是技術中立抗辯,即軟件提供了某種技術,技術不侵權,從而軟件不侵權的抗辯邏輯。而該問題的實質是軟件是提供數據還是提供技術。目前,多數情況下,提供行為指向的客體是混同的,因此能夠使用技術中立進行抗辯的情況愈來愈少,只有單純的技術才可能不被苛責。
二是實質性相似的判斷,司法實踐中兩款軟件的比對常成為案件難點。我國法院關于軟件作品實質性相似的侵權判決,包括其他類型作品的實質性相似的侵權判決中,基本上是參照作品架構、語言風格、表達形式等要素,綜合性地考慮是否構成實質性相似,30具體操作方法借鑒了美國法院三步檢驗法,即:抽象——過濾——對比法。
(二)方法專利在大數據保護中的構成要素分析
方法專利對于大數據的保護體現在兩方面:一種是數據挖掘中,數據挖掘專利就是指對數據挖掘開發者或委托開發人對數據挖掘技術,或對數據挖掘獲取的信息向國家審批機關申請專利,經依法審查合格后獲取的專有權;或者說,數據挖掘專利是指對數據進行處理,并獲取有益知識的計算機技術的專用權,31其本質是一種計算機程序的方法發明,對于涉及計算機程序的專利能否獲得專利權的授權,在實踐中存在較大爭議,其實質是對于算法能否受到專利法保護的爭論。美國法院在判例中認為:即使申請涉及的系統包含了計算機程序,只要該程序通過一系列數學計算產生了實用和有形的技術效果,仍然可被授予專利權。32我國目前對此區分兩種情況予以處理:如果僅僅利用計算機程序實現了某種數學計算方法和規則,則無法被授予專利權,也就是說在對數據進行挖掘之時,只是利用數據編寫了一套體現某種智力活動的規則和方法的程序,則不能構成方法發明;如果計算機程序的執行是一種正確利用自然規律的技術手段,并且能夠解決具體的技術問題,例如通過數據規律的概括使某種程序可以自然讀取某人的身份信息,則該程序屬于技術方案或其組成部分,應當受到《專利法》的保護。endprint
另一種方法專利是涉及商業方法的專利,例如收集、統計用戶信息的方法,金融機構交易數據分析方法等等,此類方法究竟屬于“智力活動的規則和方法”還是屬于可授權的專利,存在較大爭議。美國等國家已承認商業方法在一定條件下可以被授予專利權,但判斷標準尚未統一。33我國今年4月1日起實施的《專利審查指南》將專利保護范圍擴展至含有技術特征的商業模式、商業方法,這對于隨著網絡發展不斷創新出的商業模式和商業方法的維權具有重要意義。
(三)《反不正當競爭法》在大數據類案件中的保護
1、數據庫的反不正當競爭法保護
上文討論了對數據庫的著作權法保護,但著作權法理論僅僅對獨創性的選擇和編排進行保護,并非針對數據庫中的具體內容,而數據庫中的內容確是真正具有經濟價值的產物,因此作為《著作權法》的補充,《反不正當競爭法》對數據庫進行了進一步的保護。同時,對于難以成為“匯編作品”的數據庫,《反不正當競爭法》也可達到使“智力投入”得到保護的效果。制作人對數據庫投入了大量資金、勞動,只要競爭者利用了數據庫中的數據,可認定競爭者的行為違反了《反不正當競爭法》規定的誠實信用、公平等基本競爭原則,構成第2條第2款意義上的不正當競爭行為。34同時,如數據庫符合商業秘密的條件,也可作為商業秘密進行保護。
2、商業秘密的保護
我國《反不正當競爭法》中對商業秘密的定義為“不為公眾知悉、能為權利人帶來經濟利益、具有實用性并經過權利人采取保密措施的技術信息和經營信息”。因此,能夠受到《反不正當競爭法》保護的商業秘密類數據不包含為公眾可見的用戶點評等數據信息。調研中多數企業對自己的數據采取了技術措施以商業秘密的形式予以保護,而第三方以不正當手段獲取、使用商業秘密的行為大量存在,企業在尋求法律保護此類數據時的難點是舉證:原告不僅要對哪些數據構成其商業秘密進行舉證,還應對其使用了某種技術保護措施進行保護進行舉證,同時要對侵權方的不當手段進行舉證。
上述對于數據的反不正當競爭法角度的保護,主要來源于《反不正當競爭法》的基本原則,即維護競爭者之間地位平等,遵循公平、誠實信用的基本原則,從知識產權促進競爭的反面為限制不當競爭提供了法律保障。
(四)數據的壟斷和排他
對于無形的數據進行權利界定,其規制對象智力成果均屬于無形資產的范疇。單個數據本身的價值難以通過知識產權相關規定予以保護和規制,但是數據的分析和挖掘價值卻可以通過知識產權的保護進行方方面面的規制。那么,某一數據主體通過數據采集得到的數據能否成為其壟斷資源?調研中,我們發現,目前已經出現的數據寡頭與數據聯盟之間的矛盾已漸現端倪。數據寡頭利用其多平臺的特點,收集大量數據進行相應的分析,在數據的采集、運用上享有了當然的話語權,但這種壟斷地位不應是數據本身的性質,大數據的技術本身應當具有非排他性,即任何一個經過投入的主體,在對數據的采集和利用過程中均可以通過大數據的技術手段對數據加以一定形式的利用。
五、大數據司法保護的價值性判斷
由于海量數據的存儲和復制,多借助于互聯網的分發和獲得,在此過程中存在包括提供電信接入服務、支付服務、瀏覽器服務、內容服務和平臺服務等多個環節,圍繞不同時期和環節形成多維數據,企業間爭奪產權將會形成爭議,而且企業的商業模式和廣告分成也將受到影響,甚至可能出現假造數據的情況。對大數據知識產權保護,應當遵循如下原則:
1、人本原則
人本法律觀是相對于神本法律觀發展起來的,馬克思曾指出:“人是法律的出發點” “全部人類歷史的第一個前提無疑是有生命的個人的存在”35。無論是科技還是法律,其發展和完善都應當為人類服務,脫離了這個本質,就會損害到人類自身整體的利益。
(1)法律是因人而生,因人而存的。36大數據的發展和完善應當遵循保護人類基本的自由、平等、安全、尊嚴價值,促進社會的福祉發展的作用。在數據采集和使用過過程中,對于涉及到個人隱私、信息安全方面信息的數據應當采取一定的保護措施,必要時可以對大數據行業進行立法規范,設置一定的行業準入門檻,防止數據采集和交易過程中損害個人自由、尊嚴、隱私等情況出現。
(2)一種觀念認為,基于大數據行業發展前景,使用人工智能制作出的各種形式的圖文,充其量只能是一種邏輯的表達,其表達方式是非常有限的,不應當被視為作品。如果我們能夠設置人工智能使其像人類一樣“思考”,它也只是在感官上更甚于常人,而不會產生感覺,其工作成果一般不應視為作品,不能通過作品的形式獲得保護,而應視為一種財產,即人類使用工具勞動獲得的收益。還有一種觀念認為,人工智能根據預置在程序架構中的邏輯以及使用人工智能的命令,隨機組合各種圖文創作了作品,作品著作權應當歸屬于程序開發者及使用者,但雙方已經根據協議進行約定的除外。上述兩種觀點中,我們傾向于前者。
2、適度采集、隔離使用原則
(1)適度采集
大數據企業存在不同的樣態,不同的主體對于數據的興趣和癖好也不一樣。初始采集過程中,企業對于原始數據收集往往是兼收并蓄,盡可能多地收集各類數據,但是往往有些數據涉及到敏感信息,如個人的賬戶、密碼、身份等等,如果這類數據被買賣,將會造成難以估量的后果。對于這類涉及到特定信息的數據,應當慎重采集,采集后還應對數據信息進行脫敏處理。將個人信息進行大規模交易,可能會涉及到刑事責任。
(2)隔離使用
從法律層面來說,應當加大對數據采集的必要性管理,對于特定信息禁止收集、存儲和使用。采集和使用的環節應當進行隔離,并在企業間、企業各個部門之間對信息進行必要的分離管理。采集和使用應當分開進行,這樣有利于明確責任主體。建立采集和使用行為分離機制,一方面有利于保護特定的主體的隱私、商業秘密等利益,另外一方面能夠有效地預防犯罪,防止信息外泄的惡性事件。endprint
3、應當遵循合理避讓的原則
大數據基本形成或存儲于服務器或者云端上,有些企業的數據是以原始狀態存儲的,有些企業則是采取模型式存儲,傳輸和存儲環節存在不完善的地方,可以為其他企業抓取。在互聯網環境下,即便數據保護已經逐步完善,如通過https的方式加密傳輸,但是由于分享和傳播的需要,他人仍然可以接觸到數據并加以破解,導致數據外泄。以下幾點需要我們特別注意:
(1)通過爬蟲或者其他方式,對于企業數據的抓取,會損害企業的正當權益,不僅會導致數據財產的丟失、泄密,還有可能引起服務器運行的紊亂。通過這種不勞而獲的方式獲得他人的財產進而進行售賣,會造成惡性競爭的問題。
(2)在企業競爭過程中,可能存在各種矛盾,但競爭對手之間應當避免對于大數據的計算結果采取過度解讀,從而形成對某一特定企業的惡意解讀,損害企業的合法權益,即便這種解讀是客觀真實的,競爭企業間也應當避免類似情形。
(3)企業之間通過網絡開放協議,或者通過線下方式單獨訂立協議的,對于加密或者開放的數據及數據統計結論,應當采取合理避讓的方式,在競爭對手之間避免出現惡性競爭,防止利用大數據做出對競爭對手的侵權。
4、利益平衡原則
在數據采集、收據挖掘和數據交易等環節,數據本身并不產生價值,而是基于其二次開發和深度加工形成的分析報告才產生顯著價值。雖然有些公司開放了數據接口,但這并不意味著他人可以任意取用,而是需遵守一定的協議。整個數據加工的流程產業鏈中,存在多種情況,數據采集和挖掘以及交易都有可能被第三方干擾,人員流失也可能導致技術和客戶資源外泄。基于大數據產業鏈的整體比較復雜的情況,對于數據的保護應當遵守利益平衡的原則,特別是公共利益的保護,以有效的制度救濟作為補充手段,在知識產品的生產和流轉的動態過程中,始終使知識產權人的利益和社會公眾的利益保持一種平衡,37在數據的生產交易環節加強保護,通過適當的知識產權方式方法保護創新。例如:
(1)在采集時,應當平衡用戶利益和平臺利益。數據采集者和用戶之間是對立統一體,用戶可以基于大數據獲得更多的有用信息或服務,而采集者可以獲得一定的利潤回報。但用戶是否有權禁止他人對自己進行數據進行收集、為自己“畫像”,目前還存在爭議。理論上來說,數據采集者可以根據用戶行為進行客觀記錄,但應當保證這種記錄不被用于非法用途。而采集者也可以根據用戶的癖好和習慣,向用戶推薦更多用戶關心的信息,方便用戶快捷精準地獲得資源。
(2)在加工時,應當平衡數據采集者和數據中介服務機構之間的利益。在數據的整理、存儲、挖掘中,也應該平衡各方利益以及對于安全的需求、統一性的需求和便利性的需求。各方應當在數據加工時遵循一定的規范,按照行業或者國家標準來進行,但目前我國尚缺乏有效的規范。
(3)在數據交易中,還應當防止各種敏感數據,包括涉及到商業秘密、個人隱私或者其他涉及到法律權益的數據在市面流通,為交易雙方提供合法公平的市場環境。
5、鼓勵數據流動、分享原則
大數據本質上是一個數據拼圖,如果企業將大數據作為企業經營的版圖,引起行業惡性競爭或者數據壟斷,必然損害整體的數據行業發展,進而損害到社會公共利益。大數據的壟斷與大數據的本質背道而馳,最終毀掉的是大數據本身的價值。38對此,我們需注意以下幾點:
(1)鼓勵企業將其經營的數據在脫敏以后加工進行交易,甚至于免費進行分享,會促進行業的整體發展,但是這種機制必須在一定的安全保障下進行。
(2)對于傳統企業來說,大量的運營信息的數據化及數據化成果采集、挖掘和使用將會是未來的行業發展的重點,有價值的數據將會被逐步壟斷,導致需方和售方博弈。在一定時期內,完成數據化將會導致技術、人才競爭的加劇。
(3)數據版圖之爭成為下一個糾紛熱點,圍繞傳統行業數據加工和挖掘和新興市場主體的數據采集都會引發激烈的競爭。整體互聯網法依賴于分享機制的形成,公開的技術分享將會大大促進行業整體進步。
6、法律倫理原則
人工智能(AI)是使用計算機科學的概念、程序和方法從事認知過程的科學,實際上就是一種機器模仿人類智力活動的技術。人工智能研究的創始人之一的明斯基(Marvin Minsky)在1968年用一句話集中概括了人工智能研究的實質:“讓機器從事需要人的智能的工作的科學”。39人工智能容易引發倫理困境,如前文所述,技術雖然具有中立性,但是使用技術的人卻具有一定的意圖,在對于人工智能模仿人類的活動所產生的法律效果缺乏評估的情況下,還是應當慎重認定相關法律行為和法律責任。從本質上來說,人工智能所遵循的是設備預先內置的邏輯思維能力,也就意味著這種規則的是由人類創作的,而人類使用人工智能進行二次學習的過程會產生下一階段的活動,但由于無法預先評估機器在學習后會具備哪些能力,將會導致一些法律問題。例如高速行駛的無人智能汽車,在極端情況下,可能要面臨著殺死乘車人還是行人的問題,具體決策都是根據計算機自動識別和評估來完成的,如果通過事先預置的智能系統進行決策,將會導致災難性后果,甚至人工智能開發者也需承擔刑事責任。但如果將這種情形下的決策權移交給駕駛者,就能相對緩解法律倫理困境。
大數據案件近年來逐步增多,與以往的涉互聯網案件顯著不同的是,以往案件的多以“信息”為載體,而大數據模式以“全息”為載體。大數據模式采用全息的多維度、多樣態來解讀數據,在數據采集、數據分析和數據產權、數據成果等問題上爭議非常復雜。我們通過提煉一定的規則方法,希望能夠在大數據產業起步階段,助力促進產業健康發展,培育和凈化市場環境,優化社會創新的氛圍。endprint