張惠彬 肖啟賢

摘? ? 要:科學研究自由是我國《憲法》所賦予的基本權利,該項權利保障了科研人員從事科學研究不受非必要的限制,從而有利于促進科學技術的發展。人工智能時代,文本與數據挖掘作為一種基礎性的科學研究方法,已成為科學研究自由的新范式。從我國法律體系上來看,文本與數據挖掘受到版權法律制度的嚴重制約,存在巨大的版權侵權風險。豁免科學研究中實施文本與數據挖掘的版權責任是各國版權法律制度發展的趨勢。我國第三次《著作權法》的修改雖對合理使用制度加以完善,并一定程度上考慮了科學研究發展的需要,但總體上仍無法滿足人工智能時代的需求。借鑒歐盟《數字化單一市場版權指令(2019)》第三條的規定,增設“以科學研究為目的的文本與數據挖掘合理使用”,對于保障人工智能時代的科學研究自由,實現科技自立自強和人工智能戰略具有重要意義。
關鍵詞:文本與數據挖掘;科學研究自由;合理使用;著作權法修改
中圖分類號:D 923.8? ? ? ? ? 文獻標志碼:A? ? ? ? ? ? ? 文章編號:2096?9783(2021)06?0074?11
引? 言
新冠肺炎疫情暴發后,全球都在尋找科學抗疫之路。在疫情數據監控、病毒機理分析、防控措施等方面,文本與數據挖掘(Text and Data Mining,簡稱TDM)成為抗疫的重要工具,為打贏抗疫之戰提供了有力保障。自人工智能技術興起后,TDM對于提高科研效率、加速科學發現、支撐科研創新、促進經濟增長越來越重要[1]。使用TDM開展科學研究的自由已經成為人工智能時代科學研究自由的應有之義。然而,TDM過程中所涉及的文本與數據的提取、復制與傳輸等環節大部分為版權法所限制,在我國著作權法語境下面臨嚴重的侵權風險。主張版權遭受侵害的當事人能否伸張權利?抑或是科研人員得以在“科研自由”的憲法保護傘下免其版權責任1?從國際層面來看,為科學研究中使用TDM的行為設立版權例外,豁免其版權侵權責任,已成為各個國家和地區的普遍做法。2019年3月,歐盟通過了《數字化單一市場版權指令(2019)》(以下簡稱《DSM指令》),在歐盟層面引入了TDM版權例外制度。《DSM指令》是當前全球數字版權領域影響最廣泛的立法成果。2020年11月,我國《著作權法》第三次修改對合理使用制度進行了完善,但在保障人工智能時代科學研究中TDM技術的自由使用方面仍然十分不足。有鑒于此,本文在充分考察人工智能時代TDM在科學研究領域的重要作用的基礎上,通過規范分析的方法對我國《著作權法》修改后,科學研究中TDM的版權風險進行解構;通過比較法研究的方式,解析歐盟《DSM指令》的具體做法,檢視我國《著作權法》第三次修改的不足,并提出相應的完善之策。一、TDM已成為人工智能時代科學研究自由的新樣式
(一)TDM是人工智能時代科學研究的新手段
人工智能2時代是繼網絡時代、大數據時代之后,人類所面臨的技術和社會變革最為深刻的時代[2]。其不僅從科學研究成果上為人類社會帶來了多種可能性,也從科學研究的過程中體現了與過去完全不同的思維,引發了科學研究方法的創新。人工智能時代,TDM成為科學研究的重要手段。其以大量的資料為基礎,通過算法的設置實現自動分析并生成有用的知識,將人類從無窮無盡的文本和數據中解放出來。
現代人工智能的核心技術是基于數據的機器學習,即從觀測數據(樣本)出發尋找規律,并利用這些規律對未來數據或無法觀測的數據進行預測的技術[3]。大數據、機器學習等人工智能理論與成果的應用,極大推動了TDM技術的發展。用數據庫管理系統來存儲數據,用機器學習的方法來分析數據,挖掘數據背后的知識,這兩者的結合促成了數據庫中知識發現(Knowledge Discovery in Databases,KDD)的產生,而數據挖掘3是知識發現最核心的部分[4]。雖然經典的TDM和機器學習并非完全相同,但兩者均使用相同的關鍵算法來發現數據中的模式[5]。國外學者普遍認為:“TDM是機器和深度學習的基石,如果沒有利用計算機分析大量數據并使用認知技術來發展學習模式的能力,人工智能是不可能存在的”[6]。吳漢東教授亦指出:“文本和數據挖掘,可視為從另一角度對人工智能技術過程的表述”[7]。因此,TDM既得益于人工智能技術的發展,同時也成為人工智能時代最為基本的技術手段之一。
《DSM指令》將TDM定義為:“任何旨在分析數字形式的文本和數據,以便生成包括但不限于模型、趨勢、相關性等信息的自動分析技術”[8]。簡言之,TDM幾乎包含了所有使用計算機來進行信息索引、分析、評估和解釋的活動[9]。TDM一般均存在四個技術步驟:
第一步,信息的獲取。TDM的對象是數字形式的文本或數據,其獲取的途徑包括但不限于使用爬蟲等方式從網上直接抓取或通過應用程序接口(API)獲取。在該步驟中,所獲取的信息可能被復制并儲存在服務器中。第二步,目標數據集的創建。TDM的實施者將對獲取的信息進行預處理以剔除不必要的信息或對信息進行標準化處理。并非所有的信息均可直接進行TDM,如自然語言文本通常需要轉化成可為計算機處理的結構性數據。經過處理的文本或數據將形成一個新的目標數據集,用于開展數據挖掘。第三步,數據挖掘。研究者利用載有挖掘程序的計算機對數據集進行分析,以生成所需要的模型、趨勢、相關性等知識。第四步,挖掘結果及發布。這一步驟取決于TDM實施者的研究目的,如通過期刊論文、專著或內部文獻等形式將挖掘結果進行公布。
從以上步驟中可以看出,TDM與傳統的科學研究方法最大的不同之處在于其實現了信息的“機器閱讀”,甚至改變了人類作為知識創造唯一主體的局面。人工智能時代,人類社會所產生的信息將難以計數,大數據驅動知識學習已經成為一種必然的趨勢。因此,有學者認為,“數據挖掘這種新時代的科學新工具讓我們實現了用數據化手段測度人類行為和人類社會,再次改變了人類探索世界的方法”[10]。從目前的趨勢來看,這一說法并非夸大之詞。在計算語言學領域,使用TDM的研究項目約占25%~30%;在提高生物醫學發現的效率、優化自然資源的管理和使用等方面,TDM也同樣收效良好[5]。TDM已經成為人工智能時代不可或缺的科學研究方式。
(二)TDM在我國科學研究中的應用現狀
我國當前在人工智能技術的研發、應用和產業發展方面具有較大的優勢,相關領域的論文發表數量、專利擁有量以及部分領域的核心關鍵技術均處于世界前列。人工智能成為我國經濟發展的新引擎,在國家自主創新戰略體系和國際競爭中扮演著重要的角色。人工智能時代的到來,TDM成為我國各領域科研工作中最為廣泛使用的基礎性研究方法之一。以TDM在抗擊新冠肺炎疫情中的應用為例,我們大致可以一窺其在我國科研工作中的重要意義。
2019年末,新冠肺炎疫情暴發后,清華大學AMiner團隊聯合多個科研團體在其科技大數據挖掘服務平臺基礎上研發上線“知識疫圖”系統。該系統匯集了包括疫情、科研、知識、媒體、政策等300余項與新冠肺炎有關的數據資源,開發了新冠肺炎開放數據集、疫情智能駕駛艙、高關注學者分析、新冠肺炎學術成果時間線,以及新冠肺炎期間用戶在線社交行為研究等功能模塊[11]。其中,新冠肺炎開放數據集為TDM的實施提供了重要的基礎;學術成果時間線對大量的論文文獻以及從新聞媒體、社交平臺等渠道提取的大量信息進行文本與數據挖掘,并以時間軸的形式集中呈現其中的學術觀點、熱點事件等;高關注學者分析則對包括鐘南山、李蘭娟等國內外重要學者的學術領域、學術水平等信息進行挖掘,為研究人員和公眾提供相關的知識;用戶在線社交行為研究則以微信大數據等為基礎實現對用戶疫情期間心理狀況的自動分析;在疫情趨勢預測等方面TDM也作出了重要的貢獻。另有學者利用TDM等技術構建疫情追溯數據模型,以實現短時間內對高風險人群和地區的精準定位[12];通過對微博文本進行TDM來研究疫情心理時空距離對公眾情緒的影響等[13]。
此外,TDM技術在金融、交通、公共衛生、文本分析、傳統醫藥研究、社會輿情分析、市場決策等領域也擁有廣闊的應用前景和眾多成功案例。有學者更斷言,“在人工處理數據洪流已經變得不可行且過于昂貴的當下,效率與耗費在客觀上促使TDM成為必須行動的項目”[14]。隨著5G時代的到來,人類將進一步被信息的洪流所淹沒,TDM所具有的意義將更加凸顯。因此,TDM并非僅僅是一個新穎的科學概念,其已經成為現實中普遍存在的科學研究手段,并深刻影響我國科技、經濟以及社會發展的進程。
(三)人工智能時代科學研究自由的新樣式
從各國的情形來看,TDM均非絕對無限制之自由,其最主要的限制來自各國版權法律。TDM作為一種科學研究方法,必須以大量的文本(如數字圖書、網絡中的文章、期刊等)或數據(數據庫或其他形式的數據資源)為基礎。其在挖掘過程中通常涉及到對受版權法保護的文本或數據的復制、發行、改編、翻譯等行為。沒有版權人的授權,此類行為均涉嫌侵害他人版權權利。尤其是在涉及商業使用時,TDM可能會對版權人的利益造成一定的損害。因此,TDM的使用雖然十分重要并且廣泛,但并非是沒有限制的任意使用。
科學研究自由是《中華人民共和國憲法》(以下簡稱《憲法》)所保障的一項公民基本權利,其也為《中華人民共和國科學技術進步法》和《中華人民共和國高等教育法》所明文規定4。學者認為,我國《憲法》語境下的科學研究自由應當包含“研究自由”與“教學自由”。所謂研究自由是指研究者不受非法的限制和拘束,而選擇研究對象、目的、方法、場所、時間的自由,以及發表研究成果的自由[15]。從TDM的過程來看,其主要關涉科學研究方法的自由以及發表研究成果的自由。具體而言,則存在以下兩個方面的考慮:其一,TDM作為一種新的研究方法,研究人員是否有不受限制而使用的權利?其二,TDM所產生的研究成果是否能夠自由發表?由于TDM與人工智能的密切關系,以上兩個問題的答案均深刻影響著人工智能時代國家科學技術的進步以及綜合力量提升。
TDM已經成為科學研究自由的新樣式。從科學研究自由的內涵上考察,TDM作為人工智能時代科研人員開展研究所必備的手段,其屬于科學研究方法自由之列。而發表利用TDM所產生的研究成果則自然屬于發表研究成果的自由。將TDM歸于科學研究自由之列,深層次的原因則在于科學研究自由所具有的集體性價值導向。有學者指出:“知識創新、科技進步是需要學術自由5作為法治保障的,所以學術自由的集體性價值,也就是對于提高國家的國際競爭力的作用和價值,已經超過以往的任何時代”[15]。歐盟《DSM指令》在序言中指出,隨著研究越來越多在數字技術的協助下進行,除非采取步驟解決TDM方面的法律不確定性(筆者注:主要是指版權侵權的風險),否則歐盟作為一個研究區域的競爭地位將受到影響。歐盟豁免科學研究中TDM版權責任的初衷即在于TDM在促進知識創新和科技進步方面所體現的集體性價值。
從實踐層面看,TDM作為一種科學研究自由已經為大多數發達國家所認可。美國作為人工智能技術和產業最發達的國家,其版權法為TDM在科學研究中的使用提供了充足的空間。美國版權法第107條規定的合理使用原則所固有的靈活性,使法官在面對糾紛時能自為判斷TDM的使用是否符合公平理念。在“作家協會訴HathiTrust”案以及“作家協會訴谷歌公司”案等案件中,美國法院均認為TDM構成合理使用,從而不構成侵權[1]。在《DSM指令》生效兩年內,歐盟所有成員國均需將指令內容轉化為其國內法律。因此,歐盟境內將普遍承認TDM屬于科學研究自由的范疇。此外,日本也早在2009年即確立了TDM版權例外,是全球最早開展該立法的國家6。由此觀之,TDM作為一種科學研究自由,其不僅具有理論上的依據,也是國際版權立法的趨勢。
二、科學研究中應用TDM的版權風險
任何自由均非絕對,科學研究自由其本身也受到憲法和法律的外在限制。根據《憲法》第五十一條的規定:“中華人民共和國公民在行使自由和權利的時候,不得損害國家的、社會的、集體的利益和其他公民的合法的自由和權利”。TDM作為一種人工智能時代的科學研究自由樣式,在理論上具有其合理性。然而,從我國法律體系上來看,其受到版權法律制度的嚴重制約。
(一)TDM版權風險解構
TDM之所以存在版權風險,原因在于挖掘的對象往往是受版權法保護的作品。《中華人民共和國著作權法》(以下簡稱《著作權法》)第三條規定了九種法定作品類型,其中包括文字作品、美術作品、攝影作品、視聽作品、圖形作品、計算機軟件作品等在內的作品類型均可以作為TDM的對象。此外,根據“匯編作品”的規定,即使是不構成作品的數據以及其他內容的集合,只要其選擇和編排具有獨創性,則該匯編而成的集合也可以作為匯編作品而受到保護。目前,科學研究中常見的TDM對象(如網頁內容、期刊文章、數字圖書等)絕大多數都是版權法所保護的客體。
從TDM的過程來看,其所涉及的版權權利類型眾多。《著作權法》第十條明確了著作權人可排他利用作品的各種行為類型,也即著作權人的專有權利范圍。其中包括對作品的復制、修改、發行、信息網絡傳播、改編、翻譯等權利。TDM的第一步需要獲取各種文本和數據信息,用于創建目標數據集。該過程一般需要對目標信息進行復制并保存,從而涉嫌侵犯復制權。目標數據集的創建包含了信息的預處理過程,包括對信息進行翻譯、刪改、整理、匯總、格式轉換等步驟。這一過程則有侵害他人翻譯權、改編權以及匯編權的可能。而在挖掘過程中,同樣也涉及信息的復制。挖掘形成的研究成果的發布或者具體利用則會引起侵害信息網絡傳播權、改編權等問題。因此,TDM在科學研究中的運用具有極大的侵權風險,容易引起版權糾紛。“谷歌數字圖書館”系列案件是學界公認的與TDM相關的著作權糾紛之一。該案件的起因在于谷歌公司與多家圖書館合作將館藏書籍進行掃描和數字化,并將數字化的圖書匯編為一個巨大的數據庫作為其數字圖書項目的一個部分。谷歌公司以此為基礎向用戶提供檢索服務,用戶可以檢索到包含檢索詞的內容片段(無法閱讀全文),并可對檢索詞的出現頻率進行分析。此外,該項目也為文本與數據挖掘、相關算法開發等提供了極大支持。截至2014年,谷歌公司已經對超過2千萬本圖書進行了掃描和數字化。然而,由于谷歌并未獲得版權人的授權,從2005年起,其遭到了來自作家協會以及個人作者的起訴。該系列糾紛在美國持續了超過10年的時間,直到2016年美國法院最終認定谷歌的行為屬于合理使用[16]。而在我國發生的,與“谷歌數字圖書館”項目相關的案件“王莘訴北京谷翔信息技術有限公司、谷歌公司”案中,法院認為“片段式”為他人提供檢索構成合理使用,而“全文掃描”原告作品的行為則構成對原告復制權的侵犯7。在TDM項目中,對作品的全文復制是常見的操作。因此,相對于美國,TDM的實施在我國具有更大的版權侵權風險。
(二)合理使用制度無法提供適當的豁免
雖然科學研究自由會受到版權的制約,但并非沒有別的出路。《憲法》本身即確立了一種二元限制的結構,即以私人權利為代表的個體性自由主張與以科學研究自由為代表的集體性自由主張之間構成相互制約、相互平衡的二元結構。“前者為確保作者對其創作的作品的權利奠定了憲法基礎,后者則保障了后續作者和其他使用人對他人作品利用的權利。”[17]此外,促進科學事業的發展也是我國《著作權法》的重要立法目的。因此,版權人的權利在一定程度上也應當受到科學研究自由的制衡。這一點最直接的體現則為“合理使用”制度。我國現行《著作權法》第四節為“權利的限制”,其中第二十四條規定了兩種與科學研究自由相關的合理使用,即“為個人學習、研究或者欣賞,使用他人已經發表的作品”“為學校課堂教學或者科學研究,翻譯、改編、匯編、播放或者少量復制已經發表的作品,供教學或者科研人員使用,但不得出版發行”。符合上述規定的作品使用行為因構成合理使用而可以不經著作權人許可并無需支付報酬。
現行合理使用制度難以滿足科學研究中TDM的需要。首先,《著作權法》第三次修改中雖然在法定的合理使用類型之后增加了兜底條款,即“(十三)法律、行政法規規定的其他情形”8,但這并不意味著我國合理使用制度從封閉式立法轉變為開放式立法,法官仍不得自為創設新的合理使用類型。而目前的其他法律、行政法規中并無任何關于TDM合理使用的規定。其次,此次《著作權法》修改增加了為學校課堂教學或者科學研究合理使用9的行為類型,即增加了“改編、匯編、播放”三種行為。顯而易見的是,立法者已經認識到當前課堂教學或科學研究中對作品使用的需要已不僅僅是翻譯和少量復制。僅就TDM而言,就包括了復制、翻譯、改編、匯編等眾多作品使用行為。只是這一修改雖有其進步之處,但仍然難以為科學研究中的TDM提供豁免。因為該項合理使用不僅存在主體限制——限于公共性質的學校、科研院所等,也存在復制數量的限制——僅限于“少量復制”。TDM既已成為人工智能時代廣泛運用的科學研究方法,其使用者自然不限于學校和科研院所,而就其挖掘過程來看,則需要對作品大量乃至于全部復制。再者,為個人學習、研究或欣賞的合理使用雖無方式與數量的限制,但其僅限于“個人”主體。當前的科學研究工作基本上已告別了個人單打獨斗的模式,而人工智能作為當前最為復雜的科學研究領域之一,更是如此。因此有學者感嘆:“在此國際大背景下,文本數據挖掘的例外規定在我國著作權法中卻付之闕如”[7]。此不免為我國第三次《著作權法》修改之失。
三、豁免科學研究中TDM版權責任的歐盟經驗
2019年3月26日,《DSM指令》以348票贊成、274票反對、36票棄權的結果在歐洲議會獲得通過。該指令旨在于歐盟內部創設一個協調一致、高水平的版權保護體系,以促進歐盟境內的創新,激勵投資和新內容的生產,避免在數字環境中歐盟內部市場的分裂。文本與數據挖掘的版權例外作為此次歐盟立法的焦點之一,被規定在《DSM指令》第二章“使例外和限制適應數字和跨境環境的措施”中。
(一)立法背景
1.TDM面臨極大的法律不確定性
在歐盟原有的法律框架之中,實施TDM的確存在極大的版權風險,但其亦有可能為既有的各種版權例外所豁免。《DSM指令》在序言第(8)項中指出:在某些情況下,TDM可能涉及受版權保護的行為、受數據庫權利保護的行為,或者兼而有之,特別是作品或其他內容的復制、從數據庫中提取內容等行為。具體而言,TDM可能侵犯歐盟《信息社會版權指令》(Directive 2001/29/EC)所規定的復制權,與《數據庫指令》(Directive 1996/9/EC)所規定的數據庫特別權利等。但在以上兩部指令中,同時也規定了可能適用于TDM的版權例外,包括臨時復制例外10和科學研究例外11。然而,臨時復制例外的適用具有較為苛刻的條件,包括要求復制是臨時的、附帶的,是技術過程中不可或缺的組成部分,且不具有獨立的經濟價值等。而就科學研究例外的情形來看,歐盟各成員國在這項例外是否適用于TDM上存在不一致的規定,且歐盟法律將該項例外限于“非商業目的”并需要注明來源和作者姓名(除非證明是不可能的)[18]。因此,TDM在歐盟即使存在合理使用的可能,但依然具有極大的不確定性,嚴重影響了該項技術的使用。
2.跨國科研合作受到阻礙
《DSM指令》的目的之一即在于在歐盟各國之間建立統一的數字版權制度,以促進區域內的版權交易與合作。歐洲委員會的報告則指出:“歐盟版權規則的不成體系在例外方面尤為明顯,在大多數情況下,歐盟法律規定的例外情況是成員國可選擇執行的”[19]。而就文本與數據挖掘版權例外制度而言,在《DSM指令》出臺之前,歐盟各成員國之間的立法并不同步。從立法時間來看,英國早在2014年即引入了該項版權例外制度,法國、德國等則相繼開展了相關立法。從立法內容來看,各個國家既存的規定之間也并不一致[20]。另一方面,科學研究例外并不具有強制性,歐盟各國版權法律并非必須作出規定。因此,該項例外在歐盟各成員國中的執行情況具有較大的差異性。各成員國之間的法律差異嚴重影響了跨境科研合作。
3.合同及技術措施阻礙TDM的使用
即使TDM符合了上述臨時復制例外或科學研究例外的條件,也不意味著科研機構能夠順利實施該技術。因為在獲取供挖掘的信息時,授權人往往可以通過合同條款禁止被授權人進行TDM,或者設置諸多限制。即使是依據版權法可以自由利用的信息(如超過版權時效的作品),信息的提供者也一樣可以通過合同條款禁止實施挖掘行為。此外,技術措施的運用也具有同樣的效果。因此,歐盟議會的報告指出,“合同和技術措施的結合經常被用于為從事TDM項目的研究者設置不可逾越的障礙”[18]。
(二)歐盟TDM版權例外的具體內容
《DSM指令》采“雙軌制”的做法,即區分以科學研究為目的的文本與數據挖掘例外和不限目的的文本與數據挖掘例外,并分別規定于第三條和第四條中。第三條第一款規定:
成員國應當規定,科研機構和文化遺產機構為科學研究目的進行文本與數據挖掘,對其合法獲取的作品或其他內容進行復制和提取的行為,屬于96/9/EC指令第5(a)與第7(1)條,2001/29/EC指令第2條以及本指令第15(1)條所規定的權利的例外。
1.適用主體和目的
該例外的適用主體僅包括“科研機構”和“文化遺產機構”。按《DSM指令》第2條的規定,科研機構是指大學(包括其圖書館)、研究所,以及其他進行科學研究或以開展涉及科學研究的教育活動為主要目的的實體。且該機構必須符合兩個條件:一是以非營利為基礎;二是出于為成員國所承認的公共利益而進行研究。文化遺產機構則是指可公開進入的圖書館、博物館、檔案館或電影、音頻等遺產機構。而指令序言指出,為與歐盟現行的鼓勵大學、研究機構與私營部門合作的政策相一致,研究組織在公私伙伴關系框架內開展研究活動時,也應屬于這種例外情況。以上兩類主體均具有較強的非商業性質,受商業機構決定性影響的研究組織,因可能導致商業機構優先獲得研究成果而不一定能適用該例外。在適用目的上,例外則僅限于“科學研究目的”,即使是適格的主體也不能以其他目的(如商業目的)自由實施TDM。
2.適用的行為類型
在豁免的行為方式上,包括實施TDM中發生的“復制”與“提取”兩種行為。96/9/EC指令第5(a)與第7(1)條所規定的分別為數據庫權利人所享有的復制權與提取權(right of extraction)、反復利用權(right of re?utilization);2001/29/EC指令第2條規定了版權人或鄰接權人所享有的復制權;而《DSM指令》第15(1)條則賦予了新聞出版者對其新聞出版物的鄰接權,具體包括復制權和向公眾提供權(right of making available to the public)。也即符合該項例外的TDM可免于上述權利的限制。
3.適用的條件
該項例外的適用前提是:用于TDM的作品或其他內容是通過合法渠道獲取的。《DSM指令》序言部分指出“合法獲取”應理解為包括基于開放獲取政策或通過權利人與研究組織、文化遺產機構之間的合同安排(如訂閱)以及通過其他合法手段獲取內容。此外,由于技術保護措施的存在,即使是合法獲取的作品或內容也有可能無法開展TDM。因此,《DSM指令》同時也規定權利人可以采取措施確保承載作品或其他受版權保護內容的網絡和數據庫的安全性和完整性,但該措施不應該超過實現這一目標所必須的限度。即要求權利人所采取的技術措施應與風險相對稱,不應該阻礙TDM的實施。而對于合法獲取的作品或內容以及其副本,TDM實施者可以保留作為科學研究或驗證研究結果之用,但必須采取適當的方式儲存。
4.例外的強制性
以科學研究為目的的TDM例外不允許版權人或數據庫權利人通過合同條款排除適用。這是《DSM指令》第三條與第四條之間最大的區別之一。第四條所規定的是不限目的的TDM例外,其適用范圍可包含私人或公共部門出于各種目的的TDM,但條件是權利人沒有以適當方式明確保留該例外的適用。由此可見,《DSM指令》對于科學研究中的TDM提供了更大的自由度。因為立法者認為,從例外的性質和范圍來看,其對于權利人所造成的任何潛在損害都將是最小的。
四、保障人工智能時代科學研究自由的制度設計
我國第三次《著作權法》修改中,在合理使用制度上仍然堅持采用“封閉式”立法模式,即除《著作權法》第二十四條所規定的十三種情形外,其余使用作品的行為很難被認定為屬于合理使用的范圍。而以科學研究為目的的TDM并非其中任何一種合理使用類型所能包含。這一立法模式雖然具有更大的可預見性和適用的便利性,但隨著科技和社會的發展,此模式的靈活性和包容性則明顯不足。在我國,甚至出現了司法實踐與立法規范背道而馳的亂象。最高人民法院發布的指導意見中指出:“在促進技術創新和商業發展確有必要的特殊情形下,考慮作品使用行為的性質和目的、被使用作品的性質、被使用部分的數量和質量、使用對作品潛在市場或價值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不至于不合理地損害作者的正當利益,可以認定為合理使用”12。也即在某些“特殊情形”下,法官可突破我國《著作權法》的封閉規定,適用一定的標準自行判斷是否屬于“合理使用”。“自此,我國法院在一系列案件中陸續突破著作權法的封閉性規定,結合合理使用四要素展開三步檢驗法分析,以最終作出是否構成合理使用的司法認定。”[21]由此觀之,實踐中欲認定以科學研究為目的的TDM為合理使用也并非毫無可能,只是該種認定存在以下三個方面的弊端:其一,與《著作權法》的明確規定相沖突,存在法官造法的嫌疑;其二,在《著作權法》缺乏相應規定的情形下,侵權的嫌疑容易阻卻TDM實施者的行為;其三,容易造成實踐中判斷標準的多樣化,影響司法的公正性。
將以科學研究為目的的TDM行為納入《著作權法》合理使用規范之中,作為一種獨立的合理使用類型既具有理論上的合理性,也有國際經驗可供參照,同時也是呼應我國人工智能發展戰略和中央關于科學自立自強要求的重要立法措施。《著作權法》的第三次修改工作剛剛完成,而下一次修法的時機亦難以估計,但《著作權法實施條例》的修訂工作正在進行之中。因此,根據新修《著作權法》第二十四條第(十三)項13的規定,可在《著作權法實施條例》的修訂中增加以科學研究為目的的TDM合理使用規定。但從TDM在人工智能時代所具有的重要性以及普遍性來看,在時機成熟時,仍有必要將其納入我國《著作權法》之中。
(一)以科學研究為目的的TDM版權例外的合理性探析
新技術的運用對于版權人來說存在兩面性,即版權風險與版權擴張并存。如互聯網技術的運用使作品的傳播變得輕而易舉,版權人一方面面臨利益受損的局面,另一方面也在不斷想辦法獲取這一新生領域所帶來的版權利益。由此,信息網絡傳播權得以確立,其既是出于保護版權人利益的需要,也吹響了版權人向互聯網領域進軍的號角。而TDM技術的出現也同樣為版權人提供了攻城略地的機會。他們所主張的“挖掘權”即是明證。但一項權利是否能為法律所確認,必須經過利益平衡的考量。無論是從我國《憲法》和《著作權法》所設置的利益平衡機制還是我國當前的現實發展需求來看,為科學研究中的TDM設置版權例外均具有合理之處。
其一,在著作權的“憲法進路”看來,著作權制度是一種中性制度,對著作權的限制與著作權本身同樣重要,著作權的正當性應當建立在對憲法目標的實現上[17]。換言之,“憲法規定發展教育、科學和文化事業的國家義務和社會目標,是我國著作權法基本目標的憲法淵源”[22]。我國《憲法》既已為科學研究自由提供了最基礎的保障,則著作權不應當成為實現該目標的阻礙。在不損害著作權人原有利益的情況下,對基于新技術而產生的新權利主張加以適當限制,是實現《憲法》利益分配的要求。TDM旨在對現有資料進行機器分析,并從中獲得可供利用的知識。縱然其中涉及對作品或者其他內容的復制,其僅僅是該過程中無法避免的一個技術步驟。所復制的內容并非用于傳播,因此不會造成對權利人的市場替代。而所涉及的改編、匯編、翻譯等行為,也由于同樣的原因不會產生損害權利人利益的后果。從另一個角度觀之,若認為TDM屬于版權人的專有權利,則勢必嚴重阻礙科學研究中TDM的運用。進一步而言,《憲法》所賦予公民的科學研究自由實際上將無從保障,公共利益與私人權利的平衡將被打破。
其二,從《著作權法》的角度而言,“促進社會主義文化和科學事業的發展與繁榮”是賦予著作權人專有權利的目標之一14。保障公眾對作品的接觸、欣賞和學習是提升公民素質、促進再創作以推動社會文化和科學事業發展與繁榮的重要環節。可以說,作品、作者以至于著作權法均是因公眾而得以存在,公眾既是目的,也是動力和最關鍵一環。因此,著作權法在賦予著作權人專有使用作品權利的同時,也給予公眾消費性使用15作品的權利,以實現著作權法的利益平衡設計。為學習、研究或欣賞等目的消費作品則是公眾消費性使用作品的重要體現,其實質是獲得作品的內容,包括隱含的思想或信息[22]。唯應注意的是,消費性使用應當以“合法取得作品”以及“合理使用作品”為前提[23]。在合法取得作品的前提下,僅以科研目的進行TDM是對作品的消費性使用而非傳播性使用。而通常在取得作品的過程中,權利人已經實現了其回報。誠然,在TDM過程之中可能造成復制件外泄、發表的研究成果中利用了作品的表達等,但這不應當成為事先禁止科學研究中實施TDM的理由,應當依著作權侵權規則加以規制,即僅在相關后果產生侵權時才依權利人的主張對其加以禁止。
歐洲學界有觀點亦認為,基于“思想和事實不受保護”的原則,任何旨在提取作品中所蘊含的思想和事實的復制行為均應當被允許[24]。該觀點將TDM視作“機器閱讀”的過程,并認為這與人類閱讀是相同的,均是利用作品中的思想以產生新的知識。唯其不同之處在于,機器的閱讀必須以復制為前提。若禁止該復制,則無異于禁止人們對作品中的思想和事實的利用。這與版權法的初衷是相違背的。思想/表達二分法大致劃定了版權人的控制范圍與公眾行為自由之間的界限,體現了保護版權利益與公共利益之間的平衡。若不對版權人的這種權利主張加以限制,將打破這種平衡,縮小公有領域的范圍,不利于實現版權法促進社會文化和科學事業發展的目標。
其三,增設以科學研究為目的的TDM版權例外具有高度的現實意義,符合我國當前的戰略需求。十九屆五中全會提出:“堅持創新在我國現代化建設全局中的核心地位,把科技自立自強作為國家發展的戰略支撐”。人工智能作為21世紀三大尖端科技之一,其對于我國實現科技自立自強,建設科技強國的意義不言而喻。國務院印發的《新一代人工智能發展規劃》指出:“人工智能是引領未來的戰略性技術,世界主要發達國家把發展人工智能作為提升國家競爭力、維護國家安全的重大戰略”。作為人工智能時代最重要和最基礎的科學研究工具,TDM被普遍運用到自然科學和社會科學等領域,并創造了巨大的經濟和社會價值。鑒于TDM在人工智能時代所具有的重要意義,其已成為國際上所普遍承認的一種科學研究自由,并體現在各國家和地區的立法中。我國欲實現人工智能發展的三步走戰略16,實現科技自立自強,必須充分保障TDM在科學研究中的使用自由。而具體落實到版權法領域,則是應當破除當前我國《著作權法》對科學研究中使用TDM的制度限制。
(二)立法設計
基于TDM作為一種科學研究自由所具有的合理性以及我國當前的人工智能發展趨勢和政策,筆者認為,我國《著作權法》第二十四條,即關于合理使用制度的規定亟須更新。具體而言,則是在第二十四條第(十二)項之后增加一項新的法定合理使用類型:
(十三)以科學研究為目的進行文本與數據挖掘,對合法獲取的作品進行復制、翻譯、改編、匯編。
1.該項合理使用應當限定為“以科學研究為目的”
《憲法》所規定的科學研究自由體現的是對公共利益的保障,也即為提升一國科研實力,促進國家科技、經濟和社會發展而賦予公民的自由。以公共利益對私人所享有的版權權利進行限制有其充分的制度基礎,且不會造成對權利人的過度損害。而“以營利為目的”實施TDM則暫時不應當納入版權例外的范疇。一方面,大范圍開放TDM版權例外,容易造成作品提供商提高授權許可費。實際上,若不將該版權例外限制在一個較為有限的范圍內,權利人會默認所有交易對象均有進行TDM的可能,從而在定價時提高授權許可費,以彌補其預期利益的損失。另一方面,商業性的TDM需求巨大,而模式亦甚多,其更有可能對權利人形成市場替代,從而損害權利人利益。因此,限于科學研究為目的是多數國家的立法選擇,而《DSM指令》也僅對此目的下的TDM版權例外作出強制規定。此外,該項合理使用不應當作主體上的限制。無論是國家設立的科研院所、高等學校,還是私人設立的研究機構,只要其是出于科學研究目的而進行文本與數據挖掘,其均屬于《憲法》所規定的科學研究自由的范疇。以主體性質進行區別對待沒有正當的理由。
2.該項合理使用應當以“合法獲取”為前提
這一前提條件旨在實現TDM實施者與內容提供者之間的利益平衡。以付費換取接觸作品或其他內容的權利是普遍的做法,也是版權法的基本邏輯。一方面,該例外旨在對抗內容提供者基于技術發展而無故擴張的版權主張(進行TDM的權利),并非要否定原有的制度(許可使用、技術保護措施等相關規定)。另一方面,專門為研究者提供數據集已經成為一種商業模式,這種商業模式的開展不僅需要付出一定的成本,而且也方便了研究的開展,為研究者所樂見。因此,合法獲取這一前提條件具有其合理性。
3.《著作權法》第二十四條第一款構成了對該合理使用的內在限制
新修改的《著作權法》引入了合理使用“三步檢驗法”的內容,規定合理使用作品“不得影響該作品的正常使用,也不得不合理地損害著作權人的合法權益”。TDM的實施即使滿足了該項合理使用的規定,但若依然可能產生與他人作品的正常使用相沖突或不合理地損害權利人合法權益的后果時,法官則可行使自由裁量權,以決定該行為是否可獲得豁免。因此,該規定的引入實際上為該項合理使用設定了限制,有利于實現TDM實施者與版權人之間的利益平衡,避免制度的濫用和異化。
4.該項合理使用的行為類型包括“復制、翻譯、改編、匯編”
從TDM的技術過程來看,對作品進行復制、翻譯、改編以及匯編均是常見的操作,且通常是不可或缺的環節。其中,“復制”并不受數量上的限制。原因在于,在TDM技術過程之中,大量復制是必不可少的。更為重要的是,TDM過程中對作品的復制并不導致傳播,不會為著作權人帶來潛在或實際的替代效應。從更為本質的角度而言,這四種行為均是對作品內在思想的使用過程中所必要的步驟,屬于消費性使用之列。退一步來看,即便在TDM過程中存在不規范的作品使用行為,若實際產生了對著作權人的市場替代,或者造成作品的傳播等,也可依“三步檢驗法”的標準排除合理使用規則的適用,追究使用者的侵權責任。
結? 語
版權與科學研究自由的沖突由來已久,其實質是科技發展過程中版權人利益與公共利益的動態博弈。科技自立自強須要充分的科學研究自由作為保障,而維護版權人的利益亦是促進社會文化和科學事業發展與繁榮的基石。TDM作為人工智能時代不可或缺的科研手段,對于實現我國人工智能戰略和促進科技自立自強意義重大。豁免科學研究中的TDM版權責任,不會打破我國《憲法》和《著作權法》所設定的利益平衡,有利于實現科學研究自由,促進TDM的應用和發展。當前,國際競爭的主舞臺已轉移到科技領域。發達國家紛紛完善其版權制度,以實現其在人工智能領域的戰略布局。響應十九屆五中全會的號召,加快建設科技強國,完善科技創新體制機制,亟須謀求合理使用制度的更新和完善。
參考文獻:
[1] 羅嬌,張曉林.支持文本與數據挖掘的著作權法律政策建議[J].中國圖書館學報,2018,44(3):21?34.
[2] 何哲.通向人工智能時代——兼論美國人工智能戰略方向及對中國人工智能戰略的借鑒[J].電子政務,2016(12):2?10.
[3] 中國電子技術標準化研究院.人工智能標準化白皮書[EB/OL].(2018?01?24)[2021?3?14].http://www.cesi.cn/images/editor/20180124/20180124135528742.pdf.
[4] 羅森林,馬俊,潘麗敏.數據挖掘理論與技術[M].北京:電子工業出版社,2013:17.
[5] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ? Technical Aspects[EB/OL].[2021?3?14].https://www.europarl.europa.eu/RegData/etudes/BRIE/2018/604942/IPOL_BRI(2018)604942_EN.pdf.
[6] Maximising the benefits of Artificial Intelligence through future?proof rules on Text and Data Mining[EB/OL].(2018?04?09)[2021?3?14].https://eare.eu/assets/uploads/2018/03/OpenLetter?to?European?Commission?on?AI?and?TDM_9April2018.pdf.
[7] 吳漢東.著作權合理使用制度研究[M].北京:中國人民大學出版社,2020:236.
[8] EUR?Lex.Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC (Text with EEA relevance.)[EB/OL].(2019?05?17)[2021?3?14].https://eur?lex.europa.eu/legal?content/EN/TXT/HTML/?uri=CELEX:32019L0790&from=EN.
[9] Future TDM.Baseline report of policies and barriers of TDM in Europe[EB/OL].[2021?3?14].http://www.futuretdm.eu/knowledge?library/?b5?file=2374&b5?folder=2227.
[10] 黃欣榮.大數據時代的哲學變革[N]. 光明日報,2014?12?03(015).
[11] AI+大數據,新冠肺炎知識智能服務應用大揭秘[EB/OL].(2020?05?13)[2021?3?14].https://mp.weixin.qq.com/s/l5hKnZykGtMBdAyM6uG?jQ.
[12] 沈陽,李洪磊,陳杰.圖數據模型及其在疫情追溯領域的應用研究[J].軟件導刊,2021,20(2):13?17.
[13] 張放,甘浩辰.疫情心理時空距離對公眾情緒的影響研究——基于新冠肺炎疫期微博文本面板數據的計算分析[J].新聞界,2020(6):39?49.
[14] 楊娟.文本與數據挖掘合理使用例外規范的體系化設置[J].圖書館論壇,2020,40(4):141?150.
[15] 王德志.論我國學術自由的憲法基礎[J].中國法學,2012(5):5?23.
[16] Campbell, Victoria.Authors Guild v. Google, Inc. [J].DePaul Journal of Art, Technology and Intellectual Property Law, 2016,27(1):59?72.
[17] 李雨峰.論著作權的憲法基礎[J].法商研究,2006(4),112?120.
[18] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ? Legal Aspects[EB/OL].[2021?3?14].https://www.europarl.europa.eu/RegData/etudes/IDAN/2018/604941/IPOL_IDA(2018)604941_EN.pdf.
[19] European commission.Communication from the Commission to the European Parliament,the Council,the European Economic and Social Committee and Committee of the Regions[EB/OL].[2021?3?14].http://ec.europa.eu/newsroom/dae/document.cfm?action=display&doc_id=12526.
[20] 阮開欣.歐盟版權法下的文本與數據挖掘例外[J].圖書館論壇,2019,39(12):102?108.
[21] 李楊.著作權合理使用制度的體系構造與司法互動[J].法學評論,2020,38(4):88?97.
[22] 劉銀良.著作權法中的公眾使用權[J].中國社會科學,2020(10):183?208.
[23] 高富平.數字時代的作品使用秩序——著作權法中“復制”的含義和作用[J].華東政法大學學報,2013(4):134?149.
[24] Marco Caspers.A right to read for machines? Part I: The introduction[EB/OL].(2016?12?02)[2021?3?14].https://www.futuretdm.eu/blog/a?right?to?read?for?machines?part?i?the?introduction/.
The Construction of Copyright Exemption Rules for Text and Data Mining in the Era of Artificial Intelligence
Zhang Huibin, Xiao Qixian
(Civil and Commercial Law Department, Southwest University of Political Science and Law, Chongqing
401120, China)
Abstract: The freedom of scientific research is a fundamental right granted by China's Constitution, which guarantees that researchers are free from unnecessary restrictions in their scientific research, thus contributing to the development of science and technology. In the era of artificial intelligence, text and data mining, as a basic scientific research method, has become a new type of scientific research freedom. From the perspective of Chinese legal system, text and data mining is severely restricted by the copyright legal system, and there is a huge risk of copyright infringement. From the perspective of comparative law, exempting the copyright liability for text and data mining in scientific research is a trend in the development of copyright legal systems in various countries. Although the third revision of Copyright Law improved the fair use system and considered the needs of scientific research development to a certain extent, it was generally unable to meet the needs of the era of artificial intelligence. Referring to the provisions of Article 3 of the European Union's Copyright Directive of Digital Single Market (2019), the addition of "fair use of text and data mining for the purpose of scientific research" is of great significance to ensure the freedom of scientific research and to achieve science and technology self?reliance and artificial intelligence strategy in the era of artificial intelligence.
Key words: text and data mining; freedom of scientific research; fair use; revision of Copyright Law