唐思慧
大數據環境下文本和數據挖掘的版權例外研究
——以歐盟《DSM版權指令》提案為視角
唐思慧
大數據時代,文本和數據挖掘技術的廣泛應用打破版權法構建的利益平衡機制,給我國著作權法帶來了挑戰,亟需調整。美國的應對是從默示許可轉到無條件例外規則,而歐盟《DSM版權指令》提案以義務式的模式規定了“科學研究領域的文本和數據挖掘”例外規則,對科研促進及對版權保護力度適中,值得借鑒。我國著作權法修改應制定“文本和數據挖掘合理使用規則”,嚴格限制適用條件,重構利益平衡機制。
大數據 文本和數據挖掘 版權例外 利益平衡
大數據時代,數據的產生、收集、儲存日益規模化,運用文本和數據挖掘技術從海量數據中發掘有用信息成為數據產業乃至科技創新的重要支撐。而文本和數據挖掘涉及對大量受版權保護客體的復制、使用,這打破了版權法所構建的利益平衡機制,亟需調整并應對。歐美國家所采取的因應措施值得借鑒。
文本和數據挖掘(Text and Data Mining,以下簡稱TDM)是指從大量文本數據中發掘信息和知識的計算機處理技術。《歐盟數字化單一市場版權指令》提案(以下簡稱《DSM版權指令》提案)將TDM定義為:“為了獲取模式、趨勢、相關關系等信息而對數字格式的文本與數據采取的任何自動化分析手段。”也有認為:“從機器的可讀資料中提取有價值信息的過程,涉及對資料的大量復制、數據的提取以及數據的整合,從而識別出特定模式。”作為一種復雜的自動化處理技術,TDM包括多個階段的計算機技術,初始階段如對文本數據的復制、提取,后續階段如對復制結果的處理、分析等,最終目的是發現規律或者趨勢。其流程為獲取信息來源、轉換數據格式、載入數據、分析數據、形成報告。①參見樊佳怡:《歐盟有關文本和數據挖掘的法律框架》,載《信息資源管理學報》2016年第1期,第12–16頁。
以往的知識發現過程建立在定量、采樣的數據基礎上,因此能做到對這些少量數據進行精確分析。TDM技術則實現了從依靠少量的數據樣本到分析與事物相關的所有數據,從追求精確性到接受數據的紛繁復雜,從探求難以捉摸的因果關系到關注事物間的相關關系。②參見[英]維克托?邁爾—舍恩伯格、肯尼思?庫克耶著:《大數據時代》,盛楊燕、周濤譯,浙江人民出版社2013年版,第29頁。TDM挖掘者利用自動化手段對海量的文本、數據進行復制、提取,將復制提取的結果(包括結構化數據、非結構化數據和半結構化數據)轉換成能夠被計算機處理的結構化數據,再進行分類、比較、解析等,最終得到分析總結報告。
(一)大數據環境下TDM技術的特征
TDM技術作為大數據時代重要的分析工具,具有以下新特征。
第一,主體的特殊性。TDM需要利用自動化技術(如網絡爬蟲,針對非結構化、半結構化數據的轉換技術等)對文本和數據進行抓取、復制、處理、比較、分析,因此,挖掘主體需具備一定技術和物質條件,一般以非自然人的組織機構形式存在,如大學、圖書館或者其他研究機構等。
第二,復制范圍廣泛。TDM結果的質量很大程度上取決于采取樣本的范圍,傳統的采樣方式不再適應于對海量數據的挖掘,TDM采用“樣本=總體”的全數據模式,利用自動化技術能夠復制、提取所有與主題相關的文本數據。
第三,無法辨識被挖掘對象的權利狀態。TDM作為自動化技術,只能根據人工設置的指令運行,本身并不能主動識別被挖掘對象的權利狀態,如享有版權的主體、被挖掘文本數據是否受版權保護等。
第四,挖掘結果具有巨大價值。“數據就像一個神奇的鉆石礦,當它的首要價值被發掘后仍然能不斷給予……絕大部分都隱藏在表面之下”③[英]維克托?邁爾—舍恩伯格、肯尼思?庫克耶著:《大數據時代》,盛楊燕、周濤譯,浙江人民出版社2013年版,第127頁。,數據的價值是“取之不盡,用之不竭”,而TDM就是發掘數據潛在價值的重要工具。通過自動化技術能及時有效地實現對數據的重組利用、再利用,得到所需的模式、趨勢、相關關系等信息,這些在商業、科研、教學、社會管理中作用巨大。
(二)TDM技術對版權法的利益平衡機制的打破
互聯網的開放、交互、共享等特性使作品的傳播和獲取簡易化、多樣化,使得“樣本=總體”的全數據模式成為可能,海量文本和數據通過TDM技術被復制和提取,其中存在大量受版權保護的客體,這面臨版權侵權的危險,主要問題有:
第一,TDM技術合法性存疑,易陷入侵權爭議。一方面,TDM受版權或數據庫權的限制,在大多數國家未制定相應的版權例外規則的情況下,因TDM技術導致的糾紛,往往只能判斷其是否符合已有的版權例外規則。另一方面,關于合法訪問是否默許TDM行為,亦存在較大的爭議:以出版商為代表的權利人一方認為機構付費訂閱的內容只包括緩存、閱讀、打印以及在PDF文檔中進行檢索的權利,而不包括文本和數據挖掘;以研究人員為代表的挖掘者一方認為“有權閱讀即有權挖掘”,不需要權利人再授權。④Peter Murray-Rust, The Right To Read Is The Right To Mine[OL].[2017.2.21]. https://blog.okfn.org/2012/06/01/the-right-to-read-is-the-rightto-mine/.
TDM技術在基礎階段通過自動化手段來完成對海量文本數據的復制提取。在對文本數據進行復制提取時,計算機無法識別挖掘對象的權利狀態;由于TDM技術的隱秘性,權利人往往難以知曉自己權利受到侵害;加之網絡技術的發達使得信息產生、傳播復雜化、多樣化,作品的權利主體難以確定;被復制對象的數量龐大,獲取權利人授權的成本高昂。這些因素使得挖掘者通常不經過授權就對文本數據進行挖掘,易陷入侵權爭議。
第二,市場和社會層面的利益沖突凸顯。在版權市場中,一方面,TDM技術涉及對作品、數據庫的復制、提取,權利人希望通過版權法來規制TDM,通過作品獲取更多利益;另一方面,作為挖掘者,在版權法未賦予TDM版權例外規則的情況下,版權保護則構成實施TDM技術的障礙,而獲得權利人許可往往成本高、程序繁雜,挖掘者則希望盡量降低獲取、使用作品的成本。在社會層面上,在法律賦予TDM合法性之前,未經授權進行TDM意味著版權侵權;而大數據時代,TDM技術將是科研創新的重要支撐,在其價值性日益凸顯的背景下,嚴格保護版權意味著TDM技術應用的舉步維艱,私權保護和社會公共利益之間的沖突日益凸顯。
(三)TDM技術給我國著作權法帶來的挑戰
一般而言,實施TDM技術的主體通常為具備科學研究能力的科研機構,包括大學、公共圖書館等非營利性法人或者其他非法人組織,也包括商業研究所、商業公司等營利性法人;TDM技術挖掘的對象是包括作品在內的海量數字文本內容,TDM的初始階段涉及對作品的大量復制,后期涉及對作品、數據或信息的使用、分析與應用。
我國《著作權法》第10條第1款第(五)項明確規定著作權人對其作品享有復制權,并將復制定義為:以印刷、復印、拓印、錄音、錄像、翻錄、翻拍等方式將作品制作一份或者多份的行為。在未經著作權人同意的情形下,利用TDM技術復制作品就構成對復制權的侵犯。TDM技術所涉及的復制行為能否適用著作權法中的合理使用或者法定許可規則?《著作權法》《信息網絡傳播條例》中沒有明確規定TDM技術的著作權例外規則,涉及科學研究的例外制度分別是《著作權法》第22條的個人使用和科研教學使用(分別為該條第1款第(一)項;第(六)項)、《信息網絡傳播條例》第6條第3款,而法定許可并不涉及TDM技術。由于TDM的實施主體通常是有科研能力的研究機構,而個人使用的主體限于個人,或者擴展到其家庭,⑤吳漢東著:《知識產權法》,法律出版社2014年版,第100頁。但不能擴展到單位,因此個人合理使用不能適用于研究機構;TDM運用自動化手段,對大量文本數據進行復制、提取,而科研教學使用將使用方式限制為“少量翻譯或者復制”和“提供少量”,因此科研教學使用條款也不能適用于TDM技術。
綜上,TDM不能適用合理使用或者法定許可規則,經授權才能賦予研究機構對作品進行TDM的合法性。大數據環境下,TDM技術的普及、應用引發的問題日益凸顯,亟需立法予以規制,作出前瞻性安排。歐美的因應措施值得關注。
(一)美國:從默示許可到無條件例外——以Google Books案為線索
Google Books項目是指谷歌公司將大學圖書館等提供的書籍掃描數字化,然后在互聯網上發布、向用戶提供書籍的電子檢索。Google Books項目通過復制紙質或數字作品,形成數據庫,并建立“Google Books”搜索引擎,用戶通過輸入搜索關鍵詞或者短語,能夠得到數據庫里面包含關鍵詞或短語的所有書籍,以及這些詞語在每本書中出現的次數。谷歌公司在Google圖書館項目中使用“ngrams”搜索工具,向用戶提供幾個世紀以來詞語和短語的使用頻率的統計信息,用戶可以獲得不同時期、不同語言地區對相關詞語的使用頻率,從而辨別社會就某一主題的興趣變化;研究者還可以從大量谷歌掃描的圖書中搜索到“詞語頻率、句法模式和主題標識”,從中發現術語、語法和文學風格的變遷。從Google Books項目復制書籍,到提供檢索服務,最后通過對用戶的歷史搜索記錄進行統計分析,得出某個主題或者領域的變化趨勢,構成一個完整的TDM過程。
2005年9月,美國作家協會以及幾位作家對Google網站提起集體訴訟,要求谷歌公司賠償損失以及停止侵權。隨后,美國五大出版社向Google提起了停止侵害訴訟。雙方當事人于2009年11月13日達成和解協議,即《Google Books和解協議》。該協議中,谷歌公司可以不經版權人的事先授權而對受版權保護的圖書進行數字化,并就其內容對外提供檢索服務,而版權人則可決定其圖書在線顯示內容的多少和銷售價格的高低,并可決定是否將其圖書撤出谷歌數字圖書館。
顯然,《Google Books和解協議》中采取了“默示許可”規則,實質上推定了權利人的事先授權,文本和數據挖掘者可以跳過授權這一環節而對其文本內容進行復制、提取,權利人可獲得報酬以及隨時決定是否撤回其授權許可。然而該案后續的審理結果并未采納《Google Books和解協議》中的“默示許可”方案。
美國上訴法院于2015年10月16日作出判決,認定Google Books項目屬于合理使用,案件被上訴到聯邦最高法院,聯邦最高法院于2016年維持原判。在上訴法院的判決中,法官根據《版權法》第107條合理使用規則予以綜合考量:(1)使用的目的和性質,包括是否具有商業性質還是非營利的教育目的;(2)享有版權的作品的性質;(3)與享有版權的作品整體相比所使用部分的數量和實質性;(4)使用對享有版權的作品的潛在市場或價值的影響。最終認定谷歌未經授權對受版權保護著作加以數字化,設置搜索功能以及片段瀏覽功能屬于非侵權的合理使用行為,其復制的目的具備高度轉換性,文本僅作有限公開,其展示行為不會造成對原作品市場的替代,谷歌的商業性質不能作為排除合理使用的正當理由。
可見,在實踐中認定TDM是否屬于合理使用時,版權法并未規定具體的限制條件,而采用典型的因素主義,法官只需考量TDM行為是否符合四因素,這種認定方式可稱為“無條件例外”模式。
(二)歐盟:有條件的版權例外
對文本和數據挖掘,也有在版權法中確立TDM版權例外制度,并嚴格限定其適用條件,可稱為“有條件例外”模式,這典型體現在歐盟的《DSM版權指令》提案中。2016年9月14日,歐盟委員會發布了《DSM版權指令》,提案以義務式的模式規定了“科學研究領域的文本和數據挖掘”例外。
1.歐盟TDM版權例外規則的艱難抉擇:基于比例性考察
歐盟現有的科學研究版權例外規則不適用于TDM,歐盟多樣的許可實踐產生不必要的交易費用以及單一市場法律制度不統一,導致TDM在歐洲科研中發展速度緩慢。⑥《Commission Staff Working Document Impact Assessment on the Modernisation of EU Copyright rules》,p125.對此歐盟曾提出四種解決方案:方案一:增強行業自律舉措,而不改變歐盟法律框架;方案二:為非商業性科學研究制定TDM版權例外規則;方案三:針對公共利益研究組織進行的非商業性或商業性科研制定TDM版權例外規則;方案四:針對任何合法訪問的主體(包括公共利益研究機構和商業研究機構)進行的商業目的或非商業目的科研制定TDM版權例外規則。
歐盟委員會將上述方案的效益、成本、對利益相關者的影響以及社會、基本權利的影響進行了對比,如表1所示,其中(0)表示中性評價或者無影響,(+)表示有一定積極影響,(++)表示有較強積極影響,(–)表示有一定消極影響,(– –)表示有較強消極影響。
表1 歐盟解決TDM問題的四種方案對比
⑦ Public-Private-Partners,公私合作關系。
續表1
方案1主張不做立法調整,其余三種方案主張制定TDM版權例外規則,這三種方案主要在受益主體和科學研究目的方面存在差異:方案2和方案4的受益主體既包括商業性的研究機構也包括公益研究機構,方案3只包括公共利益研究機構;方案2只允許非商業性的科學研究,而方案3和方案4允許商業性和非商業性的科學研究;方案3能夠有效保證TDM的法律確定性,降低研究人員的交易成本,對出版商的TDM許可市場的影響也比較小,而且出版商付出的合規成本也較少。而方案1不能保證TDM的合法性,方案2不能確保PPPs項目中TDM的合法性,方案4給權利人帶來高昂的成本同時還嚴重影響TDM許可市場。因而歐盟提案最終采用方案3,以期達到最佳利益平衡。
2.歐盟TDM版權例外規則的具體內容
《DSM版權指令》第3條⑧《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 3:1. Member States shall provide for an exception to the rights provided for in Article 2 of Directive 2001/29/EC, Articles 5(a) and 7(1) of Directive 96/9/EC and Article 11(1) of this Directive for reproductions and extractions made by research organizations in order to carry out text and data mining of works or other subject-matter to which they have lawful access for the purposes of scienti fic research.2. Any contractual provision contrary to the exception provided for in paragraph 1 shall be unenforceable.3. Rightholders shall be allowed to apply measures to ensure the security and integrity of the networks and databases where the works or other subject-matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective.4. Member States shall encourage rightholders and research organizations to de fine commonly-agreed best practices concerning the application of the measures referred to in paragraph 3.明確了文本和數據挖掘的版權例外規則,以義務式的模式規定成員國須在國內法進行轉化,“成員國應對第2001/29/EC號指令第2條,第96/9/EC號指令第5(a)和7(1)條和本指令第11(1)條規定的權利作出例外規定:研究機構以科學研究目的,為了對合法訪問的作品或其他客體進行文本和數據挖掘,可以采取復制和提取行為。”其構成要件為:
(1)行為主體:公共利益研究機構。《DSM版權指令》提案第1條將其定義為:大學、研究所或者其首要目標是開展科學研究或提供教育服務的組織。此類研究機構必須基于非營利性目的而研究或將其利潤再投資于科研活動中,或者為了完成公益項目而進行研究。⑨《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 1:(1) ‘research organisation’ means a university, a research institute or any other organisation the primary goal of which is to conduct scientific research or to conduct scientific research and provide educational services:(a) on a non-for-profit basis or by reinvesting all the profits in its scientific research; or(b) pursuant to a public interest mission recognised by a Member State; in such a way that the access to the results generated by the scientific research cannot be enjoyed on a preferential basis by an undertaking exercising a decisive influence upon such organisation.此項例外主要目的是為了促進科學研究,原文將科學研究、教育服務用“and”相連接。本文認為僅提供教育服務的機構不屬于這里的研究機構,因為《DSM指令》第4條已單獨針對教育服務規定了“在數字和跨境教學活動中使用作品和其他客體”的版權例外條款。
(2)行為目的:科學研究目的,包括商業性和非商業性的科學研究。歐盟在議定文本和數據挖掘時,曾提出三種方案:僅允許非商業性科學研究目的;允許非商業性和商業性科學研究目的,但限制商業性科學研究受益人的范圍;允許非商業性和商業性科學研究,不限制受益人范圍。歐盟最終優選第二種方案。
科學研究目的包括非商業性研究和商業性研究。該項例外條款的適用主體為公共利益研究機構;公共利益研究機構進行商業性研究,既可獨立完成,也可通過PPPs框架完成,但研究機構必須將商業利潤再投資于科研活動中。
(3)行為方式:“reproductions and extractions”明確研究機構的行為方式為復制和提取。但這些行為只是文本和數據挖掘的基礎階段,其后續階段還包括對復制、提取結果的轉化、處理以及分析等,這些后續階段的行為是否仍然能夠適用TDM版權例外規則?若不能適用,那么后續階段的處理、分析行為是否受到改編、匯編、翻譯等權利的限制呢?若研究機構進行復制、提取之后,并未將其結果用于TDM,那么此時能否繼續適用TDM版權例外規則?
本文認為,條文中既然僅明確復制和提取行為的合法性,那么例外規則就不能適用于TDM的后續階段。在TDM的后續階段將復制提取結果轉換成結構化的數據,再對其進行分類、比較、解析等,最終得到全新的內容,并不能體現出原有作品或數據庫的內容或者表達方式,因此TDM后續階段不涉及對作品或數據庫的演繹、匯編。研究機構只能將復制提取的結果用于TDM,若是將復制提取的結果作其它用途,就不受TDM版權例外規則的保護。
(4)行為對象:合法訪問的作品或者數據庫。此處的合法訪問包括經過權利人的授權⑩如果授權范圍已經包括對文本內容的復制,則不必適用TDM版權例外規則,若授權范圍不明確或者權利人禁止復制,才可能適用例外規則。或者訪問內容對外公開。條文否定了“有權閱讀就有權挖掘”這個命題,因為研究機構合法訪問之后就已經獲得了閱讀的權利,但仍需要通過TDM版權例外來賦予復制和提取行為合法性,就說明有權閱讀并不代表有權挖掘。
(5)限制的權利:對作品的復制權、對數據庫的全部或部分的復制權、防止對數據庫內容的全部或經定性或定量證明為實質部分進行擷取權利、新聞出版物的出版者的復制權。
(6)與合同的關系:該項例外規定是強制性例外,任何違反例外規定的合同條款都無效,在歐盟的現有版權許可市場中,版權人往往在許可合同條款中排除例外規則的適用,[11]《Proposal for a DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》,p117.而《DSM版權指令》提案一旦通過,意味著此類合同條款無效,這能夠保障TDM例外規則的有效實施。
(7)對權利人的保護:權利人可以采取必要措施,確保承載作品或其他客體的網絡和數據庫的安全性和完整性,而且權利人和研究機構可以共同協商采取最佳措施,這項規定能夠有效防止他人惡意破壞網絡或數據庫。
采用“有條件例外”模式的還有英國2014年最新版權法修改案,其增設了文本與數據分析的例外條款,在原條文“科學研究與個人學習的例外”條款之下增設了第29A條,“用于非商業性科學研究的文本與數據分析所需的復制”[12]《Copyright, Designs and Patents Act 1988》,29A Copies for text and data analysis for non-commercial research:(1) The making of a copy of a work by a person who has lawful access to the work does not infringe copyright in the work provided that—(a) the copy is made in order that a person who has lawful access to the work may carry out a computational analysis of anything recorded in the work for the sole purpose of research for a non-commercial purpose, and(b) the copy is accompanied by a sufficient acknowledgement (unless this would be impossible for reasons of practicality or otherwise).,在明確文本和數據挖掘行為合法性的同時,限制其適用條件為非商業性的科學研究。《新加坡版權法》公眾征求意見稿也規定了TDM例外規則。
比較而言,“默示許可”的成本高、對科研活動的促進作用較低,權利人仍能控制文本內容;“無條件例外”模式成本最低,版權保護力度最弱,但易導致例外規則的濫用及盜版內容泛濫,對科研活動的作用未知;“有條件例外”模式中,成本、對科研的促進及對版權的保護力度都處居中位置。
在著作權領域,作品載體不再局限于紙質文檔、光盤或CD,作品的數字化、電子化日益普遍且方興未艾。TDM技術能實現對海量數據的獲取、處理和分析,其帶來版權保護問題亟需法律調整。
(一)TDM著作權例外規則的模式選擇:基于利益平衡的分析
1.應對TDM的可選方案
結合國際最新立法與司法實踐,我國可采用以下方案:“默示許可”方案、“解釋兜底條款”及“制定TDM合理使用規則”。
默示許可是指作品使用人雖然沒有得到著作權人的明示授權,但是通過著作權人的行為可以推定著作權人不排斥他人對其作品進行利用,作為一種補償,使用人應當向著作權人支付報酬的一種著作權許可使用方式。[13]馮曉青、鄧永澤:《數字網絡環境下著作權默示許可制度研究》,載《南都學壇》2014年第5期。,較之傳統授權模式,默示許可交易成本更低、程序更簡捷,也能夠有效保護著作權。盡管如此,當著作權人真實意思與此相反時,復制和提取行為實質上是對著作權的侵犯,而著作權人一旦撤回授權,復制和提取結果就不能繼續使用。同時,依照默示許可,復制和提取者應向著作權人支付報酬,商業性研究主體和非商業性研究主體所承受的經濟壓力差異明顯。
“解釋兜底條款”體現在《著作權法》第三次修改送審稿中,其第43條第1款第(十三)項增加了“其他情形”,第2款則增加了“以前款規定的方式使用作品,不得影響作品的正常使用,也不得不合理地損害著作權人的合法利益”,即三步檢驗標準。送審稿中并未出現TDM例外條款,因此,可根據三步檢驗標準,對兜底條款進行解釋。雖然解釋兜底條款具有一定的靈活性,卻增加了不確定性,在認定TDM是否侵權時,缺乏明確統一的標準,導致司法實踐不統一,不利于著作權的保護。
制定“TDM合理使用規則”路徑則沿襲了我國著作權限制條款的立法模式,在賦予TDM合法性的同時,嚴格限制其適用條件,如主體、目的等。適當的例外規則能夠實現TDM的確定性,防止例外規則的濫用;既不會過度損害著作權,也能促進科學研究,充分考慮了權利人和科研機構、著作權人和社會公眾之間的利益平衡。
2. TDM著作權例外規則的利益平衡
TDM例外規則是利益平衡原則的體現,在權利人與研究機構之間、私人利益和社會公益之間形成新的利益平衡點。在著作權人和科研機構之間,既要保護著作權人的正當權益,也要賦予科研機構利用TDM技術對作品進行復制的合法性。因此,需要在復制權的保護范圍上打開一道缺口,而這道缺口僅針對有限的主體——即滿足特定條件的科研機構——開放,科研機構的復制行為不能給著作權人造成巨大損失,同時也要衡量其進行TDM的正當性,而衡量的標準就是社會公益。
大數據環境下,TDM技術擴大了研究機構對他人作品的復制范圍和數量,以更為便捷的方式實現了對海量數據的價值發掘,有利于推動科研創新,但此類復制仍在復制權的保護范圍之內,著作權人專有權與社會公益之間失衡。一方面,著作權是私權,在私權領域,權利人的利益是第一位的,法律不能對私權人過多限制,以免抑制作品的創作;另一方面,科學研究能夠帶來技術的進步、文化的繁榮,考慮到社會公益,保障社眾能夠接近作品,著作權人應將其權利讓渡一部分,讓渡這部分權利不至于過度減損著作權,也足以實現社會公益。
(二)TDM著作權例外規則的具體立法
1.適用主體為非營利性研究機構
考慮到權利人的利益,不應將主體范圍無限擴大;社會公益是合理使用規則確立的初衷,而商業性主體的首要目的是為了賺取利潤,因此應當將其排除在外;我國民法典的編纂工作已經啟動,民法總則將法人分為營利法人、非營利法人以及特殊法人,將非營利法人定義為:“為公益目的或者其他非營利目的成立,不向其出資人或者設立人分配所取得利潤的法人”。可以將TDM例外規則的適用主體限制為非營利性的研究機構,非營利性則援引民法總則關于非營利法人的定義。
2.限制行為方式為復制
應考慮TDM技術的特點,賦予基于TDM所實施的復制行為的合法性。利用其它手段對作品進行復制則不受例外條款的保護,而且復制的結果只能用于實現文本和數據挖掘,研究機構不能將復制的結果提供(包括但不限于轉讓、向公眾公開等方式)給其他不受例外規則保護的主體,否則構成對作品的侵權。
3.排除商業性科學研究
應考慮權利人和社會公眾的利益平衡,科研機構進行TDM的目的是為社會公益,而非賺取利潤;若允許商業性的科學研究,著作權人就相當于為商業性主體做了嫁衣,所以,應當將其行為目的限制為非商業性的科學研究。此目的將禁止非營利研究機構和商業公司合作,杜絕商業公司通過該條款搭便車的可能。
4. TDM結果可以免費對外公開
TDM結果是否可以對外公開,需要考慮兩點因素:(1)TDM結果的公開行為是否受到著作權限制。誠如上言,TDM的后續階段不涉及對著作權人作品的演繹、匯編等,其結果不能體現原作品的表達方式,因此TDM結果的公開不受著作權限制;(2)TDM結果的公開是否具備商業目的。合理使用條款只適用于非商業性的科學研究,如果研究機構最終將TDM結果作商業性使用,則不能獲得合理使用條款的保護,在TDM的復制階段,研究機構就已經構成侵權。因此,TDM結果可以免費公開,但不得作商業性用途。
5.不適用于未發表的作品
在確定行為對象時,應將未發表的作品排除在外。我國著作權取得方式為自動取得,即作者完成作品的創作就享有著作權,不以發表為權利取得要件。作者未發表其作品之前,著作權處于被作者絕對控制的狀態,科研機構不得根據例外規則對此類作品進行復制。
綜上,我國著作權法應當在“權利的限制”一章中增加TDM合理使用條款,在《〈中華人民共和國著作權法〉修改草案送審稿》第43條規定增加一項,規定“TDM合理使用”條款,將原第(十三)項“其他情形”推后為第(十四)項,具體規定為:
第四十三條 在下列情況下使用作品,可以不經著作權人許可,不向其支付報酬,但應當指明作者姓名或者名稱、作品名稱、作品出處,并且不得侵犯著作權人依照本法享有的其他權利:
……
(十三)非營利性的研究機構以非商業科學研究為目的,利用文本和數據挖掘技術對他人已發表的作品進行復制,但不得將復制結果向他人提供,也不得將挖掘結果作商業用途;
(十四)其他情形。
In the era of big data, the extensive application of text and data mining technology breaks the interest balance mechanism created by copyright law, which brings challenges to the copyright law of China and calls for urgent adjustment. The United States changes the implied license to the unconditional exception rules,while the Proposal for a Directive of the European Parliament and of the Council on Copyright in the Digital Single Market proposes an obligation model to specify “the exception rules of text and data mining in the field of scientific research.” It is worthwhile to draw attention to the promotion of scientific research and the moderate copyright protection. The revision of the Copyright Law in China should formulate the rules for the rational use of text and data mining, strictly restrict the applicable conditions and reconstruct the interests balance mechanism.
big data; text and data mining; copyright exception; interest balance
唐思慧,湘潭大學公共管理學院副教授,管理學博士,碩士生導師,“法治湖南建設與區域社會治理協同創新中心”研究員