徐 軒 孫益武
(復旦大學圖書館 上海 200433)(杭州師范大學法學院 浙江 杭州 311121)
英國數據挖掘著作權例外條款研究及其啟示*
徐軒孫益武
(復旦大學圖書館上海200433)
(杭州師范大學法學院浙江杭州311121)
數據挖掘是大數據時代重要的科學研究方法。國際圖書館界十分關注數據挖掘相關法律問題的研究,呼吁通過立法而不是以許可方式保障用戶的數據挖掘權。英國新修訂的著作權法為數據挖掘提供了著作權例外,明確規定例外適用的主體、目的、形式要件及限制,涵蓋數據挖掘的完整過程,符合“三步測試法”的要求。我國圖書館界應當加強數據挖掘著作權例外的研究,關注并積極應對出版商關于數據挖掘的政策動向,并推動國際和國內的相關立法。
數據挖掘文本與數據挖掘著作權例外圖書館
對海量數據進行數據挖掘是數字環境下學習和科研創新不可或缺的部分[1]。為順應科學研究的發展規律,滿足國際著作權制度變革的需要,2014年6月英國修訂著作權法時新增了數據挖掘例外條款。本文重點探討英國關于數據挖掘的著作權例外條款,并為我國圖書館界提出若干建議。
1.1定義
數據挖掘(Text and Data Mining,簡稱TDM),又譯“文本與數據挖掘”,是“基于計算機的從文本或數據中提取、組織數據的過程。它通過大量復制素材、提取數據并重組其識別模式、趨勢和假設,或通過一定的方式重組挖掘到的信息”[2]。在計算機領域,數據挖掘與“數據庫中的知識發現(Knowledge Discovery in Database)”“機器學習(Machine Learning)”等詞義相近。本文所研究的“數據挖掘”采用較廣義的定義,即“從大量文本與數據中挖掘有趣模式和知識的過程”[3]。
1.2流程
數據挖掘主要分為4個步驟[4]:首先,進行信息檢索,收集要分析的目標信息集合;其次,識別目標信息,并將所有信息規范成機器可讀的格式以便從中提取結構化數據;第三,利用計算機技術提取有用信息;最后,進行數據分析、測試假設并確定發現新的知識。
其中,獲取、分析數據及對結果處理等步驟涉及諸多著作權問題,主要包括:(1)在進行數據挖掘時,研究人員必須以某種格式獲取信息,那么研究人員是否有權免費獲取或自由使用這些內容或數據,是否需獲得數據所有者的許可或授權呢?(2)當使用某種程序或方法進行數據分析時,是否復制了源數據庫的完整內容或核心內容?特定種類的挖掘程序或方法是否應禁止或限制?(3)對挖掘結果的處理和利用方式是否合乎法律規定?
在實際操作中,數據挖掘往往是對源數據(數據庫)的內容進行復制,同時涉及數據庫相關權利、合同法、著作權法等相關規定。英國新修訂的著作權法從著作權例外的角度,為非商業性科學研究的數據挖掘提供了例外,充分考慮了數據挖掘流程中涉及的關鍵法律問題,構建了較為完善的著作權例外體系。
近年來,與數據挖掘相關的著作權議題成為世界知識產權組織(WIPO)“關于教育、教學和研究機構以及其他殘疾人的例外與限制”及“圖書館和檔案館相關的例外與限制”兩個條約議題的討論內容,引發各利益相關方的激烈討論。其中,非洲的集團、圖書館界代表等呼吁應為數據挖掘提供著作權例外。非洲多國代表認為,“應當將通過搜索引擎、自動化知識發現工具或任何目前所掌握或今后發現的其他數字手段對任何合法獲取的受著作權保護的作品進行復制和再使用納入著作權例外的范疇;上述手段包括:存儲、歸檔、鏈接、數據挖掘程序、數據操作及虛擬科學試驗等,但須在合理的可行范圍內標明出處。”[5]國際圖書館協會和機構聯合會(IFLA)建議將數據挖掘相關內容納入數字時代圖書館相關例外與限制的國際文書,并在《關于圖書館和檔案館的著作權例外與限制的條約建議稿(4.4版本)》中為數據挖掘的著作權例外設立專門的條款,提出“如果為了分離、提取或便于使用其中所包含的事實或獨立信息,應當允許對通過圖書館或檔案館獲取的作品或鄰接權保護材料進行改編和復制”[6]。
2011年5月,英國學者伊恩·哈格里夫斯(Ia n Hargreaves)發布題為《數字機遇:知識產權與發展的反思》的研究報告,并提出:法律不應限制新技術和工具在研究尤其是非商業性研究中的使用,英國的著作權例外條款已經不能滿足社會和技術的變化;而數據挖掘是一種具有代表性的新型研究工具[7]。哈格里夫斯建議:英國政府應當為非商業性研究中的數據挖掘提供著作權例外,并在歐盟層面推動將以商業性研究為目的的數據挖掘亦納入著作權例外范疇[7]。
在此背景下,2014年6月,英國在其修訂的著作權法中新增了關于數據挖掘的著作權例外條款,對數據挖掘的主體、目的、形式等要件作出具體規范,同時明確規定構成著作權侵權的數據挖掘相關行為或情形。
英國在其2014年6月新修訂的著作權法第29款“研究、個人學習和基于非商業目的文本與數據分析”中新增了基于非商業目的數據挖掘的例外條款,該條款規定:有權獲取作品的主體開展的基于非商業性目的數據分析的復制行為,不構成著作權侵權[8]。條款對于數據挖掘著作權例外適用的主體、目的、形式及限制條件等都作出了明確規定。
3.1主體要件
數據挖掘的著作權例外的主體必須是擁有作品的“合法獲取(lawful access)”權利的主體。但條款未明確“合法獲取(lawful access)”的具體含義。查閱英國政府的說明文件可知,通常情況下,“合法獲取(lawful access)”指的是依法享有的獲取作品的權利,途徑包括訂閱圖書或期刊、購買數據庫以及遵循創作共同協議等[9]。因此,一般情況下,研究人員(或其所在的研究機構)通過與出版商簽訂購買合同,依據著作權法相關法律“合理使用”某些作品,或依據“創作共同(creative commons)”等新型許可方式合法獲取作品。
3.2目的要件
英國新修訂的著作權法規定,數據挖掘的例外適用于有獲取權的主體對作品的復制,而復制目的應同時滿足僅用于計算分析且基于單一的非商業性目的兩個要件[8]。
一方面,這一規定既明確了數據挖掘是對大數據進行分析后發現潛在有用信息的過程這一核心內容,同時將范圍限制在利用計算機開展數據處理而進行的復制。另一方面,該例外明確將其適用范圍限定在“單一的非商業性目的”內,將商業性研究中的數據挖掘行為排除在外。例如,大學(科研人員)與企業合作開展的商業性研究不屬于非商業性研究,不符合“單一的非商業性目的”的要件,因此無法適用于該例外,在開展數據挖掘時應獲得所復制的著作權作品權利人的許可。
3.3形式要件
在開展非商業性研究的數據挖掘時,研究人員需通過注明出處等方式對復制的作品表示充分的尊重。如果因可行性或其他原因無法實現時(如因為海量的數據來源無法對原作品一一進行引注),則亦不認為是違反這一形式要件。該要件強調數據挖掘者對所復制作品著作權權利人的精神權利的充分尊重,但因注明所有作品的出處等方式并不切合實際,因此可通過注明大量作品的來源數據庫等方式體現尊重。
3.4著作權例外的限制
英國著作權法在賦予著作權例外的同時,明確規定了轉讓限制、目的限制、交易限制等著作權例外的限制情形。在未取得著作權人授權或許可的情況下,如果將根據數據挖掘著作權例外條款而產生的復制件轉讓給其他任何主體(轉讓限制),或其利用復制件的目的超越了計算分析和非商業性研究這兩個目的要件(目的限制),或數據挖掘結果用于出售、出租、許諾出售或出租以及為出售或出租而進行公開披露等交易行為(交易限制),均視為對原作品的侵權。
該規定進一步明確了數據挖掘過程中可能存在的構成著作權侵權行為,防止對數據挖掘所產生的復制件及數據挖掘結果的不合理濫用,保證其范圍局限在非商業性研究范疇內,確保權利人的權益不受到侵害。
3.5與合同的關系
英國數據挖掘的著作權例外條款明確規定:任何阻止或限制本款中所指的不侵犯著作權之復制的合同條款不具有執行力[8]。該條款闡明了例外條款與合同的關系,確保條款的實施。
本條款重申尊重著作權例外的法定義務,其意義在于確保著作權相關的數據挖掘例外需要得到優先適用,尤其是在其規則與合同義務發生沖突之時。從意思自治①的角度來看,出版商(或數據庫商)和圖書館作為市場主體可能對作品的出售、許可和傳播設立相應的規則,但這種規則不應突破本條賦予的法定例外。然而,在實踐中,由于出版商、數據庫商掌握著著作權資源,往往具有較高的議價能力,在談判中處于強勢地位,雙方簽訂的資源采購協議中可能含有限制圖書館行使法定例外的條款。根據英國數據挖掘著作權例外的相關規定,出版商等內容提供者可以采取合理的措施以保持網絡的安全性和穩定性,前提是這些措施不應阻止或不合理地限制研究者復制其內容開展基于非商業性目的數據挖掘的行為。限制研究者對其合法獲取的文本和材料進行復制以開展非商業性數據挖掘的合同條款應視為無效。
“三步測試法”是目前國際法領域被廣泛承認和援引的判定著作權例外合法性的通用法則。其基本內容由《與貿易有關的知識產權協定》(以下簡稱TRIPS協定)第13條規定,而《世界知識產權組織版權條約》(WCT)第1條的議定聲明將其運用范圍拓展至數字環境[10],并在歐共體訴美國版權法110(5)節違反TRIPS協定的WTO爭端(以下簡稱美國版權法WTO爭端案)中得到運用和確認[11]。“三步測試法”基本內容是,合法設定的著作權例外應當符合以下三個條件:(1)應局限在特定的特殊情形( certain special cases);(2)不與作品的正常使用(normal exploitation)相沖突;(3)不得不合理地損害權利人的正當利益。筆者從“三步測試法”的角度分析英國數據挖掘著作權例外條款制度設計的合法性。
4.1特定的特殊情形
“三步測試法”的第一步是著作權例外應局限于“特定的特殊情形”,美國版權法WTO爭端案的專家組認為,這一標準的內涵包括:一是例外應被明確限定,二是例外應被局限在狹窄的范圍之內[12]。
英國著作權數據挖掘的例外條款對例外的主體要件、目的要件和形式要件作出了清晰界定,且將例外局限在對作品有合法獲取權利的主體所開展的非商業性研究的范圍內,排除了商業性的數據挖掘行為,符合“特定的特殊情形”的兩層內涵。
4.2不與作品的正常使用相沖突
“三步測試法”的第二步是例外應不與作品的正常使用相沖突。其核心是明確“什么是正常使用”和“什么是不與作品的正常使用相沖突”。美國版權法WTO爭端案專家組認為,通常情況下“使用(exploitation)”指的是“為自利的目的而使用”,“正常使用”應被理解為“類型化或標準化的、規則的、典型的、普通的”的利用方式,包含經驗因素和規范因素[12],且應同時考慮這兩種因素。因此,例外賦予的使用行為必然對著作權保護范圍產生某種程度的減損,但是如果這種減損構成對著作權人全部專有權的完全使用,則應認定為與作品的正常使用相沖突[12]。
英國著作權數據挖掘的例外條款設立了例外的限制,明確規定轉讓行為、超越目的行為、交易行為等與“與作品的正常使用相沖突”而被認定為不適用于該例外的行為,再次明確“基于單一的非商業性目的”等要件,對可能出現的與作品的正常使用相沖突的行為進行預防性規范,防止第三人濫用例外規則同權利人產生經濟性競爭[12],保障著作權權利人的利益。
4.3不得不合理地損害權利人的正當利益
由于任何例外都在事實上不可避免地對權利人利益產生某種程度的減損,因此,“三步測試法”的第三步“不得不合理地損害權利人的正當利益(legitimate interests)”的核心是確認這種損害是否在合理范圍內。美國版權法WTO爭端案專家組認為,權利人擁有經濟性權利和精神權利等非經濟性權利[12]。從實際操作的角度考慮,雖然正當利益不限于經濟價值,但是考察權利人享有的專有權的經濟價值仍然是衡量合理利益的保守方法。如果著作權例外造成或可能造成權利人收入的不合理損失,那么對權利人正當利益的損害就達到不合理的程度[12]。
一方面,英國數據挖掘的著作權例外條款僅限于單一的非商業性復制行為且同時規定應該對作品來源進行充分可能的標注;另一方面,規定例外條款不適用于數據復制之后的出售、出租、許諾出售、出租或為了出售或出租而進行的披露行為,從制度上最大程度地保護權利人的經濟利益和精神權利,確保著作權例外造成權利人收入的損失控制在合理范圍之內。
5.1認識數據挖掘對圖書館的重要意義,加強研究相關法律問題。
大數據背景下,數據挖掘已成為我國圖書館學和業界重要的研究方法和工作內容。網絡和網絡計量的研究日益成為圖書館學分支文獻計量學的研究前沿[13],即利用各種軟件、程序對圖書館學專業領域涉及的各種海量數據進行分析和處理,并總結出新的規律。實際工作中,圖書館員對各類數據(如文獻利用數據、讀者服務數據及學術產出數據等)進行分析和處理,發現潛在的新知識,為機構和政府提供決策支持,成為圖書館事業發展的新領域。
數據挖掘及相關技術在我國許多學科的研究中被普遍應用。為了更好地支持科研創新,促進知識產權保護和信息共享與利用的平衡,減少數據利用過程中的侵權風險,圖書館作為支持學科發展和科研創新的重要機構應當重視數據挖掘法律問題的研究。
我國圖書館界應對以下課題開展研究:(1)圖書館學及業界開展的數據挖掘可能存在的法律風險分析;(2)科研工作者開展的數據挖掘的內容來源、性質和結果處理方式;(3)數據庫的權利保護與數據挖掘的著作權風險以及防范機制等。
5.2關注出版商調整數據挖掘政策的動向,積極爭取使用資源的合理權利。
圖書館訂購的文獻資源,尤其是電子數據庫,是數據挖掘的重要數據來源。2014年2月,出版商愛思唯爾(Elsevier)更新數據挖掘政策,允許研究人員在開展非商業性研究時對已訂購資源進行數據挖掘,同時需通過愛思唯爾提供的在線應用程序接口(Application Programming Interface,簡稱API)批量下載機器可讀的可擴展標記語言(XML)格式文獻[14]。數據挖掘的結果可以在“署名和非商業性使用(CC-BY-NC)”許可模式[15]下進行非商業性利用。愛思唯爾已將數據挖掘相關內容納入或更新至相應數據庫采購合同。歐洲研究圖書館協會(Association of European Research Libraries,簡稱LIBER)認為,愛思唯爾關于數據挖掘的政策可能會限制研究者可以使用的工具、數據挖掘的方法,以及影響研究結果的透明性和再現性,最終可能對圖書館事業的發展和科研創新產生負面影響[16]。
對于出版商的數據挖掘政策,圖書館界應當保持關注,積極應對,對數據庫采購中所涉及的權利和例外規則進行合法性分析,從圖書館的角度通過與數據庫商的談判,積極爭取非商業性機構合理使用電子資源的權利,防止許可合同中不斷增加的限制條款侵蝕圖書館的管理空間和研究者的科研自由,為圖書館的發展和科研進步爭取更好的法律保障環境。
5.3完善數據挖掘著作權例外的國內立法,推動相關議題的國際協調。
我國《著作權法》第三次修訂草案送審稿重新定義了復制權,即復制權是以印刷、復印、錄制、翻拍及數字化等方式將作品固定在有形載體上的權利;并將“數字化”納入了復制權的范疇[17]。然而,其中“數字化”的概念存在一定的模糊性,數據挖掘中涉及的復制是否可以納入“數字化”范疇尚未明確,使得我國未來的《著作權法》可能仍然無法回答數據挖掘等數據分析的法律屬性,存在一定滯后性。我國《著作權法》第三次修訂應充分考慮新技術將對科學研究和個人學習產生的重要影響,將數據挖掘相關的合理使用規則納入考慮范圍。
我國有必要借鑒英國的相關做法,在時機成熟時將有權獲取的主體開展的非商業性研究的數據挖掘行為納入復制權的合理使用范疇。借鑒英國的立法模式,兼顧“三步測試法”的要求,全面考慮相關著作權或數據庫保護的例外規則對利益相關方的影響,從數據的獲取、利用和結果處理等各環節,建立健全著作權限制與例外條款。
在世界知識產權組織的舞臺上,我國圖書館界應積極推動關于“圖書館、教育和科研”的著作權例外的國際文書的談判和締結,將數據挖掘等新技術因素納入數字環境下國際著作權體系革新的框架,將非商業性科研目的的數據挖掘相關內容納入著作權例外的范疇。
綜上,完善國內立法,推動國際協調,將有助于數字時代圖書館提高信息服務能力、充分發揮職能,推動公共資源的有效利用,促進科研創新,構建數字環境下的平衡的著作權法體系。
注釋:
①意思自治是指當事人依法享有自愿訂立合同的權利,任何單位個人不得非法干預。
[1]IFLA. IFLA Statement on Text and Data Mining [EB/OL].[2015-03-06]. http://www.ifla.org/files/assets/clm/statements/ iflastatement_on_text_and_data_mining.pdf.
[2]UK Government. Text Mining and Data Analytics in Call for Evidence Responses [EB/OL]. [2015-03-06]. http://webarchive. nationalarchives.gov.uk/20140603093549/http://www.ipo.gov. uk/ipreview-doc-t.pdf.
[3]Han Jiawei, Kamber M.數據挖掘:概念與技術 [M]. 范明,孟小峰, 譯. 北京:機械工業出版社, 2012:4.
[4]Joint Information Systems Committee. The Value and Benefits of Text Mining [EB/OL]. [2015-03-06]. http://www.jisc.ac.uk/sites/ default/files/value-text-mining.pdf.
[5]WIPO. Provisional Working Document Towards an Appropriate International Legal Instrument (in Whatever Form) on Limitations and Exceptions for Educational, Teaching and Research Institutions and Persons with other Disabilities Containing Comments and Textual Suggestions [EB/OL].[2015-03-07].http://www.wipo.int/edocs/ mdocs/copyright/en/sccr_27/sccr_27 _ref_sccr_26_4_prov.pdf.
[6]IFLA,ICA,EIEL&INNOVARTE. Treaty Proposal on Copyright Limitations and Exceptions for Libraries and Archives (Version 4.4)[EB/OL].[2015-03-07]. http://www.ifla.org/files/ assets/hq/ topics/exceptions-limitations/tlib_v4_4.pdf.
[7]Hargreaves I. Digital Opportunity: A Review of Intellectual Property and Growth [EB/OL].[2015-03-07].https://www.gov. uk/government/uploads/system/uploads/attachment_data/file/ 32563/ipreview-finalreport.pdf.
[8]British Council. The Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulations 2014 [EB/OL]. [2015-03-08]. http://www.legislation.gov.uk/uksi/ 2014/1372/regulation/3/made#regulation-3-1-a.
[9]UK Intellectual Property Office. Exceptions to Copyright:Research [EB/OL]. [2015-03-08]. https://www.gov.uk/ government/uploads/system/uploads/attachment_data/file/ 375954/Research.pdf.
[10]WIPO. Agreed Statements Concerning the WIPO Copyright Treaty [EB/OL].[2015-03-08]. http://www.wipo.int/treaties/en/ text.jsp?file_id=295456.
[11]朱理. 后TRIPS 時代版權限制和例外的國際標準:WTO 專家組首例版權爭端裁決之下的三步測試法及其未來[J].知識產權,2006(1):74-80.
[12]United States — Section 110(5) of US Copyright Act (Complainant: European Communities)Panel Decision[EB/OL]. [2015-04-28]. https://www.wto.org/english/tratop_e/dispu_e/ cases_e/ds160_e.htm.
[13]趙蓉英, 許麗敏. 文獻計量學發展演進與研究前沿的知識圖譜探析[J]. 中國圖書館學報, 2010(5):60-68.
[14]Elsevier.Elsevier Updates Text-Mining Policy to Improve Access for Researchers [EB/OL]. [2015-03-09].http://www.elsevier. com/connect/elsevier-updates-text-mining-policy-toimprove-access-for-researchers.
[15]Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)[EB/OL].[2015-03-10]. http://creativecommons.org/licenses/bync/4.0/.
[16]Association of European Research Libraries .LIBER Responds to Elsevier's Text and Data Mining Policy [EB/OL]. [2015-03-10]. http://libereurope.eu/blog/2014/03/28/liber-responds-toelseviers-text-and-data-mining-policy/.
[17]國務院法制辦公室《.中華人民共和國著作權法(修訂草案送審稿)》第13條[EB/OL]. [2015-03-09]. http://www.chinalaw.gov. cn/article/cazjgg/201406/20140600396188.shtml.
Research on UK Copyright Exceptions to Data Mining and Its Enlightenment
Data mining is an important method of scientific research in the big data era. International library community concerned about the legal issues related to data mining, and called for legislation rather than license to guarantee the users' rights of data mining. Newly-revised copyright law of UK provides copyright exceptions to data mining, stipulating the subject, purpose, formal elements and restrictions, when the exception applies, which covers the complete process of data mining, and in line with the requirements of "threestep test". Chinese library community should strengthen relative research, respond to the publishers' policy trends about data mining actively, and promote the improvement of domestic and international legislation.
Data mining; Text and data mining; Copyright exception; Library
G250
B
*本文系教育部人文社會科學研究青年基金項目“基于《馬拉喀什條約》視角的圖書館無障礙服務版權制度研究”,項目編號:14YJC870023;上海圖書館學會一般課題“研究型圖書館電子圖書閱讀推廣載體研究”,項目編號:14STX008C的研究成果之一。
徐軒女,1982年生,碩士,現工作于復旦大學圖書館,館員。
孫益武男,1982年生,博士,現工作于杭州師范大學法學院,講師。
2015-04-14 ]