關鍵詞 人工智能 大數據 合理使用
作者簡介:楊小桐,北京外國語大學法學院在讀博士,研究方向:國際區域法律治理。
中圖分類號:D99 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ?? ? ? ? ? ?DOI:10.19387/j.cnki.1009-0592.2020.04.237
技術的巨大進步得益于對大數據流的再利用和處理,在大數據時代,尋求海量在線數據中的定位已經成為一項極其復雜而又至關重要的任務。人工智能和數據利用結合的最優體現即是文本和數據挖掘技術的應用。然而之前歐盟版權制度對文本和數據挖掘行為所造成的侵權行為規制過于嚴厲,同時對作品的跨境獲取予以限制。這樣的方式既不經濟也不現實,甚至還會阻礙該項技術和相關產業的發展。本文從文本和數據挖掘技術概念出發,以技術本身操作過程中對大量受著作權法保護客體的復制、利用行為產生的問題為切入點,探究歐盟在面對技術應用過程中的立法回應,以此分析我國在面對新一輪技術革命引發的市場競爭中應建立的制度保障。
數據和本文挖掘技術(text and data mining,以下簡稱TDM)是一種通過自動化軟件工具從大量的數字數據中收集信息的研究技術。其具體是指機器從閱讀材料中獲取信息的過程,工作原理包含復制大量的材料,提取數據,然后重新組合供給識別等流程。歐盟在2019年3月正式通過歐盟《數字化單一市場版權指令》(以下簡稱《版權指令》)TDM例外條款,目的在于使受保護的作品跨境獲取更為便利,以此促進學術研究順利進行,達到激勵創新的目的,以此釋放文本和數據挖掘潛力。
《版權指令》第3條中將數據和文本挖掘定義為任何旨在分析數字形式的文本和數據的自動分析技術,以便生成包括但不限于模型、趨勢、相關性等在內的信息。TDM過程分為四個階段。首先,確定潛在的相關文檔;其次,將文檔轉換成機器可讀形式,以提取數據;再次,提取有用的信息;最后,挖掘以發現新知識、測試假設和識別新關系。它包括通過復制大量的材料來提取數據,并重新組合以最終輸出新的模式。因此,其概念所指過程必然涉及與利用知識產權法特別是著作權法所保護客體的權利相沖突的問題。
TDM過程分為四個階段。首先,確定潛在的相關文檔;其次,將文檔轉換成機器可讀形式,以提取數據;再次,提取有用的信息;最后,挖掘以發現新知識、測試假設和識別新關系。它包括通過復制大量的材料來提取數據,并重新組合以最終輸出新的模式。因此,其概念所指過程必然涉及與利用知識產權法特別是著作權法所保護客體的權利相沖突的問題。
數據挖掘問題的實質是代表科技進步的公共利益與舊著作權法保護下著作權人的私人利益之間的沖突。TDM的四個過程主要涉及對著作權人復制權的侵犯。文本和數據挖掘如果僅針對不受版權保護的事實或數據則無需授權。但是TDM復制受保護作品的行為勢必造成侵權,即如果將材料標準化成機器可讀格式的預處理就可能侵犯復制權。根據所依據的挖掘軟件和提取技術特征,挖掘行為(即TDM過程中提取數據的階段)也可能侵犯復制權。如有些提取技術可以將作品的某些部分以最小程度的范圍進行復制,從而低于侵犯版權的閾值而避免侵權,如果高于其界值則必然構成對復制權的侵犯。
(一)美國
與歐盟法律實踐相比,美國的版權制度被認為更有利于TD M運用,根據美國版權法轉換性使用含義,界定合理使用需要考慮的是作品的使用是否增加了原作的價值,即如果引用的材料被用作新材料,在創造新信息、新見解和理解過程中發生了轉變。
美國通過谷歌圖書館案①真正實現TDM合法化,在谷歌圖書館案長期訴訟中,法院認為搜索引擎使新的研究形式成為可能,通過使用谷歌項目語料庫向互聯網用戶提供單詞和短語使用頻率的統計信息被認為是達到了轉換性使用的高度,以此為數據和文本挖掘技術打開了新生之門,也為美國開始商業性的數據挖掘和信息獲取開辟了全新發展道路。
(二)英國
如果考慮歐洲對TDM的監管,英國應該是第一個引入特定版權保護的國家,英國允許文本和數據分析用于非商業研究。但是,英國對TDM監管所采模式為“附條件”例外類型,即這樣的保護僅僅適用于為非商業性研究目的而對作品中記錄的任何內容復制后進行計算分析的行為,同時任何可以獲得豁免的主體在訪問作品時必須是通過合法渠道。所獲得豁免情況的受益者只要是用來復制文本和數據分析研究的工作,且是有關人員可以合法查閱的工作都不應受到任何限制。文本和數據分析中涉及的復制是技術流程的必要組成部分,因此允許挖掘進行研究不太可能對版權作品的市場或價值產生負面影響。
(一)歐盟《版權指令》對數據和文本挖掘例外規定
最新通過的歐盟《版權指令》第3條款創設了有條件的文本和數據挖掘制度,為科學研究目的,成員國應當在立法中明確允許研究機構為開展文本與數據挖掘工作所需的各種復制及數據提取活動。同時規定該類主體僅限于非商業性,具有公益性的研究機構,其獲取內容的方式必須是合法的。
(二)學理分析及評價
數據和文本挖掘的限制在歐洲學界已經進行了充分的討論。《版權指令》為跨境使用相關內容用于特定目的(如研究、教育、文本和數據挖掘等)提供更具體的規范可預期性。
1.合理性
《版權指令》第3條的引入符合歐盟利用數據發展的重要政策目標。特別是它將為歐洲各地的研究人員提供一個標準化的發揮領域,使他們能夠合法地開展TDM項目。該提案的主要積極影響在于,通過強制性解決方案協調成員國法律,特別是各成員國迄今所采用的現有TDM例外情況的不一致性表明如果不采取歐盟范圍內的立法,法律制度將極大地影響技術進步。②能否自由地在各國層面實施TDM例外規定將會影響適用TDM例外的自愿性,也會進一步影響跨境合作,甚至會面臨更高昂的跨境交易成本,因此采用指令的方式強制性地要求各國將其轉化為國內法以確定TDM在參與研究合作的所有歐盟成員國都具有合法性提供了明確的標準和依據。
2.制度不足
(1)范圍的有限性。關于這項提議的諸多討論都是TDM例外的豁免者是否不應僅限于研究機構。事實上,將未經授權的個人和按照與符合資格的研究組織中的個人排除政策選擇之外,是否在充分性方面論證存在不足,即個人在利用文本和數據技術進行深度搜索、復制和提取信息時,是否符合個人在對作品進行合理使用的獲取手段。如果從行為產生的結果看,只要用于個人學習而使用作品的行為都符合合理使用,但是其實質上忽略了獲取作品行為的違法性評價,在看待除研究機構以外的個人是否能夠利用TDM技術獲取資源時需要經過法律評價和確認,該種行為是否正當應該從其行為的外部性方面予以考量。
(2)內容的有限性。將TDM例外限制在“科學研究”范圍內可能會降低歐盟版權改革整體效率,并造成實際的復雜性。這種方法可能會引起一些微妙的問題,即新的限制在享有合法數據庫訪問權的研究機構中的適用性問題。例如,如果公立大學根據“教育目的”合法訪問數據庫,它是否需要為“科學研究”目的支付額外的許可費?然而,研究機構可能會發現諸多法律不確定性,即由于可能產生的潛在法律風險以及運行TDM研究項目前應考慮的相關交易成本從而限制TDM研究的進行。由于這種例外情況已經局限于研究機構,因此對合法訪問的數據庫的特定用途取消限制可能會避免不必要的麻煩。
(3)與技術保護措施并存。為保護網絡和數據庫的安全性和完整性而采取的措施可能會允許版權人阻止試圖進行TDM的研究人員的訪問。但是,《版權指令》序言12條指出,這些措施不應超過為實現確保系統安全和完整的目標所必須采取的措施,也不應破壞例外情況的有效適用。③值得注意的是,技術保護措施可能完全限制或阻止為不受作者權利限制的目的而存取作品的行為。此外,各國對保障適用例外情況的措施執行不一致,以及對反規避規定的技術保護措施的限制亦有不同,因此可能會實質性地限制新強制性例外情況的協調功能,從而限制《版權指令》實際效果。
目前TDM例外的規定依然存在諸多問題值得思考,特別是對TDM例外的具體改進措施。例如,例外的范圍是否應該擴大:(1)TDM例外不應該局限于研究機構,而應該擴展到所有那些享受合法訪問潛在的挖掘內容的主體,特別是初創企業和獨立研究人員。(2)對于某些主體(非研究機構或個別研究人員、記者等以外的其他主體)進行的商業用途的TDM,假如造成損害可以根據有關數據加以證明的話,可以考慮要求其支付相應的賠償金。(3)鑒于研究越來越注重質量和可被驗證性,TDM例外應該包括能夠存儲和通信為TDM創建的研究成果。
在我國現行法律體系下,科研機構文本與數據挖掘是需要經過合同的方式進行授權才屬于著作權法上的合法行為。我國在借鑒歐美等國家和地區的相關立法時,首先應該充分考量市場因素,以人工智能發展前景和市場競爭需求為主要考察對象,在市場大量運用TDM技術以獲取信息促進人工智能產業迅速發展時,我國應該放開對TDM技術以獲取相關作品的禁止性規定,允許TDM技術在數據挖掘數字化材料處理方面的應用,將其合理使用化,但是對這樣的合理使用需要進行一定條件的限制,例如限定特定的主體,此類主體不應如歐盟《版權指令》中僅限于研究機構,可以放寬至相關互聯網新型企業,或初創企業,或致力于研究的公民個人;對目的限制方面,可以由科學研究領域擴展至為公眾提供一定程度的材料的獲取,公眾在大部分程度上可以免費獲取無需支付費用,其實質是美國TDM合理使用化標準+一定程度付費標準;在技術措施層面,應該明確這些措施不應超過為實現確保系統安全和完整的目標所必須采取的措施,也即不能通過為實現安全完整目標來阻礙TDM技術的有效實施。
人工智能在未來幾年很可能成為最具顛覆性的技術,同時它確實帶來了一系列棘手的法律挑戰,特別是得益于互聯網和大數據流的機器學習技術正以難以想象的速度發展。文本和數據挖掘技術通過復制或抓取大量的數據,賦予人工智能自主決策和創造力,使機器學習成為可能。
一段時間以來,歐盟一直在爭論文本和數據挖掘技術是否應該考慮在版權和其他特殊權利的范圍內使用,或者是否應該豁免這些主體。允許TDM的強制例外是對信息技術發展的制度回應。然而,它的范圍不應過于狹窄,否則依然會抑制來自不同主體的創新。我國在面對TDM 技術發展的過程中,應該以市場為導向,以促進發展激勵創新,贏得市場為主要目標,法律在對技術進行保障的過程中可以選擇有條件的例外,但現階段條件不宜過細,亦或可以選擇合理使用模式,鼓勵研究機構與相關出版機構、作者進行合作,在接觸并使用作品的同時能夠保障作者的獲酬權,充分吸收借鑒融合美英國家和地區的立法選擇,以此促進我國機器學習和文本數據挖掘技術領域的發展。
注釋:
①Authors Guild v Google, Inc, No. 13-4829 (2d Cir. 2015), affirming Authors Guild v Google, Inc, 954 F.Supp.2d 282 (2013).
②See, for example, Copyright, Designs and Patents Act 1988, ?29A (United Kingdom); Art. 38 of the Law No. 2016-1231 for a Digital Republic added paragraph 10 to Art. L122-5 and paragraph 5 to Art. L342-3 of the Intellectual Property Code (Code de la propri閠?intellectuelle) (France); Estonian Copyright Act, Art. 19(3); and German Copyright Act, Art. 60d. See also Copyright Act, Sec. 5, Art. 47-7 (Japan).
③European Commission, Proposal for a Directive of the European Parliament and of the Council on Copyright in the Digital Single Market, COM(2016)593 final, 2016/0280, 14 September 2016, Recital 12.
參考文獻:
[1]Jiawei Han, Micheline Kamber, Jian Pei.數據挖掘:概念與技術(第3版)[M].范明,孟小峰,譯.北京:機械工程出版社,2012:7.
[2]UK Government. Supporting Document T Text Mining and Data Analytics in Call for EvidenceResponses[EB/OL].(2014-06-03)[2019-6-20].https://webarchive.nationalarchives.gov. uk/20140603125140/http://www.ipo.gov.uk/ipreview-doc-t.pdf.
[3]Diane McDonald,Ursula Kelly.The Value and Beneft of Text Mining to UK Further and Higher Education: Digital Infrastructure[M]. London: JISC,2012:26.
[4]許夢嬌.科學研究目的數據挖掘所用作品的合理使用[D].浙江:浙江大學,2018:11.
[5]唐思慧.大數據環境下文本和數據挖掘的版權例外研究——以歐盟《DSM版權指令》提案為視角[J].知識產權,2017(10):111.
[6]周玲玲.歐盟文本與數據挖掘新策解析[J].圖書館建設,2017(7):20.
[7]Brigit Schmidt and Milena Dobreva. New Avenues for Electronic Publishing in the Age of Infnite Collections and Citizen Science: Scale, Openness and Trust[M]//Thomas Margoni,Giulia Dore.Why We Need a Text and Data Mining Exception. And Christian Handke, Lucie Guibault, Joan Josep Vallb椋甀s Europe Falling Behind in Data Mining? Copyrights Impact on Data Mining in Academic Research. Amsterdam:IOS Press, 2015:120-130.