【摘要】生成式人工智能機器學習所引發的著作權法爭議,本質是傳統版權產業與新興人工智能產業之間的利益分配爭議。機器學習行為類型化的技術特征以及合理使用制度步驟式的適用邏輯,決定了對該問題應當按照分類分步的思路進行處理。在前置的行為定性問題上,機器學習可分為非表達型和表達型兩類,前者屬于非作品性使用無侵權責任;后者因屬于作品性使用而落入著作權專有權利控制范疇,存在侵權使用與合理使用之分。在后續的規則設置問題上,基于經濟分析路徑,非商業性目的的機器學習符合“三步檢驗法”標準,屬于合理使用范疇;商業性目的的機器學習雖不滿足合理使用條件,但仍能通過產業主體間私人自治的版權規則構建實現合法化轉型。
【關鍵詞】生成式人工智能 機器學習 作品性使用 合理使用 法定許可
【中圖分類號】G230 【文獻標識碼】A 【文章編號】1003-6687(2024)11-096-09
【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.11.013
以ChatGPT為代表的生成式人工智能的誕生,不僅預示著一場新的智力革命的到來,更因其所展現的巨大應用潛力而被視作推動第四次信息科技革命的“技術奇點”。生成式人工智能以數據、算法和算力作為核心要素,依賴于以數據挖掘分析技術為底色的機器學習,通過數據投喂進行模型訓練進而實現算法升級和技術躍遷。海量數據輸入下的機器學習模型訓練,使得生成式人工智能在事實上具備系統科學領域所定義的“涌現能力”。①然而,機器在學習過程中被“喂養”的除了源于公有領域的數據資源外,還不可避免地大規模涉及受著作權法保護的作品內容。這導致生成式人工智能在帶來廣闊產業發展前景的同時,也引發了有關著作權合法性的擔憂。2023年7月,超15000名美國作家協會會員聯合發布署名公開信,要求OpenAI等人工智能公司不得未經許可利用作品進行A780fbc7c077d3bba247c54ff42696c7aI模型訓練,并且還應當對之前的作品使用行為進行財產性補償。[1]2024年3月,由于未經新聞出版機構許可使用受著作權保護的內容訓練聊天機器人,谷歌被法國市場監管機構處以2.5億歐元罰款,成為全球首家因訓練數據而受到處罰的人工智能公司,對此谷歌稱監管機構并未充分考慮當前人工智能開發商摸索新路的艱難處境。[2]在我國,以被喻為全球AIGC平臺侵權第一案的“奧特曼案”為代表,審理法院認定未經許可利用作品進行人工智能模型訓練并提供生成式服務的行為構成著作權侵權。①
技術的變革本身雖蘊含生機與希望,但同時也充斥著風險與挑戰。[3]生成式人工智能一方面因具有重要經濟意義和創新價值而廣受青睞,另一方面卻因如影隨形的復雜著作權問題而沖擊著現有法律秩序。可以說,生成式人工智能的出現不僅是一次重大的科技革命,更引領著一場深刻的社會變革。對于這樣一個新興事物所引發的著作權問題,應警惕避免陷入技術治理上的“科林格里奇困境”。[4]既不應在技術發展的早期階段就過早地實施控制,以致阻礙技術生產力的進一步發展;也不應等到技術已經深度融入整個經濟社會結構后才施加干預,導致治理成本大幅提升乃至所產生的負面效應已無法消除。機器學習是生成式人工智能的關鍵技術,對于機器學習過程中使用作品所導致的著作權法爭議,在因應路徑上須以對技術運行原理的拆解為前提,同時結合著作權制度的適用邏輯,厘清究竟何種情形下的機器學習作品使用行為與既有規范存在合法性沖突,在此基礎上探求如何調整和構建相應的版權規則,以更好地解決爭議,從而有效化解人工智能時代技術發展與合規需求之間的矛盾。
一、機器學習著作權法爭議的檢視與解構
生成式人工智能作為新質生產力的典型代表,其所引發的高關注度使得當前有關機器學習著作權問題的討論進入白熱化。已有研究雖然從多個角度對該問題進行了不同闡釋,但囿于理論層面共識的缺乏以及制度層面規則的缺失,致使相關爭議仍存在很大不確定性。鑒于此,有必要回歸對于機器學習著作權法爭議本身的檢視與反思,從中梳理出爭議背后的實質焦點并加以解構,從而為后續研究錨定方向。
1. 機器學習著作權法爭議的檢視反思
當前,有關生成式人工智能機器學習行為定性及其制度安排的討論仍處于爭議之中,尚未形成共識。在理論探討上,目前主要存在以下四種觀點。其一,合理使用說。該觀點認為,鑒于人工智能技術對促進經濟發展具有重要意義,為避免因海量侵權糾紛引發技術治理上的過度控制,導致人工智能產業發展受到“寒蟬效應”的影響而遭遇阻滯,有必要將機器學習納入著作權合理使用范圍以使之實現合法化轉型。[5]在相應的學理分析上,該觀點主要基于“轉換性使用”理論,主張機器學習作品使用行為所指向的并非作品的獨創性表達部分,也不以再現作品的文學藝術科學價值為目的,屬于在功能或目的上具備轉換性的“非表達性使用”,足以構成合理使用。[6]其二,法定許可說。該觀點同樣主張機器學習作品使用行為具有經濟意義上的正當性,但認為相較于合理使用制度對技術進步的傾斜保護,法定許可制度能夠在有效解決機器學習著作權問題的同時,更好地兼顧權利保護與技術發展之間的平衡,故可考慮將機器學習納入法定許可范疇以實現合法化轉型。[7]其三,許可使用說。該觀點認為,機器學習作品使用行為不僅會影響作品的正常利用,還會導致著作權人一直以來通過許可轉讓獲取收益的商業邏輯陷入失靈,致使內容生產端因喪失經濟激勵而走向枯竭。故從保障著作權人利益的角度出發,不應將機器學習納入合理使用或法定許可范疇,而須沿襲“先許可后使用”的傳統模式,否則即構成侵權。[8]其四,排除控制說。不同于前述諸觀點,該觀點主張機器學習對作品的利用屬于著作權控制之外的行為,并不會對著作權人利益造成削弱。應當將機器學習作品使用行為從著作權專有權利控制范疇中予以排除,無須適用著作權制度進行“先進后出”式的分析來為之抗辯,從而迎合人工智能的發展。[9]
縱觀當前對于生成式人工智能機器學習著作權問題的探討,大多圍繞產業主體間的利益博弈展開,基于促進人工智能產業發展或維護傳統版權產業利益的不同考量,通過理論及現實層面的正當性證成,尋求與既有制度的適配。但這一論述邏輯僅僅是對機器學習著作權問題的一種直觀反映和機械分析,一方面在技術層面上忽略了對機器學習使用作品的技術過程還原,另一方面在制度層面上缺乏對版權規則適用理念的剖析。正因如此,實踐中有關機器學習著作權問題的諸多討論,才會陷入執著于對現有著作權制度進行改造或重構,試圖以此將機器學習完全納入既有制度框架從而一勞永逸地解決問題的誤區。這種“一刀切”的做法,不僅無法有效回應和兼顧不同產業主體的利益訴求,更無益于化解機器學習著作權法爭議上的僵局。
2. 機器學習著作權法爭議的本質解構
世界銀行2023年發布的生成式人工智能報告顯示,全球生成式人工智能產業市場預計將于2026年達到65億美元,然而傳統版權產業不僅未能從中分得相應的利益,其原有市場還因此受到強烈擠占和沖擊。[10]可見,生成式人工智能機器學習的著作權法爭議,本質上是傳統版權產業與新興人工智能產業之間的利益分配爭議,其直接影響到后者當前發展模式的合法性以及未來發展生態的塑造。對于這樣一個涉及經濟、政治、科技等諸多方面的復雜問題,若是僅以全有或全無的兩極化態度來簡單對待,不加區分地認定所有機器學習行為都構成或不構成著作權侵權,進而判定都適用或不適用合理使用規則,很可能造成爭議的進一步加劇。
應當認識到,在技術層面上,目前實踐中已經發展出多種類多形態的生成式人工智能,不同的機器學習類型對于作品使用行為的差異,表現在從工作機制到運行結果的各個方面;在法律層面上,合理使用規則的適用前提在于存在落入著作權專有權利控制范疇的侵權使用行為,這是探討是否構成合理使用的重要基礎,作品使用行為若不構成侵權自然也就無須設置相應的合理使用規則。[11]因此,機器學習行為類型化的技術特征以及合理使用規則遞進式的適用邏輯,決定了對該問題的回答應分解為兩項子問題,按照“兩步走”的方式進行階梯式處理。具體而言,首先是前置的行為定性問題,即是否所有類型的機器學習行為都落入著作權專有權利控制范疇涉嫌侵權,這決定了是否存在進一步適用合理使用規則的前提與必要;其次是后續的規則設置問題,即是否所有落入著作權專有權利控制范疇涉嫌侵權的機器學習行為都滿足合理使用規則的適用條件,這決定了其最終能否實現合法化轉型。遵循這一分類分步的思路,對上述兩個問題依次展開論述,以在有效維持產業主體間利益平衡的基礎上,科學合理地應對生成式人工智能機器學習所引發的著作權法爭議。
二、前置問題:機器學習行為的著作權法定性
生成式人工智能機器學習著作權問題的妥善解決,首先有賴于準確界定機器學習過程中使用作品行為的法律性質。實踐中是否所有類型的機器學習行為都必然落入著作權專有權利控制范疇涉嫌侵權,對這一前置性問題的回答將直接決定后續版權規則設置的走向。解決這一問題也就意味著明確是否有必要通過合理使用規則的適用來完成機器學習行為的合法化轉型。
1. 機器學習行為定性的分析基礎:“作品性使用”概念的引入
機器學習依托數據“喂養”開展模型訓練,其使用的海量數據既包括處于公有領域的資源素材,也包含受著作權保護的作品內容。對已經進入公有領域的資源素材的使用不會受到著作權法的限制,而對于版權作品的使用是否將導致所有類型的機器學習行為都落入著作權專有權利控制范疇構成侵權,對這一問題的判斷關鍵在于準確認定機器學習對于作品的不同使用方式,是否都屬于著作權法意義上的使用。換言之,只有當機器學習作品使用行為屬于著作權法意義上的使用,此時該行為才可能因涉嫌侵權而具有進一步討論是否滿足合理使用標準的必要,否則便不存在侵權爭議,即在機器學習過程中能夠自由地使用作品。
有學者通過借鑒商標法領域內商標性使用和非商標性使用的劃分理念,將著作權法領域中的使用行為區分為作品性使用和非作品性使用,并指出只有在作品性使用情形下才存在討論構成侵權使用抑或合理使用的必要。[12]在商標法語境下,商標性使用是指對于商標識別來源功能的利用行為。反之,描述性使用等非基于商標識別來源功能的使用行為則是非商標性使用,此時由于不構成商標法意義上的使用,故也就不存在進一步分析是否構成合理使用的侵權前提。[13]同理,在著作權法范疇中,作品性使用是指對作品進行著作權法意義上的使用,即通過利用作品中的獨創性表達以再現其文學藝術科學價值。非作品性使用則是一種技術性使用,是指將作品作為一種工具進行功能性利用,以便獲得其中不受著作權保護的事實性信息等相關要素。[14]而作品中的獨創性表達部分并未被使用,其文學藝術科學價值也不會得到再現。由于非作品性使用并不屬于著作權法意義上的使用,相應的也就不存在落入著作權專有權利控制范疇進而涉嫌侵權的可能,此時合理使用規則也因適用前提的缺失而不再有出場的必要。基于該思路,可將“作品性使用”這一概念運用至人工智能領域,用以分析機器學習使用作品行為的著作權法定性問題。
2. 類型化視角下機器學習行為定性分析
生成式人工智能機器學習在技術流程上以數據輸入環節為開端,以針對學習資料的提取分析環節為核心,但最終是否存在內容輸出環節則因具體類型的不同有所差異。基于機器學習的這一工作特征,可以依據有無表達性內容的輸出將其劃分為非表達型機器學習與表達型機器學習,進而對不同機器學習行為的著作權法定性進行類型化分析。[15]
非表達型機器學習即無表達性內容輸出的機器學習類型。其目的通常在于提取分析作品中不受著作權保護的事實性信息,實際上只是將作品當作其模型訓練的工具加以利用,屬于系統運行過程中不具有著作權法意義的非作品性使用,因不觸及作品中的獨創性表達而不存在落入著作權專有權利控制范疇構成侵權的可能。實踐中許多生成式人工智能機器學習都屬于該類型,譬如目前廣泛應用的人臉自動識別系統。人臉自動識別系統通過大量收集新聞報道中含有人物形象的拍攝圖片,從中提取人臉要素作為數據資料進行算法訓練。新聞圖片通常都享有著作權,但由于此類非表達型機器學習僅僅提取其中的人類面部生理特征這一不受著作權保護的事實性信息,而非為了利用具有創造性的內容表達以輸出并再現其藝術價值,不會影響作品的正常利用及形成替代性競爭,故該作品使用行為屬于不具有著作權法意義的非作品性使用,能夠自由使用作品而不涉及著作權侵權。應當意識到,不同于傳統物權所具有的絕對排他性,功能主義視角下的著作權并非禁絕所有接觸和使用作品行為的專有權利,而是意在控制針對作品獨創性表達部分的相關利用行為。[16]因此,非表達型機器學習對于作品的非作品性使用并不觸及著作權專有權利,亦不構成侵權。
表達型機器學習是存在表達性內容輸出的機器學習類型,旨在吸收利用作品中具有獨創性的表達特征,進而輸出并再現作品的文學藝術科學價值,這顯然屬于著作權法意義上的作品性使用,可能因落入著作權專有權利控制范疇而存在侵權使用與合理使用之分。實踐中屬于該類型的生成式人工智能機器學習同樣常見,如微軟于2014年啟動開發的“下一個倫勃朗”(The Next Rembrandt)項目,通過將畫家倫勃朗的畫作作為學習資料進行模型訓練,創作出仿照倫勃朗的繪畫風格但又不同于原作的新畫作。[17]該類表達型機器學習對于作者創作風格和作品內容的模仿與展現,本質上是對作為作品核心部分的作者個性化表達的使用,明顯屬于著作權法意義上的作品性使用行為,可能對原作的著作權在市場上產生競爭乃至替代效果。當然,倫勃朗早在1669年逝世,其畫作也因早已進入公有領域而能夠被自由使用,故不會存在侵權爭議。但倘若該類表達型機器學習所使用的是其他仍處于著作權保護期限內的作品,那么就可能因此落入著作權專有權利控制范疇,繼而存在構成侵權使用或合理使用的判斷空間。
可見,關于生成式人工智能機器學習的著作權法定性問題不可一概而論,并非所有類型的機器學習行為都可能落入著作權專有權利控制范疇構成侵權,應當根據機器學習使用作品的不同方式,以及是否存在表達型內容的輸出進行類型化分析。具體而言,非表達型機器學習由于對作品的非作品性使用行為不具有著作權法意義,故不構成侵權,也不會引起爭議。而表達型機器學習則涉及對作品獨創性表達的利用與再現,屬于著作權法意義上的作品性使用,因此落入著作權專有權利控制范疇,有待進一步判斷究竟是侵權使用,抑或是合理使用。因此,生成式人工智能機器學習的著作權法爭議,實際上圍繞基于作品性使用的表達型機器學習而展開。同樣,后續關于機器學習行為的版權規則設置問題的討論,亦應該以該類型機器學習為中心。
三、后續問題:機器學習行為的版權規則設置
如前所述,在所有的機器學習類型中,只有表達型機器學習因屬于作品性使用而落入著作權專有權利控制范疇。然而是否所有的表達型機器學習均能夠納入合理使用范疇,該問題將最終決定其究竟是侵權使用,還是因滿足合理使用條件而具備行為合法性,無須承擔侵權責任。合理使用規則不是現代科技的對立物,現代科技也不是合理使用規則的“掘墓人”。[18]對于機器學習行為的版權規則設置,應當在嚴格遵循合理使用規則適用邏輯的基礎上作出相應判斷。
1. 機器學習適用合理使用規則的梯度分析
我國現行著作權法對于合理使用規則適用標準的建構,遵循《伯爾尼公約》的“三步檢驗法”,①即應當符合特定且特殊情形、不得影響原作品的正常使用、不得不合理地損害原作品著作權人的合法權益。針對機器學習行為是否適用合理使用規則的判斷,也應按照該標準逐步展開階梯式分析。
(1)關于第一步,是否“符合特定且特殊情形”,即行為在目的或范圍上是否具有可預見性與合目的性。[19]具體到本土法源,應按照《中華人民共和國著作權法》(以下簡稱《著作權法》)合理使用制度的列舉式規定,判斷相關行為能否納入某種合理使用法定情形當中。在2010年修正后的《著作權法》所列舉的十二種合理使用法定情形中,機器學習行為表面上看似滿足個人學習研究或教學科研兩類合理使用情形的要求,實則卻缺少納入的解釋空間。原因在于,在兩類合理使用情形的主體限制性要件上,個人學習研究情形強調個人使用,適用主體僅限于自然人而不包括法人或其他組織。但人工智能開發的系統性和復雜性所導致的巨額成本,決定了其事實上無法由個人單獨完成。教學科研情形則強調適用于高校、科研院所等科研教育公共機構,無法涵蓋具有商業性質的企業主體,這意味著作為人工智能開發重要力量的廣大企業被排除在外,顯然有悖于實際。[20]
面對該問題,目前主要有兩條解決路徑可供選擇。一是經過第三次修訂后的《著作權法》,在合理使用制度的立法模式上實現了由完全封閉向相對開放的轉變,第十三項“法律、行政法規規定的其他情形”的增設,為將機器學習行為納入合理使用范疇提供了可能。在具體操作上,可借助《中華人民共和國著作權法實施條例》修訂的契機,在其中增加關于機器學習使用作品的專門例外規定,從而完成與合理使用兜底條款的對接,使兜底條款由象征性的宣示意義轉化為真正具備司法適用上的實踐價值。[21]二是鑒于人工智能時代背景下機器學習的重要創新價值與社會意義,可考慮通過修訂《著作權法》的方式,專門增設機器學習合理使用法定情形,從而為人工智能的發展提供更加完善的制度保障。從機器學習日益成為當今信息生產過程中的基礎性技術手段這一發展趨勢來看,將其納入合理使用范圍確有必要。但需要明確的是,無論作何選擇,機器學習行為最終能否適用著作權合理使用規則,均以其是否通過“三步檢驗法”后續兩個步驟的考察為前提。
(2)關于“三步檢驗法”中的后兩步,對兩個“不得”要件,世貿組織裁決委員會在其作出的權威解釋中,采用經濟意義上的分析路徑對二者分別進行了闡述。①所謂“不得影響原作品的正常使用”,是指對于原作品的利用不得與著作權人通過行使法定權利以獲取經濟利益的市場行為相抵觸。為確保原作品著作權人行使法定權利所獲取的經濟利益能夠穩定地歸于其自身,對于原作品的利用不得與原作品著作權在市場上形成競爭乃至替代關系。[22]為了防止因合理使用制度的適用范圍變得過寬而損害著作權人的經濟利益,造成著作權法對作品創作的激勵功能被削弱,應當統籌考慮原作品著作權在市場上的既有利益和預期收益兩個方面。此外,考慮到技術發展對于作品使用方式的影響與改變,這里的正常使用在范圍上也不能一成不變,既要包括當下已有的傳統使用方式,也要涵蓋未來可能的潛在使用方式。所謂“不得不合理地損害原作品著作權人的合法權益”,是指在不違背利益平衡精神的前提下,允許對原作品的利用行為在一定合理范圍內可以對原作品著作權人的經濟利益造成適當減損。該要件的存在事實上起到了一定的緩和作用,意在確保原作品著作權人的經濟利益不會遭受過度損害的同時,盡可能地將合理范圍內的作品利用行為納入其中,從而化解著作權人與使用者之間的矛盾,以及避免造成合理使用制度的適用范圍被不當限縮。[23]關于作品使用行為對著作權人造成的利益損害是否合理的問題,可以借助比例原則進行判斷,具體包括四個方面:一是目的正當性,即所實施的行為應具有正當目的;二是手段適當性,即所采取的限制性手段應能夠促成目的的實現;三是手段必要性,即所采取的限制性手段應是所有手段中造成損害負擔最小的一種;四是損益相稱性,即實施行為所獲得的收益與造成的損害之間應保持均衡。[24]
遵循上述思路,在經濟分析視角下,對于機器學習行為是否滿足“三步檢驗法”中兩個“不得”要件的考察,有必要依據是否具有商業性目的的經濟標準進行分類判斷。首先,關于第二步“不得影響原作品的正常使用”,由于非商業性目的的機器學習主要應用于科學研究、社會治理等公共事業領域,因此并不會阻礙著作權人行使專有權利,即通過作品進行獲利,也不會與原作品在著作權市場中形成競爭或替代關系。而商業性目的的機器學習,則出于逐利動機應用于各種形式的營利活動中,所產生的獨立著作權市場利益將擠占原作品既有的著作權市場利益,與后者形成競爭或替代關系。另外還要看到,將作品作為學習資料進行算法訓練雖然不是傳統的作品使用方式,但當下迅猛發展的人工智能技術使其注定成為未來不可或缺的一種重要的作品使用方式,這也為著作權人開拓潛在的著作權市場提供了新的空間。[25]因此,無論是基于對當前還是對未來的考量,商業性目的的機器學習都會影響著作權人對作品的正常使用。
其次,關于第三步“不得不合理地損害原作品著作權人的合法權益”,按照比例原則的分析進路,一是在使用目的的正當性上,非商業性目的的機器學習往往立足于增進社會福祉之理念,廣泛應用于社會治理等公共事業方面,其公益目的具有明顯的正當性。而商業性目的的機器學習則以追求私人利益和市場競爭優勢為目的,其損害原作品著作權人合法利益的行為難謂正當。二是在目的實現手段的適當性上,根據市場失靈理論,當著作權人與使用者為達成交易所付出的成本顯著高于該筆交易所能帶來的收益時,便無法依賴市場機制促成自愿交易。[26]為維護知識產品市場的運行秩序以促進作品傳播,著作權法通過設置合理使用制度對市場交易障礙進行糾正,從而保證那些必要的或有益于社會的作品使用行為不至于因高昂的交易成本無法實施。[27]非商業性目的的機器學習可應用于公共事業領域以推動社會福利增加,其非營利特性使得著作權人往往因無法獲取相匹配的收益而選擇拒絕交易,繼而導致交易成本不斷攀升并形成交易壁壘,最終出現市場失靈。為使有益于社會的作品使用行為不因交易成本過高而無法實施,通過限制著作權人的復制權等部分專有權利,將非商業性目的的機器學習納入合理使用的做法應被看作是適當的。但就商業性目的的機器學習而言,其營利特性的存在使之不具備納入合理使用的適當性。三是在手段之于目的的必要性上,并非要絕對化地將所有類型的機器學習行為都納入合理使用范疇,而是在對機器學習行為進行類型化區分的基礎上,僅考慮在特定情形下(即僅限于非商業性目的的表達型機器學習)適用合理使用規則,從而讓著作權人盡可能承受最小權利限制和利益負擔,同時,也與合理使用制度內含非商業性使用要件的理念相契合。[28]四是在造成損害與獲得收益的相稱性上,從公益和私益的價值位階對比來看,非商業性目的的機器學習在帶來科技創新進步與社會福利增加的同時,并未過多擠占著作權人利用作品獲得收益的市場空間,對著作權人造成的較小利益減損是成比例、可接受而非不計代價的,故符合相稱性要求。而商業性目的的機器學習,在追求私人利益的同時雖然也可能在一定程度上起到了促進創新的附帶性作用,但與其對著作權人造成的市場替代和利益損害規模相比,兩者之間難以相稱。
綜上,在按照經濟分析思路對機器學習行為進行類型化區分的基礎上,依照“三步檢驗法”標準,非商業性目的的機器學習符合特定且特殊情形,既不與原作品的正常利用相抵觸,也不會不合理地損害原作品著作權人的合法權益,滿足合理使用規則的適用條件,有必要納入合理使用范疇以保障其創新價值的釋放。而商業性目的的機器學習,由于其不符合“三步檢驗法”的要求,因此不是合理使用的情形。
2. 非合理使用情形下機器學習的版權規則安排
商業性目的的機器學習雖然無法滿足“三步檢驗法”標準而不適用合理使用的規則,但多元化的版權規則框架仍為其提供了實現合法化轉型的其他可行路徑。換言之,合理使用制度的適用缺位,反倒為著作權人與人工智能開發商就非合理使用情形下機器學習行為的版權規則安排,留下了進一步探索和互動的合作空間。
作為與合理使用相并列的一項著作權限制制度,法定許可同樣對著作權人之于作品的人身權利部分予以限制,準許使用者在未經著作權人許可的情況下以特定方式利用作品,從而為作品傳播使用活動提供便利。但不同于合理使用的是,一方面法定許可表現出了對帶有商業性目的的作品使用行為的接納。也正因如此,法定許可要求使用者應當向著作權人支付報酬以實現對后者財產權利的確認和尊重。[29]另一方面法定許可還允許著作權人通過事先聲明的方式進行權利保留,從而將作品排除在適用范疇之外。這種保留選擇空間的立法安排,實際上暗含了立法者對于著作權人與使用者可以就許可條件進行協商約定的認同。[30]相較于合理使用,法定許可在消除市場流轉障礙、提升作品使用效率的同時,也保證了著作權人利益的實現,從而有效維持不同主體間的利益平衡。此外,法定許可的法律特征還表明,私人自治歷來都是一種最基礎最直接的糾紛化解渠道,具備適用上的優先性,縱使是在相關法定規則的設置中也不可或缺。可見,在面對生成式人工智能機器學習所引發的著作權法糾紛時,除了寄希望于法定規則的完善,也應重視私立規則的重要作用。對此,可考慮以法定許可作為制度藍本,構建基于產業主體間私人自治的“準法定許可”版權規則。
以利益平衡原則為核心,基于產業主體私人合作的“準法定許可”版權自治規則的構建,主要由基礎性許可規則與附加性限制規則兩部分組成。首先,關于基礎性許可規則的安排可參照著作權法定許可制度的相關規定,即生成式人工智能開發商出于機器學習訓練數據目的,可以在事先未獲得著作權人許可的情況下使用作品。如此一來,便保證了機器學習使用作品的穩定性和持續性,使人工智能開發商追求技術進步與產業發展的需求得到回應。其次,關于附加性限制規則的設置,為使著作權人利益得以實現,延續其在以往許可使用模式下獲取收益的目標,同時為尊重著作權人對作品的處置自由以及實現對人工智能開發商使用作品行為的監管,有必要針對未經許可的機器學習作品使用行為施加一定義務或限制,具體包括以下幾方面。
(1)付酬義務。著作權制度旨在合理回報人類的智力勞動,私人自治版權規則的構建亦如是。[31]遵循該設計目標,人工智能開發商未經許可使用作品進行機器學習的,應當向著作權人支付相應報酬。對于報酬的標準確定及其給付,一是可以通過強化著作權集體管理組織在其中的作用,由其在廣泛征求著作權人意見并吸納部分著作權人直接參與的基礎上,會同人工智能開發商依據市場行情協商確定付酬標準并代為給付。[32]我國目前已經形成了五大著作權集體管理組織,行業范圍覆蓋音樂、音像、文字等多個方面。著作權集體管理組織的介入,一方面能夠保障著作權人的談判地位和利益實現,降低其交易風險與監督成本;另一方面也有利于減輕人工智能開發商的搜尋成本和協商成本,從而提升其所追求的作品使用效率。當然,就當下著作權集體管理組織的傳統運行機制而言,為適應人工智能時代的發展需要,有必要在內部運行透明度、許可費用分配效率、協商促進配套機制等方面做出相應的調整與改進。[33]二是考慮到如今網絡內容平臺作為數字作品的主要生產聚集地,已經事實上成為機器學習所需優質數據資源的重要來源。故人工智能開發商還可通過與內容平臺建立合作,依托內容平臺與著作權人之間的服務協議同著作權人達成合意,按照著作權集體管理組織確定的付酬標準,在未經許可但支付報酬的情況下使用作品。
(2)披露義務。對于著作權人有關作品使用情況的知情權和監督權的保障,是決定其是否進一步主張權利保留或權利救濟,以及確保人工智能開發商依法依約使用作品的重要基礎,故有必要就機器學習的版權數據訓練情況進行公開披露。在具體要求上,可參考歐盟《人工智能法案》關于人工智能模型訓練的相關透明度義務,要求未經許可使用作品進行機器學習的人工智能開發商,應當在實際使用前的一定合理期限內,對擬使用的作品名稱及其作者、擬使用的目的及方式、擬付酬標準等詳細情況進行事先公告,以提升作品利用過程的透明性。[34]
(3)作品使用限制。為保證著作權人的作品處置自由以及尊重私人主體之間的自治空間,當著作權人作出權利保留的聲明,明確表示不得將作品用作機器學習時,人工智能開發商的作品使用行為就理應受到限制。對于作品使用限制的具體設置,可借鑒谷歌數字圖書館計劃中的“選擇退出”(Opt-out)機制并將之分為兩類。①一是事先退出,即在前述披露公告期內若著作權人表示不同意,人工智能開發商不得使用其作品進行機器學習。二是事后退出,即在披露公告期限屆滿后人工智能開發商使用作品進行機器學習但著作權人表示不同意,人工智能開發商應當立即將作品從數據庫中刪除,同時按照之前公告的付酬標準向著作權人支付使用作品期間的報酬。
另外,在責任承擔與權利救濟上,若著作權人發現人工智能開發商未經許可使用作品且未支付報酬,或是人工智能開發商未按照約定使用作品或支付報酬,可仿照“通知—刪除”規則下的處理程序,通知人工智能開發商立即將作品從數據庫中刪除并支付使用作品期間的報酬。人工智能開發商在接到通知后應當立即采取相應措施,或是選擇與著作權人進行協商達成合意,轉而進入版權自治私立規則的適用范疇。若人工智能開發商未能及時采取措施或是與著作權人達成相關合意,則著作權人有權提起訴訟,通過與法定程序的銜接來實現對自身權利的救濟以及對人工智能開發商責任的追究。
面對傳統授權使用模式的制度性失靈以及合理使用法定規則的適用性困難,基于產業主體間私人自治的“準法定許可”版權規則,為非合理使用情形下的機器學習行為提供了實現合法化轉型的可行路徑。在具體設計上,“準法定許可”版權規則以維持利益平衡為核心理念,集法定許可制度權利限制之“剛”與私人自治機制靈活適用之“柔”于一身。通過貫徹“促進加限制”的二元價值取向,既保證了機器學習技術發展對于作品使用效率的追求,又回應了著作權人為了獲得創作激勵而對作品許可利益的關切,從而有效彌合人工智能開發商與著作權人關于非合理使用情形下機器學習行為的著作權法爭議。
結語
生成式人工智能的快速勃興,正引領著一場有關信息生產和知識創造的技術革命,在進一步解放人類精神生產力的同時,也打破了以往作品利用模式下的產業利益互動格局,引發有關機器學習使用作品的著作權法爭議,沖擊與重塑著傳統著作權制度的底層邏輯。我國于2023年7月出臺的《生成式人工智能服務管理暫行辦法》中明確強調,生成式人工智能模型訓練應以對知識產權的尊重為前提。
生成式人工智能機器學習的著作權問題兼具技術和制度兩個面向,一方面技術的發展需要法律制度不斷作出調整以涵蓋出現的新問題,另一方面法律制度的協調又能夠反過來推動技術進一步發展。關于生成式人工智能機器學習的著作權法爭議,其本質是傳統版權產業與新興人工智能產業之間的利益分配分歧。解決問題的正確思路是始終秉持實現產業主體間利益平衡的基本理念,結合生成式人工智能機器學習的技術特征以及著作權相關法規制度的適用邏輯,在遵循階梯式分析進路的基礎上,對機器學習作品使用行為的不同情形作出關于著作權合法性的準確判定,據此分別設置合理版權規則,采取相應的規制舉措。唯有如此,方能在有效緩和產業主體利益沖突的基礎上,實現技術發展與權利保障之間的共贏。
參考文獻:
[1] Authors Guild. More Than 15000 Authors Sign Authors Guild Letter Calling On AI Industry Leaders to Protect Writers[EB/OL].[2023-07-18].https://authorsguild.org/news/thousands-sign-authors-guild-letter-calling-on-ai-industry-leaders-to-protect-writers/.
[2] David Meyer. Google Becomes the First AI Company To Be Fined Over Training Data[EB/OL].[2024-03-20].https://fortune.com/2024/03/20/google-250-million-euro-fine-france-news-publishers-ai-bard-gemini-training-data/.
[3] 劉少軍,聶琳峰. 數字藏品版權的功能、困境與治理[J]. 北京聯合大學學報(人文社會科學版),2023(1):51-61.
[4] David Collingridge. The Social Control of Technology[M]. New York:Palgrave Macmillan Press,1980: 11.
[5] 吳漢東. 人工智能生成作品的著作權法之問[J]. 中外法學,2020(3):653-673.
[6] Matthew Sag. The New Legal Landscape for Text Mining and Machine Learning[J]. Journal of the Copyright Society of the USA, 2019(2): 346-365.
[7] 劉友華,魏遠山. 機器學習的著作權侵權問題及其解決[J]. 華東政法大學學報,2019(2):68-79.
[8] 馬忠法,肖宇露. 論人工智能學習創作的合理使用[J]. 山東科技大學學報(社會科學版),2020(5):32-38,47.
[9] 劉曉春. 生成式人工智能數據訓練中的“非作品性使用”及其合法性證成[J]. 法學論壇,2024(3):67-78.
[10] World Bank Group. Publication: Generative Artificial Intelligence[EB/OL].[2023-07-07].https://openknowledge.worldbank.org/entities/publication/4f623641-ba34-4f0d-9a7d-105f02a5ee00.
[11] 魏遠山. 生成式人工智能訓練數據的著作權法因應:確需設置
合理使用規則嗎?[J/OL].圖書情報知識,1-11[2024-10-23].http://kns.cnki.net/kcms/detail/42.1085.G2.20240515.1112.002.html.
[12] Abraham Drassinower. What's Wrong with Copying?[M].Cambridge: Harvard Universitr2P0cOEguBNIiP+YujRMkg==y Press, 2015: 87-88.
[13] 李安. 機器學習作品的著作權法分析——非作品性使用、合理使用與侵權使用[J]. 電子知識產權,2020(6):60-70.
[14] Edward Lee. Technological Fair Use[J]. Southern California Law Review, 2010(4): 797-874.
[15] Benjamin Sobel. Artificial Intelligence's Fair Use Crisis[J]. Columbia Journal of Law & the Arts, 2017(41): 45-98.
[16] 徐小奔,楊依楠. 論人工智能深度學習中著作權的合理使用[J]. 交大法學,2019(3):32-42.
[17] Shlomit Yanisky-Ravid. Generating Rembrandt: Artificial Intelligence, Copyright, and Accountability in the 3A Era: The Human-like Authors Are Already Here: A New Model[J].Michigan State Law Review, 2017(4):659-726.
[18] 吳漢東. 著作權合理使用制度研究(第四版)[M]. 北京:中國人民大學出版社,2020:200.
[19] 張陳果. 解讀“三步檢驗法”與“合理使用”——《著作權法(修訂送審稿)》第43條研究[J]. 環球法律評論,2016(5):5-24.
[20] 張金平. 人工智能作品合理使用困境及其解決[J]. 環球法律評論,2019(3):120-132.
[21] 萬勇.人工智能時代著作權法合理使用制度的困境與出路[J]. 社會科學輯刊,2021(5):93-102.
[22] 熊琦.“視頻搬運”現象的著作權法應對[J]. 知識產權,2021(7):39-49.
[23] 熊琦. 著作權合理使用司法認定標準釋疑[J]. 法學,2018(1):182-192.
[24] 張翔. 刑法體系的合憲性調控——以“李斯特鴻溝”為視角[J]. 法學研究,2016(4):41-60.
[25] 李安. 機器學習的版權規則:歷史啟示與當代方案[J]. 環球法律評論,2023(6):97-113.
[26] Wendy J Gordon. Fair Use as Market Failure: A Structural and Economic Analysis of the Betamax Case and Its Predecessors[J].Columbia Law Review, 1982(8): 1600-1657.
[27] 劉禹. 機器利用數據行為構成著作權合理使用的經濟分析[J]. 知識產權,2024(3):107-126.
[28] 馮曉青,胡夢云. 合理使用視野下“私人復制”著作權問題研究[J]. 南都學壇,2011(6):78-86.
[29] 馮曉青. 知識產權法前沿問題研究[M]. 北京:中國政法大學出版社,2023:390.
[30] 熊琦. 著作權法定許可制度溯源與移植反思[J]. 法學,2015(5):72-81.
[31] 司曉. 奇點來臨:ChatGPT時代的著作權法走向何處——兼回應相關論點[J]. 探索與爭鳴,2023(5):79-86,178-179.
[32] 張平. 人工智能生成內容著作權合法性的制度難題及其解決路徑[J]. 法律科學(西北政法大學學報),2024(3):18-31.
[33] 張惠彬,王懷賓. 版權優先還是技術優先?——法國應對AIGC版權風險的趨勢及啟示[J]. 編輯之友,2024(5):103-112.
[34] 高雅文,來小鵬. 生成式人工智能語料版權問題研究[J]. 出版廣角,2024(5):27-34.
The Copyright Dilemma and Institutional Responses of Generative Artificial Intelligence Machine Learning
WU Jia-xu, LAI Xiao-peng(Civil, Commercial and Economic Law School, China University of Political Science and Law, Beijing 100088, China)
Abstract: The copyright law dispute caused by generative artificial intelligence machine learning is essentially a dispute over the distribution of interests between the traditional copyright industry and the emerging artificial intelligence industry. The technical characteristics of machine learning behavior typification and the applicable logic of fair use of institutional steps determine that the problem should be handled in a step-by-step approach based on proper classification. Machine learning can be divided into two categories in the qualitative problem of pre-existing behavior: non-expressive and expressive. The former belongs to non-derivative use without infringement liability; The latter falls under the exclusive control of copyright due to its belonging to derivative use, and there is a distinction between infringing use and fair use. In the subsequent rule setting issue, based on the perspective of economic analysis, non-commercial machine learning meets the "three-step test" criteria to constitute fair use. Although machine learning for commercial purposes doesn’t meet the requirements of fair use, it can still achieve legal transformation through the construction of private autonomy copyright rules among industry entities.
Key words: generative artificial intelligence; machine learning; derivative use; fair use; statutory license
(責任編輯:張君)
基金項目:科技部國家重點研究計劃項目“知識產權司法保護與跨部門協同服務關鍵技術研究”(2022YFC3303000);北京市法學會2023年市級法學研究課題“算法安全綜合治理體系建構研究”(BLS2023B010)
作者信息:吳家煦(1997— ),男,福建三明人,中國政法大學民商經濟法學院博士研究生,主要研究方向:知識產權法、數據法;來小鵬(1960— ),男,陜西西安人,中國政法大學民商經濟法學院教授、博士生導師,主要研究方向:知識產權法、數據法。
① “涌現能力”是指當人工智能模型訓練參數達到一定量級后,定量上的變化導致行為發生質變,其性能表現產生無法解釋的顯著提升,致使其突然具備語言理解、邏輯推理、生成創造等方面的強大能力。
① 參見廣州互聯網法院(2024)粵0192民初113號民事判決書。
① 《伯爾尼公約》第九條第二款規定:“本聯盟成員國法律有權允許在某些特殊情況下復制上述作品,只要這種復制不致損害作品的正常使用也不致無故危害作者的合法利益。”
① 參見Report of the WTO Panel, United States-Section 110(5) of the US Copyright Act, WT/DS160/R(June 15, 2000)。
① 參見Field v. Google Inc. 412 F. Supp. 2d 1116 (D. Nev. 2006)。