中圖分類號:DF523;D913.4 文獻標(biāo)識碼:A 文章編號:1673-8268(2025)02-0045-10
從ChatGPT到DeepSeek,隨著ChatGPT火爆全球,生成式人工智能技術(shù)不斷迭代創(chuàng)新,廣泛應(yīng)用于文本生成、圖像合成、音樂創(chuàng)作、程序代碼、工業(yè)設(shè)計等領(lǐng)域,正在成為打造新質(zhì)生產(chǎn)力的重要引擎。數(shù)據(jù)是訓(xùn)練生成式人工智能底層模型的基礎(chǔ),訓(xùn)練數(shù)據(jù)集是生成式人工智能技術(shù)應(yīng)用的基石。為實現(xiàn)高質(zhì)量的輸出,生成式人工智能的訓(xùn)練數(shù)據(jù)往往包含大量受著作權(quán)保護的作品和個人信息[1]87。在個人信息收集場景中,人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者可能由于數(shù)據(jù)收集過程的高度自動化而不能及時與數(shù)據(jù)主體進行交流,致使知情同意原則存在適用困境;也可能在獲取文本語料場景中,因未征得權(quán)利人許可復(fù)制、改編或者傳播而涉嫌侵犯他人知識產(chǎn)權(quán)[2]。傳統(tǒng)著作權(quán)法的強保護和“一對一”的授權(quán)交易模式,為生成式人工智能訓(xùn)練數(shù)據(jù)的合法使用帶來了挑戰(zhàn)。
2023年8月15日,我國《生成式人工智能服務(wù)管理暫行辦法》正式施行,明確提出實施“包容審慎”的監(jiān)管方式,要求提供和使用生成式人工智能服務(wù)應(yīng)尊重知識產(chǎn)權(quán),依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動。目前學(xué)界較多學(xué)者支持通過“合理使用”制度調(diào)整新興技術(shù)和生成式人工智能產(chǎn)業(yè)產(chǎn)生的著作權(quán)問題,但卻忽視了我國現(xiàn)有合理使用制度與人工智能產(chǎn)業(yè)需求之間的不匹配,以及制度內(nèi)容無法涵蓋新情形等問題。對此,為充分發(fā)揮訓(xùn)練數(shù)據(jù)集的基礎(chǔ)性作用,促進我國生成式人工智能產(chǎn)業(yè)的創(chuàng)新與發(fā)展,應(yīng)基于對生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的需求與挑戰(zhàn)的深人分析,探尋其合法性基礎(chǔ);進一步澄清我國“合理使用”和“法定許可”制度在訓(xùn)練數(shù)據(jù)環(huán)節(jié)的適用條件,并挖掘法定許可制度的特點與優(yōu)勢,科學(xué)設(shè)計和完善法定許可機制,以應(yīng)對訓(xùn)練數(shù)據(jù)利用作品過程中授權(quán)許可、成本與收益、市場競爭等方面的難題;進而針對產(chǎn)業(yè)發(fā)展的現(xiàn)實需要,實現(xiàn)法定許可利益平衡的制度設(shè)計初衷,優(yōu)化生成式人工智能領(lǐng)域著作權(quán)的權(quán)利限制與例外的規(guī)制框架。
一、生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的困境
人工智能創(chuàng)作以數(shù)據(jù)為基礎(chǔ)。數(shù)據(jù)的質(zhì)量在一定程度上決定人工智能創(chuàng)作成果的藝術(shù)價值[3],數(shù)據(jù)的完整性也在一定程度上決定人工智能系統(tǒng)是否有實質(zhì)性進步[4]。我國《生成式人工智能服務(wù)管理暫行辦法》第7條要求提供者應(yīng)當(dāng)對生成式人工智能產(chǎn)品的預(yù)訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)來源的合法性負(fù)責(zé)。生成式人工智能訓(xùn)練所使用的數(shù)據(jù)涉及海量的他人作品,極易引發(fā)侵權(quán)風(fēng)險,始終面臨著獲得授權(quán)許可難、授權(quán)對價高、利益競逐激烈以及易形成市場競爭壁壘等多重挑戰(zhàn)。合理使用制度雖然在推進生成式人工智能數(shù)據(jù)訓(xùn)練活動方面存在積極作用,但不可否認(rèn)的是,其在訓(xùn)練數(shù)據(jù)領(lǐng)域的實際應(yīng)用中,仍存在立法、司法和守法等層面上的適用困難。
(一)訓(xùn)練數(shù)據(jù)利用作品取得授權(quán)難
《中華人民共和國著作權(quán)法》(以下簡稱《著作權(quán)法》 ① )中并未明確規(guī)定人工智能訓(xùn)練數(shù)據(jù)利用作品的行為屬于著作權(quán)的限制與例外情形,相應(yīng)行為應(yīng)當(dāng)事先獲得著作權(quán)人的許可,否則構(gòu)成侵權(quán)②。生成式人工智能的開發(fā)和訓(xùn)練需要海量數(shù)據(jù),涉及的著作權(quán)人數(shù)量眾多,應(yīng)用的場景也各有不同。生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者很難一一獲得被利用作品著作權(quán)人的授權(quán)許可,為著作權(quán)“授權(quán)的可行性”和“授權(quán)的意義\"帶來挑戰(zhàn)。
以ChatGPT為例,盡管OpenAI并未公開 GPT-3.5語言模型數(shù)據(jù)量,但從公開數(shù)據(jù)來看,GPT-3語言模型由1750億參數(shù)訓(xùn)練而成[5]。盡管實用化后的大模型ChatGPT3.5“僅\"擁有200億參數(shù)[6],生成式人工智能系統(tǒng)的開發(fā)仍基于龐大的數(shù)據(jù)集,意味著研發(fā)者獲得法定授權(quán)的工作量巨大。同時,生成式人工智能系統(tǒng)的訓(xùn)練數(shù)據(jù)具有時效性和實時性。隨著時間的變化,數(shù)據(jù)可能發(fā)生變化,影響數(shù)據(jù)訓(xùn)練的結(jié)果。同時,數(shù)據(jù)在實踐應(yīng)用中的實時更新將對所訓(xùn)練模型能力的提高產(chǎn)生影響。如果訓(xùn)練數(shù)據(jù)對作品的利用需要在使用前與著作權(quán)人一一達成許可協(xié)議,那么確定并聯(lián)系權(quán)利人、進行許可談判、支付許可費用等程序耗費的時間成本,可能使特定領(lǐng)域數(shù)據(jù)失去時效價值。這不僅會使研發(fā)或應(yīng)用無法正常進行,也有損促進技術(shù)創(chuàng)新和文化繁榮的公共利益[7]187。
從現(xiàn)有法律規(guī)范看,生成式人工智能訓(xùn)練過程對作品的使用未被合理使用的十二種法定情形所保護,也難以進一步將其解釋為被此十二種情形所周延。其商業(yè)屬性決定了訓(xùn)練數(shù)據(jù)利用作品的行為不屬于“個人學(xué)習(xí)”“教學(xué)或科研”“公共文化機構(gòu)”使用的情形,難以直接援引“合理使用”條款作為侵權(quán)抗辯。除此之外,訓(xùn)練數(shù)據(jù)利用作品的行為不屬于《著作權(quán)法》兜底條款和《信息網(wǎng)絡(luò)傳播權(quán)保護條例》規(guī)定的相關(guān)情形[8]。而從司法層面看,在我國司法實踐的個案中,已存在法院混用“三步檢驗法”和“四要素標(biāo)準(zhǔn)\"來審查某個行為是否構(gòu)成合理使用,存在結(jié)果上的不確定性[9]。因此,合理使用制度難以為訓(xùn)練數(shù)據(jù)利用作品行為提供充分的依據(jù)。
在域外實踐中,人工智能訓(xùn)練數(shù)據(jù)利用作品行為是否符合著作權(quán)保護的例外情形,需要嚴(yán)格遵守法律的規(guī)定。在德國Kneschke訴LAION案中①,法院根據(jù)《德國版權(quán)及鄰接權(quán)法》第60d條,將“出于科學(xué)研究目的的文本和數(shù)據(jù)挖掘”例外適用于以人工智能訓(xùn)練為目的開展的文本和數(shù)據(jù)挖掘的非商業(yè)研究組織。但是,不免費提供研究成果或與任何從研究中獲益的營利性組織有關(guān)聯(lián)的組織,都可能被法院認(rèn)定為不符合著作權(quán)保護的例外條件。另外,日本于2018年修訂的《日本著作權(quán)法》增加了“柔性合理使用條款”。這使得人工智能訓(xùn)練數(shù)據(jù)利用作品的行為只有在符合使用目的、使用程度和獨創(chuàng)性表達概率要求的情況下,才存在適用\"非享受性使用作品(第30條之4)”“計算機附隨性使用(第47條之4)”“信息處理輕微利用(第47條之5)\"情形的可能性[10]。而2023年,日本政府為進一步保持其在人工智能領(lǐng)域的競爭力,公開表示未來日本的法律可能不會對人工智能訓(xùn)練中使用的數(shù)據(jù)實施著作權(quán)保護。在我國《著作權(quán)法》沒有明確規(guī)定的情況下,人工智能訓(xùn)練數(shù)據(jù)利用作品的行為需要通過明確的法律規(guī)定為行為合法性提供依據(jù),以避免司法實踐中可適用條款過于粗糙和籠統(tǒng)。
(二)訓(xùn)練數(shù)據(jù)利用作品授權(quán)成本高
任何生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者若需提前取得著作權(quán)人的許可,并覆蓋數(shù)據(jù)訓(xùn)練活動所涉的全部作品,都將耗費巨大的時間和金錢成本,因而難以確保所有訓(xùn)練數(shù)據(jù)利用作品的行為都具備合法性。
第一,生成式人工智能作品訓(xùn)練涉及的著作權(quán)人較為分散,因此識別和促成交易產(chǎn)生的成本十分高昂。而許可費用的堆積也將導(dǎo)致許可費用之和過高而難以開展商業(yè)活動[11]。第二,質(zhì)量越高、越稀缺的數(shù)據(jù),所需成本可能更高;涉及醫(yī)療、金融等可能會受到法律法規(guī)限制的特定領(lǐng)域的數(shù)據(jù),所需成本可能更高。第三,在實踐中,可能出現(xiàn)針對作品使用者或使用企業(yè)的定價歧視,作品的使用者將不一定能夠通過公平的對價利用生成式人工智能研發(fā)所需的訓(xùn)練數(shù)據(jù)。如果生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者基于私人市場議價和當(dāng)事人信息成本交換完成著作權(quán)交易[12],那么訓(xùn)練數(shù)據(jù)所需的交易成本可能因著作權(quán)人的利益考量而難以負(fù)擔(dān)。同時,針對個性化的定價,中小型的初創(chuàng)企業(yè)可能因無法負(fù)擔(dān)相關(guān)的費用,面臨著訓(xùn)練數(shù)據(jù)質(zhì)量低下、產(chǎn)品缺乏競爭力的境況,而最終被市場淘汰。2024年6月24日,Suno和Udio兩家人工智能音樂初創(chuàng)公司被訴案件引發(fā)各界熱烈討論。如果法院最終裁定該音樂公司不能免費使用主流唱片公司的作品進行訓(xùn)練,那么簽署成本高昂的許可協(xié)議可能會成為這類初創(chuàng)公司的唯一選擇。這也將使擁有最雄厚資金的公司最終占據(jù)市場優(yōu)勢地位,阻礙人工智能技術(shù)和產(chǎn)業(yè)的創(chuàng)新和發(fā)展,限制初創(chuàng)公司的市場競爭力[13]。
(三)訓(xùn)練數(shù)據(jù)利用作品利益難平衡
從被利用作品的權(quán)利人和作品使用者兩方來看,具有營利性質(zhì)的生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者,更注重經(jīng)濟成本和最終效益,而著作權(quán)人則更注重自身的合法權(quán)益是否得到維護。缺乏支持創(chuàng)新的著作權(quán)機制,過度維護或削減著作權(quán)人的權(quán)利,都將導(dǎo)致訓(xùn)練數(shù)據(jù)利用作品的活動中利益天平面臨失衡。
在新技術(shù)出現(xiàn)的情況下,技術(shù)提供者往往要求無阻礙地使用所有著作權(quán)作品,而作者對其作品的新技術(shù)使用模式也要求享有專有權(quán)[14]。生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者往往希望用更低的成本獲取更多可用的數(shù)據(jù),最大程度地實現(xiàn)時間和經(jīng)濟成本的優(yōu)化,推進產(chǎn)品或服務(wù)的創(chuàng)新發(fā)展進程。但是,被利用作品的著作權(quán)人有可能提出不同且價格偏高的付酬要求,進而阻礙訓(xùn)練數(shù)據(jù)庫的建成和系統(tǒng)的優(yōu)化。除此之外,在很多情況下,由于訓(xùn)練數(shù)據(jù)規(guī)模過于龐大,研發(fā)人員也難以分辨哪些數(shù)據(jù)已經(jīng)涉及侵權(quán),往往在事后才被動發(fā)現(xiàn)。
生成式人工智能訓(xùn)練數(shù)據(jù)環(huán)節(jié)不僅關(guān)乎系統(tǒng)的搭建和產(chǎn)業(yè)的發(fā)展,還將對生成式人工智能技術(shù)的社會可接受度產(chǎn)生重要影響。目前,針對生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的行為,一些學(xué)者主張適用“合理使用制度”方案,將其認(rèn)定為不構(gòu)成侵權(quán)的例外行為,排除《著作權(quán)法》對該行為的約束,著重強調(diào)合理使用制度在降低交易成本、避免市場失敗、避免損害重要法律價值等方面的積極作用。但是,這會使著作權(quán)人的合法權(quán)益未被兼顧,擁有質(zhì)量高、稀缺性和特定領(lǐng)域數(shù)據(jù)的主體的市場優(yōu)勢被犧牲。即便在短時期內(nèi),依靠合理使用制度能夠推進生成式人工智能數(shù)據(jù)訓(xùn)練活動的順利開展,但勢必會引發(fā)著作權(quán)人對適用合理使用制度的強烈反對,甚至?xí)拗粕鐣姭@取優(yōu)質(zhì)數(shù)據(jù)和作品的機會,激化生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者與著作權(quán)人以及社會公眾之間的矛盾。
(四)訓(xùn)練數(shù)據(jù)利用作品有競爭壁壘
生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者對訓(xùn)練數(shù)據(jù)的價值把控,著作權(quán)人對個人合法權(quán)益的最大化維護,以及社會公眾對獲取有效數(shù)據(jù)的需要,使得各方形成利益割據(jù),形成生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者和提供者內(nèi)部以及與個人之間的競爭壁壘,進而使個人與公共領(lǐng)域之間產(chǎn)生數(shù)據(jù)壁壘。
目前,生成式人工智能模型的訓(xùn)練數(shù)據(jù)主要來自網(wǎng)絡(luò)抓取的公開數(shù)據(jù),意味著作為搜索引擎入口的大型平臺有更多的機會獲取有價值的用戶數(shù)據(jù)集[15]。隨著掌握和處理相關(guān)數(shù)據(jù)的能力成為經(jīng)營者在相關(guān)市場具有市場力量的重要表現(xiàn)[16],生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者出于對關(guān)鍵數(shù)據(jù)的把控和對商業(yè)利益、數(shù)據(jù)財產(chǎn)性權(quán)益的關(guān)注,極易獲得相關(guān)領(lǐng)域“數(shù)據(jù)監(jiān)控”與“數(shù)據(jù)獨裁”的隱形權(quán)力[7]108。這將對市場內(nèi)部和外部獲取高質(zhì)量數(shù)據(jù)形成限制,使得生成式人工智能訓(xùn)練和創(chuàng)作存在新型壟斷風(fēng)險。例如,社交平臺Reddit 的聊天數(shù)據(jù)一直是生成式人工智能企業(yè)的數(shù)據(jù)訓(xùn)練素材,谷歌“Bard”的底層算法和OpenAI的ChatGPT都將Reddit平臺作為其訓(xùn)練數(shù)據(jù)來源。2023年4月,Reddit表示將向訪問其應(yīng)用程序編程接口的公司收費,不再愿意免費提供平臺數(shù)據(jù),成為首批公開要求科技巨頭付費使用數(shù)據(jù)的企業(yè)。2023年6月,Reddit進一步提出對“每5000萬次API訪問請求\"收取1.2萬美元的收費標(biāo)準(zhǔn),加劇了行業(yè)內(nèi)獲取此類企業(yè)高質(zhì)量數(shù)據(jù)的壓力和難度[17]。
二、建立生成式人工智能訓(xùn)練數(shù)據(jù)利用作品法定許可的優(yōu)勢
生成式人工智能的發(fā)展需要以大量的訓(xùn)練數(shù)據(jù)為基礎(chǔ),而訓(xùn)練數(shù)據(jù)包括受著作權(quán)保護的作品。根據(jù)現(xiàn)行《著作權(quán)法》的規(guī)定,生成式人工智能的研發(fā)者需要甄別可使用訓(xùn)練資料的范圍,并就受《著作權(quán)法》保護的作品向著作權(quán)人獲得授權(quán)。雖然,這對著作權(quán)人有利,但大大增加了機器學(xué)習(xí)的成本,阻礙生成式人工智能技術(shù)的發(fā)展與使用[18]。法定許可制度致力于調(diào)整新舊產(chǎn)業(yè)之間的利益沖突,以緩和新興技術(shù)與傳統(tǒng)制度矛盾為出發(fā)點。這更能滿足生成式人工智能訓(xùn)練數(shù)據(jù)的現(xiàn)實需求,決定了法定許可制度在規(guī)范生成式人工智能訓(xùn)練數(shù)據(jù)利用作品行為方面更具備合理性和優(yōu)勢。
(一)提供利用作品的合法性基礎(chǔ)
我國《著作權(quán)法》明確規(guī)定了四項直接依照法律規(guī)定即可使用他人作品的法定許可情形。除此之外,《信息網(wǎng)絡(luò)傳播權(quán)保護條例》還規(guī)定了扶助貧困地區(qū)的作品使用公告制度。相比其他國家,我國的法定許可內(nèi)容已較多,具有一定的制度基礎(chǔ)。與其他著作權(quán)制度一樣,我國著作權(quán)法定許可是當(dāng)初為加入國際公約而建立的制度,但產(chǎn)業(yè)支撐環(huán)境缺乏,且適用度不足[19]。但在歷次修法過程中,我國《著作權(quán)法》關(guān)于法定許可的制度與變化愈發(fā)關(guān)注新興產(chǎn)業(yè)的新需求,其概念的核心關(guān)鍵要素在于不經(jīng)許可,但須付報酬,以尊重權(quán)利[20],設(shè)立目的是使人們能夠適當(dāng)?shù)孬@得使用作品的機會[21]152,對著作權(quán)的限制弱于合理使用制度。
有些法定許可情形是考慮到某些使用行為已經(jīng)超出合理范圍,而作者又無法加以控制,才采取這種折中解決辦法,以使權(quán)利人能夠獲得合理報酬[22179。通常情況下,大模型在數(shù)據(jù)挖掘的過程中,通過爬蟲技術(shù)、非法獲取手段等構(gòu)建數(shù)據(jù)庫時,易產(chǎn)生著作權(quán)侵權(quán)風(fēng)險。且在實踐中,這種情形所涉的數(shù)據(jù)量更大、比重更高,訓(xùn)練數(shù)據(jù)利用作品的行為不完全在合理范疇之內(nèi),使得被利用作品的作者無法及時發(fā)現(xiàn)和遏制侵權(quán)行為,無法對利用其作品的訓(xùn)練行為進行有效控制。法定許可制度下,作品使用的權(quán)利來源為法定授權(quán),使用行為為付費使用,其非自愿性決定了著作權(quán)人與作品的使用人無法通過自愿的方式商定使用許可,而是通過法律明確規(guī)定,讓作品使用人可在無需獲得著作權(quán)人許可下使用有關(guān)作品,但應(yīng)當(dāng)支付報酬。這允許使用者以特定方式使用已經(jīng)發(fā)表的作品,弱化了著作權(quán)的排他性,但保留了著作權(quán)人獲得報酬的權(quán)利。
(二)提高利用作品的授權(quán)效率
生成式人工智能對模型的訓(xùn)練需要大量的數(shù)據(jù),其中就包括海量作品,這導(dǎo)致其在大量、重復(fù)地利用過程中,無法取得全部著作權(quán)人的授權(quán)。由于作品總會隨著技術(shù)的進步和生產(chǎn)生活的需要產(chǎn)生全新的用途,為保護產(chǎn)業(yè)發(fā)展與競爭,不能將基于作品產(chǎn)生的全部價值賦予著作權(quán)人,否則會導(dǎo)致基于作品的壟斷,進而產(chǎn)生許可費用畸高、作品潛在市場縮小、市場失靈嚴(yán)重等一系列影響[23]。法定許可制度本質(zhì)上是對著作財產(chǎn)權(quán)專有性的一種限制,其立法價值并不旨在促進權(quán)利人的許可收益,而是以一種非市場化的權(quán)利流轉(zhuǎn)模式克服事前協(xié)商所帶來的交易障礙。由于法定許可使用免去了事先取得著作權(quán)人同意,也就免除了對使用報酬進行商談的手續(xù)[2]180,,進一步提高了作品整體的傳播效率和交易效率[22]18]。法定許可制度可以擬制出一個政府管控的市場,推進權(quán)利高效流轉(zhuǎn),無需雙方單獨協(xié)商,而是采用統(tǒng)一的付費標(biāo)準(zhǔn)[7]187,由法律法規(guī)作出規(guī)定,或者依行業(yè)協(xié)議、商業(yè)慣例確定,以保證著作權(quán)授權(quán)定價具有一致性。此時,法定許可制度發(fā)揮了最高限價的作用,排除具有“權(quán)利劫持”意圖的著作權(quán)人,有助于提高交易效率,推進權(quán)利流轉(zhuǎn)和資源分配[12]。法定許可制度還通過劃定合理定價區(qū)間,推進雙方迅速達成合意,防正價格歧視和不理性定價降低交易的質(zhì)量和效率。
(三)避免支配過多作品的新壟斷產(chǎn)生
面對日益加劇的數(shù)據(jù)剝削和數(shù)據(jù)壁壘,法定許可制度既能夠防止科技巨頭利用市場優(yōu)勢形成數(shù)據(jù)霸權(quán),又能夠限制著作權(quán)人對作品的控制,切實維護生成式人工智能產(chǎn)品或服務(wù)研發(fā)訓(xùn)練的公平市場競爭環(huán)境。
目前,生成式人工智能模型訓(xùn)練數(shù)據(jù)的來源大致可分為三種。第一種是來源于公有領(lǐng)域的內(nèi)容。第二種是通過簽訂合同獲得合法授權(quán)的內(nèi)容,即通過與權(quán)利人簽訂合同獲得有效授權(quán)而合法使用的相關(guān)數(shù)據(jù)和內(nèi)容。第三種是未經(jīng)授權(quán)的信息及內(nèi)容。大型科技公司為了壟斷訓(xùn)練數(shù)據(jù),很有可能利用其優(yōu)勢地位與被利用作品的著作權(quán)人簽訂排他性許可使用協(xié)議,通過支配大規(guī)模作品的著作權(quán),排除其他人工智能公司尤其是相對較小的公司再次使用這些訓(xùn)練數(shù)據(jù)的可能。法定許可能夠防止生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者利用優(yōu)勢地位交叉和循環(huán)使用相鄰市場數(shù)據(jù)助推“剝削效應(yīng)”、未經(jīng)著作權(quán)人同意強制收集數(shù)據(jù)、在與下游競爭者競爭時給予自我優(yōu)待的情形,避免基礎(chǔ)模型因“獲得用戶一獲取數(shù)據(jù)一提升模型—再獲得用戶”的正反饋模型形成數(shù)據(jù)壟斷和基于數(shù)據(jù)的壟斷[24]。同時,法定許可制度限制了著作權(quán)人對作品的控制,但沒有因提高社會生產(chǎn)效率而對著作權(quán)人造成實質(zhì)性市場損失,反而能夠以相應(yīng)的報酬鼓勵著作權(quán)人的創(chuàng)作激情,在一定程度上減少了著作權(quán)人為獲取與作品價值相符合的對價而產(chǎn)生的高價追求。
(四)更好平衡多方利益
法定許可制度的初衷在于緩解新媒體傳播帶來的沖擊,降低交易成本,通過調(diào)和新舊產(chǎn)業(yè)之間的利益沖突來防止市場壟斷的出現(xiàn),旨在為傳播活動提供便利,促進公共利益和社會文化事業(yè)的發(fā)展。而合理使用制度是從“作品”角度出發(fā)[25],其設(shè)立初衷是促使大型內(nèi)容制作者補貼公共利益的資源再分配[26]。但互聯(lián)網(wǎng)和新興技術(shù)降低了傳統(tǒng)內(nèi)容創(chuàng)作和發(fā)行的門檻,導(dǎo)致合理使用制度難以適用于大多數(shù)人工智能創(chuàng)作行為,從而引發(fā)著作權(quán)侵權(quán)行為[27]。當(dāng)立法者認(rèn)為一種使用方式涉及重要的公共利益但不足以因此否定補償權(quán)時,法定許可就成為實現(xiàn)利益雙方之間平衡的妥協(xié)方案[28]17。
第一,法定許可制度能夠為人工智能系統(tǒng)研發(fā)者提供支持技術(shù)創(chuàng)新和發(fā)展的生態(tài)環(huán)境,確保充足的數(shù)據(jù)集為人工智能系統(tǒng)的開發(fā)和完善提供基礎(chǔ)支持。這間接滿足了研發(fā)者盡可能利用高質(zhì)量數(shù)據(jù)進行模型訓(xùn)練的希望,明確了訓(xùn)練數(shù)據(jù)的權(quán)源,通過合理、靈活的定價機制和許可類型滿足其開發(fā)需求,推進生成式人工智能系統(tǒng)性能和生成效果的提升。第二,新興技術(shù)和產(chǎn)業(yè)的誕生不能忽視“人”的智力貢獻。法定許可制度能夠為被利用作品的著作權(quán)人提供權(quán)益保障,保留著作權(quán)人的創(chuàng)作意愿,允許使用者借助原始作品的精華創(chuàng)造更大的價值,也反饋給原始權(quán)利人以經(jīng)濟補償,通過交易性分配緩解權(quán)利人和使用者之間的矛盾[7]188。第三,法定許可制度的規(guī)定符合公眾利益。對于生成式人工智能而言,準(zhǔn)確、多樣、可信的訓(xùn)練數(shù)據(jù)有利于降低人工智能系統(tǒng)的偏見,能夠為公眾提供可信的生成內(nèi)容,建立廣泛的公眾信任。
三、生成式人工智能訓(xùn)練數(shù)據(jù)利用作品法定許可的制度路徑
為進一步踐行我國生成式人工智能治理原則和監(jiān)管方案,推進我國人工智能產(chǎn)業(yè)的創(chuàng)新與發(fā)展,實現(xiàn)著作權(quán)人與生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者以及社會公眾之間的利益平衡,有必要從立法、執(zhí)法以及知識產(chǎn)權(quán)制度價值等角度,構(gòu)建適合我國人工智能產(chǎn)業(yè)發(fā)展和知識產(chǎn)權(quán)制度體系的治理方案。
(一)通過人工智能專門立法創(chuàng)設(shè)法定許可
自1990年以來,我國《著作權(quán)法》基本每十年修改一次(分別為2001年、2010年和2020年),與著作權(quán)有關(guān)的行政法規(guī)修改頻率也不高[29]。《著作權(quán)法》的修改也可能難以涵蓋所有訓(xùn)練數(shù)據(jù)利用作品的情形,甚至可能導(dǎo)致利益平衡機制失衡,損害其原有體系。2024年5月,國務(wù)院辦公廳關(guān)于印發(fā)《國務(wù)院2024年度立法工作計劃》的通知明確提出預(yù)備提請全國人大常委會審議人工智能法草案。人工智能法將被作為專門立法來調(diào)整人工智能技術(shù)所涉的各類法律問題。因此,考慮到修訂《著作權(quán)法》的周期較長、難度較大,在生成式人工智能領(lǐng)域,更適宜在專門的綜合性立法中設(shè)置法定許可制度條款,創(chuàng)設(shè)例外情形以解決矛盾。
第一,將人工智能法定許可機制納入專門立法考量。通過專門人工智能立法,可以協(xié)同國家知識產(chǎn)權(quán)主管機關(guān),完善針對人工智能系統(tǒng)應(yīng)用的知識產(chǎn)權(quán)制度,確保立法能夠滿足人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展要求,調(diào)整新興技術(shù)和產(chǎn)業(yè)發(fā)展所帶來的個人利益與社會公益間的不平衡。在《人工智能示范法 2.0》(以下簡稱《示范法》)中,人工智能領(lǐng)域知識產(chǎn)權(quán)制度被納入“促進發(fā)展創(chuàng)新原則”的考量。《示范法》第10條規(guī)定:“國家鼓勵人工智能研發(fā)和應(yīng)用,依法保護人工智能領(lǐng)域知識產(chǎn)權(quán),建立與人工智能發(fā)展相適應(yīng)的知識產(chǎn)權(quán)法定許可制度。國家知識產(chǎn)權(quán)主管機關(guān)依法就人工智能法定許可制度制定配套規(guī)則,明確人工智能生成物的權(quán)益保護和收益分配機制。”[30]《示范法》明確提出了將法定許可制度納人人工智能治理之中的立法思路,進而規(guī)定由相關(guān)機關(guān)制定相關(guān)的配套制度。例如,鼓勵數(shù)字作品著作權(quán)登記和建立數(shù)字作品著作權(quán)信息區(qū)塊鏈存證標(biāo)準(zhǔn),以確保著作權(quán)確權(quán)、流轉(zhuǎn)、保護等工作可源;發(fā)揮著作權(quán)集體管理組織在協(xié)商方面的代表性和靈活性,進一步提高確定定價比率的效率等[719。
第二,創(chuàng)設(shè)生成式人工智能作品訓(xùn)練的例外條款。基于技術(shù)發(fā)展對內(nèi)容產(chǎn)業(yè)及知識產(chǎn)權(quán)保護帶來的影響,歐盟通過《數(shù)字化單一市場版權(quán)指令》對人工智能訓(xùn)練數(shù)據(jù)利用作品行為作出回應(yīng),對文本和數(shù)據(jù)挖掘設(shè)置了“以科學(xué)研究為目的”和“不限制目的”的兩種例外情形,并以合法訪問權(quán)作為權(quán)利限制與例外的前提,以權(quán)利人可以表達禁止進行數(shù)據(jù)挖掘的意愿為限制條件①。在我國立法體制下,《著作權(quán)法》近期修訂的可能性不大,而國家已有人工智能專門法的立法計劃,可以考慮通過專門立法的例外條款調(diào)整生成式人工智能系統(tǒng)應(yīng)用產(chǎn)生的特殊知識產(chǎn)權(quán)問題。我國《信息網(wǎng)絡(luò)傳播權(quán)保護條例》是在互聯(lián)網(wǎng)迅速發(fā)展的背景下,針對權(quán)利人、網(wǎng)絡(luò)服務(wù)提供者和作品使用者之間的新問題,由《著作權(quán)法》授權(quán)制定的專門條例。其中,對利用信息網(wǎng)絡(luò)向農(nóng)村地區(qū)的公眾免費提供作品這一特殊情形,該條例便規(guī)定了公告征詢著作權(quán)人意見并支付報酬的制度,創(chuàng)設(shè)了一種新型的用于扶助貧困群體的法定許可。該制度在設(shè)立之初有較大爭議,但在實踐中引發(fā)的著作權(quán)爭議卻非常罕見[31]509。相對于此,人工智能專門立法能夠避免需要上位法授權(quán)制定的問題,并能對產(chǎn)業(yè)的新發(fā)展形式作出制度內(nèi)容上的細化補充。
(二)同步規(guī)定合理使用并實現(xiàn)二者互補銜接
合理使用制度與法定許可制度既有根本區(qū)別,也存在一定相似之處,在適當(dāng)條件下能夠相互轉(zhuǎn)化。近年來,學(xué)界也指出二者存在相互轉(zhuǎn)化的發(fā)展趨勢。
在使用目的上,二者存在根本不同。合理使用制度的設(shè)定完全是從教育、信息和文化方面的考慮出發(fā),僅限于非商業(yè)性使用;法定許可制度的目的是使人們能夠適當(dāng)?shù)孬@得使用作品的機會[21]152,具有商業(yè)性目的,對作者個人的權(quán)益只是稍加限制,以防止形成文化壟斷[32]。
從限制制度來看,二者之間卻存在新的發(fā)展趨勢,即合理使用在一定范圍內(nèi)向法定許可使用轉(zhuǎn)變,免費的合理使用制度與付費的法定許可使用相互補充(或兩者并立,或三者共存)[21]163。一方面,新技術(shù)使傳統(tǒng)合理使用存在向法定許可使用轉(zhuǎn)變的趨勢。例如,20世紀(jì)70年代以來,歐洲國家創(chuàng)立的公共借閱權(quán)規(guī)定,圖書館在出租圖書時應(yīng)向作者支付版稅,以及為個人使用目的而復(fù)制他人作品的應(yīng)向著作權(quán)人支付法定報酬。許多西方國家采用的新版稅制度已在部分復(fù)制、錄制領(lǐng)域內(nèi),使合理使用變成一種許可使用[21]155。另一方面,法定許可和合理使用制度都為非自愿許可,但法定許可制度在維系著作權(quán)人獲酬權(quán)的條件下,滿足了使用人對作品利用數(shù)量與方式的需要。例如《保護文學(xué)與藝術(shù)作品伯爾尼公約》中合理使用的方式還限于“復(fù)制\"這一特定的作品使用方式,而TRIPs協(xié)議則將合理使用的范圍擴大到了權(quán)利人“專有權(quán)\"控制的所有使用方式[25]。因此,為促進人工智能產(chǎn)業(yè)創(chuàng)新與發(fā)展,維護訓(xùn)練數(shù)據(jù)利用作品相關(guān)著作權(quán)人的合法權(quán)益,應(yīng)以治理目標(biāo)為導(dǎo)向,合理轉(zhuǎn)化著作權(quán)限制與例外的優(yōu)勢,調(diào)和合理使用制度與法定許可制度的關(guān)系,明確二者不是非此即彼的矛盾關(guān)系,充分利用制度優(yōu)勢推進技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。
(三)科學(xué)設(shè)定法定許可范圍、條件和程序
法定許可是指特定情況下,作品使用者可以不經(jīng)著作權(quán)人同意而使用其已經(jīng)發(fā)表的作品的制度。因此,并不是所有的生成式人工智能研發(fā)階段使用作品的情形都能夠納入法定許可的范圍,因而需要進一步考量可納入法定許可的情形、條件和程序。
對于限制與例外中要求的“某些特殊情形”,應(yīng)從“質(zhì)”和“量”兩方面考量。第一,在質(zhì)上應(yīng)該被明確確定。第二,在量上其范圍應(yīng)被限于狹窄的范圍[28]99。過于寬泛的數(shù)量標(biāo)準(zhǔn)可能導(dǎo)致應(yīng)被例外的情形被忽略,而占比較高的情形被認(rèn)定為特殊情形。有學(xué)者認(rèn)為,人工智能創(chuàng)作活動暫時無法確定適用法定許可制度對應(yīng)的特定主體和特殊利益,因此只要一般自然人、法人和非法人機構(gòu)具備進行智能創(chuàng)作研發(fā)和應(yīng)用的能力,就可以依照申請程序申請[7]19。雖然,這能夠較大程度上涵蓋生成式人工智能研發(fā)的主體,減少適格主體的認(rèn)定矛盾,但似乎違背了法定許可制度的初衷,并沒有將人工智能技術(shù)利用作品的場景和情形進行進一步劃分,也沒有區(qū)分研發(fā)者和提供者因能力差異對主體適格的影響。因此,可以綜合考量適用客體的標(biāo)準(zhǔn),進一步根據(jù)生成式人工智能系統(tǒng)的風(fēng)險或領(lǐng)域劃定適用范圍,明確區(qū)分研發(fā)者和提供者可申請法定許可的范疇。
為推進法定許可制度更好地調(diào)整生成式人工智能產(chǎn)品或服務(wù)的數(shù)據(jù)訓(xùn)練行為,應(yīng)進一步完善法定許可申請或著作權(quán)人申報的程序性條款。生成式人工智能法定許可制度在確保傳播效率提升的同時,應(yīng)當(dāng)更側(cè)重于制定嚴(yán)格的法定許可申請程序性條款以及爭議解決機制,倒逼人工智能產(chǎn)業(yè)向著作權(quán)產(chǎn)業(yè)獲得授權(quán)許可或者法定許可[3]?;蚩蓞⒖紡娭圃S可制度解決生成式人工智能訓(xùn)練數(shù)據(jù)集面臨的“許可使用”困境,建立著作權(quán)人申報程序,著作權(quán)人同意其作品被使用的,可以向主管部門進行申報,要求獲得相應(yīng)的補償金;不同意的,則可以要求主管部門裁定撤銷許可使用[1]100,以“選擇退出\"維護著作權(quán)權(quán)益。以英國為例,其政府計劃針對人工智能訓(xùn)練數(shù)據(jù)單獨采用“選擇退出”的機制,即允許科技公司默認(rèn)使用在線內(nèi)容訓(xùn)練人工智能模型,除非出版商和其他內(nèi)容創(chuàng)作者明確“選擇退出”[34]。由于在實現(xiàn)中難以知曉進行數(shù)據(jù)挖掘活動的公司的真實身份,出版商和其他內(nèi)容創(chuàng)作者質(zhì)疑“選擇退出”的現(xiàn)實可操作性,更傾向于“選擇加入”機制,以達成許可使用條款,進一步保留對作品內(nèi)容使用方式的控制權(quán)。美國版權(quán)局則提出,影響“選擇加入”或“選擇退出”制度決策的核心因素是權(quán)利人的“交易成本”,取決于“選擇加人”的平均交易成本與“選擇退出”的平均交易成本的差異,以及權(quán)利人對作品被利用的態(tài)度,因而需要更多的實證研究作為支撐[35]。因此,僅在事后采用“選擇退出”機制是不充分的,政府更需要提前介人并實施嚴(yán)格的保障措施,根據(jù)權(quán)利人實際需求全面科學(xué)地設(shè)計法定許可的程序性條款。
(四)配套明確的法定許可定價標(biāo)準(zhǔn)和付酬機制
法定許可中,權(quán)利人不再享有許可的定價權(quán),轉(zhuǎn)而依靠政府確定的稿酬標(biāo)準(zhǔn)[31]628。由于法定許可制度排除了著作權(quán)人的控制權(quán),他人無需經(jīng)著作權(quán)人許可就可使用其作品,使得權(quán)利人喪失了討價還價的市場談判能力,獲得補償?shù)慕痤~往往低于市場談判價格。在法定許可情況下,著作權(quán)人的經(jīng)濟利益通常沒有獲得充分滿足[28]17。為彌合這一矛盾,生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的法定許可制度設(shè)計應(yīng)進一步完善配套保障機制,并強化技術(shù)支持。
第一,完善著作權(quán)集體管理機制。著作權(quán)集體管理制度的目的是彌補著作權(quán)人在信息獲取與維權(quán)能力方面的不足,降低使用者的交易成本、法律風(fēng)險與許可費用的負(fù)擔(dān)[36]。當(dāng)前我國著作權(quán)集體管理組織代表性顯著不足,在實踐中對著作權(quán)人和作品使用者的價值也不完全一致,仍存在法定壟斷地位下的集體管理組織被認(rèn)為存在服務(wù)意識不強、運作效率低、公開透明度不足等問題[37]。但著作權(quán)集體管理組織在統(tǒng)一管理、利益分配和救濟維權(quán)方面具有一定的優(yōu)勢,可以通過指定相關(guān)的著作權(quán)集體管理協(xié)會或新設(shè)國家人工智能主管機關(guān),就人工智能訓(xùn)練數(shù)據(jù)利用作品制定統(tǒng)一的付費標(biāo)準(zhǔn),行使發(fā)放使用許可和轉(zhuǎn)付利用費用的職能。美國《2018年音樂現(xiàn)代化法》就對音樂法定許可申請程序做出了改變,由按作品許可改為一攬子許可,許可費用統(tǒng)一向集體管理組織繳納,極大地簡化了法定許可手續(xù)。另外,也應(yīng)考慮吸納一部分權(quán)利人參與作品使用費的定價協(xié)商,通過靈活的選擇吸引更多優(yōu)質(zhì)作品進人“版權(quán)池”[38]。
第二,創(chuàng)新引入第三方付酬機制。在許可方面,有學(xué)者主張可以采用“先用后付、以收定付”原則[7]193。但我國法定許可制度中,尚無不按規(guī)定主動支付報酬的懲罰措施。最高人民法院的個案甚至確認(rèn):“作品使用人在不損害著作權(quán)人獲得報酬權(quán)的前提下,‘先使用后付款’不違反法律規(guī)定?!雹龠@導(dǎo)致使用人存有僥幸心理,拒絕主動支付報酬。對此,可進一步發(fā)揮知識產(chǎn)權(quán)局、法院、集體管理組織,乃至人工智能主管機關(guān)的統(tǒng)籌作用,引人第三方機構(gòu),推進“先收款、后付款”的付酬機制,最大程度保障相關(guān)權(quán)利人的獲酬權(quán),確保訓(xùn)練數(shù)據(jù)高效應(yīng)用于系統(tǒng)開發(fā)。若單純依賴市場主體的自愿協(xié)商機制,則可能導(dǎo)致資本過度集中于頭部企業(yè);而通過法定許可制度,則能有效避免價格的失控。
第三,完善數(shù)字著作權(quán)登記溯源機制。由于生成式人工智能模型訓(xùn)練涉及海量數(shù)據(jù),在利用相關(guān)作品的過程中,往往難以確定每個作品的歸屬、使用場景和付酬情況,甚至還會有很多未經(jīng)標(biāo)注的作品在不同媒介中被傳播和利用,難被溯源并進行利益分配。同時,一旦訓(xùn)練數(shù)據(jù)庫被攻擊或盜取,就會導(dǎo)致數(shù)據(jù)泄露,對原始權(quán)利人造成的經(jīng)濟利益將難以計算。因此,可以充分發(fā)揮區(qū)塊鏈技術(shù)不可篡改的優(yōu)勢,確保訓(xùn)練數(shù)據(jù)利用的作品可溯源、易追蹤,降低研發(fā)企業(yè)登記全部訓(xùn)練數(shù)據(jù)的成本,提升作品利用的證明力[7]96
第四,鼓勵大模型提高訓(xùn)練數(shù)據(jù)透明度??紤]到生成式人工智能的算法、模型和參數(shù)都具有商業(yè)秘密性和知識產(chǎn)權(quán)價值,可以采取由生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者創(chuàng)建模型卡的制度,對訓(xùn)練數(shù)據(jù)等關(guān)鍵性信息進行登記和備案[39]。2023年11月,法國、德國、意大利發(fā)布《基于歐洲人工智能法案價值觀的創(chuàng)新友好型路徑》聯(lián)合聲明,提出由基礎(chǔ)模型的開發(fā)人員定義模型卡,在確保透明度和安全性的基礎(chǔ)上加強自我監(jiān)管。模型卡內(nèi)容應(yīng)包括但不限于基礎(chǔ)模型的參數(shù)數(shù)量、預(yù)期用途、潛在限制和偏見研究結(jié)果等。另外,也可以由人工智能主管機關(guān)提供標(biāo)準(zhǔn)模板,要求研發(fā)者遵守著作權(quán)要求,就生成式人工智能模型訓(xùn)練所用的內(nèi)容提供一份詳細的摘要,包括但不限于利用已公開的作品,并向社會公開,以此配合數(shù)字著作權(quán)登記溯源機制,提高大模型的透明度,輔助付酬機制落地,以形成完整邏輯閉環(huán)。
四、結(jié)語
生成式人工智能正在引發(fā)新一輪智能化浪潮,并已經(jīng)賦能至各行各業(yè),有效地提升了社會生產(chǎn)的效率,為人們的生活帶來諸多便利。相關(guān)的矛盾和爭議也應(yīng)運而生。數(shù)據(jù)訓(xùn)練作為生成式人工智能開發(fā)階段中的關(guān)鍵一環(huán),其行為合法與否對后續(xù)的建模和部署階段也將產(chǎn)生影響。針對訓(xùn)練數(shù)據(jù)利用作品行為的著作權(quán)爭議,有必要厘清合理使用制度的局限性,發(fā)揮法定許可制度的優(yōu)勢,通過專門立法創(chuàng)設(shè)適于生成式人工智能特性的法定許可情形,進一步完善法定許可的配套機制,實現(xiàn)數(shù)據(jù)訓(xùn)練活動“有法可依”。構(gòu)建完善的訓(xùn)練數(shù)據(jù)利用作品的法定許可制度,尚需學(xué)界和產(chǎn)業(yè)界的討論與磨合;特別是對于該情形下法定許可具體范圍、客體范疇、定價標(biāo)準(zhǔn)的界定,以及付酬機制、登記機制的運行,均需結(jié)合產(chǎn)業(yè)實踐需要,作出細化規(guī)定。在此基礎(chǔ)上,通過充分發(fā)揮法定許可制度的獨特優(yōu)勢,以滿足生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者以及著作權(quán)人和社會公眾的多元利益需求。
參考文獻:
[5]MARR B.GPT-4 Iscoming-what we know so far[EB/OL].(2023-02-24)[2024-04-17].htp://www.forbes.com/sites/ber-nardmarr/2023/02/24/gpt-4-is-coming--what-we-know-so-far/? sh=11045dd86c2d.
[6]SINGH M,CAMBRONERO J,GULWANIS,et al.Code fusion:A pre-trained difusion model for code generation[EB/OL].
(2023-10-26)[2024-02-18].https://arxiv.0rg/abs/2310.17680.
[7]何煉紅.人工智能知識產(chǎn)權(quán)保護;挑戰(zhàn)及應(yīng)對[M].北京;法律出版社,2024.
[8]高陽,胡丹陽.機器學(xué)習(xí)對著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對[J].電子知識產(chǎn)權(quán),2020(10):21.
[9]李琛.論我國著作權(quán)法修訂中“合理使用”的立法技術(shù)[J].知識產(chǎn)權(quán),2013(1):16.
[10]鄭重.日本著作權(quán)法柔性合理使用條款及其啟示[J].知識產(chǎn)權(quán),2022(1):117-118.
[11]張吉豫,汪賽飛.大模型數(shù)據(jù)訓(xùn)練中的著作權(quán)合理使用研究[J].華東政法大學(xué)學(xué)報,2024(4):29.
[12]蔣一可.數(shù)字音樂著作權(quán)許可模式探究——兼議法定許可的必要性及其制度構(gòu)建[J].東方法學(xué),2019(1):155.
[13]O'DONNELLJ.Training AI music models isabout to getveryexpensive[EB/OL].(2024-06-27)[2024-07-10].https://www.technologyreview.com/2024/06/27/1094379/ai-music-suno-udio-lawsuit-record-labels-youtube-licensing/.
[14]劉家瑞.論著作權(quán)法修改的市場經(jīng)濟導(dǎo)向——兼論集體管理、法定許可與孤兒作品[J].知識產(chǎn)權(quán),2016(5):47.
[15]張嚴(yán).生成式人工智能壟斷風(fēng)險問題探析[J].科學(xué)決策,2024(9):205.
[16]殷繼國.人工智能時代算法壟斷行為的反壟斷法規(guī)制[J].比較法研究,2022(5):187.
[17]ISAAC M.Reddit wants togetpaidfor helping toteach bigA.I.systems[EB/OL].(2023-04-18)[2024-10-06].https://www.nytimes.com/2023/04/18/technology/reddit-ai-openai-google.html.
[18]劉友華,魏遠山.機器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決[J].華東政法大學(xué)學(xué)報,2019(2):76.
[19]熊琦.著作權(quán)法定許可制度溯源與移植反思[J].法學(xué),2015(5):72.
[20]李照東,郭謙.論著作權(quán)法定許可制度的完善——以《著作權(quán)法》第 23條為例[J].山東社會科學(xué),2018(2):159.
[21]吳漢東.知識產(chǎn)權(quán)基本問題研究[M].北京:中國人民大學(xué)出版社,2009.
[22]張今.著作權(quán)法[M].北京:北京大學(xué)出版社,2015.
[23]徐小奔,楊依楠.論人工智能深度學(xué)習(xí)中著作權(quán)的合理使用[J].交大法學(xué),2019(3):41.
[24]李希梁,張欽昱.生成式人工智能的反壟斷規(guī)制[J].電子政務(wù),2024(5):56.
[25]李明德,許超.著作權(quán)法[M].北京:法律出版社,2009:95.
[26] SOBEL B.Artificial intelligence’s fair use crisis[J].Columbia Journal of Law amp; Arts,2017(45) :85.
[27]華劫.合理使用制度運用于人工智能創(chuàng)作的兩難及出路[J].電子知識產(chǎn)權(quán),2019(4):35.
[28]朱理.著作權(quán)的邊界:信息社會著作權(quán)的限制與例外研究[M].北京:北京大學(xué)出版社,2011.
[29]李銘軒.著作權(quán)法合理使用規(guī)則僵化的困境與出路[J].出版廣角,2022(11):53.
[30]周輝,李延楓.《人工智能示范法》釋義[M].北京:中國社會科學(xué)出版社,2024:24.
[31]崔國斌.著作權(quán)法原理與案例[M].北京:北京大學(xué)出版社,2014.
[32]張平.知識產(chǎn)權(quán)法[M].北京:北京大學(xué)出版社,2015:72.
[33]毛銘浩.音樂著作權(quán)法定許可制度的立法價值重塑[J].電子知識產(chǎn)權(quán),2023(1):57.
[34]GROSS A,THOMAS D.UK toconsult on“opt-out”modelfor AIcontent-scraping in blowto publishers[EB/OL].(2024-10-17)[2024-10-30].https://www.ft.com/content/26bc3de1-af90-4c69-9f53-61814514aeaa.
[35]BRENTLIdentifyingtheconomicimplicationsofatificialinteligene forcopyrightpolicy:Contextanddirectionforco-nomic research,U.S.Copyright Office,2025[R/OL].(2024-02-14)[2024-12-12].hps://www.copyright.go/economic-re-search/economic-implications-of-ai/dentifying-the-Economic-Implicationsof-rtificial-Inteligence-fr-opight-Policy-NAL.pdf.
[36]向波.著作權(quán)集體管理組織:市場功能、角色安排與定價問題[J].知識產(chǎn)權(quán),2018(7):69.
[37]張祥志.破解信任困局:我國著作權(quán)集體管理“信任機制”的法治關(guān)注[J].新聞與傳播研究,2019(3):53.
[38]張平.人工智能生成內(nèi)容著作權(quán)合法性的制度難題及其解決路徑[J].法律科學(xué)(西北政法大學(xué)學(xué)報),2024(3):30.
[39]肖紅軍,張麗麗.大模型倫理失范的理論解構(gòu)與治理創(chuàng)新[J].財經(jīng)問題研究,2024(5):25.
Statutory license for the use of works in generative artificial intelligence training data
ZHOUHui1,JIN Xiai2
(1. Institute ofLaw,Chinese Academy of Social Sciences,Beijing 10o72O,China; 2.Law School,University of Chinese Academy of Social Sciences,Beijing 1O2401,China
Abstract:The development of generative artificial inteligence(AI),suchas DeepSeek,especially DeepSeek,relies heavilyonhigh-quality training data,andusing worksfor training hassparkedaseries ofcopyrightdisputes.To ensure thehigh-qualitydevelopmentofgenerativeAI,itisurgenttoaddresspracticalissuessuchasdiffcultiesinobtainingauthorizationforworks,highauthorizationcosts,thechallengeofbalancing interests,andcompetitive bariers.While the fairuse systemcan helpresolveisuesrelated tothe dificultyofobtainingauthorization forworksand highutilization costs,it sacrifices the interests ofcopyright holdersandcertain public interests tosome extent.Relying solelyonthe fair use system cannot fullyaddressthe new copyright issues arising from the development of generative AI. Establishing a statutory license for using works to train generativeAIcan providealegitimate basis for using works,improveauthorizationeffciency,and prevent newforms ofmonopolies thatcould excludeorrestrictcompetitionin generativeAI bycontroling thecopyrightofacertainnumberofworks.Additionall,throughreasonable licensing fees,itcanprovidenecessarycompensationforcopyrightholders,achievingabeter balanceof interestsforallparties involved inthe innovative developmentof generativeAI.Theimplementationof astatutory licensing systemfor generativeAItraining worksrequires specializedAIlegislation tocreateaframework thatcomplementsandconnectswithfairuse.Thisshould involvethescientific establishment of the scope,conditions,and procedures of statutory licenses,along with clear pricing standards and compensation mechanisms.
Keywords:generative artificial intelligence; training data; fair use;statutory license;DeepSeek
(編輯:刁勝先)