

摘要:探討我國生成式人工智能版權補償金制度的建構,以期實現版權人利益保護與生成式人工智能技術發展之間的平衡,促進二者良性發展。文章梳理了生成式人工智能所引發的版權人利益實現困境,包括版權作品使用的許可利益取得困難,版權作品衍生使用的開發利益取得困難,作品侵權損害賠償取得困難。闡釋版權補償金制度的原理,并借鑒國外的版權補償金制度,分析生成式人工智能對接版權補償金制度的業態路徑,認為在生成式人工智能專業模型層對接版權補償金制度較為恰當,并提出生成式人工智能版權補償金制度的具體建構策略,包括明確補償支付主體身份、優化補償收繳工作主體、采取“比例+單一”的復合補償標準、建立公私利益相互補充的補償分配體系。
關鍵詞:生成式人工智能;版權作品;版權補償金制度;集體管理
DOI:10.19619/j.issn.1007-1938.2025.00.011
作者單位:湖南理工學院法學院
引文格式:王健宇. 生成式人工智能版權補償金制度的原理及建構[J]. 出版與印刷,2025(1):37-47.
生成式人工智能通過對已有數據的識別與學習,以適當泛化能力生成相關內容[1] 的方式為市場提供服務。對“已有數據”進行識別與學習,是生成式人工智能建模并得以運行的關鍵。“已有數據”主要由公共作品和版權作品兩部分組成,相較之下,版權作品在提升人工智能生成內容(artificial intelligencegenerated content,英文縮寫AIGC)的質量上效果更為顯著。近年來,版權人與人工智能平臺圍繞生成式人工智能使用版權作品是否需要給予補償的問題,在司法層面展開了激烈的探討與對抗。如安德森(Sarah Andersen)等藝術家提起訴訟,稱Stability AI 公司、Midjourney 公司和Deviant" Art 在線畫廊使用其受版權保護的作品卻未給予補償;[2] 卡德雷(Charlie Kadrey)等小說家指控Meta 公司使用其作品的盜版內容來訓練AI 模型;[3] 全球三大唱片公司環球音樂、索尼音樂和華納音樂共同起訴人工智能音樂技術公司Udio 和Suno,指控它們利用唱片公司的錄音來訓練生成式AI 音樂系統,存在大規模版權侵權行為。[4]透過這些事例可以發現,版權人群體對人工智能平臺的“不滿”主要源于版權人的版權利益沒有得到應有的尊重。《中共中央關于進一步全面深化改革 推進中國式現代化的決定》提出“加快建立數據產權歸屬認定、市場交易、權益分配、利益保護制度”,本文試圖通過分析生成式人工智能所引發的版權人利益實現困境,通過借鑒國外的版權補償金制度,探討我國生成式人工智能版權補償金制度的建構,以期達到版權人與人工智能平臺之間的利益平衡。
一、生成式人工智能引發版權人利益實現困境
生成式人工智能技術對版權作品的獨特使用方式,不僅給現有版權制度帶來嚴峻的法律預期不確定風險,而且對版權人的版權利益形成了全面擠壓,引發版權人利益實現困境。
1. 版權作品使用的許可利益取得困難
生成式人工智能需要使用海量的版權作品來進行模型訓練,因而時常出現人工智能平臺未經版權人許可使用版權作品,卻規避支付版權作品許可費用的現象。現有著作權制度旨在促進作品商品化,以讓版權人獲得經濟回報的方式激勵創新。[5] 但在使用著作權制度規范生成式人工智能使用作品的行為時卻面臨一個基本問題:版權人對于其作品所享有的壟斷性許可利益,未能在生成式人工智能的應用中得到實現。
其一,生成式人工智能使用版權作品的行為,原則上應獲取版權人單獨同意并支付許可費用,但在我國《著作權法》尚未對關于人工智能挖掘作品、投喂數據的行為進行明確規定的情況下,要求人工智能平臺以逐個獲得版權人許可的方式取得作品的使用權,需要消耗巨大的人力和財力成本,這將變相驅使人工智能平臺在法律的灰色地帶游走。2023年,全球知名圖片提供商華蓋創意起訴熱門人工智能繪畫工具Stable Diffusion的開發者Stability AI,聲稱Stability AI“非法”竊取下載了數百萬張圖片,侵犯了其版權。[6] 其二,在復雜的網絡空間中要準確識別作品是否享有版權及其背后的版權人十分困難。一方面,生成式人工智能依靠爬蟲技術對門戶網站作品進行自動化抓取,但爬蟲技術基于算法的設定,側重的是“取”的全面性,而非“取”的精準性,準確定位作品權屬不是它的技術目的;另一方面,由于存在法人作品、委托作品、獨占許可等法定或議定關系,版權人身份與創作者身份不是綁定關系,因此,要想在自動化爬取的同時精準追蹤版權并非易事。其三,現有版權規則在生成式人工智能領域尚未形成統一的解釋。以“復制”行為為例,復制行為是生成式人工智能建立訓練語料庫、重復進行訓練、組建應用模型的必要步驟。按照我國《著作權法》第10條關于數字化復制行為的規定,生成式人工智能將不特定版權作品爬取到特定數據庫,并進行多次使用,屬于典型的復制侵權行為。然而,國內部分學者近年來主張臨時復制作品的行為不構成版權侵權,計算機臨時復制技術應被視為合理使用,可用于人工智能模型訓練。[7] 司法解釋層面的分歧加劇了版權人獲得作品版權許可利益的難度。
2. 版權作品衍生使用的開發利益取得困難
版權作品的另一價值體現為版權人對作品的衍生使用,這與生成式人工智能使用作品進行訓練,從而輸出相應領域內容的行為高度一致。結合生成式人工智能的運作過程來看,當版權人的作品進入訓練語料庫后,需要經過人工或算法的標識與篩選,實現提取語言表達結構、相關內容事實等人類自然表達范式的目的,最終輸出文本、圖像、視頻等人工智能生成內容。簡言之,生成式人工智能將作品內化為模型參數并實現外部輸出的過程,實際上就是在開發版權作品衍生使用的潛在利益,這一行為可能侵犯版權人的合法權益。
其一,生成式人工智能在技術方面存在“算法黑箱”,版權人難以監督作品被衍生使用的邊界,即便AIGC 構成演繹作品,版權人也不可能及時取得相應的利益。生成式人工智能模型設計者以外的人或組織通常無法理解算法運作的具體模式,不能提出不同意見、參與決策過程,只能接受最終的結果。[8] 與傳統作品授權模式中版權人能夠直觀地監督作品衍生使用的方式不同,生成式人工智能將作品轉化為數據加以訓練后,版權人對作品的控制權就已名存實亡,既無法得知作品經過冗長的代碼運算會流向何方市場,也不清楚作品的哪些部分會被生成式人工智能加以演繹輸出。其二,作品的自身市場與相鄰市場的利益,面臨著被AIGC“替代”所帶來的削弱風險。以稀缺的高奇幻藝術風格插畫市場為例,插畫家魯特科夫斯基(GregRutkowski)的作品在Stable Diffusion 上短短數月便獲得了超過93 000 次的使用,這讓插畫家在欣喜之余又不免擔憂其原創作品會被難以區分的人工智能作品所淹沒。[9] 在作品的相鄰市場,如在小說的影視化改編領域,只要將小說中某個場景的描述輸入到Sora 這類文生視頻大模型,便能返回得到一段精美的視頻動畫。此時,無論這段視頻是否構成對原作品的演繹,其蘊含的原作品思想在一定程度上已削弱版權人在相鄰市場的衍生使用利益。
3. 作品侵權損害賠償取得困難
主張損害賠償是一種常見的權利救濟手段,版權亦是如此。當出現生成式人工智能未經許可使用版權人作品,輸出與原作品相似的內容時,版權人都可以在事后主張生成式人工智能涉嫌版權侵權,進而通過要求損害賠償的方式得到相應的補償。然而,認定生成式人工智能構成對作品侵權在實踐中并非易事。
我國版權侵權認定規則沿“思想—表達”邏輯展開,特別是在表達層面要求滿足“接觸+實質性相似”的條件。首先,版權人很難就生成式人工智能“接觸”作品的行為進行舉證。一方面,囿于前述算法黑箱現象,生成式人工智能獲取作品資源以及對模型進行數據“投喂”的過程極具隱蔽性,[10] 版權人難以根據生成式人工智能“接觸”作品的路徑完成溯源舉證;另一方面,現有的關于人工智能的法律規范為生成式人工智能設定的透明性義務可操作性不強。《生成式人工智能服務管理暫行辦法》第4 條第5 項規定要“采取有效措施,提升生成式人工智能服務的透明度”,《人工智能示范法2.0(專家建議稿)》第6 條提出“從事人工智能研發、提供活動應當遵循透明、可解釋原則”,但是以上規范存在共性問題,即關于透明性的規定可操作性不足,沒有為人工智能的研發、服務活動設置可行的作品使用公開標準。透明性不足導致版權人難以獲得生成式人工智能“接觸”作品的證據。其次,依照我國現有的著作權法,主張AIGC 與原作品構成“實質性相似”較為困難。我國《著作權法》第24 條將表達量作為界分侵權行為與合理使用行為的重要標準,只有超出“少量”復制使用的標準才可能構成“實質性相似”侵權。簡言之,“實質性相似”的認定前提是AIGC與原作品在表達上達到一定程度的重復。但在一般情況下,生成式人工智能憑借其算法算力優勢僅通過對原作品進行只言片語的提取加工,就足以讓版權人只能在AIGC 中看到原作品的“影子”而無法識別具體的“相似”部分。
二、版權補償金制度的原理闡釋與域外借鑒
OpenAI首席執行官奧爾特曼( Sam Altman)曾表示:“我們正在努力研究新模式,如果一個AI 系統使用了您的內容,或者使用了您的風格,您將得到報酬。”[11] 可以預見的是,如果生成式人工智能在運作源頭就要背負版權侵權的原罪,后續的應用和服務勢必會蒙上陰影。
1. 版權人享有版權補償的原理闡釋
從生成式人工智能的角度來看,對版權人進行公平補償是確保其長期保持高質量生成能力的必要舉措。生成式人工智能因數據而生,也因數據受困。其以海量人類作品為訓練基礎,提煉并模仿的是人類在文學、藝術和科學領域的表達結構。一旦人類創作衰減,生成式人工智能就會因缺乏持續創新的人類作品輸入而重復訓練舊數據,無法在表達范式上實現突破與更新。在人類中心主義的版權框架內,為確保人類的創造力在生成式人工智能可能對人類的作者地位產生影響、沖擊乃至取代的情況下得以留存,有必要引入版權補償金制度。通過給予版權人公平適當的作品使用回報,不僅可以保障版權人的基本社會權益,而且可以抑制人機關系的異化,讓人類不至于在批量化的機器創作面前喪失創作動力,被機器反向“役使”。
從版權人的角度來看,補償是作品作為數據要素參與生產的應有之義。版權利益的取得需要遵循我國按勞分配以及多種分配方式并存的利益分配邏輯。《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》第12 條指出:“健全數據要素由市場評價貢獻、按貢獻決定報酬機制。結合數據要素特征,優化分配結構,構建公平、高效、激勵與規范相結合的數據價值分配機制。”在承認知識勞動的前提下,將馬克思主義勞動理論嵌入生成式人工智能領域,生成式人工智能將成為內容產出的直接勞動者,版權人作品則以勞動對象或勞動資料的身份參與生成式人工智能的價值生產過程。此時,版權人就會因作品(原始數據)的提供成為AIGC 產出的間接勞動者。如果版權人不能憑借其作品作為數據要素,參與到生成式人工智能所帶來的利益分配中,就好比一位以寫作謀生的受薪員工,其勞動成果被復制,卻沒有得到適當的報酬,這無異于是一種“無償”的勞動征用,[12] 將對現有的公平分配機制造成破壞。
2. 版權補償金制度建構的域外借鑒
主張在生成式人工智能這一新業態的發展中借鑒國外的版權補償金制度,是因為該制度與生成式人工智能使用作品的版權補償金制度(簡稱“生成式人工智能版權補償金制度”)在發展背景、制定目的等多方面具有適配性,可為生成式人工智能版權補償金制度的建構提供有益借鑒。
版權補償金制度緣起于德國。隨著錄音錄像技術、靜電復印等復制技術的發展,作品的復制效率、復制質量大幅提高,私人復制行為日益盛行,[13] 但是按照當時德國的《著作權及鄰接權法》(Gesetz" über Urheber-recht und verwandte Schutzrechte)規定,私人復制是合法使用行為。此時,立法者就面臨著類似生成式人工智能使用版權作品行為時的困境:私人復制行為不具有法律上的可責性,卻又切實影響到版權人的利益時,應當采取何種措施加以平衡?[14]
1965年,德國《著作權及鄰接權法》通過第53 條與第54 條規定初步建立起版權補償金制度,法條吸收了德國最高法院在“格倫迪格—記者案”(Grunding-Reporter)和“身份證案”(Personalausweis)中針對私人復制行為所提出的觀點,即錄制設備制造商應當就消費者利用錄制設備進行復制的行為承擔侵權責任,因為錄制設備制造商從消費者普遍的復制行為中獲得了顯著的收益。[15] 不難發現,補償金收繳的本質是將提供技術的主體作為第三方,加入到版權人與使用者之間的交易鏈條中,讓技術提供者為私人復制行為付費。[16]2007年,德國參議院審議通過《信息社會版權制度第二法規》(Zweites Gesetzzur Regelung des Urheberrechts" in der Informationsgesellschaft),規定由著作權集體管理組織、機器和儲存介質的生產商協會等協商確定版權補償金的補償費率。[17] 至此,數字時代的版權補償金制度在德國基本建立。
當版權補償金制度在德國初顯成效后,英國、加拿大、日本、美國等紛紛效仿。據統計,已有超過42 個國家建立了版權補償金制度。[18] 雖然不同國家由于國情不同對版權補償金制度的規定存在差異,但是在制度構建方面有著共通之處,具體包括以下幾點:①明確版權補償金支付主體為復制設備的制造商和銷售商,因為在實踐中直接向個人收繳補償金很難實現;②補償金征收的金額或比例,需要根據市場情況由法律或有關版權組織協商確定;③收繳、分配補償金的主體多為著作權集體管理組織或專為收繳補償金設立的團體。
梳理版權補償金制度的發展脈絡可以發現,設計版權補償金制度的目的是平衡私人利益與公共利益,彌補版權人因新技術出現和使用帶來的利益損失。版權補償金制度一方面在版權人的專有權利與社會公眾的利益需求之間取得了某種平衡,另一方面也為版權人保留了獲取適當報酬這一基本權利。這與構建生成式人工智能版權補償金制度的目的不謀而合。
三、生成式人工智能對接版權補償金制度的業態路徑
在闡明版權人應享有版權補償的理據與域外版權補償金制度的實踐做法后,需探明版權補償金制度在生成式人工智能的哪一業態階段進行補償支付最合適。在張凌寒教授關于生成式人工智能業態的研究中,生成式人工智能業態被分為了“基礎模型—專業模型—服務應用”三個層次。[19]130(見圖1)沿此業態發展思路,本研究認為在生成式人工智能專業模型層對接版權補償金制度較為妥帖。原因如下。
首先,基礎模型層是具有公共利益屬性的數據基礎設施,作為生成式人工智能的起步階段,不宜施加過多的研發成本,以免妨礙技術創新。在這個階段,生成式人工智能不僅需要使用海量作品來形成算法,還需要購買或開發算力體系。這意味著,生成式人工智能在基礎模型層的開發成本十分高昂,例如微軟僅開發OpenAI 的前期產品Dall-E和ChatGPT 就投入了數十億美元,[20] 可見并非每個人工智能研發企業都能負擔基礎模型層的高額開發成本。如果在基礎模型層就主張對接版權補償金制度,不僅會遏制人工智能領域中小規模企業的發展,而且可能導致其鋌而走險,采取非法手段獲取作品數據,不利于公平有序的市場競爭秩序的形成。針對生成式人工智能開發領域存在的技術成本高昂問題,《關于人工智能立法的重點制度建議》提議“建設高質量數據集和數據庫,制定數據標準體系,建立數據資源共享機制,構建公共數據池”,即借助公共數據池將公開數據、超版權保護期作品、部分放棄版權利益的作品等匯集在統一數據池中,并經公私合作、登記備案等手段過濾不良信息、違法信息等內容,以提高生成式人工智能的訓練質量,降低訓練成本。鑒于公共數據池和基礎模型的通用性以及對下游產業的控制力,二者應當被歸為公共基礎設施,[19]132 依一般法理,在此情況下版權人無權為作品的公共性使用主張經濟補償。
其次,專業模型層匯聚了最為豐富和寶貴的版權作品,是生成式人工智能走向服務應用的中間層,也是對接版權補償金制度的恰當階段。當生成式人工智能進入專業模型層,就意味著其已走完模型研發中最為基礎與復雜的算法構建階段,基本具備了人機交互功能,只需使用更為優質或專業的版權作品加以深度學習,優化算法和輸出結果,即可向市場提供應用服務。由圖1 可見,生成式人工智能由基礎模型層進入專業模型層有兩條路徑,一是為提供專業服務而購買基礎模型,二是為提供通用服務而優化基礎模型。兩條路徑的主體分別為專業模型開發者和基礎模型優化者。它們雖然在應用目的上存在差異,但是都只有在專業模型層利用專業領域數據庫進一步對模型進行優化才能貼合市場需求。在這一階段對接版權補償金制度,能夠滿足研發主體利用高質量作品來深化基礎模型的現實需要,為生成式人工智能輸出獨特且專業的表達提供制度保障。
最后,相較于生成式人工智能的基礎模型層和專業模型層,服務應用層所涉及的市場關系與法律關系更為復雜,不適合對接需要進行批量作品許可的版權補償金制度。在服務應用層,生成式人工智能的主要任務是與市場主體進行交互,利用用戶輸入的作品提供內容生成服務,在此過程中持續優化生成效果。若在此階段對接版權補償金制度,可能帶來一系列問題。一是版權人向誰主張版權利益的問題。當前,AIGC 的權屬屬于平臺還是用戶尚懸而未決,更何況可能存在職務作品、委托作品等特殊權屬作品,出現版權與版權人分離的情況。二是版權利益如何計算的問題。版權補償標準的考量因素嵌套在服務應用層可能會被過度解讀和放大,諸如作品的使用頻次、使用內容的多少、作品的市場熱度等稍有關聯的因素,都可能會因為追求分配公平性的考量而被納入計算標準,反而會阻礙版權補償金制度的建構。因此,服務應用層不適宜對接版權補償金制度。
四、生成式人工智能版權補償金制度建構
生成式人工智能版權補償金制度的建構需要秉持以人為本、公平公正原則。圖2 為生成式人工智能版權補償金制度流程圖。通過明確補償支付主體身份、優化補償收繳工作主體、采取“比例+單一”的復合補償標準、建立公私利益相互補充的補償分配體系等方式降低版權補償金制度的構建成本,在不失效率的同時彰顯機制的人文關懷。
1. 明確人工智能企業的補償支付主體身份
任何包含類似稅收的補償機制,首先需要明確機制的適用對象。生成式人工智能使用版權作品,應由支付主體人工智能平臺(基礎模型優化者與專業模型開發者)向版權人支付補償費用。包含以下兩方面原因:其一,人工智能平臺實際使用了大量版權作品,符合“誰使用,誰付費”的版權支付邏輯。在應用生成式人工智能的過程中,會使用版權作品的主體無外乎人工智能平臺與用戶。在人工智能平臺向市場投放其開發的生成式人工智能產品之前,版權作品就已作為訓練數據在模型訓練階段被內化為模型參數,在此過程中作品的價值得到充分轉化,理應向版權人支付經濟補償。而用戶雖然可以在與平臺交互的過程中獲得AIGC,但是并不知曉獲得的AIGC涉及多少版權作品,也不可能在享受平臺免費服務的過程中主動支付該筆費用。其二,根據“誰受益,誰補償”的公平理念,人工智能平臺以營利為目的提供有償市場服務,對版權人既有作品的市場造成侵占,理應支付經濟補償。當前,部分人工智能平臺依靠生成式人工智能大模型,不僅實現了市值的大幅躍升,而且可以基于服務性能差異向用戶收取高性能版本的生成式人工智能訂閱費用。例如,Stability AI公司經過2022年起的三輪融資,市值躍升至約合69億元人民幣;百度公司發布的大語言模型文心一言將應用服務分為免費3.5版本、付費4.0版本、4.0工具版本與4.0Turbo版本,隨著生成式人工智能性能的逐步提升,該收益的前景會變得愈發可觀。
2. 引進類集體管理組織,優化補償收繳工作主體
基于著作權集體管理的現行框架,可以考慮調整我國《著作權法》和《著作權集體管理條例》中關于著作權集體管理組織的“壟斷”設定,允許市場中達到一定條件的版權人群體,如出版社、音樂公司等營利性組織共同參與經濟補償的收繳工作。一方面,著作權集體管理制度在版權人群體中有著深厚的基礎。美國作家協會曾發起一項調查,旨在探討是否可以通過集體管理的方式,補償那些作品被用于培訓生成式人工智能模型的作者,結果顯示:65%的作家支持采取集體管理制度,以確保他們能夠獲得作品被用于人工智能模型訓練的相應費用。[21] 另一方面,出版商等版權人群體,即“類集體管理組織”[22],在市場中實際發揮著集體管理的功能。截至2024年年底,中國音樂著作權協會官網顯示會員數為14064人,其中大多數為具有一定知名度的作曲家、音樂家等。與此同時,我國相當多的民間音樂作品的版權則聚集在如QQ音樂等具有營利性的類集體管理組織。這實際上是版權人在對“非營利性”集體管理組織同“營利性”類集體管理組織的服務意識與服務效率等多方面進行比較后,“用腳投票”的結果。[23] 因此,考慮到我國著作權集體管理的特殊國情,為滿足生成式人工智能作品訓練的需要,在現有的五大傳統著作權集體管理組織(包括音樂著作權協會、音像著作權集體管理協會、文字著作權協會、攝影著作權協會以及電影著作權協會)的基礎上,可進一步引入類集體管理組織,共同承擔版權作品集體許可交易的職能。
3. 采取“比例+單一”的復合補償標準
在稅收領域,按計稅依據的不同可以分為從價稅與從量稅。從價稅是以征稅對象為標準,征稅的額度會隨征稅對象的價值變化而浮動;從量稅是以征稅對象的數量、重量、面積等為標準,采用固定的征收額度。簡言之,從價稅是浮動式的比例標準,從量稅是固定式的單一標準。通過引入稅收概念劃定生成式人工智能使用作品的補償標準,可分為兩種補償方式:①就人工智能平臺整體性使用專業領域作品數據庫的行為,應設置一定的比例標準收取人工智能平臺的年度或季度營業額作為補償金。營業額包括生成式人工智能高性能版本的服務訂閱費、AIGC 商業性使用費等與版權作品關聯的收益。一方面,整體性使用專業領域作品數據庫是訓練與優化生成式人工智能模型的通行做法,例如OpenAI 在獲得Shutterstock公司與美國聯合通訊社(The Associated Press)的數據使用許可后,另外組建WebText語料庫,該語料庫會隨著作品數量變化和生成式人工智能版本迭代而及時更新。另一方面,當作品數據內化為模型參數,在AIGC上識別特定作品的專有價值難以實現,無法采取單一補償標準來為整體性使用作品數據庫的行為提供補償。②就人工智能平臺需要輸出稀缺或特定表達內容的行為,應采取單一標準,按照使用數量或傳統許可模式向特定版權人提供補償。按照“使用數量”提供補償是指生成式人工智能為實現特定領域的內容生成,在版權人特定且作品數量有限,使用對象可量化的前提下,按照使用數量更為精準地向版權主體輸送版權利益;按照“傳統許可模式”提供補償則是指針對生成式人工智能的某些獨特輸出要求,只需要按照傳統一對一授權許可方式進行支付即可。單一補償標準是對比例補償標準的補充,二者互補能夠更好地促進生成式人工智能行業的公平發展。
4. 建立公私利益相互補充的補償分配體系
當完成對版權補償的統一收繳后,就需要解決如何向個體版權人或版權人群體分配作品版權利益的問題。考慮到AIGC 體現的是作品的聚合價值,以某一作品在人工智能用戶端的使用次數等作為分配要素可能失之偏頗,很難實現分配公正。因此,經濟補償的分配問題應遵循“單一+比例”的補償標準邏輯,建立公私利益相互補充的補償分配體系。具體而言,通過單一補償標準所收取的費用,直接付給個體版權人;通過比例補償標準所收取的費用則交由該作品領域的非營利性社會文化基金會統一使用。
首先,通過單一補償標準所收繳的經濟補償,因適用對象具有相對明確的指向性,著作權集體管理組織只需要根據人工智能平臺提供的作品需求目錄,找到限定范圍內的部分作品及版權人,按件計算版權利益,進而在季度或年度分配方案中添加該筆版權補償費用即可完成,這與傳統的收益分配模式并無二致,無須創設新組織來解決費用分配問題。其次,通過比例補償標準所收繳的經濟補償,因該費用是源于數據庫在人工智能平臺的整體使用所帶來的收益,在此情況下,某一特定作品所產生的貢獻并不突出。鑒于作品使用的整體性,派生出補償使用的公共性。此時,有必要利用現有的或創設新的社會文化基金會等非營利性組織將經濟補償用于版權人的群體公益事業,例如美國音樂家聯合會( American Federation of" Musicians)與廣播和唱片公司將錄音和無線電轉錄征稅所得交由信托基金用于公益文化事業建設。
五、結語
生成式人工智能的發展給現有版權制度帶來諸多挑戰。如何解決生成式人工智能在使用作品時的合法性問題,是選擇創設寬松的合理使用條款還是遵循嚴格的授權許可規則,依然存在較大爭議。因為無論采用哪種思路,都不可避免地會側重保護版權人或人工智能平臺的利益。為調和版權人與人工智能平臺之間的利益失衡問題,本文在借鑒德國版權補償金制度的基礎上提出構建生成式人工智能版權補償金制度,該制度貼合生成式人工智能業態發展中不同階段的具體需求,或能避免出現版權人不愿生成式人工智能無償使用作品、人工智能平臺難以承擔高昂研發成本的問題,從而實現二者的良性發展。
延伸閱讀:國家網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》
2023年7月,國家網信辦聯合國家發展改革委、教育部、科技部、工業和信息化部、公安部、廣電總局公布《生成式人工智能服務管理暫行辦法》(簡稱《辦法》),自2023年8月15日起施行。
《辦法》提出國家堅持發展和安全并重、促進創新和依法治理相結合的原則,采取有效措施鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管。
在促進發展具體措施上,《辦法》明確鼓勵生成式人工智能技術在各行業、各領域的創新應用,生成積極健康、向上向善的優質內容,探索優化應用場景,構建應用生態體系;支持行業組織、企業、教育和科研機構、公共文化機構、有關專業機構等在生成式人工智能技術創新、數據資源建設、轉化應用、風險防范等方面開展協作;鼓勵生成式人工智能算法、框架、芯片及配套軟件平臺等基礎技術的自主創新,參與生成式人工智能相關國際規則制定;推動生成式人工智能基礎設施和公共訓練數據資源平臺建設,促進算力資源協同共享,提升算力資源利用效能,推動公共數據分類分級有序開放,擴展高質量的公共訓練數據資源,鼓勵采用安全可信的芯片、軟件、工具、算力和數據資源。
《辦法》明確生成式人工智能服務提供者應當依法開展預訓練、優化訓練等訓練數據處理活動,使用具有合法來源的數據和基礎模型;涉及知識產權的,不得侵害他人依法享有的知識產權;涉及個人信息的,應當取得個人同意或者符合法律、行政法規規定的其他情形;采取有效措施提高訓練數據質量,增強訓練數據的真實性、準確性、客觀性、多樣性。
此外,《辦法》明確了數據標注的相關要求,提出在生成式人工智能技術研發過程中進行數據標注的,提供者應當制定符合本辦法要求的清晰、具體、可操作的標注規則;開展數據標注質量評估,抽樣核驗標注內容的準確性;對標注人員進行必要培訓,提升遵法守法意識,監督指導標注人員規范開展標注工作。