摘要:生成式人工智能大模型語料訓練是否構成侵權,有幾種不同的解釋論。通過對產業界、創作者、其他利益相關者等各方訴求分析,對比不同解決路徑的優缺點,合理使用規則是解決該問題的最優路徑。合理使用規則的適應性,不僅取決于其制度價值本身,還在于傳統“四要素”和“三步檢驗法”分析框架已經發生的變化,即“轉換性使用”在合理使用制度中具有了獨立的地位。新技術時代,“變革性使用”又進一步超越了傳統合理使用理論中對行為人主觀意圖的考量,轉而關注使用行為在客觀上是否推動了技術發展與社會進步。司法層面,合理使用路徑適用于大模型語料訓練具有比較優勢,在當前法律框架下也具有可行性。誠然,也存在典型的不適用合理使用、應當被認定為侵權行為的情形。
關鍵詞:生成式人工智能;合理使用;轉換性使用;公共領域保留;變革性使用
一、問題的提出
生成式人工智能技術的迅猛發展及其日益擴大的應用場景,已然成為社會各界矚目的焦點。在版權領域,這一技術革新不僅對法政策帶來了前所未有的挑戰,實踐中還不斷檢驗著傳統法理的普適性和相關規則的合理性。例如,在人工智能大模型訓練中,其使用語料進行訓練的行為是否具有合法性、是否涉嫌侵犯版權,引發了業界廣泛的關注與討論。
按照基礎模型來區分,人工智能主要包括決策式人工智能和生成式人工智能。決策式人工智能主要學習數據中的條件概率分布,即一套樣本歸屬于特定類別的概率,機器可對新的場景進行判斷、分析和預測。生成式人工智能主要學習數據中的聯合概率分布,即數據中由多個變量組成的向量呈現一定的概率分布,機器可以對已有數據進行歸納總結,并在此基礎上使用深度學習技術等來創作模仿式、縫合式的內容。{1}目前,生成式人工智能被廣泛應用于文字、圖片、音頻、視頻等內容的生成領域,而海量的數據則是生成式人工智能訓練所需要的基礎養料。以生成圖片的大模型StableDiffusion為例,StabilityAI公司在發布之初就聲稱其使用了1200萬個圖像來訓練其模型;其后的開發中使用了更多圖像,并使用了三個不同的LAION數據集。但其絕大部分的圖像,都是從互聯網上公開發表的圖像中抓取的。{2}
在利用圖像對人工智能大模型進行訓練的過程中,不可避免地會觸及到使用他人享有版權的作品作為訓練素材的問題。{3}在很多情形下,從事生成式人工智能研發的企業并未獲取版權人的正式授權,潛藏著侵犯他人版權的法律風險。在此背景下,產業界迫切需要法律與公共政策能夠明確提供關于使用語料的合法性指引。同時,創作者與公眾也高度關注自身利益能否得到有效保障,以及公共利益如何在技術發展的浪潮中得到合理體現。因此,人工智能大模型訓練,特別是生成式人工智能大模型訓練過程中使用語料的合法性及合理性問題,成為人工智能時代亟待研究的重大課題。
司法實踐中所面臨的問題,更是迫在眉睫。2024年10月12日,北京互聯網法院就其受理的數起涉及人工智能文生圖和圖生圖的案件,組織了部分法學專家和經濟學專家進行了較為充分的討論。相關案件中,繪畫創作者主張被告即人工智能開發企業在未經許可的情況下,在語料訓練過程中使用了他們的圖片,侵犯了其版權。該案所牽涉的人工智能模型,是以StableDiffusion模型為基礎,加入被告從網絡上自行搜集的部分圖像進行訓練的一個專門用于輸出中國風圖像的垂類模型。筆者有幸參加了北京互聯網法院組織的討論,但研討會并未得出一個具有共識性的結論。這里,筆者根據討論會上的幾種觀點,結合國內外產業實踐和版權法上的相關規定,探討人工智能大模型語料訓練的合理使用問題,特別是透過法政策視角探討版權合理使用制度適用的空間,試圖建立起新技術背景下基于技術變革的轉換性使用之分析框架。本文研究旨在構建一個既有利于技術創新,又能夠保障創作者與公眾權益的法律環境,為生成式人工智能技術的健康發展提供堅實的法律支撐。
二、幾種主要的觀點
根據前述北京互聯網法院組織的研討會上學者們發表的觀點,結合相關學者的論述,筆者歸納出與會學者的以下五種不同的觀點。
(一)非表達性使用論
非表達性使用論觀點認為,“思想—表達”二分法是作品獲得版權保護的基礎,人工智能訓練屬于“非表達性使用”,不屬于版權法意義上的使用行為,故不構成版權法上的侵權行為。所謂“非表達性使用”,是指不以閱讀、欣賞作品為目的,在結果上也沒有再現作品表達的作品利用行為。{4}持這種觀點的學者認為,生成式人工智能數據訓練中,對于作品的使用屬于通過計算機進行信息處理的范疇,與典型的人類使用存在明顯的差異。{5}人工智能并非理解作品的思想和表達,而是分析其背后的邏輯規律,屬于機械的分析,不產生對于作品表達的理解與欣賞,所以并非傳統版權法意義上的使用行為,因此不屬于版權法的調整范圍。{6}
這一觀點,近期在學術界受到了廣泛的關注。然而,學界尚未能就此形成普遍的共識。相反,一些持反對意見的學者主張,版權法的核心在于保護表達,而非思想。作品的表達實質上是由諸如像素、文字、音調等不同的表達要素通過特定的排列組合所構成的。機器學習在解析人類作品時,所捕捉的正是這些要素間的邏輯規律,因此其本質上仍屬于對作品表達的學習,并未逾越傳統版權法的規制范疇。故此,不能就此斷言機器學習不構成版權法意義上的使用行為。而且,從對于思想與表達的欣賞和學習角度,將機器學習行為歸類于非表達性使用,并不能很好覆蓋全部的機器學習行為。例如,對于計算機代碼的學習這類行為,就是典型的對表達的學習,并不涉及思想。
事實上,非表達性使用論的解釋路徑,對版權體系會造成不小的沖擊。稍有不慎,可能會破壞版權法的內部邏輯。因為版權法上“思想—表達”二分法的基礎分界,必然將非表達性使用歸于對“思想”之使用,可能由此導致對作品之利用成為“脫韁野馬”,游離于版權法之外。實踐中,是否需要以及如何限縮版權法調整范圍,應當在分析和總結更多場景的基礎之上,再得出相應的結論。{7}
(二)機器學習合理使用論
機器學習合理使用論觀點認為,技術中立暗含了技術發展優先的價值傾向,機器學習可以歸于合理使用,因此不侵犯版權。持這種觀點的人認為,人工智能模型在技術系統中屬于底層技術資源,技術效果具有普惠性,所以模型訓練過程中對海量作品的使用具有版權法上的目的正當性。此種使用,既不會影響原作品的正常使用,并且在其他版權保護機制的配合下也不會不合理地損害版權人合法權益。{8}而反對觀點則認為,我國《著作權法》第二十四條對于合理使用的適用范圍規定得相當嚴格,由12項具體行為模式和1條兜底款項組成,且兜底款項也僅限于法律和行政法規的特殊規定。從法治理論的基本觀念出發,法律文本上對于權利的限制條款,本身屬于立法價值上的衡量與選擇,不宜隨意地擴張解釋。此外,也有觀點認為,機器學習論過于忽視了版權人的利益,在商業收益較高的人工智能訓練企業和投入大量精力創作作品的人類作者之間,沒有達到利益平衡。{9}
(三)臨時復制論
臨時復制論觀點認為,機器學習只是臨時復制,或者認為機器學習的復制并非以傳播為目的的復制,因此不侵犯版權。持這種觀點的人認為,版權法中的復制是一種為了傳播進行的準備行為,只有將復制的產物用于傳播,才構成復制權侵權。{10}在機器學習的語境下,數據的處理與分析是一個高度動態的過程。數據被臨時性地存儲在計算機的緩存之中,僅供模型在訓練階段即時調用與分析。一旦學習過程結束,這些數據便會被系統自動清除;既無長期留存之必要,亦非旨在通過復制達到廣泛傳播之目的。{11}這種臨時性、過渡性的數據處理方式,與版權法保護的復制權,在行為模式上存在本質上的區別。
進一步而言,機器學習并未使公眾有機會接觸到用于訓練的作品中所蘊含的獨創性表達。這一過程被嚴格限制于特定的技術框架內,其目的純粹是為了提升算法的精準度與效率,而非將作品內容公之于眾或進行商業利用。因此,從實際影響來看,機器學習并未對權利人的合法權益造成實質性的損害,其復制行為不應被納入版權法所規制的侵權行為范疇之內。
(四)版權侵權論
版權侵權論觀點認為,人工智能大模型訓練屬于商業性使用,現行版權法并未將其歸為合理使用的情形,因此屬于版權侵權行為。持此種觀點的人認為,認定不侵權可能導致法律上的悖論與嚴重的利益失衡。若僅憑海量圖片授權難度大、交易成本高為理論依據,便輕率地判定不構成侵權,這無疑會引發一系列邏輯上的困境。試想,單獨使用他人一張圖片,無疑是對版權的侵犯;當數量增至一萬張時,或許尚可爭議是否構成侵權;但若使用一億張圖片,卻反而可能逃脫侵權的指控,這樣的邏輯顯然站不住腳。
相對于傳統的版權侵權行為而言,人工智能大模型訓練企業未經授權便使用了海量的圖片,其侵權行為情節嚴重、危害廣泛,更應成為法律制裁的首要對象。不能僅僅因為企業規模龐大、利益糾葛復雜,就可以肆意踐踏他人的版權,進行“強取豪奪”。而且,對于那些嚴格遵守版權授權規則,不惜花費大量成本去獲取授權,重視數據合規的企業而言,這樣的判定無疑是不公平的。它們本應是市場中的楷模,卻因他人的侵權行為而產生競爭劣勢。最終,可能會導致“劣幣驅逐良幣”現象,這無疑是對市場公平秩序的嚴重破壞。
此外,人工智能產業領域展現出高度的專業細分特征,其中專注于數據集收集的企業也構成了一個頗為龐大的市場板塊。這些企業需要歷經繁瑣的程序和大量的人財物投入以獲得權利人授權,倘若大數據模型訓練企業能夠合法地、未經授權便輕易地獲取數據,那么數據集收集市場將面臨瓦解的風險。事實上,數據集收集企業的貢獻遠非簡單的收集工作所能概括,它們還承擔著篩選、過濾、處理數據的重任,致力于構建高質量的數據庫。這一環節,對于人工智能訓練來說至關重要。例如,LAION數據庫便是StableDiffusion類生成式人工智能得以發展的基石。因此持版權侵權論的觀點認為,在處理相關案件時,即便判決的賠償金額較少,哪怕只是象征性的,也必須要明確界定該行為屬于侵權行為。
(五)總體國家安全觀論
總體國家安全觀論認為,人工智能大模型訓練客觀上不屬于版權法意義上的合理使用,也不宜用其它解釋論或者方法論來規避其侵權性質,但可以從總體國家安全觀的戰略高度出發,主張不判定其為侵權行為。此種觀點是基于我國在生成式人工智能技術領域可能面臨的落后風險及其對國家安全構成的潛在影響,認為應該從公共政策視角出發,認定在特定時期內允許人工智能大模型企業不經授權地利用公開數據進行訓練。在此期間,為加速技術進步與產業發展,可以暫時犧牲對版權人利益的保護。待人工智能大模型企業完成初步訓練,人工智能技術達到相對成熟階段之后,再重新審視并調整利益分配機制。
對此,反對觀點則認為,技術發展的初衷應是更好地促進權利保護,而非以犧牲正當權利為代價來追求所謂的更高層次的“總體國家安全”,我們必須要堅持以人為本的人本主義價值判斷。“在版權保護中融入人本主義理念,就需要識別出版權制度所作用的諸個體,分析其獨特的訴求、具體的生存樣態、利益陷入沖突的可能性,致力于克服技術對人的價值侵蝕,以最大化地滿足不同個體的‘實現傾向’。”{12}況且,從輸出美術作品、文學作品的人工智能技術訓練,到國家安全之間,相差多層維度,需要細致的論證。否則,籠統地適用總體國家安全觀,不僅在司法裁判上造成困惑,而且更會引發法律的不確定性和國際社會的不安。
三、侵權,還是不侵權?——法政策上的不同選擇
前述五種不同的觀點,分歧明顯,甚至針鋒相對,難以達成共識。實際上,這一問題不僅困擾著中國的司法界,美國的司法界也同樣面臨挑戰。目前,積壓在美國法院的類似案件有20余件,至今尚未做出任何實質意義的判決。其實,問題的核心在于,人工智能大模型語料訓練行為,是構成侵權,還是不構成侵權?諸多針鋒相對、難以統一的觀點所表現出的是人們在法律上的認知、公共政策上的選擇以及法治觀念上的不同;甚或是,參與討論的各學者均已預設立場,缺乏對人工智能產業鏈上各方利益訴求者的傾聽和理解。若要破解這一難題,首要的是清晰界定并理解各方的利益訴求與實際需要,進而確立一個公正而平衡的裁判標準,最終選定一個最為適宜的方案。在制度和規則設計上,我們需要精心平衡人類作者的版權保護與生成式人工智能產業發展的需求。為此,必須全面衡量各方的利益訴求與實際需要,確保從法政策上設計出的制度或者規則既能有效保護創作者的權益,又能為人工智能產業的健康發展提供有力支撐。
(一)產業界的訴求
產業界的訴求,無非是降低交易成本,避免侵權風險。從產業角度來說,對于人工智能大模型訓練企業而言,最重要的問題是如何以一個相對合理的價格,合法獲取海量的用于訓練的優質人類作品資源,法律和公共政策必須給產業一個明確和可行的指引。降低交易成本,可以通過以下幾種路徑。
第一,從法律與公共政策的角度,直接認定人工智能語料訓練不是版權法意義上的使用,直接拿掉人類作者的請求權基礎,這可以直接讓人工智能訓練企業徹底解套。這是“非表達性使用論”或者純粹的“機器學習論”{13}所主張的。此一主張,雖廣受產業界歡迎,但對于創作者來說,則徹底失去對于作品的控制;即使權利人明示作品不允許被用于人工智能大模型訓練,也不能排除產業的使用,也失去了主張獲取收益分配的可能性,因為沒有了請求權的基礎。{14}
第二,將此類使用視為合理使用,允許企業未經授權即可使用作品,且無需支付費用。然而,合理使用規則通常對使用目的和性質有所限制,要求人工智能服務非營利性,如無償或低于成本價提供。這對人工智能企業而言,無疑限制了其商業應用范圍。若采用此路徑,需探索新的合理使用機制,以擴大至商用范疇。
第三,建立人工智能大模型訓練的法定許可制度。從原理上來說,法定許可相比于合理使用而言適用范圍更廣泛,其使用目的可以是營利性的;相較于合理使用往往針對的使用篇幅而言,法定許可使用作品的篇幅、規模也可以更大。{15}不過,法定許可需要向權利人付費,這是明顯不同于合理使用的地方。
第四,建立默示許可+許可撤回/退出制度。公開發表的作品默認可以被使用,除非權利人有明示聲明不得用于人工智能訓練。原則上,這種默示許可的情形,是應該付費的;但付費渠道怎么安排則需要研究。
第五,獲取權利人明確授權。在這個大前提下,鼓勵版權集體管理組織、創作平臺、專業的數據采集企業等,負責給人工智能訓練企業提供訓練所需的資源。{16}這些數據采集企業去獲得授權和支付費用,再將數據做成數據集,并進行初步的整理、篩選、評級等,再賣給人工智能訓練企業。這一路徑理論上具有可行性,但實際推行中會遭遇不小的挑戰。例如“番茄小說”遭抵制的事件,番茄小說平臺在服務協議中加入授權人工智能訓練的內容的時候,就受到了作者們的廣泛抵制。{17}這一事件背后的原因,也是沒有考慮到創作者們的實際訴求與擔憂所導致的。
(二)創作者的訴求
創作者的基本訴求是需要合理的分配機制,避免產生被人工智能所取代的風險。創作者主要關心的是兩個問題:一是自己的作品被用于人工智能訓練能否獲得收益;另一個也許是更為關鍵的,即人工智能對于人類創作者交易機會的剝奪問題。
對于前者,創作者期望建立平衡的利益分享機制。按照傳統的利益對稱理論,創作者認為一個基本原則是:如果允許人工智能訓練企業無償使用其作品,那么生成式人工智能服務就應該是無償的、非營利性的;如果生成式人工智能服務是營利性的,就必須向創作者分享收益。然而,難點在于,對于使用海量作品訓練的人工智能產品而言,單個作品的邊際貢獻是非常低的,恐怕難以準確定價,或者說定價的基準與創作者預期相差甚遠,這無疑增加了交易失敗的風險。{18}
而對于后者,一個可行的解決方案是嘗試建立人工智能生成內容(ArtificialIntelligenceGeneratedContent,以下簡稱AIGC)強制標識制度,要求AIGC必須添加明顯的標識來區分于人類作品,將AIGC和人類作品分為不同賽道,減少其對人類創作者交易機會的影響。近期,網絡游戲《雀魂麻將》的運營團隊在其官方B站賬號發布了一位名為“南楓花”的雀士角色立繪,因該立繪的繪畫質量欠佳、人體結構存在瑕疵等問題,引發了玩家對其是否為人工智能生成內容的廣泛質疑,并招致了玩家群體的強烈抵制。隨后,《雀魂麻將》運營方不得不在官方B站賬號發布聲明澄清,并展示了創作過程中的線稿,證實該立繪確為人類藝術家所作,同時承諾會對原畫中的不足之處進行修改,這才逐漸平息了風波。{19}可見,現階段消費者還是更加愿意為人類作品付費。區分人類作品與人工智能生成內容,在一定程度上可以降低人工智能對于創作者交易機會的影響。目前,關于人工智能生成內容強制標識制度的草案已經進入征求意見階段。{20}預計很快就會落地施行。但究竟是否能達到預期效果,消費者是否更加愿意給人類作品付費,這還有待市場的檢驗。
(三)其他利益相關者
除了創作者和產業界之外,還存在眾多其他潛在的利益相關者,包括公眾、終端用戶、人工智能生成內容的消費者,以及社會組織、政府部門和國家戰略層面的相關方等。這些利益相關者,也都密切關注人工智能技術的發展以及相關公共政策所帶來的影響。
使用生成式人工智能的終端用戶,包括個人用戶和企業。對于后者而言,尤其要注意使用AIGC侵權的問題。因此,企業用戶更加迫切地需要出臺相關的法律和公共政策,厘清原作品權利人和人工智能訓練企業之間的權利義務關系,以避免在使用AIGC過程中“一不小心”就侵犯了原作者的權利。從這個角度來說,建立平衡的利益分享機制,完善授權機制,結合權利用盡原則,可以充分避免這一風險。同時,建立AIGC強制標識制度,可避免企業用戶被AIGC魚目混珠,也便于其核算成本,提高效率。
四、版權合理使用制度的價值取向
(一)權利限制:公共領域保留
在版權法領域,賦權的正當性理論往往以浪漫主義的作者身份為中心,即作者通過帶有“人格意義的表達”{21}或“智力性的勞動”{22},將全新的內容帶入了世界。但是,這種作者范式的理論假設,有時無法解釋所有作者所使用的原材料,{23}也無法解釋全部的創作行為過程。可以說,公共領域的存在及其所構成的對權利之限制,是版權制度的另一面。{24}事實上,在作者的獨創性貢獻之外,公共領域的存在為創作行為的社會外部性及其背后所代表的公共利益之價值取向,提供了理論依據,并形成了權利限制規則的正當性基礎。
具體而言,公共領域保留是指將維持創造者身份的基礎性原材料予以保留,不進行私人賦權,而是留給未來潛在的創作者所共同使用。一方面,公共領域的保留為版權保護邊界的模糊性提供了對價,限制了版權的不合理擴張。當版權法因無法確定獨創性的邊界而將壟斷權利延及作品的全部內容時,作者應當容忍基于公共利益的考慮明顯可以識別出的不應由個人壟斷的部分被保留在公共領域內。{25}另一方面,公共領域的保留是保證知識創造活動可持續性的必然要求。人類文化具有傳承性、累積性,任何作品的創作事實上都不能被認為是純粹的個人創作,因為任何新知識都是站在巨人的肩膀上產生的。{26}將基礎性的創作元素留在公共領域,有利于保留文化發展潛在空間與可能性。“通過公共領域保留對作者享有的版權進行一定的限制,可以防止著作權人對其作品的完全壟斷,這是利用公共領域保留實現維護公共利益的方式。”{27}狹義的公共領域保留理論往往是基于公共利益屬性被排斥在版權法保護范圍之外的客體(如《著作權法》第五條規定的內容);寬泛的公共領域理論還包括了基于公共利益而對權利限制的所有方式,包括強制許可、法定許可、合理使用制度等。事實上,合理使用規則是版權規則體系中為保留公共領域所做出的重要權利限制,避免了以潛在創造者的工作環境變得貧瘠為代價而進行的對個別權利人的激勵,為創作者的共同身份以及創作過程的可持續性提供了保護。{28}
(二)適用版權合理使用的正當性
從價值取向的視角,比較容易分析人工智能技術及其產業發展的當代意義,也能夠合理地討論適用版權合理使用的正當性。
1.人工智能技術及其產業發展存在著巨大的社會利益。新技術時代,此技術具有基礎性、普惠性,不能僅因其具有商業性質,就簡單地否定其公共利益屬性。{29}一般而言,在探討人工智能大模型語料訓練適用版權合理使用的正當性時,僅僅強調其為產業帶來的顯著經濟利益是不足以支撐論點的。這是因為產業的龐大經濟利益與公共利益并非同一概念,而更多地體現為商業利益。鑒于商業巨頭已具備顯著的市場競爭優勢,若再賦予其對創作者作品的合理使用權限,可能會引發利益嚴重失衡、產業壟斷、技術偏見以及創作者交易機會喪失等一系列問題。{30}因此,這一觀點很可能面臨廣泛的質疑與挑戰。
為此,我們必須明確闡述產業利益背后隱藏的公共利益實現的可能性,并努力尋求兩者的和諧統一。畢竟,公共利益的實現很大程度上依賴于產業發展所帶來的技術創新與進步。至于上文提到的利益失衡、壟斷、技術偏見等問題,盡管這些風險確實存在,但并非僅依靠版權法來解決,而應結合《反壟斷法》《反不正當競爭法》等一系列法律法規進行綜合治理,版權法僅發揮在其自身的作用即可。{31}
有人認為,人工智能開發者能夠獲得的商業價值,遠超用于訓練語料的版權本身的價值。因此,生成式人工智能企業能夠從訓練中獲取遠超被訓練語料本身價值的商業利益,那么向權利人支付相應費用便是理所當然的。事實上,在商業價值足夠的情況下,生成式人工智能企業非常樂意向權利人支付費用以獲取授權,從而避免糾紛與爭議,并免于讓自身陷入輿論風波。在筆者參與對某醫學人工智能研究基地的調研中發現,其商業模式是采用患者與醫院簽訂授權協議,允許醫院將基因信息數據用于科學研究等領域;醫院將所收集的基因信息進行處理、加工并做成數據集。然后,由醫院將這些經過處理的信息數據集出售給研發單位。研發單位用這些數據對人工智能進行訓練,開發用于對試管胚胎進行基因篩選的人工智能,淘汰被認為是“存在風險”的胚胎,降低新生兒出生缺陷的概率。此外,人工智能研究基地還在積極探索利益共享機制,與騰訊公司合作,通過微信平臺獲取用戶授權,并向數據提供者支付小額費用,以此規避數據使用不合規的風險。
的確,如果企業可以從海量語料中挖掘出巨大的商業價值,市場自然會形成愿意為其收集語料的產業鏈條,從而避免市場失靈。但現實卻并非如此,甚至是恰好完全相反。正是因為生成式人工智能的直接商業價值往往不足以超過所使用的海量作品的價值,由此才會出現市場失靈。此時,公共政策和合理使用制度的介入顯得尤為重要。那么,我們為什么還要支持這種“虧本生意”呢?
首先,因為除了有限的直接商業價值以外,我們還從中看到了有利于公共利益無限的可能性。生成式人工智能具有如下特點:規模性,需達到百億參數級別;涌現性,能夠產生預料之外的新能力;通用性,不限于專門問題或者領域。{32}當一個大模型經過精心訓練并達到成熟階段后,其潛力與價值便如同沃土一般,能夠孕育出眾多具體且多樣化的應用。這種模型不僅具備基礎性特征,能夠為各類創新應用提供堅實的支撐,還展現出普惠性特征,使得更為廣泛的領域都能從中受益,產生一系列難以直接用商業價值來衡量的間接社會效益。正如高鐵這類基礎設施,在考量其經濟效益時,我們不能僅僅局限于其自身的運營收入和票務收益。高鐵作為現代化交通網絡的基石,對國民經濟的整體推動作用才是更為深遠和重要的。同樣,人工智能大模型就是新時代的數字基礎設施,其對社會經濟、科技創新乃至日常生活的全面賦能,才是衡量其價值的重要維度。因此,在評估大模型的價值時,我們需要具備更加全面和長遠的視角。
其次,生成式人工智能大模型極大地降低了創作門檻,使得更多的主體能夠參與到藝術創作之中,激發蘊藏在廣大受眾中的創作潛力。實踐中,一些創作者已經開始使用生成式人工智能來輔助創作。“對于從業者來說,人工智能繪畫可以啟發靈感,提供創意思路,輔助藝術創作,提升工作效率;對于普通人來說,人工智能繪畫可以展現想象力和個性,讓人享受藝術創作的樂趣。”{33}此外,從科研創新的角度來看,生成式人工智能在處理和分析海量數據時所展現出的強大能力,為科學研究開辟了新的道路。它們對于推動基礎科學、醫學、生物學等領域的發展具有不可估量的價值。從社會福祉的角度考慮,生成式人工智能在醫療、教育、環境保護等領域得到廣泛的應用,顯示出其提升社會整體福祉的巨大潛力。比如,在醫療領域,人工智能輔助診斷系統可以提高診斷的準確性和效率,減輕醫生的工作負擔,讓更多患者受益于高質量的醫療服務。在教育領域,個性化學習平臺可以根據學生的學習習慣和能力提供定制化的教學內容,從而提高教育效果。這些應用,雖然短期內無法直接轉化為顯著的商業價值,但它們對于提升社會整體福祉具有重要意義。
最后,從促進數據共享和開放的角度來看,支持生成式人工智能的合理使用,有助于推動數據的共享和開放,進而促進創新和經濟發展。在數字經濟時代,數據已成為新的生產要素,對于推動產業升級和經濟發展具有重要作用。通過合理使用機制可以激勵更多的數據提供者愿意分享自己的數據,從而形成一個更加開放、協同的數據生態系統,為創新和經濟發展提供源源不斷的動力。
綜上所述,盡管在某些情況下,生成式人工智能的開發可能無法直接帶來顯著的商業價值,但它蘊含著促進科研創新、提升社會福祉以及推動數據共享和開放等多重公共利益的可能性。這些可能性不僅關乎當前的利益平衡,更關乎未來的可持續發展和社會進步。因此,公共政策有必要介入,利用合理使用制度為其掃清障礙。也許正是基于這種意義,有學者提出通過“總體國家安全觀”來為人工智能產業發展紓困解難。
2.存在市場失靈、產業發展面臨困境。如前文所述,生成式人工智能的訓練是一個復雜且耗時的過程,它高度依賴于龐大的數據量來確保其準確性和效率。在實際應用中,這種人工智能所使用的作品規模往往達到驚人的數億級別,涵蓋了文本、圖像、音頻等多種數據類型。面對如此龐大的數據需求,如果要求人工智能訓練企業逐一獲取作品授權,那么所產生的交易成本將會是一個天文數字,這對于任何一家企業來說都是難以承受的。此外,創作者們往往對自己的作品有著極高的價值預期,他們希望自己的創作能夠得到應有的回報和認可。然而,在人工智能模型訓練的過程中,單個作品所起到的實際貢獻價值卻相對較低,很難與創作者的期望相匹配。這種價值認知上的差異,使得雙方在價格談判上往往難以達成一致,由此導致交易失敗的情況時有發生。
面對這樣的問題,產業的進步無疑將遭遇重大阻礙。因此,需要采取積極有效的措施來應對這一困境。通常,針對市場失靈的情況,財政補貼和政策扶持等調整手段被廣泛采用。在此背景下,采用合理使用制度似乎變得尤為必要。這意味著,企業在無需獲得版權人許可和支付報酬的情況下,即可對版權作品進行必要的使用。此舉能夠顯著減輕企業在獲取數據過程中所需承擔的高額交易成本,進而為產業的蓬勃發展注入強勁動力。
3.對作者利益影響有限:非特定性與非競爭性使用。在生成式人工智能語料訓練的過程中,對人類作品的使用展現出了兩個顯著的特點:非特定性和非競爭性。這兩個特點共同構成了該使用方式在版權法框架下具有合理性的重要基礎。非特定性是指人工智能模型在訓練過程中并不針對特定的單個作品進行使用。相反,它會從海量的作品中廣泛提取特征和規律,以構建其內部的知識結構和算法模型。這種使用方式避免了對單個作品的過度依賴或者對特定作品的過度挖掘,從而降低了對版權人利益的潛在損害。在訓練過程中,人工智能模型更像是一個“學習者”,它不斷地從各種作品中汲取營養,以提升自己的智能水平。非競爭性則體現在人工智能生成內容并不會直接替代或削弱原作品的市場價值。盡管生成式人工智能可以創造出與人類作品相似甚至在某些方面超越人類作品的內容,但其生成內容往往具有獨特性和創新性,與原作品形成差異化競爭。此外,人工智能生成內容更多地是作為一種輔助工具或補充資源存在,而非直接替代原作品。因此,這種使用方式并不會對原作品的市場價值造成過分的損害。
基于上述兩個特點,我們可以認為,在生成式人工智能的訓練過程中對人類作品的使用方式符合合理使用的精神。它既沒有過分損害版權人的利益,也沒有破壞市場的公平競爭秩序。相反,這種使用方式有助于推動人工智能技術的創新和發展,為人類社會的進步和繁榮做出貢獻。更何況,版權人“合理容忍的利益減損”本身就是法官衡量的一個方面。{34}因此,在版權法的框架下,應該對這種使用方式給予充分的肯定和保護。
4.轉換性使用對于科技創新與技術進步促進的可能性。生成式人工智能對人類作品的使用可能構成轉換性使用。轉換性使用自從于1994年由美國聯邦法院的坎貝爾案所確立下來,一直被認為是檢驗是否是合理使用的關鍵因素。{35}轉換性使用是指以新的目的或方式使用作品,并在原作品基礎上增加了新表達、新意義或新功能。人工智能在訓練過程中可能會將作品的內容轉換為特定的數據格式或特征表示,這些轉換后的數據并不直接體現原作品的表達內容,而是用于生成新的、與原作品不同的內容。這種轉換性使用有助于推動技術的創新和發展,同時也不會過分地損害版權人的利益。大模型訓練中對作品的使用顯然不同于作品原本的使用方式,其目的在于創造一個訓練大模型的環境,使得大模型可以從中“學習”到重要的規律,甚至涌現出推理等“智能”,以更好地完成多種任務。{36}
從推動技術進步與引發社會變革的宏觀視角來審視,轉換性使用這一概念可以被賦予更為深遠和豐富的解釋。在這種理解下,轉換性使用不僅僅是一種單純的技術手段或操作行為,它更是一種以促進技術創新和進步為核心目標的策略。
具體而言,轉換性使用強調的是對原作品進行再加工、再創造的過程;這種過程并非以侵犯原作者的版權為初衷或目的,而是旨在通過技術手段提取、整合、優化原作品中的信息或元素,進而生成具有全新價值、功能和意義的新作品或新產品。在這個過程中,轉換性使用不僅促進了技術的不斷迭代和升級,還推動了相關產業的快速發展和變革。它使得人們能夠更加高效地獲取、處理和利用信息,也激發了人們的創造力和創新精神,為社會的持續進步和發展注入了源源不斷的動力。誠然,對轉換性使用的深入探討,需要對合理使用規則之價值目標進一步探討。
(三)合理使用規則變遷的價值追尋
從要素分析法為基礎的合理使用,到獨立的轉換性使用理論,再到筆者曾提出的“變革性使用”{37},這一變遷過程,展現的是規則背后的價值追求:不僅是對版權法理論的深化與拓展,更是對技術進步與社會變革的積極響應。轉換性使用作為合理使用制度的一種重要形態,其內涵與外延的演變,深刻反映了版權法在面對新技術挑戰時的靈活性與適應性。事實上,從使用目的的轉換性使用到技術變革的轉換性使用(即變革性使用),這兩個維度的轉換都具有獨立的價值追求,對技術進步或社會變革有著深遠的影響。
首先,轉換性使用規則的建立,在合理使用制度中具有獨立的地位。在一定程度上,這一規則讓人們擺脫了基于“四要素”和具體規則的分析,而是轉入了具有憲法意義的價值追問和理論追尋。坎貝爾案中,法官引入“轉換性使用”的判斷標準,無疑為版權法中的合理使用制度帶來了新的活力與深度變革。{38}這一標準強調,當一項作品被以新的方式、目的或形式使用時,如果這種使用方式能夠賦予原作以新的表達、意義或信息,從而創造出一種全新的審美、批判或教育價值,那么這種使用即被視為轉換性使用,很可能構成合理使用。這一標準的提出,不僅豐富了合理使用的內涵,也在一定程度上挑戰了傳統“四要素”——使用目的與性質、版權作品的性質、使用作品的數量與實質性、對版權作品潛在市場或價值的影響之權威地位。
在隨后的司法實踐中,轉換性使用的地位逐漸凸顯,成為判斷合理使用的重要乃至核心標準。從美國學者的相關研究的統計數據來看,自1994年坎貝爾案后,涉及轉換性使用的判決數量急劇增長;至2017年初,在合理使用相關判決中的占比已高達90%,且其中94%的案件最終被認定為合理使用。{39}這一趨勢反映出轉換性使用標準在司法實踐中得到了廣泛的認可與應用,它以其獨特的靈活性,為眾多創新性的使用行為提供了法律上的正當性依據。
轉換性使用的獨立性體現在其能夠單獨推翻傳統四要素中的某些判斷。例如,一旦作品的使用被認定為轉換性使用,即使該使用具有商業目的(傳統四要素中的第一要素通常對此持負面看法),也可能被視為合理使用。同時,原作是否未發表或是否具有高度的創造性(第二要素),以及復制的數量與實質性(第三要素),在轉換性使用的框架下都變得相對次要。甚至,即使使用行為可能對原作的市場造成一定影響(第四要素),只要這種影響是基于轉換性使用產生的全新價值,而非直接替代原作的市場地位,也可能不被視為侵權。{40}
誠然,或許是轉換性使用過于開放,2023年5月美國聯邦最高法院在安迪·沃霍爾案中,似乎有意限縮轉換性使用的范圍。{41}在該案中,法院將轉換性使用重新定位為“四要素”中第一要素的一個考量因素,而非決定性的唯一標準。合理使用的第一個要素以及對應的轉換性使用分析,都是一個程度問題。{42}這意味著,即使新作品通過添加新的表達、意義或信息實現了轉換性,但如果其使用目的與原作高度相似,且出于商業目的,那么這種使用仍可能不被視為合理使用。這一判決,無疑對轉換性使用的廣泛應用進行了一定程度的限縮。該判決不僅立刻引發了藝術界、攝影界的高度關注,也在生成式人工智能領域引發廣泛擔憂。{43}
的確,對于生成式人工智能而言,這一判決的影響深遠。生成式人工智能技術依賴于對大量現有作品的學習與模仿,以創造出新的、具有獨特性的內容。如果轉換性使用的范圍被限縮,那么這些人工智能技術在訓練過程中可能更容易觸及版權侵權的紅線,從而限制了技術的創新與發展。因此,該判決不僅是對版權法的一次重要調整,也是對技術進步與創作自由之間平衡的一次考驗。
其次,在實踐中,基于使用目的的轉換性使用,也為眾多創新性的使用行為提供了法律上的正當性依據。它鼓勵對原作的二次創作和批評性評論,從而促進文化多樣性和社會開放性。然而,隨著技術的發展,特別是互聯網和數字技術的普及,轉換性使用的內涵開始發生變化,技術變革成為推動轉換性使用發展的新動力。
基于此,筆者嘗試建立起一套適用知識社會發展的新的理論,即筆者曾提出的基于技術變革的轉換性使用——“變革性使用”(Transformative-innovativeUse)。{44}在技術進步與社會變革的宏觀視角下,轉換性使用這一概念可以被賦予更為深遠和豐富的解釋,“變革性使用”成為這一價值追尋中的全新的判斷標準——其強調的是使用行為不僅改變了作品的使用目的,更通過技術的創新應用,實現了作品價值的全新轉化和增值,推動了技術的飛躍和社會的進步。
第一,變革性使用符合合理使用制度的底層邏輯:從文本抽象到理論。從合理使用制度的底層邏輯和版權法的立法目的來看,版權法要保護版權人的私權的同時,“版權法也具有確保憲法所確定的增加知識傳播、發展和繁榮科學文化的目的。后者實現的是版權法更高層次的境界和目的。為此,在版權法這種‘私法’中產生了針對專有權的公共利益,確立這種公共利益甚至被認為對于知識的增長具有實質性意義。”{45}變革性使用正是基于這一理念,通過對技術變革的積極回應,實現了公共領域的有效保留。此外,在面對技術變革時適用傳統的版權法授權,往往存在市場失靈的風險和技術不能的障礙。市場失靈可能源于信息不對稱、交易成本過高或創新激勵不足等問題,導致優質的技術成果無法得到有效傳播和利用。而技術不能則可能源于法律制度的滯后性,使得現有的法律框架無法適應新技術的發展需求。因此,法律不能盲目地擴大甚至主動制造這些障礙,而應當積極尋求制度創新,以適應技術變革帶來的挑戰。
“變革性使用”這一概念,強調的是對技術變革和科技進步具有重大突破性意義的使用行為。這種使用并非簡單地對原有作品進行復制或改編,而是通過對技術的創新應用,實現了作品價值的全新轉化和增值。它超越了傳統合理使用中對于行為人主觀意圖的考量,轉而關注使用行為在客觀上是否推動了技術的飛躍和社會的進步。在這種情況下,將這種特殊方式的使用權轉移給使用者,有利于新技術的開發、推廣與普遍化應用,將為作品創作與傳播開辟新的平臺與渠道,形成整體的社會福利增值。因此,為了追求新技術效果而進行的作品使用方式,在完成市場轉換的情形下,應當構成合理使用行為。
第二,技術變革所形成的新技術環境與市場秩序。隨著技術的不斷發展,特別是互聯網、大數據和人工智能等技術的普及,新技術環境正在形成,市場秩序也在發生著深刻的變化。這些技術變革不僅改變了作品的創作、傳播和使用方式,也對版權制度提出了新的挑戰。技術變遷與版權制度變化之間存在著密切的聯系。歷史上,版權制度往往是在應對技術變革所帶來的侵權問題中逐漸發展起來的。例如,在攝影技術出現之前,美術作品是主要的記錄手段,而攝影技術的出現則顛覆了這一格局,推動了版權制度的變革。同樣,在人工智能時代,生成式人工智能大模型等新技術也在深刻改變著我們的創作方式和文化生態,對版權制度提出了新的挑戰和機遇。
在技術變革時代,創新原則成為引領版權制度發展的重要動力,本身也是市場秩序所追求的目標,因為它符合知識產權促進技術進步及人類共同福祉的要旨。{46}這一原則強調,在保護版權人合法權益的同時,必須鼓勵創新性的使用行為,為技術進步和社會發展提供有力的法律保障。變革性使用正是基于這一原則而提出的,它強調了對技術變革和科技進步的尊重與保護,鼓勵了創新性的使用行為,并為其提供了法律上的正當性依據。
第三,人工智能時代的創新及其生態。人工智能時代的創新不僅體現在技術層面,更體現在整個創新生態的構建上。在這個時代,創新不再是一個孤立的行為,而是一個涉及多個主體、環節和領域的復雜過程。生成式人工智能大模型等新技術正在深刻改變著我們的創作方式和文化生態,為創新提供了更加廣闊的空間和更加豐富的手段。在這一背景下,提出變革性使用顯得尤為重要。它不僅能夠為創新性的使用行為提供法律上的正當性依據,還能夠促進新技術的傳播和應用,推動創新生態的構建和發展。同時,變革性使用也要求我們在面對新技術挑戰時,要保持開放的心態和創新的思維,積極尋求制度創新和技術創新之間的良性互動與平衡發展。
第四,“技術不能”導致責任形態的變化:技術與法律的重構。“技術不能”是版權法在面對技術變革時常常遇到的問題。由于技術的快速發展和法律的滯后性,往往會出現技術手段難以實現法律所預設的行為模式的情況。例如,如果權利人向法院提出停止侵害的訴訟請求,要求生成式人工智能訓練企業將其作品從大模型語料中剔除,這在技術上是難以實現的,或者需要花費巨量成本重新訓練。這種“技術不能”為我們提供了重構技術與法律關系的契機。在人工智能時代,我們需要重新審視和構建版權法的制度體系,以適應新技術的發展需求。變革性使用正是基于這一需求而提出的,它強調了對技術變革和科技進步的尊重與保護,鼓勵了創新性的使用行為,并為其提供了法律上的正當性依據。
第五,變革性使用的判斷標準,主要基于技術變革及其形成的市場轉換,并導致普惠性從而有利于社會整體福利的增值。技術革新與進步是變革性使用追求的核心價值。這種革新不僅體現在對現有技術的改進和優化上,更體現在對新技術、新領域的探索和突破上。例如,在人工智能領域,通過深度學習等技術對大量數據進行訓練和優化,可以實現對作品內容的智能化生成和個性化推薦,這種使用方式就體現了技術的革新與進步。普惠性是變革性使用的另一個重要特征。它要求技術變革帶來的成果必須能夠惠及廣大社會公眾,而不是僅僅局限于少數人或特定利益集團。這種普惠性不僅體現為技術成果的可及性和便捷性,更體現在其對社會經濟、文化、教育等多個領域的深遠影響。只有當技術變革真正實現了全民共享,才能符合變革性使用的核心要求。變革性使用還強調使用行為在完成市場轉換的情形下,應當構成合理使用行為。這種市場轉換不僅是指使用行為對原有市場的替代或顛覆,更是指其通過技術創新和進步,開辟了新的市場空間和商業模式,從而實現了社會福利的增值。例如,在生物科技領域,通過對基因序列等生物信息的分析和利用,可以推動新藥研發、疾病診斷和治療等方面的重大突破,這種使用方式就體現了市場轉換和社會福利增值。
綜上所述,變革性使用在合理使用制度中具有獨立的價值和意義。它不僅豐富了合理使用的內涵與外延,還推動了技術和社會的進步。在人工智能時代,我們需要更加深入地研究和探索變革性使用的理論和實踐問題,為構建更加公平、公正、高效的創新生態系統提供有力的法律保障。
五、版權合理使用規則的司法適用
(一)合理使用路徑的比較優勢
合理使用的路徑相比于其他解決方案的優勢在哪?結合前述幾種觀點,分析如下。
第一,相對于采用非版權意義上的使用即所謂“非表達性使用論”或者純粹的“機器學習論”這類較為新穎且可能引發爭議的解決方案,采用合理使用路徑的比較優勢在于其對版權法體系的沖擊相對較小。這一選擇之所以更為穩妥和可行,主要歸因于其能夠巧妙地依托現有的、為人所熟知的理論框架。它無需引入全新的概念或理論,從而避免了因新概念而可能引發的困惑。相反,它能夠在現有的法律框架內,通過靈活運用和解釋既有規則,有效地解決一系列實際問題。這使得司法實踐中更具可行性和可操作性。相比之下,非版權意義上的使用理論則可能面臨更多的挑戰和爭議。這一理論,試圖對標商標法上的“非商標性使用”,在版權法的框架之外尋求一種全新的使用作品的合法性依據。然而,這種做法不僅會引發法律體系上的混亂和不確定性,還對現有的版權法體系造成沖擊和破壞。{47}因此,在權衡各種因素后,采用合理使用路徑顯然是一種更為明智和可行的選擇。
誠然,也有學者認為,如果真要采用這種“非表達性使用論”或“機器學習論”的理論,其實也可以將其融入到合理使用的分析框架之中,將“非表達性使用”作為合理使用的一種形式。{48}實際上,按照這種觀點,“非表達性使用”就成為了“轉換性使用”的一種形式,符合現有的合理使用規則,不違反版權法的基本原理。
第二,相對于法定許可路徑而言,合理使用路徑更具實操性。法定許可與合理使用,可以作為兩項權利限制制度,均賦予使用人在未獲得版權人授權的情況下使用作品的權利,但兩者在性質上存在著顯著的差異。盡管從表面上看,法定許可似乎更能適應商業化、大范圍引用的現代產業趨勢。{49}然而,在實際操作中卻存在諸多局限性。從法律規則上看,法定許可的適用范圍受到了嚴格的限制。版權法中關于法定許可的規定僅限于《著作權法》第二十五條。如果試圖通過法定許可來解決新型使用方式的問題,就必然需要對法律本身進行大幅度的修改,而合理使用目前已經有可以適用的司法解釋和判例。
事實上,法定許可具有很強的行政強制性特征。如果對此進行相關的立法,其法律條文必須以明確、封閉的形式列舉出具體的適用范圍。然而,生成式人工智能技術發展日新月異,我們很難在當前階段準確預測未來的技術格局和應用范圍。此時,如果我們貿然就在法律中明確法定許可的范圍,很可能會因為立法的滯后性而導致適用范圍過于狹窄,無法滿足未來社會的實際需求。
此外,法定許可雖然允許使用人在未獲得授權的情況下使用作品,但仍然要求使用人向權利人支付費用。在人工智能時代背景下,作品的傳播和使用規模空前擴大,這將導致支付產生的資金成本急劇增加。對于許多使用者來說,這筆費用可能是一個沉重的負擔,從而限制了作品的廣泛傳播和使用。{50}
第三,相對于權利人默示許可(推定許可)+許可撤回體系而言,適用合理使用規則的理論基礎更加妥當。從民法的基本原理出發,默示許可的前提是權利人高概率的具備某種許可的意思,法律由此推定其具有這種意思。例如,依據《著作權法》第三十五條第二款規定,當文章在報刊上發表且作者未明確表示反對時,法律便默認允許其他報刊進行轉載。這一規定是基于一般人的認知以及行業慣例,認為作者在報刊上發表文章即意味著愿意讓更多人看到和了解,因此順應自然規律或生活經驗法則,設定了無需額外明示授權的默認許可原則。
然而,在人工智能大模型語料訓練的情境中,這一推定卻難以成立。與報刊發表文章不同,將作品用于生成式人工智能的訓練是一個全新的、技術性的使用方式,其涉及的權益和影響也更為復雜。而從目前部分領域創作者的反對聲音來看,難以推定作者普遍傾向于同意其作品被用于此類訓練。而且,當前社會對于這一新型使用方式缺乏廣泛共識。不同的作者、不同的行業、不同的社會群體可能對此持有不同的看法或態度。在這種缺乏共識的情況下,決然地法定為默示許可,顯然并不妥當。同時,對于許可撤回這方面來說,合理使用路徑并不排斥權利人通過事先聲明的方式來限制他人對作品的使用。實際上,《著作權法》第二十四條第一款第(四)(五)項正是采用了這種方案,為權利人提供了保護其作品不被隨意使用的途徑。因此,采用合理使用也可以達到類似許可撤回的效果。此外,默示許可雖然在一定程度上簡化了授權流程,但原則上依然要求使用人向權利人支付費用,同樣會增加使用人難以承受的負擔。
第四,相對于需要權利人明示授權而言,合理使用規則減少了科技進步的交易成本,避免交易失敗和市場失靈現象。盡管由版權集體管理組織、創作平臺、專業的數據集收集企業等單位來進行數據收集工作,并隨后將這些數據提供給人工智能訓練企業的方法,在理論上看是可行的,但實際操作中卻面臨諸多問題。如前文所述,生成式人工智能雖然潛力巨大,但對于訓練企業而言,其直接商業價值往往難以覆蓋使用海量數據所需的高額成本。這種成本與收益的不匹配,使得交易雙方很容易陷入僵局,導致交易失敗。我們完全可以建立以合理使用路徑為原則,同時鼓勵數據收集企業積極尋求差異化的競爭策略。例如,數據收集企業可以對自己的數據集合產品進行深度加工和挖掘,提煉出更具獨特性和價值性的信息。他們可以通過數據清洗、標注、分類等方式,提高數據的質量和可用性,從而為自己的數據產品增加更多的附加值,提升其市場交易價值。此外,數據收集企業還可以考慮與其他行業進行合作,共同開發定制化的數據集產品。比如,他們可以與醫療、教育、金融等領域的專業機構聯合,針對特定領域的需求,收集并整理相關的數據資源。這樣的定制化產品不僅能夠更好地滿足人工智能訓練企業的實際需求,還能夠提升數據產品的市場競爭力,從而吸引更多的購買者。
總之,通過尋求差異化的賽道和增加數據產品的附加值,數據收集企業可以在激烈的市場競爭中脫穎而出,為人工智能訓練企業提供更加優質的數據資源。這樣,即使合理使用規則確立,也不至于摧毀數據產品的交易市場。
(二)適用合理使用的路徑分析
第一,我國現行法律或司法解釋并非沒有相應的安排,人民法院可以靈活地使用自由裁量權做出合理使用的認定。客觀上,《著作權法》第二十四條第一款明確列出了12項具體行為模式,并附帶了一項嚴格法定主義傾向的兜底款項,導致合理使用僅僅適用于有法律或者行政法規規定的情形。不過,2011年《最高人民法院關于充分發揮知識產權審判職能作用推動社會主義文化大發展大繁榮和促進經濟自主協調發展若干問題的意見》第8條指出,“在促進技術創新和商業發展確有必要的特殊情形下,考慮作品使用行為的性質和目的、被使用作品的性質、被使用部分的數量和質量、使用對作品潛在市場或價值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不至于不合理地損害作者的正當利益,可以認定為合理使用。”{51}該指導意見目前仍然有效。這意味著我國法院在特定條件下,可以借鑒“四要素”標準和三步檢驗法,對合理使用的范圍做出適當突破,以符合版權法的基本要義之一——“促進社會主義文化和科學事業的發展與繁榮”(《著作權法》第一條)。而生成式人工智能大模型語料訓練,恰好符合“促進技術創新與商業發展”的前提,具備適用合理使用規則的司法空間。
第二,《著作權法》第二十四條第一款第(十三)項“法律、行政法規規定的其他情形”,無疑為版權法的司法實踐及制度安排預留了規則配套與創新空間。這一兜底款項的存在,意味著在應對新興技術、新型使用方式等復雜多變的現實情境時,法律能夠保持一定的靈活性和適應性。在構建合理使用制度的過程中,特別是在涉及生成式人工智能這一前沿科技領域時,我們可以充分利用這一兜底條款。通過工信部、網信辦等多個部門聯合出臺相關政策,可以逐步明確和擴展合理使用的具體情形和適用范圍。這些政策不僅可以細化合理使用在生成式人工智能方面的具體應用規則,還可以為司法實踐提供明確的指導和依據。同時,這一兜底條款也鼓勵了司法工作者在面對新型案件時,能夠積極運用法律解釋和推理技巧,將合理使用制度的精神和原則與具體案件相結合,從而做出公正、合理的判決。這種司法實踐的創新和探索,不僅有助于完善版權法的制度體系,還能夠為技術的進步和產業的發展提供有力的法律保障。
第三,司法實踐中的探索與突破。在司法實踐中,雖然大多數情況下法院會嚴格依據《著作權法》第二十四條所列舉的12種情形來認定合理使用,但也有一些案件嘗試突破了這一限制。例如,上海知識產權法院在上海美術電影制片廠與浙江新影年代文化傳播有限公司等版權侵權糾紛案中,就引入了“轉換性使用”的概念,并結合四要素的判斷方法,認定涉案作品在電影海報中的引用構成合理使用。該判決指出,雖然被上訴人在其電影《80后的獨立宣言》宣傳海報中使用了“葫蘆娃”“黑貓警長”的美術形象,但是這種使用并非單純展現原作品的藝術美感和功能,而是反映了“80后”一代的時代特征,屬于轉換性使用,且比例較小,占海報面積不突出,不影響涉案作品的正常使用,也未不合理地損害版權人的合法利益,因此認定是合理使用。{52}此案還入選了2016年上海知識產權保護十大案件,足以說明我國法院在合理使用制度上有足夠的探索空間和自由裁量權限。
(三)不適用合理使用規則的情形
盡管我們原則上可以通過合理使用路徑支持生成式人工智能大模型進行語料訓練,但仍需注意的是,創作者的利益也不容忽視。杰出的人類創作者及其創作的優質作品,無疑是推動生成式人工智能蓬勃發展的不竭源泉。我們絕不能采取竭澤而漁的方式,忽視了對人類創作者應得收益的公正分配。否則,這些才華橫溢的創作者可能會因缺乏激勵而逐漸退出這一領域,最終將導致人工智能的發展陷入無源之水、無本之木的困境。因此,為了保障人類創作的繁榮與人工智能的可持續發展,我們必須對各方利益進行巧妙的平衡,絕不能放任人工智能訓練企業無節制、無約束地使用創作者的作品。
在此背景下,明確界定哪些行為被排除在合理使用的范疇之外——即制定出“負面清單”,顯得尤為重要。以下是幾種典型的、應受到嚴格限制的使用行為,它們不僅侵犯了創作者的權益,也阻礙了創作的健康發展,應被排除在合理使用范圍之外。
第一,惡意地繞過技術手段采集數據的行為。對于他人享有版權的作品“合法獲取”,可以用來輔助合理使用的判斷。{53}某些企業可能采用不正當手段,如破解、規避創作者為保護其作品而設置的技術保護措施,擅自采集和使用數據。例如,一個藝術家為了保護自己的畫作不被非法復制,特意在作品中嵌入了數字水印。然而,某些人工智能訓練企業卻通過技術手段繞過這些保護,大量采集畫作數據進行訓練,這無疑是對創作者權益的嚴重侵犯。
第二,使用創作者聲明不得用于人工智能訓練的作品進行訓練的行為。有些創作者在發布作品時,會明確標注“不得用于人工智能訓練”等限制條件。然而,一些企業卻無視這些聲明,擅自使用這些作品進行人工智能訓練。比如,一位作家在發布自己的小說時,特別聲明其作品不得被用于任何形式的人工智能創作或訓練。但某人工智能訓練企業卻無視這一聲明,將小說內容作為訓練數據,這不僅侵犯了作家的版權,也違背了其意愿。
第三,故意進行過擬合訓練,使得生成式人工智能取代創作者的交易市場。一些企業可能通過過度訓練人工智能模型,使其能夠高度模仿甚至替代特定創作者的風格和作品。這種行為不僅剝奪了創作者在市場上的獨特地位,還可能導致整個創作市場的失衡。前文中提到,構成合理使用的一個重要考量因素就是非特定性、非競爭性的使用,不會影響被使用作品權利人本身的市場利益。因此,采用此種方式訓練生成式人工智能的目的就是替代,當然屬于典型的非合理使用的情形。例如,此前曾引起廣泛爭議的針對歌手孫燕姿的音色模仿的AI孫燕姿案,這種行為屬于典型的對于人工智能技術的濫用,不僅涉及侵犯版權鄰接權的問題,還涉及侵犯人格權和不正當競爭等多種違法行為。{54}在比較極端的例子中,一位插畫師向其客戶交付了兩組插畫后,客戶直接針對這兩組插畫進行深度學習訓練,最終開發出一款能夠高度模仿其畫風的人工智能模型,此后就不再委托該插畫師完成相關任務。這些做法不僅損害了插畫師的利益,也破壞了市場的公平競爭環境。因此,不能認定過擬合訓練為合理使用。
為了保障人類創作者的權益和創作活動的健康發展,我們必須對上述使用行為嚴格限制和遏制。同時,也應積極探索和建立合理的收益分配機制,以激勵更多的創作者投身于創作事業,為人工智能的發展提供源源不斷的創新動力。
六、結語
事實上,我們應該保持對人工智能的積極態度,并樂觀地看待其發展趨勢。在攝影技術尚未誕生之前,人類有著強烈的記錄影像的需求,因此,絕大多數美術作品都傾向于寫實風格。人像畫師和寫實派風景畫師構成了畫家群體的主流,雕塑作品也多以人像為主。評價體系更是高度強調作品與現實的貼合度,越接近現實中的形象,越被視為上乘之作。然而,攝影技術的出現徹底顛覆了這一格局,使得任何人都能輕松實現留影的愿望,無需再歷經數年甚至數十年的刻苦訓練。這一變革催生了攝影師這一新職業。但與此同時,畫家和雕塑家的行業并未因此走向衰落,而是轉向了非現實性的創作,從對客觀世界的寫實描述逐漸過渡到靈感性的藝術創作,這似乎更能凸顯創作的真諦。
同理,人工智能技術的發展也在催生著新的崗位,如Prompts調整師等。創作的重心從以往的手動繪畫轉變為如何巧妙地設計Prompts和參數;更為關鍵的是,如何利用個人的審美眼光挑選出更優的成品并進行進一步的加工和完善,這一過程更加貼近“創作”的本質。需要明確的是,人工智能缺乏意識,無法理解人類的審美情感,只能進行機械性的學習,無法對生成的內容進行美學上的判斷。因此,必須由人類來進行挑選和把關。從這個角度來看,人工智能永遠無法完全取代人類創作者的地位,所以我們無需為此感到焦慮,更不必對人工智能參與創造活動抱有敵意。以人工智能AlphaGo為例,在其相繼擊敗圍棋界的頂尖高手李世石與柯潔之后,一度有人悲觀地預言圍棋行業將步入沒落。然而,實際情況卻大相徑庭。圍棋領域在被人工智能攻克后,不僅沒有萎縮,反而迎來了前所未有的發展機遇,其影響力顯著擴大。越來越多的人對圍棋產生了濃厚興趣,并積極投身于圍棋活動中。對于棋手而言,人工智能更成為一個提升自我水平的強大工具,眾多棋手通過學習和借鑒人工智能的招法,實現了技藝的飛速進步,推動人類圍棋的整體水平邁上了一個嶄新的臺階。
(作者系北京大學法學院教授、博士生導師,國際知識產權研究中心研究員)
(本文得到北京一言之文化發展有限公司甘夢恒研究員協助和支持,特別致謝)