摘" "要: 生成式人工智能的興起引發了網絡版權領域新的侵權糾紛類型與平臺責任關注。在版權直接侵權層面,AIGC服務提供者并不必然構成演繹權侵權,但發生“模型記憶”時受信息網絡傳播權規制;在版權間接侵權層面,AIGC服務提供者版權替代責任的認定依賴于用戶直接侵權的成立。內容呈現模式的封閉性決定了AIGC版權侵權判定的特殊性,但內容輸出量級的放大效應客觀增加了社會整體的版權侵權風險。為此,需要聚焦AIGC服務提供者注意義務的具體情形,設定科學的事前、事中與事后版權保護措施體系。
關鍵詞: AIGC;版權;信息網絡傳播權;演繹權;直接侵權;間接侵權;注意義務
中圖分類號:TP18;D9" "文獻標識碼:A 文章編號:1004-8634(2024)06-0039-(11)
DOI:10.13852/J.CNKI.JSHNU.2024.06.004
生成式人工智能(AIGC)的快速崛起和廣泛應用,使得對網絡服務提供者版權侵權責任的關注由傳統的內容傳播領域轉向全新的內容生成領域。此前,網絡服務提供者版權侵權責任的歸責與否,在于是否幫助了侵權內容的傳播。AIGC作為全新的網絡服務類型,涉及的則是侵權內容的生成。由此,AIGC模式下存在哪些版權侵權類型,對應的AIGC服務提供者責任應當如何判定,是AIGC時代版權領域亟待解決的全新議題。
一、國內外AIGC服務領域版權侵權糾紛凸顯
1.國外AIGC領域版權侵權訴訟大量涌現
2022年11月30日,美國人工智能公司Open AI發布ChatGPT,短短2個月,用戶量便超過1億,成為互聯網歷史上增長最快的應用,本輪生成式人工智能的變革由此興起,美國也成為AIGC版權侵權糾紛出現最早也最為突出的國家。據不完全統計,自2022年11月至2023年12月,共發生12起AIGC服務提供者被訴案件,1 其中最具代表性且訴訟進程最快的當數2023年1月13日在加州北區法院受理的Andersen等三位藝術家起訴Stable Diffusion、Midjourney、DreamUp等AIGC平臺的版權侵權集體訴訟(以下簡稱“Stable Diffusion版權案”)。2
梳理該案件可以看到,在AIGC內容輸出階段,版權人的訴請主要有三:由于AIGC輸出的內容完全依賴于對語料庫中被訓練版權作品的學習,所以每次輸出的圖像均構成演繹權侵權(對應我國版權法上的改編權侵權);用戶使用版權人姓名作為提示詞,生成與版權人作品高度相似的內容并加以傳播,構成版權直接侵權;AIGC服務提供者在產品研發時,要么知道、要么放任自身的服務具備可以被用戶用來生成侵權內容的功能,所以構成版權間接侵權。
2023年10月30日,加州法院針對被告提起的“駁回原告起訴動議”做出裁定,認定原告的上述三類侵權指控均不成立。1 首先,法庭認為構成演繹作品應當與在先作品存在表達層面的實質性相似,而原告卻強調AIGC的輸出內容不管以何種方式“參考”在先作品,都應被認定為演繹權侵權。其次,法庭認為原告未能舉證用戶利用AIGC服務生成的圖像與自身作品存在實質性相似部分。再次,法庭認為版權間接侵權的成立必須以直接侵權為前提,但基于上述兩項原因原告未能滿足這一前置條件。
2.國內AIGC平臺版權侵權責任首案獲判
2024年2月8日,廣州互聯網法院就國內“大模型服務商版權侵權責任第一案”適用簡易程序做出判決。2 原告上海新創華公司享有奧特曼美術作品的國內版權授權,被告Tab平臺則向公眾提供AI文生圖服務。原告經測試發現,被告平臺可以輸出和自身作品相同或相似的奧特曼圖片,故向廣州互聯網法院提起版權侵權訴訟。3 原告主張被告構成復制權、改編權與信網權侵權。在責任承擔方面,法院認定被告負有停止侵權與損害賠償兩類義務:對于停止侵權,鑒于被告僅為AIGC服務提供者而非模型訓練者,因而無法承擔刪除訓練數據集中涉案作品的義務,但要求被告需要進一步采取“關鍵詞過濾”等措施,防止后續生成與涉案作品實質性相似的內容;對于損害賠償,鑒于被告未能履行AIGC服務提供者應具備的“建立投訴舉報機制的義務”“提示用戶侵權風險的義務”“對生成物進行顯著標識的義務”等合理的注意義務,法院認定被告具有過錯,故應當承擔損害賠償責任。
2024年6月20日,北京互聯網法院在線開庭審理了四起插畫師起訴AI繪畫軟件開發運營者的版權侵權案件。原告提出的主張是,被告抓取原告作品輸入AI模型的行為,侵犯了原告的復制權;涉案AI繪畫軟件提供原告作品與其他圖片雜糅、混合產生新圖的技術服務,侵犯了原告的改編權,等等。截至2024年11月,該案仍在審理中。4
3.AIGC服務提供者版權侵權責任的聚焦
需要說明的是,本文對AIGC服務提供者版權侵權責任的探討,聚焦于“內容生成階段”,即用戶使用AIGC服務生成版權侵權內容的情形下,AIGC服務提供者對此應如何承擔責任的問題。至于“模型訓練階段”,AIGC模型開發者未獲授權利用他人作品進行模型訓練優化應當承擔何種版權責任的問題,并非本文討論的范圍。5
在“內容生成階段”,圍繞AIGC服務提供者需要探討的版權侵權情形,主要有兩大方面:一是涉及版權直接侵權領域,這主要出現在AIGC服務提供者在生成內容時,盡管使用者并無侵權的主觀意圖,但服務提供者仍可能面臨版權侵權責任的問題。二是涉及版權間接侵權領域,這指的是當使用者故意利用AIGC服務生成侵權內容時,AIGC服務提供者所應承擔的侵權責任問題。本文將聚焦上述兩類具體侵權責任類型展開論述,并從AIGC服務提供者合理的注意義務著眼,建構科學可行的AIGC服務提供者版權保護措施體系。
二、版權直接侵權語境下AIGC服務提供者責任論證
所謂“版權直接侵權”,是指行為人直接從事版權法專有權利規制范疇的行為。6 從國內外司法實踐來看,目前AIGC服務提供者版權直接侵權主要集中于兩類情形:一是大模型每次輸出的內容是否均構成演繹權侵權,這是基于大模型訓練高度依賴對在先作品的學習而引發的質疑;二是“模型記憶”情形下,大模型可能會直接輸出和被訓練作品相同或相似的內容,進而落入信息網絡傳播權1 規制的范疇。
1.AIGC輸出內容并非絕對構成演繹權侵權
從美國相關司法實踐來看,以作家和畫家為代表的版權人針對AIGC服務提供者提起的系列版權侵權訴訟中,第一個主張便是AIGC輸出的所有內容均構成演繹權侵權。在前述“Stable Diffusion版權案”中,原告認為Stable Diffusion模型唯一做的事情就是通過內容處理技術將語料庫中的他人作品圖像(latent image)“拼合”(interpolate)為混合圖像(hybrid image)。作為“一個21世紀的拼貼工具”(a 21st-century collage tool),Stable Diffusion系統生成的任何一張輸出圖像,都是從被訓練的版權人作品中演繹而來,其自身沒有內容創作貢獻。
在美國,對于演繹作品(derivative work)的規定最早始于《1909年版權法》,是指“根據一部或一部以上的已有作品創作完成的作品”。2 因此,一個新內容要被視為演繹作品,就必須與原作品存在內容上的相關性,并以某種方式“復制”原作品的獨創性表達。《著作權法》對應存在改編權的規定,即“改變作品,創作出具有獨創性的新作品的權利”。改編權強調在已有作品的基礎上經過創造性勞動而派生出來新的作品。因此,構成改編作品需要與原作品在表達層面具備實質相似,或者說改編作品需要利用原作品的獨創性表達。3
在“Stable Diffusion版權案”中,原告的訴請存在明顯的成立障礙。因為原告強調“不管以何種方式參考(reference)在先作品,新作品都應被認定為演繹作品”,但未能舉證被告產品輸出的內容和自身作品在表達層面存在相似性。從判例法角度看,美國法院長久以來一直堅持新作品必須包含原作品的實質性部分,才能被視為演繹作品。4 由此,加州北區法院在2023年10月30日的裁定中,駁回了原告此項演繹權侵權主張,認為原告未能提供初步證據表明被告產品輸出的任一內容和自身作品存在相同或相似。
2.AIGC原則上不會輸出與語料作品相同的內容
長久以來,各界關于大模型內容生成機制最常見的誤解之一便是,用作模型訓練的作品內容會被“復制存儲”在模型參數之中,進而會被根據用戶的提示詞觸發原樣輸出。例如,在美國特拉華州法院2023年2月3日受理的“Getty Images訴Stable Diffusion版權侵權案”中,原告便主張“Stable Diffusion模型會直接復制并時常生成輸出與Getty自身圖片高度相同的內容”。但在2023年7月12日美國國會“人工智能與版權問題聽證會”上,Stability AI則針鋒相對地表示,“Stable Diffusion模型不會拼貼(collage)或縫合(stitch)被訓練作品的具體內容,也并非作為現有作品的‘搜索引擎’而直接輸出復制內容”。5
從AIGC技術原理來看,雖然AIGC模型建立在對海量語料內容的訓練基礎之上,但正常狀態下并不會復制輸出任何字面意義上的語料內容。在模型訓練階段,大模型會分解語料庫中被訓練的作品內容,將其轉換為模型參數,類似于人類大腦中神經網絡的組成部分。對于“文生圖模型”來講,其訓練學習的是在先圖像中的基礎視覺結構,如形狀、紋理,還有圖案;對于“文生文模型”而言,其訓練學習的是人類語言系統的基本結構,像不同語境下詞語、句子、段落、文章在被創作組合過程中體現的復雜樣式。在內容生成階段,AIGC大模型可以通過將使用者輸入的提示詞分解為加權標記,在統計學中的自回歸等原理下,調取模型參數,進一步生成全新的內容表達。6
2023年12月27日,備受國內外AIGC行業關注的“《紐約時報》訴OpenAI與微軟案”在美國紐約南區法院受理。原告在起訴狀中便主張,ChatGPT會直接輸出和自身文章高度相似的內容,包括逐字逐句的復制。1 但緊隨其后,被告OpenAI于2024年1月8日通過官網回應并質疑道:“看起來他們(《紐約時報》)故意操縱提示詞,包括大量的文章長篇摘錄,誘導我們模型輸出重復內容。但即使在這樣的提示詞下,我們的模型通常也不會像《紐約時報》暗示的那樣行為,這表明他們要么指示模型重復,要么從多次嘗試中挑選他們希望故意得到的內容。”2 2024年2月8日,在廣州互聯網法院判決的國內“大模型服務商版權侵權責任第一案”中,原告也是采取了和《紐約時報》類似的侵權發現手段,通過輸入“和自身作品相關的提示詞”,主動監測被告平臺能否輸出侵權內容,并最終成功舉證被告構成復制權與改編權侵權。然而根據OpenAI針對《紐約時報》起訴的抗辯,如果大模型產品輸出和版權人相同或相似的內容是原告刻意制造的,而非廣大使用者正常生成的,那么該行為是否缺乏實際損害或即便構成損害也程度極為有限同樣值得關注。
3.AIGC“模型記憶”時構成信息網絡傳播權侵權
只有在非正常狀況下,AIGC模型才會輸出和被訓練語料作品一致的內容。計算機科學領域稱之為“模型記憶”(memorization)。這被認為是AIGC模型的一個需要修復的“bug”,而非正常的功能狀態。當發生“模型記憶”時,AIGC平臺會輸出和被訓練語料相同或高度相似的內容,即使用戶輸入的是無侵權誘導風險的提示詞。此時,AIGC平臺在版權法上的身份是直接的內容提供者(Internet Content Provider,縮寫ICP)而非被動的技術服務者(Internet Service Provider,縮寫ISP)。若未獲得相應的授權,便會構成復制權、改編權以及信息網絡傳播權侵權等。
對于復制權與改編權的侵權評價標準,理論和實務界并不存在過多爭議,因此本部分主要聚焦于信息網絡傳播權侵權判斷標準的討論。值得關注的是,在廣州互聯網法院審理的國內“大模型服務商版權侵權責任第一案”中,法院最終也僅是判定前兩類侵權成立,并沒有對被告信息網絡傳播權侵權做出具體認定。根據我國《著作權法》規定,“信息網絡傳播權即以有線或者無線方式向公眾提供,使公眾可以在其選定的時間和地點獲得作品的權利”,但理論界和實務界對于信息網絡傳播權侵權的判定一直存在較為激烈的探討,并出現了“用戶感知標準”“實質性替代標準”“服務器標準”等多個判定標準。從司法實踐來看,“服務器標準”目前的認可度較高,它需要滿足兩項條件:一是將特定作品上傳到服務器之中;二是使不特定的用戶可以在自己選定的時間和地點獲取上述作品。3
“模型記憶”情形下,AIGC平臺輸出被訓練語料作品的行為之所以落入信息網絡傳播權的規制范疇,是因為:一方面,由于輸出的內容和訓練語料中的作品相同或高度相似,所以AIGC服務提供者相當于“將相關的作品內容提前存儲于自身服務器之中”;另一方面,雖然AIGC服務提供者和用戶是通過“一對一”的封閉模式進行內容交互,但實際存在向不特定用戶輸出同一“記憶”內容的現實可能,相當于“使得不特定主體可以通過交互方式獲得特定作品”。
“模型記憶”問題應當說是在大模型技術發展過程中,一個正在通過技術逐漸完善而被努力克服的問題。Open AI在針對《紐約時報》版權侵權起訴的回應中表示,“內容復制是大模型致力于徹底消除的錯誤,但當特定內容在訓練數據中出現不止一次時,這種情況就會出現”。國外相關研究表明,“模型記憶”發生的原因有三:第一,模型語料庫中存在大量重復的作品內容;第二,與特定文本描述相關聯的語料內容過于單一;第三,相較于模型參數的規模,訓練語料規模明顯不足。例如,當與特定圖像模式描述相匹配的內容語料過于單一,或眾多語料內容之間僅有細微差別時,Stable Diffusion等文生圖模型便很容易輸出和被訓練語料高度近似的內容。4
三、版權間接侵權語境下AIGC服務提供者責任探討
整體來看,AIGC平臺符合“技術中立性”的要求,提供的僅是一種被動的技術服務,用戶如何利用其服務進行內容生成,決定了版權侵權的發生與否。由此,對于AIGC服務提供者版權責任的探討,需要首先思考版權直接侵權下,用戶利用AIGC服務生成侵權內容的情形,進而判斷版權間接侵權下,AIGC服務提供者對于用戶直接侵權行為需要承擔何種程度的替代責任問題。
1.AIGC內容生成機制符合“技術中立性”要求
談到“技術中立性”原則,不得不提及美國版權法上具有里程碑意義的“索尼案”。1 該案確立了版權領域“間接侵權責任”判定的基礎:對于任何一項技術的價值,都可以在“工具性”和“目的性”兩個維度上理解,索尼的意圖原本不過是發明一種中立的錄像工具,技術如何被使用最終在于人的目的。換句話說,作為價值的善或惡,被中立論者從技術身上剝離下來,“赤裸”的技術本身仍然可以是純粹的、無偏見的。2 “技術中立原則”對于信息技術產業的發展進步尤為重要,并被稱為“電子時代的自由大憲章”。
生成式人工智能的基本原理和技術特點,使得其與傳統網絡傳播領域的服務提供者在侵權責任判定上存在本質區別。從內容生成角度來看,一方面,AIGC平臺本身不會主動輸出任何內容。AIGC平臺輸出的內容都是由使用者通過“提示詞”觸發,調取經過預訓練后形成的模型參數“DIY”(Do It Yourself)而成;另一方面,AIGC平臺不會事前存儲后續將要輸出的內容,因為大模型內部存儲的模型參數,不是訓練語料庫中的作品內容本身,而是學習相關作品內容后獲得的語言表達、圖像表達的內在趨勢、模式和相關性等。從內容傳播角度來看,一方面,AIGC平臺生成的內容不會向不特定第三方主體展示,AIGC平臺輸出的內容都是通過“一對一”問答的形式存在于封閉的用戶交互界面中,除非使用者主動進行后續的傳播、擴散,否則第三人無法直接獲取相關內容;另一方面,AIGC平臺也不會主動公開傳播使用者生成的內容,對于生成內容是否進行公開傳播以及采用何種方式進行傳播,是由使用者而非AIGC服務提供者享有最終的決定控制權。
從上述模型機制來看,AIGC平臺對外提供的是一種通用型的內容生成服務,符合“技術中立性”原則。在廣州互聯網法院審理的國內“大模型服務商版權侵權責任第一案”中,判決明確表示:“生成式人工智能具有一定的工具性,既可以用于合法目的,也可以用于非法目的……賠償損失責任的承擔需要考慮被告的過錯問題?!币蚨?,在技術中立視角下,不應將單純的技術服務與責任承擔直接掛鉤,需要論證服務提供者的具體過錯情形。作為內容生成領域的一項通用技術服務,即使用戶存在利用AIGC服務實施侵權行為的可能性,也不應直接推定AIGC服務提供者存在過錯并因此承擔侵權損害賠償責任。
2.用戶使用方式決定生成內容版權侵權與否
從實踐來看,使用者利用AIGC服務生成版權侵權內容主要存在兩類情形:一類是使用者向AIGC平臺輸入了具有“侵權誘導屬性”的提示詞,進而導致版權侵權內容的生成。例如,用戶可能出于獲取與特定版權人或特定作品相關的內容目的,向AIGC平臺輸入某位作家、畫家或某部作品的名稱以及類似“仿照”“參照”“改編”等侵權誘導提示詞。在此情形下,使用者經由AIGC平臺生成的內容存在對在先作品復制權、改編權等的侵害風險。但此時還需要注意,若使用者只是利用AIGC服務生成與在先版權人“風格”相同的內容,則未必構成版權侵權。3 另一類是使用者向AIGC平臺輸入未經授權的作品,并指示其在此基礎上進行加工或再創作。此時,使用者經由AIGC平臺生成的內容可能構成對他人作品復制權或改編權的侵害。實踐中最為常見的便是“圖生圖”的情形,即使用者向AIGC平臺輸入特定的美術作品,并要求大模型在此基礎上加以調整、修改以形成新的圖像內容。若用戶未獲得該美術作品的相應授權,且生成的新內容仍可以體現出原作品的獨創性表達,此時新的演繹作品便存在版權侵權的現實風險。
值得注意的是,大模型之所以容易被使用者誘導進行侵權內容的生成,和模型內容生成機制固有的“奉承”(sycophantic)特征密切相關。Google、DeepMind、Anthropic等大模型廠商的最新研究表明,“奉承”是AIGC模型的共性問題。因為在模型訓練階段,AIGC行業目前普遍采用基于“人類反饋的強化學習”方法,涉及的價值對齊、模型微調等具體過程均是以人類反饋評分作為獎勵機制。在與人類的內容交互中,大模型往往被訓練為傾向于服從人類的指令。1 由此對于大模型而言,順應人類指令的重要性在一定程度上會超過對內容本身正確與否、風險有無的關注,這便導致使用者存在通過誘導性提示詞利用AIGC服務生成版權侵權內容的可能。
3.AIGC服務提供者“版權替代責任”的判定要件
對于使用者利用AIGC服務從事的版權直接侵權行為,AIGC服務提供者也可能面臨版權法上“間接侵權責任”的承擔風險。在美國判例法體系下,“替代侵權”和“幫助侵權”“教唆侵權”共同構成了版權間接侵權的完整體系。2間接侵權與直接侵權相對,指侵權人雖然沒有直接從事版權法上專有權利規制的行為,但為之提供了一定的助成條件。3在我國,最高人民法院于2012年頒布的《關于審理侵害信息網絡傳播權民事糾紛案件適用法律若干問題的規定》第7條對于“版權幫助侵權、教唆侵權”加以規定;4對于“版權替代責任”則散見于上述規定第9條和11條中。5
目前來看,在國外發生的大模型版權侵權案件中,版權人均主張AIGC服務提供者需要承擔版權替代侵權責任。例如,在美國加州北區法院2023年6月28日受理的“ChatGPT版權第一案”中,兩名作家的主張是:Open AI有權利和能力控制用戶利用ChatGPT生成侵權內容,并從中獲得了經濟利益,因而構成版權替代侵權。又如,在前述“Stable Diffusion版權案”中,三位藝術家也主張被告對個人用戶的版權直接侵權負有替代侵權責任:用戶使用被告的AIGC服務生成圖像時,在提示詞中使用了版權人的名字,并將生成的內容作為版權人的作品加以傳播利用;被告明知其產品設計易于被用于制作上述“贗品”,但罔顧這一事實并直接或間接獲利,所以應承擔版權替代侵權責任。
依據版權法理論,構成版權替代侵權責任的行為人需要滿足兩項基本要求,即“具有監督版權侵權行為的權力和能力”且“從這些行為中獲取了直接經濟利益”,但更為重要的是,版權替代侵權責任的成立必須以版權直接侵權為前提條件。62023年10月30日,在加州北區法院針對“Stable Diffusion版權案”的裁定中,已經駁回了三位藝術家的版權替代侵權主張。法院依據的理由是:原告未能舉證說明被告產品輸出的內容與其具體的版權作品存在內容層面的實質性相似,即認定本案中作為替代侵權責任成立前提的版權直接侵權指控缺乏基本證據。1
四、AIGC服務提供者版權保護注意義務分析
對于AIGC服務提供者版權注意義務的探討,一方面需要思考,基于AIGC模式下內容交互呈現的封閉性,版權侵權行為的判定存在天然的特殊性;另一方面需要注意,AIGC模式下內容輸出規模的指數級擴張對于社會整體版權侵權風險的影響。由此,應當從前述AIGC服務提供者版權直接侵權與間接侵權的具體場景出發,對其版權保護注意義務進行類型化分析。
1.AIGC內容呈現的封閉性決定了侵權判定的特殊性
值得注意的是,生成式人工智能內容輸出模式的固有特征,決定了在其版權侵權與否的判定上存在天然的特殊性。我們首先需要思考用戶利用AIGC服務生成內容的行為,究竟是一種版權法規制的“公開傳播”行為,還是一種不受版權規制的“私人使用”行為?目前來看,無論是“文生文”還是“文生圖”領域的AIGC產品,生成的內容都是以對話形式存在于封閉的用戶交互界面之中,因此原則上可以被認定為是一種非公開的個人使用行為。22023年9月25日,美國特拉華州地方法院就“湯森路透訴Ross人工智能版權侵權案”3做出裁定:“如果對于作品的利用未‘向公眾公開’,從既有聯邦法院判決來看,即使是逐字逐句的‘全文復制’也一直被認為是‘合理使用’?!?在我國,根據《著作權法》中關于“合理使用”具體情形的規定,第一條便是對于作品“個人使用”行為的侵權責任豁免。實際上,在前文論述1984年的“索尼案”中也存在相似情形。美國聯邦最高法院在最終判決中表示,用戶的錄制行為具有個人娛樂性質,不構成版權侵權而屬于合理使用的豁免范疇。5
在實踐中,只有使用者將利用AIGC平臺生成的內容,通過第三方內容傳播平臺等其他途徑進一步公開利用,才會落入版權法的規制范疇。否則,即使生成內容存在版權法上的侵權風險,也只會停留在用戶自身賬號的交互界面內。版權人實際上無從發現侵權行為,也就不涉及后續的維權和進一步的侵權責任承擔問題。整體來看,AIGC模式下用戶直接生成內容的行為,是否落入版權法規制的直接侵權范疇仍存在較高程度的疑問,由此,AIGC服務提供者是否需要就此承擔侵權替代責任更有待論證。
2.AIGC輸出規模的放大效應提升了整體版權侵權風險
一方面,生成式人工智能未來或將成為通用的內容生產工具,進而顛覆整個版權行業的創作生態。在傳統版權領域,內容生成、知識創作是手工生產模式,高度依賴于專業技能與經驗傳承。生成式人工智能的發展正在使知識與人快速解耦,并推動整個版權創作形態的轉變,即從依賴“大腦構思+手工操作”向“人類構思、篩選+機器生成”轉變。自2022年起,生成式人工智能技術逐步發展成熟,并被廣泛運用于文字撰稿、語音處理、美術制圖、視頻剪輯、虛擬主播等各個內容的創作領域,形成產業化。6
另一方面,生成式人工智能帶來了全新的認知革命,“人類創作”正日益被“AI生成”所趕超和替代。在生成式人工智能技術的興起之前,創作一直被視為人類專屬領域,作為作品制度基石的“獨創性智力表達”只能由人完成,別無替代。生成式人工智能憑借“涌現能力”重塑創作邏輯,基于大規模語料和深度學習算法,可以用遠超人類的創作效率,不間斷地輸出高質量的文章、圖片、音樂、影視動畫等多模態內容。
研究發現,ChatGPT在2023年1月的內容輸出能力為3.1億單詞每分鐘;谷歌公司此前統計過,自1440年古登堡印刷機發明以來,人類社會總共出版約1.298億本書,每本書估算5萬單詞,總共約有6.5萬億單詞。因而,按照ChatGPT在2023年初的內容生產能力,每14天便可以輸出相當于人類歷史上全部印刷作品的內容總量。1 因此,在可以預見的未來,即使AIGC平臺具備“技術中立性”特征,即便AIGC模式下侵權行為的發生是一個小概率事件,但在輸出規模的放大效應后,客觀上還是存在提升社會整體版權侵權風險的可能。
3.AIGC服務提供者直接與間接侵權下的注意義務
注意義務作為侵權責任的判定依據,需要我們分析特定行為在客觀上引起或增加了何種程度的版權侵權風險,以及從理性人角度判斷,若希望避免侵權責任的承擔,則需要采取何種程度的應對義務和措施。2在英美法系國家,注意義務源于英國“蝸牛案”(“多諾休訴斯蒂文案”),3該案奠定了侵權責任判定中的“近鄰性原則”,即“人們在行為時負有義務不能損害那些預見會受到其行為影響的、同其有密切關系的人”。在大陸法系國家,注意義務源于德國三起典型案件——“枯樹案”“獸醫案”和“撒鹽案”,著眼于對“交往安全義務”的分析,強調侵權責任的認定需要分析行為人對“危險控制和防免的可能性”以及受害人對“行為人的信賴期待”。4
網絡空間與現實空間最大的不同之處就在于其是依靠網絡信息技術架構出的虛擬存在。網絡服務提供者是網絡平臺的架構者、控制者與經營者,當用戶利用網絡服務提供者的技術產品或服務從事版權侵權行為時,若沒能盡到技術上可行、經濟上合理的注意義務,其就應當承擔此種不作為侵權帶來的替代責任。5 從我國司法實踐看,對于網絡服務提供者注意義務的判定,可以落腳于“侵權預見性”和“侵權控制力”兩項基本標準。6 對于AIGC服務提供者版權注意義務的論證探討,還是應當落腳到前述版權直接侵權與間接侵權情形的具體分析。
第一,版權直接侵權情形下AIGC服務提供者注意義務的判斷。通過前文分析可以得出,當AIGC平臺出現“模型記憶”時,其內容生成行為落入版權法“信息網絡傳播權”的規制范疇。在此情形,一旦輸出未經授權的版權內容,AIGC服務提供者便需要承擔直接侵權責任??梢哉f,在直接侵權下,AIGC服務提供者原則上承擔的是一種較高的版權保護注意義務,除非享有法定的免責事由,否則便需要在事前采取措施避免侵權內容的輸出。但值得注意的是,在當下產業發展階段,若強行要求AIGC服務提供者承擔事前避免輸出版權侵權內容的義務,則可能使其背負技術上難以承受之重。7 一方面,“模型記憶”并非AIGC服務提供者故意為之的一類行為,并且是一種小概率的意外事件,8 所以很難在事前加以預見;另一方面,鑒于訓練數據中的作品海量、模型參數海量以及內容生成機制固有的隨機性等內在技術原因,AIGC服務提供者很難完全予以事前避免。這類似于此前網絡服務提供者不可能對海量的傳播內容侵權與否加以事前審查;AIGC服務提供者也不可能完全對海量的生成內容版權侵權與否進行事前的過濾。
第二,版權間接侵權情形下,AIGC服務提供者注意義務的判斷。當用戶利用自身服務生成侵權內容并加以后續傳播時,AIGC服務提供者承擔的僅是對應的間接侵權責任。前文已論證,原則上AIGC平臺因為并不涉及生成內容的公開傳播,除非用戶將侵權內容在第三方傳播平臺加以分發、利用,否則并不存在版權法規制的侵權行為。只是基于AIGC服務提供者自身強大的內容生成輸出能力,有可能提升社會整體版權侵權風險,我們才認為從價值衡量角度要求其采取相應的版權保護措施。在此情形下,相較于直接侵權用戶甚至后續的第三方傳播平臺,AIGC服務提供者承擔的版權注意義務程度較低。從可預見性角度來講,AIGC服務提供者對于用戶如何利用自身服務進行內容生成不存在準確的預期,僅能通過平臺使用規則等手段提示用戶避免從事侵權行為;從侵權控制力角度來看,AIGC服務提供者對于侵權內容是否傳播以及如何傳播的控制力十分有限。此外,AIGC服務提供者由于不擁有版權作品素材比對庫,因而對于用戶輸入的文字、圖片等內容以及在此基礎上改編輸出的衍生內容是否存在侵權,也難以進行實質性的事前審核判斷。
五、AIGC服務提供者版權保護措施的體系建構
生成式人工智能技術發展帶來的一個總體趨勢,使得對于網絡服務提供者版權責任的關注,從“內容傳播”領域轉向“內容生成”領域。需要基于技術變革、產業發展以及版權保護等多重維度,立足AIGC服務提供者版權注意義務的具體實際,搭建科學的版權保護措施體系。
1.AIGC服務提供者版權保護措施設定的價值考量
回溯1998年“避風港制度”的誕生背景,互聯網的迅猛發展賦予作品此前難以想象的傳播效率與規模,但網絡服務商群體面對新技術引發的侵權不確定性卻“踟躕不前”。為了把握發展先機,美國頒布《數字千年版權法》并率先創設“避風港制度”,通過給予內容傳播服務提供者一定條件下的版權侵權責任豁免,明確了行業整體的行為預期。更重要的是,通過“通知—刪除”等具體規則在版權人和網絡服務提供者之間搭建起應對在線版權侵權的有效合作機制。1
可以說,正是“避風港制度”對于內容傳播領域網絡服務提供者靈活寬松的侵權責任設置,才孕育了美國當下在全球信息服務行業的領先地位。時至今日,面對生成式人工智能帶來的新一輪技術變革,版權法似乎又遇到了當年創設“避風港制度”時同樣的問題境遇,只是從“內容傳播領域”轉向了“內容生成領域”。內容傳播領域網絡服務提供者的版權責任規則較為傳統,而內容生成領域網絡服務提供者的版權責任判定則是一個全新的議題。2 長久以來,網絡服務提供者版權保護措施的設定,除立足于通過保護權利以激勵創作之外,更需要服從于技術進步、產業發展以及全社會知識內容的傳播分享等更高維度的價值。究其原因在于,版權作為法律上人為創設的權利體系,不同于物權等自然權利,天然遵從于人類社會的價值判斷。生成式人工智能被稱為百年不遇、堪比工業革命一般的新技術浪潮。有學者直言,“與各種風險相比,AIGC最大的風險是技術落后的風險”。3 因此,對于AIGC服務提供者版權保護措施的設定,也應側重于鼓勵技術與產業創新的價值取向,而非強化對于行業主體的制裁懲戒。
2.AIGC服務提供者版權保護措施的可行性論證
AIGC服務提供者應當采取何種程度的版權侵權應對舉措,成為當下理論界和實務界高度關注的新興議題。4 落實到前述AIGC服務提供者版權直接侵權與間接侵權情形下注意義務的具體裁量,需要聚焦以下三個層面的問題探討:
一是技術層面,AIGC服務提供者能否通過“調整模型參數”和“刪除語料庫中被訓練素材”來避免版權侵權?從AIGC技術原理來看,在完成模型參數訓練后,不論是版權人要求AIGC服務提供者避免輸出該特定作品,還是不許對其特定作品加以訓練,借助于“調整模型參數的路徑”都不再可行。因為AIGC模型訓練的基本機制決定了其無法將特定作品內容對應的特定模型參數加以單獨刪除或改變,除非用剔除侵權作品后的新語料數據集對該模型加以再次整體訓練,但從產業實際和技術成本角度出發,因個別版權人的特定作品便加以模型大規模的重練,并不符合社會整體的成本考量。1 在實踐中,版權人可以通知并要求AIGC服務提供者刪除其語料庫中的特定被訓練作品,2 然而從技術效果來看該行為已經喪失了實際意義。因為事后的語料內容刪除行為,不會對已經訓練好了的模型參數和模型后續可能輸出的內容產生任何影響,但可以在訓練新模型或優化既有模型之前,根據版權人的通知避免對特定作品內容加以訓練,這一問題實際落入各界關注的一個焦點問題,即大模型訓練前是否以及如何為版權人提供“模型訓練退出機制”的問題。3
二是規則層面,AIGC服務提供者能否借鑒“避風港制度”下既有的義務機制來應對版權侵權?一方面,AIGC服務提供者難以履行此前“避風港制度”下的“通知—刪除”義務。AIGC服務提供者即使收到版權人發出的侵權通知,也無法直接刪除特定用戶賬號中的侵權內容,因為該侵權內容存儲在用戶本地設備而非AIGC平臺的服務器之中。4 在之前的內容傳播領域,網絡服務提供者之所以可以對用戶侵權內容采取刪除、屏蔽等直接應對措施,原因在于其提供的服務中包括內容存儲。實踐中,用戶首先會將特定內容上傳到平臺服務器中,因而平臺服務提供者有權利和有能力移除涉嫌的版權侵權內容。另一方面,AIGC服務提供者仍可以采取與其實際能力相匹配的版權保護必要措施。 當版權人根據特定的侵權內容溯源到特定的AIGC平臺后,服務提供者可以通知涉嫌侵權的用戶自行刪除或不再傳播該侵權內容。AIGC服務提供者也可以根據用戶侵權行為的具體情況,采取必要的處置措施,如以類似“三振出局”的方式,對于故意侵權用戶按照侵權程度、次數和主觀惡性加以使用限權、暫停服務和關閉賬戶等懲戒手段。
三是預防層面,AIGC服務提供者能否通過搭建和版權人之間的合作機制來克服版權侵權?一方面,需要思考能否通過搭建“輸出內容過濾機制”來預防AIGC版權侵權,這類似于建立像目前AIGC行業針對“黃恐暴內容”采取的過濾機制,通過內嵌技術插件或模型,把版權人的作品內容轉換成一定的技術過濾規則代碼,進而預防可能的版權侵權行為發生。從實操角度來看,該舉措主要涉及技術上過濾比例的問題。舉例來講,過濾掉80%相同作品內容的技術或許可以達到,但要求過濾掉100%相同內容的技術機制可能難以實現。此外,版權侵權過濾機制的建立還需要AIGC服務提供者能夠建立輸出內容侵權比對庫,這便需要版權人事前向其提供自身版權作品作為比對素材。另一方面,需要評估能否通過建立“輸入提示詞過濾機制”來避免AIGC版權侵權。與“輸出內容過濾機制”相類似,該路徑需要解決的問題也是與版權人合作建立科學的提示詞比對庫。目前AIGC產品針對知名IP,也會自動識別用戶提示詞中的敏感關鍵詞,并拒絕輸出對應的可能侵權內容。但值得注意的是,提示詞過濾舉措本身存在較大的“誤傷”概率風險,即可能會在非侵權情形下,影響用戶對AIGC產品服務的正常使用。
3.AIGC領域事前、事中與事后的版權保護措施
事前,AIGC服務提供者應當履行版權侵權提示、搭建投訴機制以及內容輸出標記三項義務。首先,AIGC服務提供者需要通過“用戶協議”等方式要求使用者尊重他人知識產權:一是避免輸入容易誘發版權侵權的提示詞指令;二是避免上傳版權侵權素材進行二次創作;三是在對生成內容進行后續公開傳播利用前,加以必要的侵權風險把關。其次,AIGC服務提供者需要建立侵權投訴舉報機制,只有如此版權人在發現侵權行為后,才能啟動后續的“通知—必要措施”等流程。目前來看,國內外主流AIGC平臺基本已經建立了這類機制。最后,AIGC服務提供者還需要對大模型生成的內容進行必要的打標處理,以方便版權人發現侵權行為后,能夠通過該標識溯源通知AIGC服務提供者,進而采取必要的侵權應對舉措。上述三項要求,在廣州互聯網法院判決的國內“大模型服務商版權侵權責任第一案”中也被認定為AIGC服務提供者應盡到的合理注意義務。
事中,AIGC服務提供者收到版權人侵權通知后,應當采取可行的版權保護必要措施。當版權人通過侵權內容中包含的標識溯源到特定的AIGC平臺后,AIGC服務提供者雖然無法對用戶生成的原始侵權內容加以直接刪除,但可以要求侵權用戶自行刪除侵權內容并不再進一步擴散,同時可以依據自身知識產權保護規則,分析侵權用戶的具體情形,采取警告、限制特定功能權限、一段時間暫停服務或者永久關閉賬號等處罰舉措。
事后,應鼓勵AIGC服務提供者采取技術和成本上可行的措施,避免再次生成相同的侵權內容?;谇笆龇治?,目前AIGC領域的侵權屏蔽舉措仍存在較大的技術和實操困難。因此,AIGC服務提供者對應的版權保護義務,一方面只能是倡議性的而非強制性的,另一方面只能是行為導向性的而非結果導向性的。我國2023年8月15日生效的《生成式人工智能服務管理暫行辦法》對于更為嚴格的公法內容安全領域,尚未要求AIGC服務提供者采取面向未來的過濾屏蔽舉措的強制要求。1 因此,應鼓勵AIGC服務提供者在技術可行的范圍,根據版權人提供的版權作品內容,采取文本、圖像相似性比對,以及重點提示詞過濾拒答等技術和機制,預防后續可能的版權侵權行為,并需要思考如何豁免AIGC服務提供者由此可能產生的“誤傷”責任。
Research on Copyright Infringement Liability of AIGC Service Provider
ZHU Kaixin
Abstract: The rise of generative artificial intelligence has triggered new types of copyright infringement disputes and concerns about platform liability in the field of online copyright. In terms of direct copyright infringement, AIGC service providers do not necessarily constitute an infringement of derivative right, however, when “model memory” occurs, it is regulated by the right to network information dissemination. In terms of indirect copyright infringement, the determination of" copyright vicarious liability for AIGC service providers depends on the establishment of direct infringement by the user. The closed nature of content presentation patterns determines the particularity of copyright infringement determination in AIGC, but the amplification effect of content output volume objectively increases the overall risk of copyright infringement in society. Therefore, it is necessary to focus on the specific circumstances of the duty of care for AIGC service providers and establish a scientific system of copyright protection measures in advance, during, and after the provision of services.
Key words: AIGC; copyright; right to network information dissemination; derivative right; direct infringement; indirect infringement; duty of care
(責任編輯:蘇建軍)
作者簡介:朱開鑫,騰訊研究院高級研究員,國家版權局網絡版權產業研究基地研究員(北京 100101)。
1 梳理來看,在這些AIGC服務提供者版權侵權案件中,原告涉及軟件代碼工程師、畫家、作家、商業圖片庫商(Getty Images)、記者、音樂出版商等版權人,被告則涉及GitHub、Stability AI、Midjourney、Deviant、Open AI、Meta、Alphabet、Anthropic等AIGC領域的研發、服務廠商。
2 在三位原告提起訴訟后,2023年4月18日,三位被告分別針對原告的指控提交了駁回原告訴訟的動議;2023年10月30日,加州北區法院就被告動議作出裁決,僅保留原告針對Stable Diffusion模型訓練直接侵權的起訴,其他主張被駁回但給予30天修正再提交的機會。2023年11月29日原告提交修訂版起訴狀。See Andersen v. Stability AI Ltd. (3:23-cv-00201) District Court, N.D. California.
1 雖然加州北區法庭在裁定中支持了被告的駁回起訴動議,但允許原告補充相關證據材料后重新提起訴訟。
2 (2024)粵0192民初113號。
3 本案判決,將大模型相關的“模型訓練”(模型訓練商版權責任)以及“生成內容可版權性”兩項核心法律爭議略過,聚焦內容輸出階段、AIGC服務提供者版權侵權責任的認定。
4 《北京互聯網法院開庭審理全國首例涉及AI繪畫大模型訓練著作權侵權案》,https://mp.weixin.qq.com/s/cyskAz1cASBaNIYQpGpGsA,最后訪問日期 2024 年 11月 8日。
5 現實產業實踐中,AIGC服務提供者與AIGC模型研發者存在多種關系:既可能存在身份上的重合關系,例如Open AI既作為GPT大模型的研發者,也是ChatGPT、GPT4等平臺的服務提供者;也可分屬不同的法律主體,例如微軟是通過API接口,調用Open AI旗下GPT模型的方式作為AIGC服務提供者;又如Midjourney是在Stability AI研發的Stable Diffusion模型的基礎上進一步訓練、調整后向公眾提供AIGC服務。
6 王遷:《知識產權法教程》,中國人民大學出版社2021年版,第14頁。
1 我國《著作權法》上的“信息網絡傳播權”大致對應美國版權法上發行、展示及表演等權利,源于《伯爾尼公約》中的“向公眾傳播權”(communication to the public)。
2 《美國版權法》第101條“定義”規定:“演繹作品”指根據一部或一部以上的已有作品創作完成的作品,如譯文、樂曲整理、改編成的戲劇、改變成的小說、改編成的電影、錄音作品、藝術復制品、節本以及縮寫本,或者依此改寫、改變或改編作品的任何其他形式。由編輯修訂、注釋、詳解或其他修改作為整體構成獨創作品的,視為“演繹作品”。
3 吳漢東:《知識產權法》,法律出版社2021年版,第210頁。
4 美國第九巡回法院在“Litchfield v. Spielberg 案”中駁回了原告的類似主張,強調前后內容之間需要“實質性相似”才構成演繹侵權;“Vault Corp v. Quaid Software Ltd 案”判決也認為,構成衍生侵權作品必須以某種形式包含受版權保護作品的一部分,必須在實質上與受版權保護的作品相似。
5 See “Artificial Intelligence and Intellectual Property-Part II:Copyright”Subcommittee Hearing,https://www.judiciary.senate.gov/artificial-intelligence-and-intellectual-property_part-ii-copyright,最后訪問時間2024年3月4日。
6 以ChatGPT為例,其大模型通過海量文本的學習,建立一個統計模型,用來估計文本序列中每個詞語或字符出現的概率,生成的是具有相似統計特征的新文本而非對訓練語料內容的復制重現。
1 See The New York Times Company v. Microsoft Corporation, 1:23-cv-11195, (S.D.N.Y.).
2 參見OpenAI回應《紐約時報》版權侵權起訴的聲明,https://openai.com/blog/openai-and-journalism,最后訪問時間2024年3月4日。
3 《最高人民法院關于審理侵害信息網絡傳播權民事糾紛案件適用法律若干問題的規定》第3條規定:“……人民法院應當認定其構成侵害信息網絡傳播權行為……通過上傳到網絡服務器、設置共享文件或者利用文件分享軟件等方式,將作品、表演、錄音錄像制品置于信息網絡中,使公眾能夠在個人選定的時間和地點以下載、瀏覽或者其他方式獲得的,人民法院應當認定其實施了前款規定的提供行為?!?/p>
4 2023年5月4日,美國埃默里大學Matthew Sag研究團隊發表“Copyright Safety for Generative AI”論文,對模型記憶的產生原因做了詳細說明,本文在此僅做初步摘錄引用,具體參見SSRN: https://ssrn.com/abstract=4438593,最后訪問時間2024年3月4日。
1 1975年,索尼發明了能夠讓用戶隨時錄制或播放電視節目的Betamax錄像機。該錄像機在美國銷售之后,美國環球電影公司和迪士尼公司將索尼告上了法庭,認為其提供Betamax錄像機給消費者使用、錄制享有版權電影的行為,侵犯了他們的版權?!八髂岚浮钡膶徖砬昂髿v時八年,并上訴至美國聯邦最高法院。
2 參見劉博涵:《“技術中立”消亡史》,https://www.guokr.com/article/456743/,最后訪問日期2024年3月4日。
3 長久以來的基本共識是,版權法并不保護藝術風格,因為根據“思想表達二分法”,其屬于思想范疇,除非生成的內容在風格之外,仍然與在先作品在具體表達層面存在實質性的相同或相似。例如2023年8月北京知識產權法院在“比利時畫家Christian與某國內畫家版權侵權案”一審判決中指出,“美術作品的主題、風格和素材的選擇本身只是美術作品中的思想,并不受著作權法的保護”。參見(2019)京73民初1376號判決書。
1 參見Anthropic發表的企業論文“Towards Understanding Sycophancy in Language Models”,https://www.anthropic.com/news/towards-understanding-sycophancy-in-language-models,最后訪問時間2024年3月4日。
2 經過立法和司法實踐的長期發展完善,美國法上版權間接侵權責任的類型劃分和概念內涵至今已趨于成熟和定型,通過對比分析《數字千年版權法》出臺前后的相關判例便可得出上述結論。舉例來說,加州地方法院在1995年審理的“RTC v. Netcom案”中以及第九巡回法庭在2001年審理的“A&M v. Napster 案”中都將著作權間接侵權責任明確劃分為幫助侵權 (Contributory Infringement)、教唆侵權 (Inducement Infringement)以及替代責任 (Vicarious Liability) 三大類,并對上述三種著作權間接侵權責任的內涵做出了一致的認定。即上述兩判決都將幫助侵權責任歸納為由“知道要件”和“幫助要件”組成,將教唆侵權責任的成立歸結為被告存在可歸責的侵權目的,將替代責任歸納為由“控制力要件”和“直接獲益要件”組成。
3 按照版權法上“直接侵權、間接侵權二分理論”,內容提供和技術服務的區分同版權直接侵權和間接侵權的區分相對應,但只有前者才屬于版權法定的內容提供行為,也只有前者的行為才會受到版權直接侵權的規制。對于技術服務行為,只有當網絡服務提供者未履行必要注意義務且存在過錯時,才會就其助成行為承擔損害賠償責任,理論界將其稱為版權間接侵權。
4 《最高人民法院關于審理侵害信息網絡傳播權民事糾紛案件適用法律若干問題的規定》第7條規定: “網絡服務提供者以言語、推介技術支持、獎勵積分等方式誘導、鼓勵網絡用戶實施侵害信息網絡傳播權行為的,人民法院應當認定其構成教唆侵權行為; 網絡服務提供者明知或者應知網絡用戶利用網絡服務侵害信息網絡傳播權,未采取刪除、屏蔽、斷開鏈接等必要措施,或者提供技術支持等幫助行為的,人民法院應當認定其構成幫助侵權行為?!?/p>
5 《最高人民法院關于審理侵害信息網絡傳播權民事糾紛案件適用法律若干問題的規定》第9條規定:“人民法院應當根據網絡用戶侵害信息網絡傳播權的具體事實是否明顯,綜合考慮以下因素,認定網絡服務提供者是否構成應知:(一)基于網絡服務提供者提供服務的性質、方式及其引發侵權的可能性大小,應當具備的管理信息的能力……”第11條規定:“網絡服務提供者從網絡用戶提供的作品、表演、錄音錄像制品中直接獲得經濟利益的,人民法院應當認定其對該網絡用戶侵害信息網絡傳播權的行為負有較高的注意義務……”。
6 李明德:《美國知識產權法》,法律出版社2019年版,第392頁。
1 此外,三位原告也未就被告有權利和能力監督個體用戶的侵權行為,并從該等侵權活動中獲得直接經濟利益做任何實質性舉證。
2 當然在例外情形下,即發生“模型記憶”問題時,AIGC平臺輸出的內容雖然仍是通過“一對一”的封閉交互模式進行,但因為存在向不特定用戶輸出同一“記憶內容”的現實可能,因此構成版權法規制的“公開傳播”行為,前文在AIGC服務提供者直接侵權部分已做分析。
3 Thomson Reuters Enterprise Center GMBH and West Publishing Corp., v. Ross Intelligence Inc., Memorandum Opinion, Sep. 25, 2023, Case No. 1:20-cv-613-SB.
4 Authors Guild, 804 F.3d at 221; see also A.V.ex rel. Vanderhye v.iParadigms, LLC, 562 F.3d 630, 638-640, 642 (4th Cir. 2009).
5 因為用戶利用Betamax錄像機錄制的電視節目,最終目的是在家庭范圍內供自身及家庭成員觀看,并不涉及相關作品內容的公開傳播利用行為。
6 朱開鑫:《生成式人工智能對版權體系影響的思考——技術、產業和制度三個面向》,《版權理論與實務》2024年第1期。
1 《[ChatGPT]GPT-3.5+ChatGPT :圖解概述》,https://architect.pub/gpt-35-chatgpt-illustrated-overview,最后訪問日期2024年3月4日。
2 環建芬:《人工智能工作物致人損害民事責任探析》,《上海師范大學學報(哲學社會科學版)》2019年第2期。
3 See Donoghue v Stevenson, [1932] AC 562.
4 張民安:《侵權法報告》(第1卷),中信出版社2005年版,第 87 頁。
5 朱開鑫:《網絡版權間接侵權研究》,《法學家》2019年第6期。
6 較為經典的案例為 2015 年到 2016 年間最高人民法院集中審理的“蘋果 APP store 網絡著作權侵權”系列案件。最高人民法院在案件審理的過程,根據蘋果公司的在線服務特征以及被侵害信息的基本特征,認為蘋果公司負有較高程度注意義務。具體來講,蘋果公司不僅能夠對于涉案APP的研發和運營進行控制,而且長久以來從涉案APP中獲得了直接的經濟收益。最高人民法院認為,根據蘋果公司 APP store 的運營模式,其對于涉案 APP 的侵權行為具有高度的可預見性和高度的控制力。
7 王若冰:《論生成式人工智能侵權中服務提供者過錯的認定——以“現有技術水平”為標準》,《比較法研究》2023第5期。
8 2023年3月,在一項以Stable Diffusion等AIGC擴散生成模型為研究對象的實驗中,馬里蘭大學和紐約大學的聯合研究團隊指出:利用Stable Diffusion模型生成的內容與數據集作品相似度超過50%的可能性達到了1.88%。
1 從版權人保護角度而言,相較于傳統的版權侵權訴訟,“避風港制度”為版權人提供了高效、及時、便捷的維權途徑。版權人發現侵權內容,平臺則迅速響應侵權通知,采取刪除屏蔽斷開鏈接等必要措施。
2 司曉:《奇點來臨:ChatGPT時代的著作權法走向何處——兼回應相關論點》,《探索與爭鳴》2023第5期。
3 王利明:《生成式人工智能侵權的法律應對》,《中國應用法學》2023年第5期。
4 邵紅紅:《生成式人工智能版權侵權治理研究》,《出版發行研究》2023年第6期。
1 AIGC模型訓練成本非常高昂,最主要的成本在于硬件和人力資源:訓練一個大模型除需要使用超級計算機和大量的GPU資源,還需要由數據科學家、軟件工程師和NLP專家組成的團隊來進行模型調試和優化。根據OneFlow估算,GPT-3訓練一次的成本約為139.8萬美元;對于一些更大的LLM模型(如擁有2800億參數的Gopher和擁有5400億參數的PaLM)采用同樣的計算公式??梢缘贸?,訓練成本介于200萬美元至1200萬美元之間。參見《ChatGPT算力需求是如何擴張的》,https://mp.weixin.qq.com/s/7oy1cvLSfByOFbrT79Ykqg,最后訪問日期2024年3月4日。
2 此時,需要AIGC服務提供者溝通上游的AIGC模型研發者來實現版權人的該項訴求。
3 研究發現對于模型訓練,國內外廠商均強調適用“合理使用制度”,但域外大模型廠商已經探索給予版權人事前“選擇退出”的渠道:OpenAI在 AI 行業中率先提供了一個簡單基于“robots協議”的退出機制;Adobe開發了一種名為“Content Credentials”的功能,它使藝術家能夠附加一個“do-not-train”標簽防止自身作品被訓練,該標簽將隨著內容的傳播而傳遞。
4 這類似于社交類APP的用戶聊天記錄和歷史信息,因為存在于用戶自身的手機或電腦等設備終端,所以運營平臺本身實際無法保存、導出和控制上述記錄和信息。
1 該《暫行辦法》第14條規定:AIGC服務提供者發現違法內容(大致對標模型“記憶”引發的版權直接侵權情形),需要采取模型優化訓練等措施進行整改,但未強調效果層面的具體要求;AIGC服務提供者發現使用者利用生成式人工智能服務從事違法活動(大致對標用戶不當使用引發的版權間接侵權),更是僅要求采取警示、限制功能、暫停或者終止向其提供服務等處置措施,未涉及面向未來的侵權屏蔽要求。