生成式人工智能(GenAI-GenerativeAI,如無特殊說明,以下統(tǒng)稱GenAI)是人工智能(以下簡稱AI)技術(shù)和產(chǎn)業(yè)的主流形態(tài)之一,是根據(jù)使用者提示,基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻1以及策略、代碼、蛋白質(zhì)結(jié)構(gòu)等內(nèi)容(AIGC-AIGeneratedConten)的技術(shù)。使用者借助AI可以高效、跨模態(tài)生成AIGC,就像“馬良”使用“神筆”可以達(dá)到點(diǎn)石成金的驚人效果。技術(shù)研發(fā)與產(chǎn)業(yè)發(fā)展的互動,創(chuàng)造了新商業(yè)模式和競爭規(guī)則,催生了新利益主體和權(quán)利格局,引發(fā)了新制度調(diào)整和法律需求。其中,AIGC作為AI生成的具有價值的無形物,引起了“誰在創(chuàng)作、成果歸誰、權(quán)利誰享、責(zé)任誰擔(dān)”的討論,集中表現(xiàn)在使用者“馬良”和提供商“神筆”的著作權(quán)之爭。實(shí)踐中,一些企業(yè)通過用戶協(xié)議的方式要求取得AIGC著作權(quán),或者對使用者的著作權(quán)進(jìn)行限制。理論上也存在多種爭議觀點(diǎn),需要回歸技術(shù)實(shí)質(zhì),基于創(chuàng)作本質(zhì),立足利益平衡,明晰權(quán)責(zé)分配,以達(dá)到鼓勵研發(fā)、激勵創(chuàng)作和激發(fā)產(chǎn)業(yè)活力的目的。
一、源于現(xiàn)實(shí)分歧——AIGC的著作權(quán)歸屬之爭
AIGC的生成過程涉及多方參與者,包括:合作建立AI的投資商、編程者、訓(xùn)練者、語料商等主體,在市場上提供AI服務(wù)的服務(wù)提供商(以下簡稱提供商),和直接使用AI的使用者。該過程可能涉及多方直接或間接的貢獻(xiàn),引發(fā)了多元利益需求。
(一)市場的態(tài)度
相較于編程者、語料商等主體以及使用者,提供商處于市場主導(dǎo)和強(qiáng)勢地位,主要通過用戶協(xié)議與使用者約定AIGC的著作權(quán)歸屬。筆者調(diào)查發(fā)現(xiàn),有些提供商明確主張著作權(quán),有些放棄著作權(quán)但可能附帶對使用者的限制條款,有些未予明確表態(tài) (詳見表1),同時大部分明確要求獲得對AIGC的無償、不限地域、不可撤銷的使用權(quán)。

(二)理論的分歧
受AI主體屬性1觀點(diǎn)和AIGC作品屬性觀點(diǎn)的影響,目前世界范圍內(nèi)存在多種著作權(quán)歸屬觀點(diǎn):
一是主張AIGC歸屬于AI本身。該主張可以細(xì)分為“AI主體說”和“虛擬人格說”兩種觀點(diǎn)。其中,“AI主體說”是一種比較科幻的想法和理論假設(shè),認(rèn)為AI載體硅基新生命形式可以作為權(quán)利主體。“AI擬人說”未將AI視為生命形式,而是將AI擬人化,認(rèn)為AI對AIGC具有決定性作用,應(yīng)當(dāng)成為民事法律關(guān)系的主體。
二是主張AIGC歸屬于編程者或提供商。該觀點(diǎn)認(rèn)為,AI能夠完成過去需要由人類親自完成的事情,編程者或提供商應(yīng)當(dāng)享有權(quán)利15其中,“編程者說”認(rèn)為編程和設(shè)計(jì)是一種創(chuàng)造性勞動,AIGC是編程者思想和情感的現(xiàn)實(shí)表達(dá)\"。“提供商說”從服務(wù)合同中使用者相對方的角度出發(fā),將最終提供AI服務(wù)的主體視為權(quán)利主體,進(jìn)而簡化了權(quán)屬劃分和糾紛解決。
三是主張AIGC歸屬于使用者。該主張可以細(xì)分為“AI工具說”和“使用者控制說”。其中,“AI工具說”認(rèn)為,AI是具有較高水平的Microsoftoffice或Photoshop工具,或者是替代或減輕人的腦力勞動或智力勞動\"的勞動工具。“使用者控制說”認(rèn)為AI技術(shù)的一致性決定了AI藝術(shù)的創(chuàng)作始終是以人一機(jī)的形式展開的,使用者的操作占主導(dǎo)地位。
四是主張AIGC歸屬于社會公有。該觀點(diǎn)認(rèn)為從防止壟斷、減少糾紛、促進(jìn)流通的角度出發(fā),部分或全部不授予私權(quán),同時為了尊重和激勵相關(guān)主體,可以從報(bào)酬、使用權(quán)等角度予以彌補(bǔ)。
五是主張AIGC歸屬于多方共有。該主張認(rèn)為AIGC由多方主體共同參與創(chuàng)作,應(yīng)當(dāng)以多方權(quán)益共享格局激勵更多的個人和企業(yè)投入更多的成本促進(jìn)社會創(chuàng)新創(chuàng)造。例如,參照1988年英國《版權(quán)、外觀設(shè)計(jì)和專利法案》規(guī)定“對于計(jì)算機(jī)生成的文字、戲劇、音樂或藝術(shù)作品而言,作者應(yīng)是對該作品的創(chuàng)作進(jìn)行必要安排的人”,這里所謂“必要安排的人”,可能包括直接的提供商或使用者,也可能是間接的投資者、編程者,或者兼而有之。
(三)問題的聚焦
AIGC的著作權(quán)歸屬問題涉及主體多、技術(shù)性強(qiáng)、過程復(fù)雜、利益需求多元化,可以通過以下思路梳理和簡化:首先,排除AI作為民事權(quán)利主體。著作權(quán)法以鼓勵創(chuàng)作為目的,只有人類才能被激勵,只有人的創(chuàng)作成果才能作為作品受到著作權(quán)法的保護(hù)24。從照相機(jī)、攝影機(jī)開始,到計(jì)算機(jī)和AI,司法機(jī)關(guān)、行政機(jī)關(guān)和理論界的主流判斷都堅(jiān)持只有人類才能擁有作者身份2。例如,美國版權(quán)局在《黎明的查莉婭》《太空歌劇院》等版權(quán)登記案件中堅(jiān)持只有人類作者才能創(chuàng)作受著作權(quán)保護(hù)的作品2。其次,著作權(quán)權(quán)屬獲得途徑很多,但作者應(yīng)當(dāng)是直接參與創(chuàng)作的主體。投資者、編程者、語料商等在內(nèi)的主體共同合作制造了AI,但都沒有直接參與具體創(chuàng)作,而直接參與方僅限于使用者和AI提供商,即市場上AI服務(wù)合同的雙方。對于提供商而言,無論是在自己的平臺上部署模型并開放給公眾使用的模型開發(fā)提供商,還是通過應(yīng)用程序接口查詢接入第三方模型的模型使用提供商2,他們在利益需求、責(zé)任承擔(dān)等方面也無須區(qū)分對待。再次,不宜單獨(dú)考慮AI投資、研發(fā)等主體的著作權(quán),這些主體不僅未直接參與AIGC生成,而且可以或已經(jīng)在產(chǎn)業(yè)鏈中獲得了商品或服務(wù)對價。最后,AIGC完全歸屬于公有領(lǐng)域的觀點(diǎn)缺乏對創(chuàng)作主體的充分尊重和有效激勵。因此,AIGC的著作權(quán)歸屬問題可以簡化為以下核心問題:提供商是否是AIGC的作者?
二、回歸技術(shù)本質(zhì)一—GenAI運(yùn)行的非創(chuàng)作性屬性
作品創(chuàng)作行為是一種智力活動,應(yīng)當(dāng)具有以下三個特征:第一,人類智能具有意向性,決定了創(chuàng)作行為是在創(chuàng)作本能驅(qū)使下將“思想”呈現(xiàn)并固定為“表達(dá)”的主觀性行為。第二,人類智能具有非理性,決定了創(chuàng)作行為是自主的推理和想象的創(chuàng)新行為,而非機(jī)械或反射行為。第三,人類智能具有的目的性,決定了創(chuàng)作行為應(yīng)有預(yù)見性而非不確定性,確保“表達(dá)”與“思想”相對應(yīng)。但AI是通過運(yùn)算實(shí)現(xiàn)來模擬人類智能,并不具備以上特征。
(一)自然語言處理的非主觀性
1.看似“心領(lǐng)神會”:通過語言技術(shù)映射世界
語言是承載和傳播人類智能的關(guān)鍵載體,語言規(guī)律在一定程度上體現(xiàn)了客觀規(guī)律。要模仿人類智能的運(yùn)行,AI需要通過自然語言處理技術(shù)(NLP)來實(shí)現(xiàn)計(jì)算機(jī)對人類語言的處理。第一,通過“詞向量”給世界打標(biāo)簽。“詞向量”技術(shù)是指計(jì)算機(jī)通過長串?dāng)?shù)字列的形式給每個單詞打標(biāo)簽,以體現(xiàn)單詞之間的排列組合規(guī)律。例如,通過詞向量可以將“踢”與“足球”聯(lián)系,一般不與“鉛球”關(guān)聯(lián)。一個單詞的詞向量越多,關(guān)聯(lián)性越多,詞預(yù)測越準(zhǔn)確。第二,通過“詞預(yù)測”按照概率生成。“詞預(yù)測”技術(shù)是基于“詞向量”標(biāo)記的事物之間的聯(lián)系,進(jìn)一步根據(jù)概率預(yù)測可能出現(xiàn)詞的技術(shù)。語言環(huán)境越復(fù)雜,神經(jīng)網(wǎng)絡(luò)層越多,運(yùn)算越復(fù)雜。例如GPT-3的最大版本有分別處理語法、特征等功能的96個層,每個層有96個注意力2頭,每次預(yù)測一個新詞時,GPT-3將執(zhí)行9216個操作2,并從中根據(jù)概率選擇。第三,通過“提示詞”聽懂用戶指令。提示詞是利用自然語言來指導(dǎo)或激發(fā)AI模型完成特定任務(wù)的方法和命令。提示詞越多越具體,對生成物的預(yù)見性越強(qiáng)。第四,通過“權(quán)重值”模擬深度學(xué)習(xí)。構(gòu)成人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型由大量的節(jié)點(diǎn)(人工神經(jīng)元)相互連接構(gòu)成,每個節(jié)點(diǎn)代表一種特定的輸出函數(shù),每兩個節(jié)點(diǎn)間的連接存在信號權(quán)重。在語料訓(xùn)練時,神經(jīng)網(wǎng)絡(luò)根據(jù)語料的結(jié)構(gòu)和模式調(diào)整連接權(quán)重值形成結(jié)構(gòu)化數(shù)據(jù),類似人腦的“記憶”。可以說,“在機(jī)器學(xué)習(xí)領(lǐng)域,權(quán)重便是一切\(zhòng)"3。這些信號權(quán)重?cái)?shù)量被稱為參數(shù)量,例如OpenAI的GPT-1有1.17億個參數(shù),GPT-2增加到15億個參數(shù),GPT-3有1750億個參數(shù)31,參數(shù)量越大則功能越強(qiáng)。
2.實(shí)則“鸚鵡學(xué)舌”:缺乏對內(nèi)容的真正理解
理解是智能的基礎(chǔ)。盡管有觀點(diǎn)提出了不同于人類的“機(jī)器理解”3概念,但筆者認(rèn)為AI并不具有創(chuàng)作意義上的理解能力。
首先,AI對現(xiàn)實(shí)世界缺乏主觀感知。人的感知和理解是建立在具身體驗(yàn)的基礎(chǔ)之上,作為大模型的AI缺乏理解的“生理結(jié)構(gòu)”,不可能形成具身的體驗(yàn)。攝像頭、傳感器等采集并形成結(jié)構(gòu)化的數(shù)據(jù),也將以權(quán)重值的形式被AI記錄,但并非感受本身,例如機(jī)器可以關(guān)聯(lián)‘糖”和“甜”,但并不真正懂得“甜”的感覺和給人的滿足感。對于抽象單詞,機(jī)器更是無感,正如美國語言學(xué)家艾米麗·本德所言,AI并不理解單詞的含義 。
其次,AI語料訓(xùn)練是非主觀性學(xué)習(xí)。AI通過“權(quán)重值”模擬深度學(xué)習(xí),只能通過“詞向量”技術(shù)看清和聽清,但不能看懂和聽懂。更為重要的是,AI一直在隨著語料的增加不斷調(diào)整權(quán)重,不會總結(jié)形成穩(wěn)定的印象、概念和觀點(diǎn),而且“正是由于AI忽視了或無法完成因果推理和常識推理,只能從大量的數(shù)據(jù)中學(xué)習(xí)統(tǒng)計(jì)規(guī)律,使得AI系統(tǒng)往往在處理新領(lǐng)域的問題時表現(xiàn)不佳”。因此,AI的感知和學(xué)習(xí)缺乏理解,就像鸚鵡條件反射式的學(xué)舌,大模型現(xiàn)在展現(xiàn)出來的是流利的語言能力,沒有真正的理解能力。
(二)人工神經(jīng)網(wǎng)絡(luò)運(yùn)算的非創(chuàng)新性
1.看似“神機(jī)妙算”:通過數(shù)學(xué)運(yùn)算模擬思考
AI通過以下三步模擬人類思考:
一是通過人工神經(jīng)網(wǎng)絡(luò)模擬人腦功能。相對于生物神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)是從信息處理角度對人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象而建立的系統(tǒng)。例如,瑞士的“藍(lán)腦工程”進(jìn)行全腦仿真,模擬人腦中的800多億個神經(jīng)元和十幾萬億個神經(jīng)突觸和中樞神經(jīng)系統(tǒng)的工作模式。人工神經(jīng)網(wǎng)絡(luò)的工作模式本質(zhì)上是一種數(shù)學(xué)模型或計(jì)算模型:每個人工神經(jīng)元代表一種特定的輸出sigmod函數(shù),每兩個神經(jīng)元之間的連接存在信號權(quán)重,根據(jù)輸出權(quán)重值和函數(shù)值的變化進(jìn)而生成新的內(nèi)容8;多個人工神經(jīng)元構(gòu)成一層,輸入層和輸出層加上多個隱藏層構(gòu)成一個人工神經(jīng)網(wǎng)絡(luò)。
二是通過“轉(zhuǎn)換器”模擬人的習(xí)慣。轉(zhuǎn)換器模型(Transformer)的突出特點(diǎn)在于自注意力機(jī)制和多頭注意力3,使得人工神經(jīng)網(wǎng)絡(luò)更像人腦一樣學(xué)會“抓重點(diǎn)”。例如,當(dāng)舞臺幕布拉開時,其可以像人一樣迅速注意到舞臺聚光燈下,而不是機(jī)械地從上至下、從左至右地掃描所有地方。當(dāng)前市場上著名的BERT、GPT、T5系列模型,尤其是2024年初OpenAI的Sora模型,都是基于該架構(gòu)構(gòu)建,確保其表現(xiàn)出更接近人類智能的特性。
三是通過“大模型”實(shí)現(xiàn)大力出奇跡。在算法、數(shù)據(jù)和算力軟硬件技術(shù)支持下,參數(shù)量達(dá)到百億乃至更高規(guī)模時,可以帶來不可思議的性能“涌現(xiàn)”。狹義的大語言模型(LLM)是指基于文本序列的概率生成模式,通過對海量文本數(shù)據(jù)學(xué)習(xí),并在學(xué)習(xí)語言的統(tǒng)計(jì)特性的基礎(chǔ)上,預(yù)測給定詞序列中的下一個詞或根據(jù)提示生成文本的模型。廣義的大模型還包括視覺大模型、多模態(tài)大模型、決策大模型、行業(yè)垂直大模型等大型神經(jīng)網(wǎng)絡(luò)。大模型應(yīng)用場景幾乎涵蓋所有行業(yè)和領(lǐng)域。例如在語言文字領(lǐng)域的“智能檢索”“文生文”等技術(shù)可以實(shí)現(xiàn)公文、新聞等材料的自動化撰寫;“文生圖像”“文生視頻”“文生音樂”,以及圖片、文字、音頻、視頻之間的靈活生成則實(shí)現(xiàn)跨模態(tài)生成應(yīng)用。
2.實(shí)則“循規(guī)蹈矩”:對有限表達(dá)的概率 選擇
首先,AI用數(shù)學(xué)模型模擬人腦思考方式。數(shù)學(xué)是AI的基礎(chǔ)和運(yùn)行方式,模型是人類理解世界規(guī)律和聯(lián)系的橋梁。從1943年麥卡洛-皮茨神經(jīng)元嘗試通過數(shù)學(xué)和邏輯來解釋生物神經(jīng)元開始,科學(xué)家將統(tǒng)計(jì)學(xué)、概率論、微積分、線性代數(shù)等數(shù)學(xué)應(yīng)用于
,出現(xiàn)了多種數(shù)學(xué)應(yīng)用模型,例如前饋神經(jīng)網(wǎng)絡(luò)處理直接信息流,卷積神經(jīng)網(wǎng)絡(luò)則擅長圖像處理,循環(huán)神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)適合序列數(shù)據(jù),另外生成對抗網(wǎng)絡(luò)、變分自編碼器、自組織映射、徑向基函數(shù)網(wǎng)絡(luò)等各有所長。但以上模型是基于人類發(fā)現(xiàn)的已有的數(shù)學(xué)模型,理論模型的構(gòu)建離不開簡單化或理想化方法,這些模型運(yùn)行出來的結(jié)果也并非完全符合規(guī)律本身。
其次,AI用統(tǒng)計(jì)相關(guān)性替代客觀因果性。研究認(rèn)為,機(jī)器在大數(shù)據(jù)中采集到的規(guī)律,都屬于統(tǒng)計(jì)相關(guān)性而非因果性,從圖靈機(jī)設(shè)想開始,AI的基本原理是在數(shù)據(jù)資源基礎(chǔ)上的數(shù)學(xué)運(yùn)算和邏輯選擇,甚至有人將大模型看作是“用于模式匹配的一個笨拙的統(tǒng)計(jì)引擎”,預(yù)測的是單詞序列,而非因果關(guān)系。例如,自2005年開始的“文生圖像”技術(shù),從深度信念網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和Transformer模型迭代升級,但仍是在計(jì)算相關(guān)性。
再次,AI用概率對海量有限表達(dá)進(jìn)行機(jī)械選擇。AI運(yùn)行是概念相關(guān)性的選擇,并非有意識的創(chuàng)作行為,仍未觸及自我意識的層面,這就從根本上抹煞了處理過程的創(chuàng)作空間,排除了處理結(jié)果具有個性化特征的可能性”。例如,相同訓(xùn)練程度的“文生圖像”在簡單提示下生成的內(nèi)容具有高度相似性。而且,AI看似“創(chuàng)意”無限,實(shí)則是在計(jì)算機(jī)強(qiáng)大儲存的有限表達(dá)中進(jìn)行的概率選擇,只不過這種有限數(shù)量超過了人腦的處理能力,看似“理解”和“創(chuàng)新”僅是算法精準(zhǔn)度的升級和掌握資料的豐富 。
(三)AIGC生成內(nèi)容的不可控性
1.啟動“毫無主見”:缺乏獨(dú)立創(chuàng)作意識
馬有千里之程,無騎不能自往。
沒有創(chuàng)作意識,在具體AIGC生成過程中沒有創(chuàng)作“思想”,僅僅是在無意識地執(zhí)行程序,而“無意識的自動創(chuàng)作并不是真正的創(chuàng)作\"。另外,AI也不具有獨(dú)立性,其訓(xùn)練內(nèi)容、算法程序均由人設(shè)計(jì),生成動作也需要使用者啟動和操作,并按照提示詞要求根據(jù)算法生產(chǎn)內(nèi)容,僅能起到將使用者思想固定和呈現(xiàn)為無形物的被動工具作用。
2.過程“技術(shù)黑箱”:算法運(yùn)行的不透明性
“技術(shù)黑箱”是指盡管運(yùn)算過程原則上是在依照算法計(jì)算并根據(jù)概率輸出,但這種概率是不確定的且難以驗(yàn)證和回溯的,導(dǎo)致了AIGC往往出乎意料。例如,2024年5月12日筆者在國內(nèi)某AI詢問“(金庸)《笑傲江湖》中岳靈珊是怎么死的?”,輸出的答案是“據(jù)法制日報(bào)2020年11月13日報(bào)道岳靈珊的尸體被打撈上岸后,經(jīng)法醫(yī)鑒定,死因系溺水死亡”。出現(xiàn)這種情況是難以解釋的,因?yàn)槎鄬蛹壣窠?jīng)網(wǎng)絡(luò)方法本身被分成多個不同的層級,每個層級之間的關(guān)系是從量變到質(zhì)變的突變或涌現(xiàn),這一過程是不能被以可視化、理想化等方式呈現(xiàn)出來的。另外,算法是企業(yè)競爭核心力,權(quán)重更是商業(yè)秘密,除了“不可解釋”這個技術(shù)層面的原因,也存在涉及企業(yè)經(jīng)營策略的“不宜解釋”因素。
3.結(jié)果“出其不意”:生成內(nèi)容的不確定性
首先,使用者經(jīng)常發(fā)現(xiàn)AI答非所問,常見以下幾種情形:(1)訓(xùn)練語料的沖突導(dǎo)致的混亂,其結(jié)果可能前后矛盾,導(dǎo)致使用者覺得對話對象“自相矛盾”。(2)算法的錯誤導(dǎo)致結(jié)果錯誤,導(dǎo)致使用者覺得對話對象“智商低下”。(3)模型對權(quán)重相近結(jié)果都隨機(jī)輸出,導(dǎo)致使用者覺得對話對象在“胡言亂語”。(4)超出訓(xùn)練語料的范圍,AI依舊嚴(yán)格依據(jù)算法“捏造”出不真實(shí)的結(jié)論或者是滯后的結(jié)果,導(dǎo)致使用者覺得對話對象在“癡人說夢”。(5)提示詞使用的歧義,比如AI對提示詞“會意”有誤,導(dǎo)致使用者覺得對話對象在“答非所問”。
其次,AI還經(jīng)常出現(xiàn)“機(jī)器幻覺”。人類貴有自知之明和謹(jǐn)慎的態(tài)度,對于自己沒有把握的內(nèi)容可以拒絕回答,或坦言不知,或采取避重就輕、閃爍其辭的模糊處理;但“機(jī)器以一種令人信服但完全編造的方式來表達(dá)自己\",它意識不到自己的無知,總能根據(jù)算法按照概率給出答案,類似在一本正經(jīng)地胡說八道,這就是“機(jī)器幻覺”。有研究認(rèn)為,產(chǎn)生“幻覺”的原因中,AI本身錯誤是占
,例如“技術(shù)黑箱”,但根本原因在于其對單詞真正含義并不理解。正如美國語言學(xué)家艾米麗·本德所言,“由于缺乏對事實(shí)的理解,它們在回答問題時會產(chǎn)生幻覺”。
(四)GenAI是人類義肢和創(chuàng)作工具
1.AI與人類智能存在現(xiàn)實(shí)差距和本質(zhì)差別
當(dāng)前AI尚停留在“弱人工智能”的初級階段,所謂“強(qiáng)人工智能”仍是一種科學(xué)前景,不僅需要量變,更需要質(zhì)變才有可能在未來達(dá)到。首先,人類智能機(jī)理尚未清晰,盡管算法可以模擬人類記憶與思維能力中的形式邏輯,但人類對自身的直覺和靈感還沒有成熟認(rèn)識,自由意志等非理性因素的機(jī)器實(shí)現(xiàn)存在很大的障礙。其次,模擬方法還不成熟、不全面,AI在神經(jīng)元模型和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)方面與人腦相距甚遠(yuǎn),在信號表達(dá)機(jī)理上也存在根本差別,而且目前AI的學(xué)習(xí)能力依賴于數(shù)據(jù)統(tǒng)計(jì),生成也是僅僅對概率的運(yùn)用,還無法模擬人類推理和類推并形成概念和觀點(diǎn)的能力。最后,智能水平差距甚遠(yuǎn)。人腦神經(jīng)突觸數(shù)量約百萬億,而且單個神經(jīng)元的能力相當(dāng)于5一8層的人工神經(jīng)網(wǎng)絡(luò),而當(dāng)前人工神經(jīng)網(wǎng)絡(luò)的神經(jīng)連接數(shù)量只有人腦的
,盡管可以運(yùn)算得很快,但智能還遠(yuǎn)遠(yuǎn)不及。
2.AI的工具屬性不能否認(rèn)AIGC的作品屬性
人類智能在AI時代不僅依然重要,而且其獨(dú)特價值在某些領(lǐng)域更加凸顯5。這種獨(dú)特價值在于,一方面可以創(chuàng)造功能強(qiáng)、效率高的AI創(chuàng)作工具,另一方面可以利用AI創(chuàng)作具備獨(dú)創(chuàng)性、值得被著作權(quán)法保護(hù)的作品。篇幅所限,本文無法展開討論AIGC的作品屬性,多數(shù)觀點(diǎn)認(rèn)為如果有證據(jù)證明人在制造或使用AI過程中,通過對AI智力投入和具體提示、選擇而得到的AIGC,則可能具備作品屬性。另有客觀獨(dú)創(chuàng)主義認(rèn)為,智力成果具備客觀上的獨(dú)創(chuàng)性就可以構(gòu)成作品。筆者同樣認(rèn)為,AI自身運(yùn)行的非創(chuàng)作性,并不能直接否認(rèn)人類使用AI生成AIGC的作品屬性。正如日本文化廳文化審議會于2024年3月發(fā)布的《關(guān)于人工智能與著作權(quán)相關(guān)問題的意見》中認(rèn)為,“人類創(chuàng)造的部分和AI生成的部分應(yīng)當(dāng)被分別評價,即使生成物中的部分內(nèi)容經(jīng)過人類的調(diào)整而具有獨(dú)創(chuàng)性,這并不能使其中完全由AI生成的部分被認(rèn)定為作品;反之,即使由AI生成的部分不構(gòu)成作品,由人類創(chuàng)造的部分依然可以被認(rèn)定為作品”。
三、基于利益平衡 提供商的貢獻(xiàn)和利益需求
直接創(chuàng)作作品的自然人是作者,具有創(chuàng)作意志并實(shí)施組織主持行為的法人或非法人組織視為作者。在AIGC生成過程中,使用者直接參與了創(chuàng)作過程,提供商提供技術(shù)和服務(wù),對AIGC的生成直接和間接作出了貢獻(xiàn),但能否視為作者還要根據(jù)其主觀創(chuàng)作意志、客觀組織主持行為和責(zé)任承擔(dān)能力等進(jìn)行分析。一方面,需要肯定使用者和提供商對AIGC的貢獻(xiàn),尊重其利益需求,激勵產(chǎn)業(yè)發(fā)展;另一方面,也需要立足利益平衡,降低交易成本,提升知識傳播效率。
(一)提供商的貢獻(xiàn)和盈利模式
不可否認(rèn)的是提供商需要為AI投入巨額成本。首先,算力成本越來越高。隨著算法需求增加和計(jì)算能力的增強(qiáng),詞向量和詞預(yù)測量快速增加,相應(yīng)計(jì)算能力需求猛增。2018年OpenAI的GPT-1共有1.17億個參數(shù),隨后版本迅速增加,GPT-4o參數(shù)約2000億,ol-preview參數(shù)約3000億°,對算力需求越來越大。同時受到技術(shù)壁壘和生產(chǎn)能力影響,算力硬件設(shè)備中的芯片成本也越來越高。其次,語料成本比重越來越重。數(shù)據(jù)是AI的石油和源泉,以數(shù)據(jù)的形式占有和學(xué)習(xí)現(xiàn)有知識是AI合法、好用的前提。為廣泛、準(zhǔn)確、合法取得數(shù)據(jù),提供商需要承擔(dān)解決數(shù)據(jù)分散、數(shù)據(jù)質(zhì)量、數(shù)據(jù)滯后和數(shù)據(jù)合法等方面的巨大成本。
提供商的市場目的是持續(xù)盈利,沒有持續(xù)盈利就沒有持續(xù)發(fā)展。據(jù)研究,2023年中國GenAI主流盈利模式包括:Maas(按模型調(diào)用量收費(fèi))、按產(chǎn)出內(nèi)容量付費(fèi)、軟件訂閱付費(fèi)、模型定制開發(fā)費(fèi)和基于廣告流量的收費(fèi)等收費(fèi)模式,其中按產(chǎn)出內(nèi)容量付費(fèi)占比達(dá)到
筆者認(rèn)為,提供商的利益需求包括以下兩個內(nèi)容:
一是基于服務(wù)的合同利益。提供商通過提供AI軟硬件來提供計(jì)算和生成服務(wù),使用者享用服務(wù)進(jìn)行操作并獲得AIGC,這種法律關(guān)系既非AIGC買賣合同,也非委托提供商生成AIGC的委托合同,而是一種無名的服務(wù)合同。例如GPT-4每月收取服務(wù)費(fèi)20美元,百度文心一言4.0每月收取59.9元人民幣。有研究認(rèn)為,將來中國GenAI企業(yè)盈利將以Mass(按模型調(diào)用量收費(fèi))為主,事實(shí)上也是一種基于模型調(diào)用量的服務(wù)收費(fèi)。
二是基于AIGC產(chǎn)品的利益。根據(jù)勞動財(cái)產(chǎn)說理論,作品因摻入作者的勞動因而獲得財(cái)產(chǎn)權(quán)。5在理論界,關(guān)于AIGC的財(cái)產(chǎn)權(quán)屬性,存在不賦權(quán)說和賦權(quán)說的爭議;關(guān)于AIGC賦予權(quán)利或權(quán)益類型,有觀點(diǎn)主張授予著作權(quán) ,有觀點(diǎn)認(rèn)為可以授予鄰接權(quán);也有學(xué)者認(rèn)為,著作權(quán)保護(hù)是最優(yōu)路徑,鄰接權(quán)也具有一定優(yōu)勢,也可以考慮數(shù)據(jù)等特殊財(cái)產(chǎn)權(quán)制度,或者考慮競爭法路徑。但從市場上看,還沒有較為成熟的提供商行使基于AIGC著作權(quán)的模式。
(二)提供商的作者身份質(zhì)疑
除了前文分析的AI生成AIGC的非創(chuàng)作性原因以外,提供商不應(yīng)視為作者還包括以下原因:
第一,從創(chuàng)作過程看,提供商未參與到具體的創(chuàng)作過程中。首先,提供商不具有創(chuàng)作的具體“思想”。提供商并不參與、也不控制具體的創(chuàng)作“思想”,而僅僅是被動性提供AI工具。其次,在與使用者合作過程中,提供商并不具有在共同創(chuàng)作思想指導(dǎo)下的分工合作,不應(yīng)當(dāng)認(rèn)為與使用者構(gòu)成著作權(quán)法意義上的“合作作者”。再次,提供商也沒有對AIGC的具體預(yù)見性。AIGC是在使用者提示下通過算法實(shí)現(xiàn)輸出,但輸出內(nèi)容是概率計(jì)算的結(jié)果,提供商對AIGC并無預(yù)見性。另外,提供商提供的AI工具自身運(yùn)行的非創(chuàng)作性,決定了提供商對具體AIGC不具有創(chuàng)作行為。
第二,從產(chǎn)業(yè)發(fā)展看,提供商的服務(wù)成本和盈利需求可以通過服務(wù)合同債權(quán)等方式獲得。如前所述,2023年中國GenAI主流盈利模式中按產(chǎn)出內(nèi)容量付費(fèi)的占比為
71該研究機(jī)構(gòu)還認(rèn)為,未來將以Mass為主。而且,相對于合同債權(quán)收益,著作權(quán)收益具有極大的不確定性,其資產(chǎn)變現(xiàn)受到多種因素影響,不應(yīng)成為提供商盈利的主要來源。
第三,從制度成本看,提供商享有著作權(quán)加大作品使用成本。一方面,明確劃分提供商與使用者之間的著作權(quán)分成,就必須明確提供商對AIGC獨(dú)創(chuàng)性部分的貢獻(xiàn)程度或比例,需要較高的技術(shù)成本和潛在的糾紛解決成本。另一方面,提供商缺乏主動使用和許可AIGC的主動性和成熟模式,甚至對AI生成了什么都難以顧及,如果授予提供商作者身份,AIGC的許可和流通事宜可能會更為繁瑣。
第四,從公平角度看,提供商享有著作權(quán)可能嚴(yán)重壓縮使用者利益。一方面,提供商相對于使用者處于絕對強(qiáng)勢地位,許多提供商不僅主張著作權(quán),還要限制使用者著作權(quán)的行使,并要求免費(fèi)的、全球范圍內(nèi)的、永久的許可使用權(quán)利等,導(dǎo)致利益失衡。另一方面,提供商掌握大量作品著作權(quán)可能會造成知識壟斷,加劇數(shù)據(jù)鴻溝,進(jìn)而影響市場公平競爭。
(三)著作權(quán)權(quán)屬的約定效力
關(guān)于AIGC能否構(gòu)成作品存在不同的觀點(diǎn)。有觀點(diǎn)認(rèn)為,使用者首先要基于設(shè)計(jì)和需求選擇合適的AI,同時選擇提示詞也需要經(jīng)驗(yàn)、設(shè)計(jì)和靈感,就像神筆馬良駕馭神筆一樣。不論是“使用者控制說”還是“AI工具說”,都認(rèn)為AI不是獨(dú)立的,使用者的操作占主導(dǎo)地位,付出了有價值的勞動。因此從作品創(chuàng)作過程、勞動價值理論、著作權(quán)制度激勵對象等角度看,使用者是AIGC的作者。排除職務(wù)行為、合同行為等因素影響外,使用者是AIGC的當(dāng)然著作權(quán)利人。AIGC能否構(gòu)成作品還需要按照著作權(quán)普通規(guī)則進(jìn)行判斷,根據(jù)獨(dú)創(chuàng)性標(biāo)準(zhǔn)進(jìn)行具體認(rèn)定,而不宜一概而論。正如北京互聯(lián)網(wǎng)法院在“AI文生圖”案件中認(rèn)為“利用AI生成圖片是否構(gòu)成作品,需要個案判斷,不能一概而論”,AIGC是否構(gòu)成作品需要采取個案認(rèn)定原則。該問題并非本文討論重點(diǎn),鑒于GenAI提供商不具有應(yīng)然作者身份,考慮到市場慣例,需要討論能否依據(jù)用戶約定取得著作權(quán)。筆者認(rèn)為應(yīng)當(dāng)明確以下兩點(diǎn):
1.AIGC標(biāo)記不具有著作權(quán)初步證明效力
AIGC標(biāo)記在很多國家和地區(qū)已經(jīng)被規(guī)定為強(qiáng)制義務(wù)。我國《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》和《生成式人工智能服務(wù)暫行管理辦法》明確規(guī)定了AI算法推薦結(jié)果和AIGC應(yīng)當(dāng)進(jìn)行標(biāo)識,國家互聯(lián)網(wǎng)信息辦公室《人工智能生成合成內(nèi)容標(biāo)識辦法 (征求意見稿)》擬細(xì)化標(biāo)識規(guī)則。美國《人工智能行動令》第1條也要求商務(wù)部制定內(nèi)容認(rèn)證和水印的指南以明確標(biāo)記AIGC。一種觀點(diǎn)認(rèn)為,該標(biāo)記相當(dāng)于著作權(quán)意義上的署名,表明作者身份并可以作為著作權(quán)人的初步證據(jù)。另一種觀點(diǎn)則認(rèn)為,該標(biāo)識并非著作權(quán)意義上的署名4,屬于產(chǎn)品來源標(biāo)識。筆者認(rèn)為,AIGC標(biāo)記的相關(guān)法律規(guī)定層級不能超越著作權(quán)法對AIGC設(shè)定著作權(quán),而且AIGC標(biāo)記的要求與著作權(quán)中的可以署名、不署名、署真名、署筆名的署名權(quán)不同,這是一種公法義務(wù),用于表明來源并使相關(guān)主體可能承擔(dān)私法或公法上的責(zé)任。因此,AIGC標(biāo)記并非作者署名,而是產(chǎn)源標(biāo)記。
2.用戶協(xié)議約定著作權(quán)須遵守誠信原則
根據(jù)當(dāng)前市場上提供商和使用者之間用戶協(xié)議的情況,可能出現(xiàn)以下幾個問題:
一是關(guān)于著作權(quán)歸屬約定和聲明問題。如果提供商在用戶協(xié)議中“放棄”本就不屬于他們的AIGC著作權(quán),不會產(chǎn)生著作權(quán)屬糾紛。
如果提供商在用戶協(xié)議中主張AIGC的著作權(quán),使用者簽署了用戶協(xié)議且事后追認(rèn)或默認(rèn)的,AIGC的著作權(quán)可以視為轉(zhuǎn)讓給了提供商。如果使用者被迫接受用戶協(xié)議,但明確主張相關(guān)條款構(gòu)成格式條款而無效的情況下,應(yīng)當(dāng)根據(jù)民法典和合同相關(guān)法律法規(guī)的相關(guān)規(guī)則,先認(rèn)定具體條款的有效性,再確定著作權(quán)歸屬。
二是關(guān)于提供商對AIGC要求無償、不可撤銷的使用權(quán)的約定和聲明問題。一般情況下,提供商對AIGC不具有著作權(quán),無權(quán)單方要求無償、不可撤銷等使用權(quán),包含該意思的條款在使用者反對的情況下不具有法律效力。
三是關(guān)于提供商限制使用者自由使用AIGC的問題。例如部分提供商明確要求使用者不得商業(yè)性使用AIGC。如前分析,一般情況下,提供商對AIGC不享有著作權(quán),也無權(quán)單方限制使用者對AIGC的作品使用方式,包含該意思的條款在使用者反對的情況下同樣不應(yīng)具有法律效力。
Artificial Intelligence Provider's Work Ownership Research on Products- -From the Perspective of Technology Essence and Right Balance
Abstract: When artificial intelligence products with originality constitute works,their atribution directly affects the creation enthusiasm,the use of works and the eficiencyofcirculation,but there are great controversies in theory andpractice.Fromtheperspectiveofgenerativetechnologyproces,generativeartificialinteligenceoperationisnonsubjective,non-innovative and non-predictable.This unconscious program operation is not a creation in the sense of copyright,but can be used as a high-tech tool for users to create.From the perspective ofcontribution and equity balance,the service provider does not have creative thoughts and behaviors, is notthe author of the work,and the program toolservice provided by it is beter realized throughthe service credit.For the current market service providers and users through the user agreement and other ways to agree on the ownership of copyright, should be based onthe principle of good faith to determine the effect.
Keywords: Generative Artificial Intelligence; Copyright; Author;AI Provider; User Agreement