東村仁 臧可
摘 要:【目的】對人工智能生成物的法律屬性進行準確定位,尋找人工智能生成物的潛在風險化解路徑。【方法】從法律層面分析人工智能生成物的產生來源及過程,揭示人工智能生成物的本質。【結果】從人工智能“數(shù)據(jù)訓練”創(chuàng)作方式和機器學習階段分析來看,人工智能不具備民事主體資格,但其作品具有可版權性的可能性,應被賦予一定權利。【結論】賦予人工智能享有署名權的權利,以“使人工智能生成物成型確定下來”為分界線,在自然人范圍內確定權屬和責任承擔者進行權利安排。運用實質性相似規(guī)則和市場替代標準化解人工智能生成物復制權和改編權侵權風險,同時適用過錯原則,相應配置人工智能設計者、使用者“防抄襲設計義務”注意義務。
關鍵詞:人工智能生成物;獨創(chuàng)性;實質性相似;過錯推定
中圖分類號:D923.41? ? ?文獻標志碼:A? ? ?文章編號:1003-5168(2024)06-0116-08
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.06.023
The Legal Nature of Artificial Intelligence Products and the Resolution of Copyright Infringement Risk
DONG Cunren1 ZANG Ke2
(1.College of Intellectual Property, Henan University of Economics and Law, Zhengzhou 450046, China;
2. School of Law, Northwest Normal University, Lanzhou 730070, China)
Abstract:[Purposes] This paper aims to accurately locate the legal attributes of artificial intelligence products and find the potential risk resolution path of artificial intelligence products. [Methods] The nature of artificial intelligence products is revealed through legal analysis of the source and process of artificial intelligence products. [Findings] From the analysis of the creation method of artificial intelligence "data training" and the machine learning stage, artificial intelligence does not have the qualification of civil subject, but the works have the possibility of copyright, which should be granted certain rights. [Conclusions] This paper gives artificial intelligence the right to enjoy the right of signature, and with "the formation of artificial intelligence products to be determined" as the dividing line, this paper? determines the ownership and responsibility bearers within the scope of natural persons to arrange the rights. The substantive similarity rules and market substitution standards are used to resolve the risk of infringement of reproduction rights and adaptation rights of artificial intelligence products. At the same time, the principle of fault is applied, and the duty of care of "anti-plagiarism design obligations" of artificial intelligence designers and users is configured accordingly.
Keywords:artificial intelligence products;originality;substantial similarity; presumption of fault
0 引言
人工智能擁有極強的學習能力,在進行數(shù)據(jù)整合和模型建立后能夠產出大量高質量的文字、繪畫等生成物。人工智能的廣泛應用以及它本身所具有的特性,給傳統(tǒng)著作權法帶來了巨大的挑戰(zhàn)。根據(jù)目前的人工智能發(fā)展水平,人工智能需要在被“喂養(yǎng)”海量作品并進行機器學習后,才會形成人工智能生成物,因此有必要對人工智能進行著作權法研究。在著作權法背景下,人工智能侵權行為相較于人類作品侵權情況更為復雜,人工智能學習作品獲取渠道的合法性和創(chuàng)作出的產物的可版權性值得研究。人工智能未經規(guī)范地獲取、使用受著作權法保護的作品可能會侵犯人類作者的著作權,導致人工智能和人類作者之間的關系失衡,從而引發(fā)侵權糾紛。在認識到人工智能是文藝創(chuàng)作的創(chuàng)造性工具的前提下,對人工智能主體資格、權利歸屬有相對準確的定位,能更好地適用著作權法對人工智能生成物進行法律規(guī)范,促進版權市場健康發(fā)展。
1 人工智能的工具性和非主體性
以人工智能的特征為切入點,對人工智能侵權進行研究有一定的現(xiàn)實意義。應當從人工智能的屬性入手,按照侵權要件確定人工智能在著作權法體系中的法律地位和侵權主體資格。
1.1 人工智能的工具性
1.1.1 人工智能生成物的形成過程。人工智能是一種智能化的機器。根據(jù)我國著作權法第二條和著作權法實施條例第三條規(guī)定,在嚴格意義上,只有自然人做出創(chuàng)作行為,其創(chuàng)作成果才有可能成為受著作權法保護的作品,法人或非法人組織屬于著作權特殊主體,機器則完全被排除在著作權法規(guī)定的主體之外。然而在人工智能時代,隨著科技進步,人工智能創(chuàng)作路徑在不斷變化,機器不再單純是減輕人類體力勞動的輔助性工具,而是能和計算機、互聯(lián)網、神經科學等科技手段結合,從事文案及代碼撰寫、繪畫設計、數(shù)字或文字閱讀處理等有一定難度活動的工具。
從人工智能創(chuàng)作的發(fā)展階段來看,總體上有兩種人工智能創(chuàng)作方式。第一種是“代碼定義”,通過程序代碼賦予機器人類的思維方式或思維結構,使其完成某種作品的創(chuàng)作[1],即事先向機器輸入包含人類創(chuàng)作思維要素的代碼編程。由于機器只是執(zhí)行固定程序,因此在這一技術路徑下機器對最終生成物的貢獻度不高。第二種是“數(shù)據(jù)訓練”,通過計算機算法對海量數(shù)據(jù)進行數(shù)據(jù)分析和建模,進而“模仿”人類創(chuàng)作的過程產出生成物。Mitchellt[2]在技術層面上對機器學習做出了明確的界定:“假定一個計算機程序從一個經驗E中學會并完成一個工作T,那么,機器學習就是為了提升一個工作 T的執(zhí)行能力P,并且當一個工作經歷E累積時,它的執(zhí)行能力P將會得到提升。”在這個概念中,“經驗”其實就是一種機器可閱讀的“數(shù)據(jù)”,即“經驗”是機器可讀形式的“數(shù)據(jù)”。吳漢東[1]把數(shù)據(jù)訓練的過程分為數(shù)據(jù)輸入—機器學習—結果輸出,其以機器學習為技術支撐,實現(xiàn)在智力創(chuàng)造活動中。在數(shù)據(jù)輸入階段,人工智能對數(shù)據(jù)進行儲存和分析,這些可供機器進行分析建模的數(shù)據(jù)多是受著作權法保護的作品,機器要么對其進行數(shù)字化副本處理,要么直接挖掘已數(shù)字化的作品。隨后輸入算法系統(tǒng),然后進入核心階段,即機器學習階段,用訓練集和測試集反復進行算法訓練和模擬。最后進入“算法創(chuàng)作”的輸出階段,生成內容集算法編程、搭建神經網絡、建立輸出模型等。這不僅是對技術的綜合運用,更可能是具有創(chuàng)造性的發(fā)揮,因此很可能成為著作權法所稱的具有思想表達外觀的作品。
對于機器學習階段,Sobel和Benjamin[3]以機器輸出內容中是否含有表達性內容為標準,將機器學習橫向分類為表達型機器學習和非表達型機器學習。對于表達型機器學習,國內學者將之細分為普通型和特殊型。普通型不以特定作者為對象,特殊型則專門向特定作者學習[4]。用于普通型機器學習的算法訓練數(shù)據(jù)來源于眾多作者的作品。例如:2015年谷歌“Inbox”郵箱推出的“智能回復”服務產品,該服務產品選取了11 000余本愛情小說來訓練算法,目的是讓該產品能夠寫出活潑幽默、風格多變的語句;巴黎索尼計算機科學實驗室用音樂家巴赫(Bach)的300首歌曲來訓練其人工智能系統(tǒng),“創(chuàng)作”出具有巴赫風格的音樂作品,報道顯示有超過50%的被測試人員認為自己聽到的就是巴赫的曲子。非表達型機器學習不輸出表達性內容,進行作品復制并非為了學習作品中的表達性要素,而只是搜集事實信息。這些信息來源局限于某一固定方面。例如,人臉識別系統(tǒng)搜集大量人臉照片,僅學習照片中的顯示人臉面部特征的要素以便準確識別人臉,這個過程既沒有表達性輸入和輸出,作品復制亦未向公眾傳播。
1.1.2 人工智能本質上屬于創(chuàng)作工具。人工智能擁有持續(xù)進階的學習能力,采用數(shù)據(jù)訓練方式的人工智能擁有一定的自主性,其輸出過程并非按照預先設定好的編程進行,而是在特定領域或事務中不受外界干擾,部分或完全自主運行,只有少部分需要人類接管。深度學習環(huán)節(jié)正是人工智能實現(xiàn)一定自主性的關鍵。人工智能能夠通過海量數(shù)據(jù)學習以及非既定性訓練歸納出規(guī)律,并以此處理改造產出可能超出預期的“作品”。圖靈測試相信在人機對話中,如果計算機可以成功欺騙人類,則認為該機器擁有人的認知與理解能力。也就是說只要機器的宏觀功能與人類的智力行為是相同的,就可以用“智能”一詞來描述這一功能。這是一種認知科學上高度的功能主義觀點,即認為心智與大腦的關系可等價于程序與硬件的關系。20世紀80年代,美國哲學家John Searle設計了著名的思想實驗“中文房間”(Chinese room),在這個實驗中,計算機始終掌握的是無意義的字符,而非有意義的語義。他認為不可能通過某種程序操作從語言形式(syntax)中得到語義內容(semantic)。目前人工智能仍處于弱人工智能階段,還沒有脫離人類對其的控制,總是被人為設定的運行過程所限制,且受輸入信息的約束。人工智能缺乏必要的認知情感與理性判斷,是用來解釋理論的科研工具。人工智能對數(shù)據(jù)訓練所積累的規(guī)律的應用只是在模擬人類實踐過程,顯然這并不必然意味著人工智能的思考和決策過程完全等同于人類。因此,我們應當在承認人工智能自主性的基礎上重新認識其工具性。
1.2 人工智能的非主體性
人工智能“數(shù)據(jù)訓練”的創(chuàng)作方式和表達型機器學習的技術路徑已表明,人工智能能夠利用數(shù)據(jù)挖掘和分析來模仿人類創(chuàng)造性的智力活動,這是類人化的表現(xiàn)。從這個層面上來說,人工智能不再是純機械性工具,而可能成為相對獨立的“機器作者”或者說擔任輔助創(chuàng)作的角色,與人類作者合作創(chuàng)作。人工智能到底能否成為法律主體,主要取決于其是否具備責任能力,能夠對其行為負責,承擔侵權責任。有觀點認為,自然人法律人格的確立以理性意志為基礎,但仍存在例外。因為自然人中存在著大量非理性、精神紊亂、意志力低下的人群,并且,法人法律人格的擬制在法律上亦能夠被承認,賦予新型法律主體法律人格不一定需要該主體具有精神能力和意志力,因此應承認人工智能的法律人格[5]。本文認為,從民事主體基礎理論和法哲學基礎來看,人工智能不具有也不應有法律人格,應將其作為權利客體來看待,從哲學角度也只能將其看作是人實現(xiàn)目的的手段和工具。
1.2.1 人工智能沒有民事權利能力。法律規(guī)定了法律主體的民事權利和義務,指引法律主體能做什么和不能做什么。人工智能因受到技術限制而缺乏規(guī)范認知能力甚至沒有法律意識,讓人工智能意識到自己有選擇的自由并感知法律壓力,不具有現(xiàn)實意義,因此也很難做出相應的決策和調整。
1.2.2 人工智能沒有民事行為能力。“如果說民事權利能力是主體存在的必要條件,則民事行為能力就是作為主體的充分要件。”[6]人工智能沒有自然人生理上的本能追求,對外表現(xiàn)出的是人工智能設計者的意思表示,人工智能無法產生從事民事活動的動機。
1.2.3 人工智能沒有民事責任能力。人工智能無法真正理解人類社會中的抽象概念和規(guī)范,因此無法識別貨幣符號的價值和理解“財產支配、賠償”的含義。部分學者主張采取“保險責任制度”和“賠償基金制度”,在保額或基金范圍內向受害人予以賠償[7]。這僅是人工智能致?lián)p而承擔責任的思路,不能將保險金額和基金視為人工智能的獨立財產。
法人或非法人組織作為非人類主體被法律賦予人格并擬制成為作者,這一著作權立法模式使得部分學者主張效仿法人擬制制度建立人工智能擬制制度。“法人”這個概念由《德國民法典》首次創(chuàng)制,在法律上對滿足特定條件的團體賦予權利能力,使其具備民事主體資格[8]。這其實是種擬制人格方式,即在法律框架之內將團體人格化。法人在法律上代表著人類團體意志的一種獨立性,因此其具有獨立人格,能夠以自己的名義締結法律關系,由法人機構行使權利和履行義務。法人統(tǒng)一于民事權利、義務和責任。法人有獨立于團體成員且能夠被法人獨立支配的財產并承擔財產責任,相比之下,人工智能沒有可持有和處理的財產。即便如此,法人仍必須建立在人類的基礎之上,是自然人的集合體。人工智能產業(yè)鏈條上都是獨立存在的主體,例如,人工智能設計者、購買者以及使用者,這些主體不同于公司的董事、監(jiān)事、高級管理人員等基于一個相同目的和意向而具有緊密聯(lián)系。
綜上,人與人工智能是一種控制與被控制的主客體關系。人工智能屬于權利客體“物”的范疇,它能為特定人所支配,滿足人類生產生活需要,直接賦予人工智能法律主體資格會違反主客體轉換的原理。我們應當將人工智能看作人類實現(xiàn)一定目的的智能工具,它具備強大的計算機功能,能夠高效地處理大量數(shù)據(jù),還擁有類人的智慧,可以處理復雜任務,甚至自主地做出決策。因此,在適用法律方面必須充分考慮該系統(tǒng)的特殊性,采用除“直接進入公共領域”和“人格擬制”外的方法解決人工智能侵權問題。
2 人工智能生成物的可版權性與權利歸屬
即使是人類創(chuàng)作的內容,也必須先符合法律規(guī)定的作品構成要件,才能成為著作權法保護的對象,人工智能生成物更應如此。2022年文本描述自動生成圖片(Text-to-Image)的AI繪畫知名度急劇增加,一幅由MidJourney生成的數(shù)字油畫獲得了Colorado博覽會藝術比賽的第一名。以目前人工智能發(fā)展平均程度來看,人工智能生成物在外觀上和人類作品幾乎完全一致,因此它是否可以成為著作權法的保護對象,重在其獨創(chuàng)性的有無。
2.1 人工智能生成物可版權性探討
2.1.1 實務案例對可版權性的考察。我國實務界關于人工智能生成物可版權性的討論,主要集中在該類客體是否具有獨創(chuàng)性,是否構成著作權法意義上的作品。北京互聯(lián)網法院和深圳南山區(qū)法院在2018年和2020年先后審結了兩個均被稱為“人工智能著作權第一案”的北南兩大案件,兩案對人工智能生成文章作品做出了截然不同的判決。
兩起案件都屬于著作權侵權糾紛案件,雙方糾紛產生焦點以及法院審理方向均一致。原告主張涉案文章系作品,侵害相關著作權,法院就原告是否為本案適格主體部分,分別判斷涉案文章是否構成文字作品。北京互聯(lián)網法院認為涉案文章不構成作品,其具有一定獨創(chuàng)性,然而具備獨創(chuàng)性并非構成文字作品的充分條件①。法院在判決書中認為,涉案軟件開發(fā)者(所有者)承擔軟件開發(fā),不涉及具體使用,軟件用戶也僅提交了關鍵詞進行搜索,均未傳遞兩者思想、感情的獨創(chuàng)性表達;涉案文章采用軟件的“可視化”功能自動生成,該分析報告外觀形式符合文字作品要求,其內容也是軟件對相關數(shù)據(jù)進行智能選擇與分析后輸出的,但是根據(jù)現(xiàn)行法律規(guī)定,文字作品應由自然人創(chuàng)作完成,自然人創(chuàng)作完成仍應是著作權法上作品的必要條件。由于分析報告不是自然人創(chuàng)作的,因此,即使威科先行庫“創(chuàng)作”的分析報告具有獨創(chuàng)性,該分析報告仍不是著作權法意義上的作品,依然不能認定威科先行庫是該篇報告的作者并享有著作權法規(guī)定的相關權利。兩年后的南山區(qū)法院在面臨同樣的問題時,從兩方面判斷涉案文章是否屬于作品:首先,從Dreamwriter軟件生成文章的外在表現(xiàn)上,認為其具有一定獨創(chuàng)性;其次,從生成過程來分析,認為其體現(xiàn)了創(chuàng)作者的個性化選擇、判斷及技巧等因素,主創(chuàng)團隊運用該軟件在數(shù)據(jù)輸入、觸發(fā)條件設定、模板和語料風格取舍上的安排與選擇,屬于與涉案文章的特定表現(xiàn)形式之間具有直接聯(lián)系的智力活動。法院認為在具體認定創(chuàng)作行為時,具有決定性的因素應當是相關創(chuàng)作行為能否被認為是智力活動,以及該行為與作品的特定表現(xiàn)形式之間是否具有真正關聯(lián)②。人工智能的文章生成技術在兩年后會發(fā)生較大變化,Dreamwriter軟件的搜集素材、決定表達的主題、寫作風格以及具體的語句形式都可以改變。有關生成內容的可選擇范圍相較于前案應當是擴大的,也就是說人工智能在文章生成過程中,其自主性行為對最終生成物的影響比例在增加,獨創(chuàng)性的可能性會更大。南山區(qū)法院明確了人工智能獨創(chuàng)性的判斷步驟,在審理此類案件時做出了創(chuàng)新及探索,但法院僅說明人工智能寫作軟件的主創(chuàng)團隊利用該軟件的創(chuàng)作行為是智力活動,由相關人員的智力活動符合著作權法規(guī)定倒推軟件生成的文字內容具有獨創(chuàng)性,并沒有闡明人工智能具有獨立的創(chuàng)作能力的正當性來源。
2.1.2 人工智能生成物具有可版權性。自然人是創(chuàng)作作品的作者,獨創(chuàng)性是自然人的創(chuàng)作思維在作品中的表現(xiàn)形式。人工智能沒有著作權法上的法律主體資格,但這是否意味著因自由意志是人類獨有而否定人工智能的創(chuàng)作能力?Disco Diffusion是2022年2月爆火的AI圖像生成程序,可以根據(jù)描述的場景關鍵詞渲染對應的圖片。人工智能會根據(jù)描述詞語的不同,生成不同風格的圖片,即盡管數(shù)據(jù)庫在短時間內沒有更新,但根據(jù)描述差異,相同素材也會形成不同結果。人工智能具有一定的自主性已經表明,具有深度學習能力的人工智能已經能夠擺脫“機械的延伸”這一刻板評價,深度學習能力可以認為是人工智能生成物具有獨創(chuàng)性的源泉。人工智能以現(xiàn)代神經科學為基礎,通過計算機建立結構神經網絡來仿生人類神經信號從樹突傳遞到軸突再到軸突末梢的過程。人工智能對輸入數(shù)據(jù)的權值進行求和,然后計算出非線性函數(shù),以提供給使用者最為合理的結果。因此能夠高度模擬人類創(chuàng)作思維的人工智能創(chuàng)作與人類創(chuàng)作有一定的相似性,使得人們不會直接否定人工智能創(chuàng)作。自由意志的存否并非通過科學檢驗和證據(jù)驗證的事實判斷[9]。獨創(chuàng)性不能完全理解成“人工智能生成物和人類作品的表達有區(qū)別之處”,其內容的表達體現(xiàn)著對于創(chuàng)作要素的能動性運用,人工智能生成內容與人類智力成果在生成過程中享有共同內在邏輯,兩者在表現(xiàn)形式上則同樣具有共同外在邏輯,何況人工智能自身本就是人智力活動的產物,因此它產生的內容天然具備人類智力成果的特征[10]。
ChatGPT是美國人工智能研究實驗室OpenAI于2022年11月30日發(fā)布的一款聊天機器人程序,其可以流暢地與用戶對話,也可以編寫和調試計算機程序,對用戶提供的數(shù)據(jù)進行分析總結。2023年1月巴黎政治大學宣布禁止使用ChatGPT等一切基于AI的工具,旨在防止學術剽竊。ChatGPT引入了RLHF(基于人類反饋的強化學習)新技術,能夠實現(xiàn)算法自動優(yōu)化,盡管它的目標任務和系統(tǒng)基礎仍然由人類設定,但ChatGPT能根據(jù)使用者需求隨時改變檢索條件,從而增加數(shù)據(jù)結果的隨機性,使其更加不可預測。再結合人工智能學習過程,在算法創(chuàng)作過程中,機器深度學習能力是使人工智能脫離人類的事先預設而實現(xiàn)個性化表達的真正源頭,或算法自由實現(xiàn)了人工智能的個性化表達,且這是人工智能獨立完成的。具體而言:
①人工智能生成物含有人格要素。“思想表達二分法”屬于版權制度的基本原理之一,版權保護的范圍是作品中含有的思想的特定表達,不能夠擴展至作品中包含或體現(xiàn)的思想,然而思想在作品中所體現(xiàn)的程度大小只能通過表達來倒推。思想與表達僅通過外在形式連接,作者思想和人格在表達中的體現(xiàn)程度無法像“思想體現(xiàn)作者人格”所說的一樣完整,思想體現(xiàn)人格只是理想狀態(tài)下對人格是否在作品中有所體現(xiàn)的描述,這僅是應然層面,并非實際狀態(tài)下實然層面上的描述。因此,著作權認定并不一定要只注重“思想”和“人格”的單一性,不應以此為由否認人工智能生成物成為作品的可能性[11]。人工智能基于前期設計能夠形成觀點或價值判斷、依照用戶要求對輸出內容進行修改、可以對一些不懷好意的需求拒絕提供服務,這些都是人工智能人格的外在體現(xiàn)。
②作品是否構成實質性相似是獨創(chuàng)性的重要標準。各類人工智能運行同一程序,因算法架構不同能夠解析出不同策略,再采取該策略產生最佳結果。因此,人工智能生成物具有作品外觀,且內容和原件作品不同,生成物吸收人類作品的創(chuàng)作特征。加之世界知識產權組織對作品獨創(chuàng)性的規(guī)定是“作品是作者自己的創(chuàng)作,完全不是從另一作品抄襲來的”,本文認為可將人工智能生成物視為作品。創(chuàng)作者身份不應成為版權保護作品的必要條件,著作權法更應以實質標準以及評價標準進行考量:“機器作品”與他人作品不構成“實質性相似”;以人類讀者為基礎的“一般社會公眾”認可,并不需要為了刻意將其與人類作者相區(qū)別而另設標準。
綜上所述,人工智能生成物只要滿足獨創(chuàng)性要求、具有和人類作品相似的外觀、有不同于人類作品的思想表達,在一般公眾眼中難以區(qū)分是機器作品還是人類作品,即可認為其具有可版權性。在人工智能時代,傳統(tǒng)制度中的“作者—著作權人”的著作權法結構應當增添新的涵義,以便著作權法及時對社會新事物給予回應,平衡人工智能生成物和人類作品的關系。
2.2 人工智能生成物權利歸屬
2.2.1 學界觀點。關于人工智能生成物的權屬問題,我國學者從人工智能表達個性、最低限度創(chuàng)造性原則、版權市場利益平衡等多個方面提出不同的見解。主要觀點如下:
著作權歸屬于人工智能開發(fā)者。在著作權權屬模式的證成中,對人工智能的作者主體資格與生成物客體資格進行適當分離。在機器作者與人類之間建立起一種可以被虛擬出來的委托創(chuàng)作的契約。如果機器作者創(chuàng)造出了具有獨創(chuàng)性的作品,那么這時著作權就會被分配給人工智能系統(tǒng)的開發(fā)設計者,從而實現(xiàn)對作品版權的最初授權[9]。
著作權歸屬參照法人作品規(guī)定或按委托作品處理。在人機合成創(chuàng)作中,無論是“機器作者”還是人類作者,都為作品做出了實質性貢獻。因此,從著作權法角度看,人工智能生成物可以被認為是代表設計者的意志而進行的一種創(chuàng)作行為的創(chuàng)作成果[12],因此按照法人作品規(guī)定確定其權利歸屬。
著作權側重保護投資人的利益。當法律應該對人工智能生成物進行某種程度的保護,但同時也要將人類作品和人工智能生成物在法律保護上的不同之處表現(xiàn)出來時,人工智能生成物的權利就是為了保護投資者利益而存在的鄰接權[13]。
從民法學角度解釋著作權權利歸屬,即“知識財產孳息”,指生成物是獨立于原物(即人工智能)所生之新物(即知識財產孳息)。該觀點采用羅馬法上的“原物主義”原則與日耳曼法上的“生產主義原則”,將人工智能創(chuàng)作物的權利歸屬于人工智能的開發(fā)者、使用者或者所有者[14]。
2.2.2? 權利主體創(chuàng)作主體相分離。人工智能無法成為民法上的權利主體,人工智能生成物卻有法律保護的必要,應當建立創(chuàng)作主體和權利主體分離的路徑,破除人工智能生成物法律保護的首個障礙。傳統(tǒng)主客體一致標準強調作品是作者意志的外化,在作者中心主義模式下摒棄作者身份承認作品的獨創(chuàng)性是不成立的。“額頭出汗”理論是版權法的基本原則之一,即創(chuàng)作時付出勞動即可獲得版權。隨著立法和司法的發(fā)展,1991年美國“Feist電話號碼簿案”的法官認為盡管對電話號碼簿的搜集和整理排序工作投入了精力和成本,但這種投入并不是人的智力創(chuàng)造性活動,達不到創(chuàng)作活動所需要的最低限度的創(chuàng)造性,故不具有獨創(chuàng)性,重新確立了最低限度創(chuàng)造性原則。從這個理論分析來看,人工智能生成物更不可能達到獨創(chuàng)性的標準,人工智能也無法因創(chuàng)作作品而享有著作權。而讀者中心主義站在作者中心主義的對立面,認為作品脫離作者落入讀者手中后,其意義是由讀者賦予的。讀者中心主義理論沖擊了著作權法制度中“作者—著作權人”的結構,認為沒有確定作者身份依舊不影響對作品獨創(chuàng)性的判斷。如孤兒作品無法確定作者但仍受著作權法保護。這是證成創(chuàng)作主體和權利主體相分離正當性的有利觀點。在人工智能生成物能夠成為作品的前提下,作者未必是第一著作權人,也就是說人工智能不作為第一著作權人,但仍可以受著作權法保護。人工智能生成物涉及多方主體,人工智能開發(fā)者、所有者和使用者都與人工智能生成物有密切聯(lián)系,其可能參與了作品產生的一個或多個階段。受人工智能主體限制,著作權法要完整保護作者和作品權利,就要對第一作者以外的其他主體也實施保護。
在現(xiàn)有著作權法制度下,賦予人工智能署名權是最佳選擇。著作權法激勵創(chuàng)作的指向對象的權利人只能是自然人和法人。當下人工智能多由法人組織充當主要開發(fā)者,公司或無組織自然人擔任使用者,在這種情形下,以“使人工智能生成物成型確定下來”為分界線確定權利范圍和責任承擔者。人工智能并不天然具備創(chuàng)作動機,其創(chuàng)作動機和深度學習的標準是由人類提前植入規(guī)定的。人工智能以完成人類指令為起點,以滿足人類需求為終點進行有限創(chuàng)作。可見創(chuàng)作作品的最終內核部分是由人類全權掌控確定成型的,因此開發(fā)者、所有者以及使用者可能是享有人工智能生成物著作權權利的主體,但投資者不符合著作權法中作品所有者的相關規(guī)則;設計者創(chuàng)造了人工智能,但并沒有參與人工智能后續(xù)選擇材料、深度學習、創(chuàng)作模擬至輸出的過程,因此不能對人工智能生成物享有著作權;使用者若只是單純使用該系統(tǒng),未對成果形成任何實質性貢獻,也不能享有同樣的權利。本文認為,應當借鑒合作作品的權利分配思路,根據(jù)具體情況分別判斷。人工智能等同于多個利益主體的代表,例如,其背后的實際控制者、用戶和投資者,實際上扮演著一種“固定”作品的“合作者”角色,進行篩選素材、歸納總結、預測結論、情感模擬等工作[15]。將人工智能擬制成名義上的作者進而賦予署名權,人工智能系統(tǒng)開發(fā)者、所有者以及使用者根據(jù)實質貢獻比例大小進行利益分配和責任承擔。
3 人工智能生成物的著作權風險與解決思路
人工智能創(chuàng)作著作權侵權的最主要困境是,機器學習中數(shù)據(jù)訓練作品獲取和使用的合法性問題。對作品進行挖掘、處理、抓取等行為性質是合法還是侵權,決定了后續(xù)機器學習和輸出行為是否具有正當性,同時也關乎人工智能技術發(fā)展趨勢。著作權法不應固守只以自然人創(chuàng)作為中心的理念,應該調整機器作者和人類作者之間的關系,同時把握人類在人工智能開發(fā)、創(chuàng)作以及完善中的主導和引領作用,在著作權法變革中堅持立法目標和制度價值取向。
3.1 風險預估:實質性相似規(guī)則與市場替代
發(fā)生復制權侵權可能性最高的階段是人工智能生成輸出階段。在人工智能創(chuàng)作中,雖然最終輸出的生成內容具備了一定的獨創(chuàng)性,但是它依然維持了數(shù)據(jù)庫中某一作品或一些作品的基本表達,這應該是一種改編作品,這種創(chuàng)作行為如沒有得到著作權人許可并向其支付報酬,那么就有可能侵犯改編權[16]。根據(jù)人工智能對數(shù)據(jù)的利用情況來看,可以分為“利用多人作品”和“利用同一人作品”兩種。前者如《陽光失了玻璃窗》,這是一首由微軟公司的“小冰”在對1926年以后500余名當代詩人的作品進行深度學習后寫成的詩;后者如由微軟開發(fā)的“下一個倫勃朗”人工智能,該人工智能通過深度學習倫勃朗的346幅畫創(chuàng)作出了與原畫相似度極高的繪畫作品。二者都侵犯了作品改編權,區(qū)別在于前一個行為侵犯了不同作者創(chuàng)作的不同作品,后一個則侵犯了同一作者的多部作品。人工智能最終生成的內容和供機器學習的作品內容實質性相似度較高,根據(jù)“接觸+實質性相似”標準進行判定或構成侵權,進一步采用“思想表達二分法”進行判斷,構成相似的要素是思想而非表達,也不能認為其是侵權。判斷實質性相似規(guī)則中的主體標準和客體標準在實踐中主觀性較強,妨礙了初步判定侵權結論的一致性。對于文學作品或者音樂作品應當以“一般公眾”作為判斷主體,以便將判斷主體標準客觀化[17]。也就是建立相關人工智能算法,訓練算法對主體運用和創(chuàng)造水平的判斷能力,判斷內容包括綜合提取作品片段程度以及使用范圍等方面。人工智能能夠精準適用整體觀察法和抽象過濾法,并且減少先入為主對于判斷的影響,對創(chuàng)作物與原作品的相似程度進行智能化、精確化和客觀化的比對,成為合理適用相似性規(guī)則的技術支撐。
人工智能數(shù)據(jù)輸入階段是容易被忽略的一個階段,數(shù)據(jù)輸入同樣也存在侵權風險。數(shù)據(jù)輸入是人工智能生成物產生的前序環(huán)節(jié),類似人類學習過程中“學習他人”的方法,人工智能要事先搜集海量數(shù)字化作品進行分析建模,提取作品中對創(chuàng)作有價值的概念、結構、規(guī)則、模式等進行深度學習。人工智能挖掘可供訓練的作品大體有兩種途徑:一是掃描作品原件后將其轉化成機器可讀形式,如谷歌數(shù)字圖書館掃描世界范圍內的圖書是為了建立一個集成式數(shù)據(jù)庫,用于人工智能進行文獻翻譯、語言搜索等創(chuàng)作需要。二是在互聯(lián)網上直接抓取已經數(shù)字化的作品。機器學習的新型“復制依賴型”技術大致包括“接觸、提取、挖掘、使用”4個環(huán)節(jié)。以機器學習挖掘紙質作品為例,第一步用影像技術將書本按頁轉換成電子圖片;第二步用光學字符識別技術將文字從電子圖片中識別出來,然后將其轉換成二進制形式的數(shù)據(jù)集;第三步把轉換好的數(shù)據(jù)集拷貝進人工智能計算機系統(tǒng)為后續(xù)使用提供來源。從現(xiàn)行《著作權法》第十條第一款第(五)項在原有7種復制類型基礎上專門增加了“數(shù)字化”復制方式可以看出,這兩種數(shù)據(jù)輸入方式均屬于法律規(guī)定的數(shù)字化復制,即對作品進行原封不動的全文復制并保存復制件,這同樣是一種侵權行為[18],而恰恰這種復制行為在人工智能學習過程中是必不可少的。
為防止人工智能侵犯著作權,對其大量獲得作品資料的行為進行限制,機器學習的作品集會因此減少,從而導致算法偏見。缺乏高質量作品的作品集本身就可能不全面或者帶有偏見,人工智能的學習模式會加劇這種片面。機器需要規(guī)模巨大、種類豐富的數(shù)據(jù)進行學習,如果學習作品需要事先取得許可,由此產生的較高許可成本會打擊一些人工智能開發(fā)者的積極性。人工智能拓展了作品的使用方式,但若不及時有效干預可能會極大損害人類作者權利。將市場替代作為侵權認定標準符合著作權法對保護著作權人壟斷市場利益、平衡著作權人利益和社會利益以及促進科技發(fā)展的立法目標,即當侵權行為對版權人市場影響較小時,法院很可能不認定其為侵權。在2015年“谷歌圖書館”案件中,法院從谷歌圖書館對著作權作品的利用角度出發(fā),全面考量了其對數(shù)字化圖書館的利用目標,并以此為依據(jù)得出結論:谷歌圖書館對版權人作品的“碎片化”搜索能力缺乏一致性、完整性,無法替代原創(chuàng)作品成果,且對版權人擁有的潛在市場收益影響不大,從而判定谷歌圖書館使用版權作品的目的和數(shù)字圖書館整體功能為“正當利用”,不構成“侵權”。在判定侵權時,可以用市場替代標準來彌補實質性相似原則的不足[19]。
3.2 侵權風險承擔方法:過錯責任原則
當人工智能程序的開發(fā)者同時也是使用者時,理應對該人工智能程序享有著作權,有權控制該程序的發(fā)表、發(fā)行和傳播。如果一個程序開發(fā)者在對一個受版權保護的作品進行編碼后,將其植入一個程序中,它所生成的內容融合了這個程序所產生的可被辨認的實質性表達,那么在這種情形下,這個內容的版權應該歸這個程序的開發(fā)者所有[20]。而對于人工智能生成物,則要看人工智能生成過程。如果人工智能生成物依賴于使用者輸入指令(無指令無輸出內容的人工智能,無法自主生成具有獨創(chuàng)性的內容),必須經過使用者進行數(shù)據(jù)篩選后才能輸出內容(但輸出過程并非對命令進行簡單轉譯,符合人工智能可版權性的個性化表達標準),這時使用者既是人工智能的激活因素,也是使“人工智能生成物成型確定下來”的人。如人工智能深度學習功能支持對使用者提供的初始數(shù)據(jù)庫之外的數(shù)據(jù)進行學習,由此產生的生成物可屬于上述情況。反之,若使用者只是按下生成的按鍵而不參與任何輸出內容的形成過程,則不能認定其對人工智能作品有實質性貢獻。承擔責任的重要基礎在于行為人具有過錯,使用者并不是在任何情況下都無須承擔責任。
3.2.1 設計者的過錯推定。對人工智能進行訓練的人工智能開發(fā)者作為預防人工智能創(chuàng)作失控的第一環(huán),理應履行一定的“防抄襲設計義務”(Obligation of Copy Prevention by design)的注意義務。它來源于隱私保護領域中的“隱私設計”(Privacy by Design)[21]。當今社會中數(shù)據(jù)信息使用和隱私保護間的沖突日益加劇,相關領域的“隱私設計”理念也逐漸時興,這就要求網絡產品和服務的提供者在其提供的系統(tǒng)中全面建立隱私保護理念,其中涉及系統(tǒng)開發(fā)目標、設計流程和操作步驟等。并要求遵循主動保護、默認保護、嵌入保護等原則,使人類社會對抄襲的道德譴責能夠在算法層面轉化成為實在的法律規(guī)制。
3.2.2 使用者的過錯推定。人工智能使用者責任認定源于人工智能工具屬性和自主性的交互關系。使用者既不應因開發(fā)者未合理獲取學習數(shù)據(jù)而侵權,也不應因學習數(shù)據(jù)合法、算法創(chuàng)作過程自主進行而不對生成物承擔侵權責任,即人工智能使用者不在設計者可見范圍內啟動人工智能創(chuàng)作,人工智能的使用方式和場景由其指令直接決定,并且使用者基于許可能夠從人工智能生成物中直接獲益。因此人工智能使用者應履行銜接流程的監(jiān)管和控制義務,及時遏制侵權行為的苗頭。
4 結語
人工智能是科技理性和人類智慧的有機結合,對人工智能的肯定既是對人類科技發(fā)展的支持,也是對人類意志的贊賞。具有深度學習能力的人工智能兼具工具性和創(chuàng)作自主性,雖不具有法律主體資格,但仍可根據(jù)獨創(chuàng)性標準承認其生成物為作品并給予著作權法保護。人工智能的特殊性會導致復制權等著作權侵權問題,無救濟則無權利,事先確定好權利歸屬才能更好地解決侵權問題。侵權責任的認定關乎創(chuàng)作者和作品傳播者的激勵,應當適用過錯責任原則。科學技術向著作權法提出了新的挑戰(zhàn),我們應該正確對待人類智力活動和人工智能的關系,在維護法律穩(wěn)定性的前提下用謙抑的方式實現(xiàn)法律與科技的良性互動。
注釋:
①參見北京互聯(lián)網法院民事判決書(2018)京0491民初239號。
②參見深圳市南山區(qū)人民法院民事判決書(2019)粵0305民初14010號。
參考文獻:
[1]吳漢東.人工智能生成作品的著作權法之問[J].中外法學,2020,32(3):653-673.
[2]MITCHELLT M. Machine Learning[M].New York: McGraw-Hill,1997:22.
[3]SOBEL S,BENJAMIN L W. Artificial Intelligence's Fair Use Crisis[J].Columbia Journal of Law & the Arts,2017,41(1):49-79.
[4]李安.機器學習作品的著作權法分析:非作品性使用、合理使用與侵權使用[J].電子知識產權,2020(6):60-70.
[5]驍克.論人工智能法律主體的法哲學基礎[J].政治與法律,2021(4):109-121.
[6]郭明瑞,房紹坤.《民法》[M].北京:高等教育出版社,2021.
[7]劉洪華.人工智能法律主體資格的否定及其法律規(guī)制構想[J].北方法學,2019,13(4):56-66.
[8]李揚,李曉宇.康德哲學視點下人工智能生成物的著作權問題探討[J].法學雜志,2018,39(9):43-54.
[9]徐小奔.論算法創(chuàng)作物的可版權性與著作權歸屬[J].東方法學,2021(3):41-55.
[10]孫正樑.人工智能生成內容的著作權問題探析[J].清華法學,2019,13(6):190-204.
[11]孫山.人工智能生成內容著作權法保護的困境與出路[J].知識產權,2018(11):60-65.
[12]熊琦.人工智能生成內容的著作權認定[J].知識產權,2017(3):3-8.
[13]許明月,譚玲.論人工智能創(chuàng)作物的鄰接權保護:理論證成與制度安排[J].比較法研究,2018(6):42-54.
[14]黃玉燁,司馬航.孳息視角下人工智能生成作品的權利歸屬[J].河南師范大學學報(哲學社會科學版),2018,45(4):23-29.
[15]郭萬明.人工智能生成成果的法律性質及著作權保護[J].出版發(fā)行研究,2022(5):58-64.
[16]焦和平.人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權風險及化解路徑[J].當代法學,2022,36(4):128-140.
[17]劉強,孫青山.人工智能創(chuàng)作物著作權侵權問題研究[J].湖南大學學報(社會科學版),2020,34(3):140-146.
[18]詹啟智.論僅復制未發(fā)行侵權行為賠償數(shù)額的確定[J].科技與出版,2016(9):63-66.
[19]曾田.人工智能創(chuàng)作的版權侵權問題研究[J].河北法學,2019,37(10):176-189.
[20]陶乾.論著作權法對人工智能生成成果的保護:作為鄰接權的數(shù)據(jù)處理者權之證立[J].法學,2018(4):3-15.
[21]初萌.人工智能對版權侵權責任制度的挑戰(zhàn)及應對[J].北方法學,2021,15(1):138-150.