曹新明 馬子斌
關鍵詞:生成式AI;生成表達形式;可版權性;權利歸屬;侵權責任
一、問題提出
2022年10月,OpenAI公司發布的大語言模型人工智能ChatGPT(生成式人工智能)標志著生成式AI(Artificial Intelligence,簡稱AI,譯為人工智能)技術達到新的發展階段。ChatGPT以生成高質量文本為優勢,能夠在極短的時間內編寫整篇學術論文。2023年1月,外文期刊《實踐護理教育》(Nurse Education in Practice)發布以ChatGPT為合作作者的文章,文章成為ChatGPT生成能力的重要體現,喻意生成式AI打破一般人工智能的技術瓶頸,形成了“AI生成”與“自然人創作”的新形勢。伴隨著人工智能生成物迅速搶占自然人作品的市場空間,學界開始重新思考人工智能生成物的可版權性、權利歸屬以及由此引發的版權侵權問題,但尚未達成共識。2023年8月15日,為促進生成式人工智能健康發展和規范應用,維護國家安全和社會公共利益,保護公民、法人和其他組織的合法權益,我國正式施行《生成式人工智能服務管理暫行辦法》。略顯不足的是,該辦法對人工智能生成物的版權問題未予以明確回應,亟須給予必要的關注。面對快速成長的ChatGPT對版權制度帶來的影響,本文以版權基礎理論為基點,以人工智能生成物的客觀問題為導向,以現有實證判例為參考,以人類參與創作的程度為標準,分析不同情境下人工智能生成物對現有版權制度各種可能的挑戰,并根據版權基礎理論探討建設性的因應措施,以資求教于同仁。
二、人工智能生成物的可版權性分析
伴隨著ChatGPT文本編寫能力的日漸增強,學界對人工智能生成物的可版權性問題愈發關注,研究成果精彩紛呈。有學者秉持“機器無意識說”否認機器生成表達形式的可版權性;反之,也有學者以“獨創性客觀說”予以肯定。無論何種學說,均將人工智能生成物視為統一類型。筆者認為,人工智能生成物是一種新技術帶來的成果,其表象具有法律意義上作品的特征,是否具有可版權性,需要秉持客觀科學的立場加以分析,基于《著作權法》立法范式,以人類創作貢獻為標準實行分類探討。
(一)否定人工智能生成物的可版權性
1.基于自然人作者標準的否定
依照我國現行《著作權法》的規定,生成式AI獨立生成的表達形式,無論是否符合作品特征,都不可簡單推斷為作品。追本溯源,我國《著作權法》借鑒大陸法系的作者權體系,秉持“自然人為作者”的基本原則,將作品視為“自然人作者之人格外化”,由此,自然人創作者是作品的構成要件之一。盡管《著作權法》將法人(包括非法人組織)擬制為作者,但生然人仍是作品的現實創作者。ChatGPT被擬人化源于其生成表達形式具備邏輯性與辯證性,據邏輯學專家分析,ChatGPT的辯證邏輯與邏輯學中的辯論術有異曲同工之處。基于此,ChatGPT所謂的“辯證思維”并非機器自我意識的覺醒。換言之,ChatGPT的提供者將辯論術轉化為代碼注入芯片,利用“數據喂養”代人數字模型運作,使機器產生“類人化”的思維。機械大腦與人類大腦注定存在距離,無法產生自然人作者涵攝的思想與情感,ChatGPT利用算力產生的“主觀性”,屬于“仿人”卻“非人”。筆者認為,ChatGPT通過“自然語言處理”模型的訓練使生成式AI自主生成的表達形式,實質是一種“偽創作”,因為ChatGPT“創新能力”是超級算力加持的量變。
2.基于《著作權法》立法目的的否定
我國《著作權法》立法目的是鼓勵創作、傳播有益于社會主義精神文明和文化自信的作品,生成式AI獨立生成表達形式僅是對現有信息的邏輯組合,是其作為作品受版權保護的主要障礙。一方面,ChatGPT能夠無限次生成表達形式,具有高產的特性。倘若認可生成式AI獨立生成表達形式的可版權性,不僅嚴重擠壓自然人創作的空間,稀釋自然人作品的價值,還與《著作權法》的初衷相背離。另一方面,生成式AI在生成表達形式過程中尚有漏洞,短期內無法解決。據美國新聞可信度評估與研究機構“新聞衛士”(NewsGuard)最新的研究報告顯示,ChatGPT-3.5在80%的情況下會產生錯誤信息,ChatGPT-4不僅傳播錯誤信息,還能增加錯誤信息的可信度。美國作家布蘭科·岡薩雷斯(Blanco·Gonzalez)等撰文指出,ChatGPT生成文本需經過人類編輯后,才能糾正其錯誤,最終版本必須在人類作者的協助下反復修改才可完成。事實證明,ChatGPT缺乏信息表達的真實性,由ChatGPT獨立生成表達形式大概率存有錯誤或誤導性信息,失去人類協助,ChatGPT幾乎不可能獨立生成完整無錯的表達形式。綜上所述,生成式AI自主獨立生成表達形式,雖然具有作品之表象,但不符合《著作權法》關于作品的基礎理論,因此不具有可版權性。
(二)肯定人機協同生成表達形式的可版權性
1.基于思想表達二分法的肯定
思想表達二分法是版權基礎理論。基于該理論,缺乏一定思想內容的表達形式不能成為作品,純粹的思想內容同樣不受版權保護。生成式AI不存在自主思想與情感,生成式AI獨立生成表達形式自然無法滿足思想表達二分法的要求。以人類貢獻程度為標準,人機協同創作可進一步劃分為AI輔助人類生成和人類輸入關鍵詞提示AI生成兩種類型。第一種類型,生成式AI輔助人類生成的表達形式能夠實現思想與表達的兼容并存。生成式AI固然缺乏思想,但生成式AI輔助生成的表達形式是凝聚自然人創作者的創作思想,生成式AI僅分工協作完成外在表達即可。第二種類型,人類輸入關鍵詞提示下生成式AI自主生成表達形式,是否符合思想表達二分法,取決于表達形式是否蘊含自然人思想。筆者認為,自然人輸入關鍵詞蘊含生成式AI生成過程的總體導向,本質而言,生成式AI生成邏輯未脫離自然人思想范疇。綜上,無論是生成式AI輔助人類生成表達形式,抑或是人類輸入關鍵詞提示AI生成表達形式,都是依照自然人創作者的思想生成表達形式,區別僅是人類參與創作程度的高低,但均在思想表達二分法的范疇之內。
2.基于作品獨創性要件的肯定
在符合思想表達二分法的前提下,仍需判斷人機協同生成表達形式是否滿足作品獨創性要件。獨創性著重強調具體的表達形式是否為創作者獨立完成之情形,主要表現為創作者獨立運用其智慧、能力和技巧,表達其某種感受、觀點、思想等。一方面,人機協同生成表達形式的過程相對獨立。生成式AI能夠自主完成模型生成、挖掘數據與自我優化,相較于一般人工智能,更具靈活性與主動性。不僅如此,生成式AI模型會持續學習創建訓練數據集的規則,通過隨機采樣確保每次執行任務都可以創建不同對象。另一方面,人機協同生成表達形式可以達到最低程度的創造性。對第一種類型而言,人類貢獻僅限于輸入關鍵詞,生成式AI生成的表達形式符合“客觀可識別的差異”即可。在2020年高陽訴優酷著作權侵權糾紛案中,我國法院認為運動攝像機的預選錄像模式、靈敏度和其他參數反映了人為干預,因此拍攝圖片視為攝影作品獲得保護。不可否認,人類貢獻程度較低并不影響人工智能生成物的創造性。第二種類型,生成式AI輔助人類生成表達形式具有創造性。我國已有相關案例論證,2019年騰訊公司訴上海某公司著作權侵權糾紛案中,法院將智能寫作輔助系統Dreamwriter的生成文本視為具有獨創性的文字作品。除此以外,ChatGPT輔助生成論文在國外期刊上公開發表,同樣論證生成式AI輔助生成文本已符合創造性標準。
三、人工智能生成物的分類探討
ChatCPT的出現提高了AI生成表達形式的質量門檻,也逐步提升了人工智能生成物的文化與經濟價值,致使人工智能生成物的權利歸屬問題日漸復雜。據上文所述,人工智能生成物的兩種類別并非全部符合可版權性,由此推斷,人工智能生成物同樣存在“作品”與“非作品”之分。因此,固守“統一認定”的方式實非明智之舉,必然導致人工智能生成物留存空白之處無法涉及,依據類別逐一分析才能由簡至深,面面俱到。
(一)人工智能生成物作為作品的版權歸屬
1.既有理論的不足
人工智能生成物作為作品的版權歸屬問題在學界評論紛然,這些學說各有其理,難分伯仲。然而AI技術日新月異已導致傳統學說呈現不足之處。具體如下:第一,職務作品說。該學說否定AI作者身份,將AI生成的表達形式視為職務作品歸屬于AI設計者或所有者。職務作品說呈現的不足,根本在于技術背景的差異性。職務作品說產生于AI依靠固定模型的初級階段,AI僅能輸出設計者預設范圍之內的表達形式,AI生成表達形式被視為設計者的意志。眾所周知,生成式AI具備自主學習與模型生成的特性,輸出表達形式已突破設計者的預設范圍,設計者只能影響技術中立性,卻不能固定生成式AI具體生成的表達形式。第二,法人作品說。該學說認為AI是由AI所有者組織,并代表AI所有者的意志生成表達形式,將AI生成表達形式歸屬AI所有者。生成式AI的使用者與所有者可以是同一主體,抑或不同主體。倘若非同一主體,法人作品說則會忽略使用者的合法權益。第三,孳息說。孳息說視生成式AI為原物,其生成表達形式屬于原物的孳息,歸生成式AI的硬件所有者。孳息屬于原物天然性能下的產物,生成式AI獨立生成表達形式符合孳息特性,但人機協同生成的表達形式,無法脫離人類輔助。由此,孳息說亦存在無法涵蓋之處。
2.遵循意思自治為主、支付報酬為輔的標準
人工智能生成物的版權歸屬涉及生成式AI所有者、設計者與使用者三方主體,如何兼顧三方主體的合法權益,是探討權屬問題的關鍵所在。筆者認為,要以生成式AI生成過程的客觀事實搭建對三方主體的認知,即分析不同主體在生成過程中的角色與作用,才能脫虛向實,做到有效兼顧。2023年3月,OpenAI公司發布ChatGPT使用協議,該協議說明OpenAI公司將所有人工智能生成物的所有權利、所有權和利益均轉讓給用戶所有,用戶可用于任何目的且對生成表達形式負責,但用戶需要按照定價頁面上的價格支付所有的費用以及相關購買的稅費。同年,智能畫圖工具Midjourney將用戶創建的圖像所有權利歸于付費用戶,非付費用戶只擁有非商業目的的全部或部分復制材料或制作、復制和共享改編材料的權利。綜上案例,用戶獲得人工智能生成物的所有權利是通過付酬的等價交換,AI使用者與所有者達成利益平衡。
人工智能生成物權利歸屬還有一種學說一委托作品說,與現行生成式AI公司的使用協議有相似性和差異性。相似性是兩者之間都遵從意思自治原則,差異有兩處:第一,委托作品一般由委托人主動約定權屬歸自己所有,而使用協議屬于生成式AI公司的主動協商,且權屬歸于用戶所有。第二,無約定之情形,委托作品的版權歸屬受托人所有,生成式AI的生成表達尚無定論。
現實中,如何認定雙方無約定下人工智能生成物的權利歸屬,關鍵是使用者是否支付相關合理費用。如果支付合理費用,使用者完成利益交換,取得人工智能生成物的版權;反之,歸屬于生成式AI的設計者或所有者,設計者與所有者可通過職務作品、法人作品、委托作品等進一步探討版權最終歸屬。
(二)人工智能生成物作為非作品的權利歸屬
1.生成式AI以生成者身份進行標注
生成式AI不能獲得作者的身份,已得到許多國家和地區的認同。美國版權局在《美國版權局實務指南》中表示其不會登記任何沒有自然人作者貢獻而單純由機器產生的作品。歐洲法院在具有里程碑意義的一項裁決中認為,原創性是作者的智力創造,人類作者是版權作品存在的先決條件。生成式AI不能成為作者,自然沒有署名權,但由生成式AI提供者或生成式AI使用者署名顯然不妥。即便自然人成為生成式AI的承責主體,也不代表自然人具有署名權。對此,烏克蘭在人工智能生成表達形式的歸屬問題上提出,生成式AI可以生成者身份在生成表達形式上進行“標注”。需要注意的是,標注不等同于署名,即不產生作者身份的法律意義。“標注”僅表示該生成表達形式是由生成式AI自主生成,產生標識性意義,同時防止被他人盜用。2023年8月7日,我國信息安全標準化技術委員會秘書處發布《生成式人工智能服務內容標識要求(征求意見稿)》,要求生成式人工智能需要標識其表達形式,包含顯示水印標識、隱式水印標識以及“由AI生成”等標識方式和信息。總之,我國提出的“由AI生成”的標識信息和烏克蘭提出的“標注”具有表示生成式AI生成身份的最終目的,只是“標注”更具直接性。
2.依據投資原則歸屬生成式AI所有者
依據投資原則判斷生成式AI獨立生成表達形式的歸屬具有合理性。生成式AI獨立生成表達形式即使不屬于作品,也并非一定屬于公有領域.其可能作為無形財產成為《民法典》保護的對象。吳漢東教授曾提出“無形財產權”的概念,無形財產權大于知識產權的理論制度體系,基本上將各類無形財產或無形財產權囊括其中。財產權是一種直接與經濟利益相聯系的民事權利,當生成式AI獨立生成表達形式屬于無形財產,以投資原則判斷其權利歸屬更為貼切。原因如下,不論是生成式AI輔助生成表達形式,還是人類輸入提示詞生成表達形式,表達形式與使用者之間均存在直接聯系。同理,生成式AI獨立生成表達形式時,生成式AI的相關主體與表達形式之間亦存在直接關系——投資與被投資關系。
依據投資原則,生成式AI獨立生成表達形式與生成式AI所有者之間具有直接聯系。首先,確定具有直接聯系的投資主體。通常情況下,生成式AI的設計者與所有者是同一主體,生成式AI的投資者不言而喻。特殊情形下,兩者并非同一主體,生成式AI機器所有者通過購買途徑獲取機器所有權,設計者則通過銷售報酬獲取既得利益,機器所有者成為生成式AI的直接聯系者。其次,平衡設計者與所有者之間的投資利益。倘若兩者屬于雇傭關系,則依據《專利法》職務發明創造的規定判定生成式AI軟件的專利權歸屬,屬于職務發明創造,則由單位通過獎勵或報酬平衡設計者利益。當兩者屬于普通關系,機器所有者可通過買賣合同獲取軟件所有權,完成投資利益的平等交互。綜上,基于投資原則的分析,生成式AI自主生成表達形式應當歸于生成式AI機器所有者。
四、人工智能生成物的侵權認定與歸責
人工智能生成物的過程具有階段性,主要包含數據訓練與具體形式生成兩個階段,而在上述階段頻繁產生的版權侵權問題亟須關注。在學術界,有學者提出,人工智能生成物的版權侵權行為應當統一認定;也有學者否認AI生成過程的統一性,提出對復制行為與生成行為分別評價。筆者認為,以生成式AI的技術原理為視角,生成式AI具體形式的生成過程是兩種相對獨立的技術行為,證明數據訓練與具體形式生成階段理應各自分析。
(一)生成式AI數據訓練階段的侵權認定與豁免
1.生成式AI數據挖掘的侵權認定現狀
數據訓練,是用以訓練機器模型或算法標注數據的方法,是通過量化數據中的最優參數,提升機器模型完成任務質量與效率的技術。數據訓練促進收集數據集與生成表達形式在技術與實踐中的深度連接。數據挖掘行為是數據訓練的重要環節之一,該行為是否侵犯版權,學界對此素有爭議。爭議焦點集中在“若數據挖掘行為屬于合理使用,是否限制其盈利目的”,由此,存在“非營利目的說”與“營利目的說”。針對該問題,各國亦采取不同的應對之策。歐盟在2019年《數字化單一市場版權指令》中新增文本數據挖掘為目的的商業性TDM例外。此外,雖然美國對近期發生的生成式AI著作權侵權案——Getty Images v.Stable AI案尚未判決,但是美國早已存在相關判例。在早期谷歌數字圖書館著作權侵權案中,美國法院采用合理使用四要素標準分析數字圖書館的數據挖掘行為,以符合轉換性為由判定數據挖掘行為構成合理使用。相比于美國,英國未采用靈活的判斷標準,而是在《版權、外觀設計和專利法》第29條第A款規定數據挖掘版權例外規則,只是將商業用途的數據挖掘行為排除在外。
2.生成式AI數據挖掘行為的侵權豁免
我國目前尚未明確界定生成式AI數據挖掘行為,筆者認為,我國應當借鑒歐盟立法確認生成式AI數據挖掘行為的合理性。理由如下:首先,符合《著作權法》利益平衡原則。當下市場中生成式AI提供者以營利性組織為主,例如OpenAI公司。假設以生成式AI提供者營利為由否認其數據挖掘行為的合法性,極易造成技術發展的阻礙,反之,又會誘發生成式AI提供者的數據壟斷風險。為解決上述問題,歐盟在商業性TDM例外條款中設置一項特殊機制,即選擇退出機制。該機制賦予著作權人選擇退出數據訓練的權利,借此降低生成式AI提供者數據壟斷的風險,同時保障著作權人的合法權利。其次,實現利益合理分配。數據訓練需要龐大的數據集,而數據集的質量決定生成式AI的輸出質量,因此,公共領域的數據不足以達到生成式AI提供者的質量需求。我國《著作權法》采用選擇進入制度,即未經授權使用著作權人作品屬于侵權行為。假設生成式AI提供者適用選擇進入制度,其收集《著作權法》保護的數據必須經過著作權人授權,顯而易見,生成式AI提供者無法負荷巨大的授權成本。最后,引入商業性TDM例外屬于技術與版權協調的必然趨勢。技術變革促進版權制度的調適與重構,從早期的互聯網上傳、搜索引擎、深度學習再到AI數據訓練,《著作權法》的修改始終是對技術更新的回應。當選擇進入制度成為生成式AI發展的阻力,我國《著作權法》應立即采取措施適應技術變革,促進創新與科學文化技術的發展。
(二)生成式AI具體形式生成階段的侵權認定與責任
1.人工智能生成物的侵權認定
人工智能生成物的技術特性時刻提醒學界需重新審視由此引發的版權侵權風險,主要集中于著作財產權。首先,復制權。生成式AI在具體形式生成階段,面臨人工智能生成物“復制”版權作品的侵權風險。眾所周知,我國《著作權法》以“實質性相似+接觸”作為侵權認定的基礎規則。人工智能生成物有兩種侵權風險:一種是同- AI生成兩種答案相同或近似的表達形式;另一種是人工智能生成物與輸入著作權作品構成相似性或同一性。針對第一種行為,OpenAI公司的使用協議中說明:“其他用戶請求與生成表達形式不被視為用戶的生成表達形式”,以此說明用戶各自擁有生成表達形式的版權。人工智能生成物只要具備客觀可識別的差異,則均受《著作權法》的保護。如果表達形式完全相同,則需考慮人類貢獻是否僅限于關鍵詞提示,并依據“前一作品公之于眾+明顯相似”的原則進一步判定。其次,改編權與匯編權。人工智能生成物是以《著作權法》保護的作品為基礎而創作的新作品,則需要依據《著作權法》的規定取得著作權人的授權許可,同理,生成式AI未經著作權人許可,將他人作品或作品的片段編入其匯編作品的行為,亦構成侵權。最后,傳播權。使用者對人工智能生成物的后續傳播行為,可能涉及對作品著作權人的表演權、放映權、廣播權和信息網絡傳播權的侵犯。
2.人工智能生成物的侵權責任承擔
生成式AI的技術中立性決定生成式AI提供者和設計者是否承擔侵權責任。生成式AI的技術中立性是生成式AI提供者是否中立的判斷標準,生成式AI的技術中立性的探討需回歸技術本身。首先,需要判斷生成式AI是否存在算法黑箱和數字鴻溝,導致人工智能生成物存在虛假、偏見等。只要生成式AI提供者和設計者設定數據,且未曾對系統做正向引導,就能判定人工智能生成物的錯誤屬于生成式AI提供者和設計者的過錯。其次,需要判斷生成式AI的提供者和設計者是否對其進行實質性干預,只要未實質性干預生成式AI的生成過程,那么生成式AI平臺的中立性就不會被打破。最后,需要判斷生成式提供者和設計者是否履行透明度和內容審核等注意義務。歐盟《人工智能法案》第28b條第5a款規定生成式人工智能提供者須遵守的透明度義務,以及AI設計與開發時的內容審核義務。我國《生成式人工智能服務管理辦法》第4條至第7條同樣規定提供生成式人工智能服務商需遵循合法性審核、尊重公序良俗等義務。
生成式AI的使用者應適用過錯原則為主,過錯推定原則為輔的歸責原則。我國知識產權法適用過錯原則為主,過錯推定原則為輔的歸責原則,過錯推定原則有助于制裁雖無主觀過錯但缺乏抗辯事由的侵權行為人。生成式AI的使用者對生成式AI的使用程度不同,其適用的歸責原則不同。當生成式AI的使用者對生成式AI的管控能力較小,例如自然人輸入關鍵詞,生成式AI的自主性較強,此時適用過錯原則能夠減輕被侵權人的舉證難度,具有合理性。當生成式AI的使用者具有直接管理生成式AI的能力,例如生成式AI輔助人類創作,能夠對人工智能生成物進行審核、檢查,確保真實性與創造性,此時適用過錯推定原則可以達到減輕被侵權人的舉證壓力,保障被侵權人的合法權益的目的。
五、結語
習近平總書記強調,“國家科技創新力的根本源泉在于人。”自然人是創新的根本,科技是發展的利器,要以法律責任守住科技底線。生成式AI技術在知識產權領域、出版領域、金融領域等掀起熱潮,然而,生成式AI在社會的定位應始終堅持自然人本位的基本原則。生成式AI在未來會繼續突破技術瓶頸,人工智能生成物的版權保護會愈加復雜,我們不可能完全排除生成式AI在未來會從“類人”變為“機器人”,也不可能完全排除人工智能生成物的可版權性。至少在當前,此種設想還尚未實現。