陳鈺
[摘要]AIGC的出現和廣泛應用對諸多行業產生巨大影響,AIGC出圈和爆火的同時其版權侵權問題受到關注。文章通過分析AIGC引發版權侵權問題的根源發現,AIGC以“數據為中心”為訓練邏輯,在數據輸入、預訓練和內容生成過程依賴海量的數據,而其中包含些許受到版權保護的數據。文章結合我國新修訂的著作權法中對合理使用的邊界和責任主體的界定來討論AIGC學習和生產的過程是否構成侵權行為,并且基于探討得出AIGC對數據的使用不屬于著作權法中對合理使用的范疇以及其不具備責任主體要素的結論,并提出利用區塊鏈技術為版權護航、精準厘清侵權責任主體、擴寬著作權法合理使用范圍的版權保護策略。
[關鍵詞]AIGC;侵權隱患;數字版權;合理使用;著作權法
AIGC(Artificial Intelligence Generated Content)即人工智能生成內容,是繼專業生產內容PGC和用戶生成內容UGC后一種新的內容生產方式。相比于先前的AIGC模型,新一代的AIGC模型在藝術繪畫、視頻制作、機器人動作、語音對話等方面都取得了巨大的進步,尤其是在創意、表現力方面充分發揮了技術優勢。不過,作為2022年十大科技熱詞之一,AIGC雖然是生產力變革背景下的最新產物,一方面能夠協助行業進行作品創作,獲得較好的經濟效益;另一方面也帶來了AIGC的學習和生產過程是否侵犯他人知識產權的爭議。文章將結合我國新修訂的著作權法中對合理使用的邊界和責任主體的界定來討論AIGC學習和生產的過程是否構成侵權行為,并且基于探討得出的結論,提出適合當下的數字版權保護策略。
一、以數據為中心:AIGC模型訓練邏輯
AIGC指基于生成對抗網絡GAN、大型預訓練模型等人工智能技術,通過已有數據尋找規律,并通過適當的轉化能力生成相關內容的技術。AIGC基于訓練數據和生成算法模型,自主生成圖像、音樂、視頻等內容,其過程包括“數據輸入—機器學習—內容輸出”三個階段。數據輸入是創建AIGC的第一個階段,數據的輸入也就意味著要收集海量的數據助力其訓練AI模型,這些數據一般都是通過數據抓取技術從龐大的網絡中獲得。當然,并不是所有的數據都能夠直接進入AI訓練的數據集中,還需要對收集的數據進行篩選,包括刪除重復數據、不科學數據以及無關數據等,精選后的數據才能夠成為訓練AI模型的數據集[1]。完成數據輸入后就進入機器學習階段,這個階段主要是AI通過對數據輸入階段形成的大型數據集進行分析,通過“深度學習”模仿人類的行為、思想和創造力,為最后的內容輸出階段做準備。完成機器學習后就進入內容輸出階段,這一階段主要是AI通過對數據輸入階段形成的大型數據集進行分析,根據操作方輸入的關鍵詞在龐大的數據集中提取相關內容,生成與關鍵詞高度契合的內容。無論在哪個階段,AIGC模型的生成都離不開數據,需要對其進行數據喂養,有學者更是稱AIGC和數據之間的關系就如“母乳”和“孩子”的關系[2],可見“以數據為中心”是AIGC的訓練邏輯。
二、“數據中心”思維下的版權隱患:AIGC面臨的侵權爭議
AIGC小模型是對特定領域內容的生成,數據需求量較低,大多訓練模型的數據集都是操作方自身建立或者已經買下版權的小數據庫。伴隨著生成算法、預訓練模型、多模態等AI技術的融合發展,催生了AIGC 生產模式的大爆發,AIGC從小模型時代跨越到大模型時代。尤其是AI預訓練模型可以實現多任務、多語言、多方式功能,在各種內容的生成上將扮演關鍵角色,其對數據需求量更大,但大部分數據存在版權歸屬問題,所以AIGC在“數據中心”思維的邏輯下存在版權隱患,AIGC正處于侵權爭議的風波中。
(一)新修訂著作權法中AIGC是否構成合理使用免責爭議
在許多侵權案件中,侵權主體都會將合理使用這一條款作為侵權抗辯的理由,但這并不意味著合理使用就成為侵權行為的“免死金牌”,是否構成侵權需要法院根據具體情況進行具體分析。在全球首例大型AIGC侵權案件(Stable Diffusion案)中,即使在合理使用標準更為靈活的美國,依舊有許多學者和律師認為把AIGC對數據和內容的使用納入合理使用的范疇是件為難的事[3]。根據我國最新著作權法第二十四條規定的十三種合理使用的權利中,文章發現適用AIGC數據模式訓練的情況只有三種,分別是“個人學習研究”“適當引用”和“科學研究”。AIGC生成需要經過三個階段,因此我們需要對這三個階段的數據使用是否在我國著作權法規定的合理使用范圍內做具體界定。首先,數據輸入是AIGC生成內容的第一步,也是關鍵的一步。在這個階段,AI雖然收集數據,但并未生成內容,在一定程度上符合著作權法第二十四條的第一種情況,即“為個人學習、研究或者欣賞,使用他人已經發表的作品”,處于合理使用的范圍,未構成侵權行為。不過,如果除卻挖掘公開可用的數據外,AI可能利用技術攫取未公開和授權的數據,根據合理使用的“三步檢驗法”,這樣的行為損害了他人的合法權益,突破了合理使用的界限。數據的合法性會影響生成內容的合法性。顯然,最基礎的數據輸入就被排除在合理使用的范圍外的話,AIGC生成的內容也存在一定的侵權行為。不過值得一提的是,新著作權法比原著作權法對合理使用范疇的界定多了一條兜底條款,即“法律、行政法規規定的其他情形”,這看似是一條開放性立法,實際上還是具有封閉性。權威釋義指出只有法律、行政法規規定的其他情形,才能構成合理使用[4]。新著作權法這一兜底條款中的“其他情形”的限定條件,首次明確除法律、行政法規的立法機關外,任何機構包括各級審判機構認定的和學者的學理判斷認定的合理使用情形,依法都不構成合理使用,AIGC自然也不能夠利用其他情形理由使用他人數據作為自身內容生成文本。所以AIGC對數據和內容的使用不在合理使用的界定內,不能構成合理使用免責。
(二)新修訂著作權法中AIGC是否能夠作為侵權主體爭議
主體性研究是哲學思想上一個常思常新的重要命題,不同哲學家對主體性有不同的觀點,主體被看作是知覺、意志、自由、理性和道德的所在地。并且由于主體指的是實施行為并為之負責的個人和實體,而不是施行于其上的客體,所以主體經常被當作“人”的同義詞,抑或是人的意識[5]。當前,愈來愈多的學者對人工智能主體說紛紛發表自身的見解。支持人工智能主體說的學者把主體中的理性看做人工智能的智能性,認為“機器人也是人”[6]。判斷AIGC是否構成侵權行為之前,我們應該厘清其是否具有主體資格,即是否具有民事權利能力和民事行為能力。我國新著權法中第九條規定著作權人包括作者和其他依照本法享有著作權的自然人、法人或者非法人組織。其中,自然人指生物學意義上的人,著作權法規定了自然人的主體中心地位,將其作為權利原始主體、完整主體,即第一著作權人。這是因為只有自然人才是作品的真正創作者。作品是人類的創作成果,表達的是人類的思想情感,并非AIGC這類科學技術革命發展下的成果[7]。無論是自然人、法人,還是非法人組織,AIGC似乎都不具備主體性。同時,AIGC作為強人工智能時代的代表,通過深度學習和訓練,其生成的作品具有外觀上思想表達特征,從其學習、生成內容的過程來看,似乎其與人類的創作過程無異,如“Stable Diffusion”案件中的作品極具創作性,但是這種類人化的形式和智能性的特征在我國現有著作權法的框架中并不能給予其主體資格。如此看來,盡管AIGC在數據輸入和內容生成階段都被質疑侵權,但我國新著作權法并未將其視為責任主體,所以AIGC本身不構成侵權行為,誰來負這個侵權責任誰就是侵權主體。
三、內容生產革命背景下的版權保護策略
內容生產形式從PGC到UGC再到如今的AIGC,在這種生產力方式變革背景下,AIGC引起的版權問題亟須得到解決。針對上文分析AIGC以數據為中心的思維邏輯,結合AIGC“合理使用”和“侵權主體”的版權爭議,文章根據實際的情況提出利用區塊鏈技術為版權護航、精準厘清侵權責任主體、擴寬著作權法合理使用范圍三個版權保護策略。
(一)技術賦能:利用區塊鏈技術為版權護航
版權保護是原創作品永續發展的基本保障,也是對著作人合法利益的一種保護。如上文所述,數字時代下數字作品易被復制、被篡改,AIGC創建訓練數據集時收集的大量數據都存在侵權風險。面對這種風險,版權保護刻不容緩,中文在線董事長兼總裁童之磊認為:“既然是以技術為因,就應該以技術去應對?!眳^塊鏈技術是一種去中心化的分布式賬本,通過加密、共識和分布式存儲等技術手段,能夠實現讀數據的安全驗證。2021年6月,工業和信息化部聯合中央網信辦發布《關于加快推動區塊鏈技術應用和產業發展的指導意見》,明確指出要發揮區塊鏈在產業變革中的重要作用,促進區塊鏈和經濟社會深度融合。這一文件體現黨和國家對區塊鏈技術的高度重視,其在數字版權確權、用權和維權等方面發揮著巨大的作用。將受版權保護的作品放在區塊鏈內儲存能夠有效維護版權人的權利,如果AIGC創建的模型訓練數據庫中的數據來自區塊鏈數據庫中,版權人能夠根據區塊鏈不可篡改、可溯源特點,維護自身合法權益,打擊AIGC數據獲取及內容生成作品的版權侵權行為。目前我國主要有優版權、紙貴科技、瑞云渲染等平臺是運用區塊鏈技術保護數字版權,這些平臺很好地為數字版權穿上了“保護衣”,保護更多版權人的權益不被侵犯。
(二)責任分明:精準厘清侵權責任主體
如上所述,AIGC在現有法律框架下還未擁有主體資格,不是權利主體,其處于無主體狀態?;诖耍珹IGC正處于主體缺位、權責不明確的困境,誰來為AIGC的過錯買單關系到版權人的利益問題。所以,精準厘清侵權責任主體是保護數字版權的另一重要舉措。我國新著作權法第十一條指出創作作品的自然人是作者或者由法人或者非法人組織主持,代表法人或者非法人組織意志創作,并由法人或者非法人組織承擔責任的作品,法人或者非法人組織視為作者[8]?,F有著作權語境下,AIGC不屬于自然人作者,在此情形下,法人則成為其數據和作品的作者。“法人作者”是一種“擬制人格”,即以法人名義所表現的共同意志和法律擬制的團體人格。無論是人合組織還是財合組織,法人的意志、行為根源于自然人,但法律通過主觀擬制將自然人的意志、行為歸屬于法人[2]。因此,AIGC在數據和內容生成的過程中其實背后還是人工智能團隊在操縱,其數據的篩選和內容的生成都包含了人工智能團隊的意志。此外,AIGC所體現的智能性不能完全等同于人類的理性和情感,也不具備民事權利能力和民事行為能力,其造成的侵權行為需要負責的還是幕后操縱的具體的人。厘清侵權責任主體后,一方面著作權人才能夠依照相關原理維護自身權益,防范數字版權被侵犯;另一方面也能夠震懾操作方想要肆意妄為侵犯著作權的想法。
(三)調整邊界:拓寬著作權法合理使用范圍
合理使用體現了著作權法的立法目的,具有保護權利人權利和促進社會發展的雙重屬性。目前我國著作權法第二十四條采用的是“封閉式(有窮舉例)+開放式(其他情形)”的立法模式,這為數字環境下新出現的一些情況提供應用合理使用的可能性。但條款中“其他情形”的判定需要司法的具體裁定,在此過程中往往耗費大量人力、物力和財力,不利于技術的發展以及著作權人的維權。同時,根據現有合理使用的范圍規定,很多侵權主體在侵權訴訟中以“合理使用”作為抗辯理由,以期通過“鉆空子”來逃避侵權處罰,傷害著作權人的利益,所以擴寬著作權法“合理使用”范圍具有實際意義。著作權合理使用的擴張應當以擴張合理使用的目的為突破口,譬如可以囊括“為進行學習、研究、欣賞、報道新聞或保存版本之需要,應用人工智能挖掘數據,生成的內容作品非商業性或純公益性”的情形。其中,為學習、研究、欣賞等都在原來合理使用的范圍內,而非商業性和純公益性屬于合理使用目的。除此以外,我國著作權法的立法目的是“促進社會主義文化和科學事業的發展與繁榮”,最高人民法院在文件中表明“在促進技術創新和商業發展確有必要的特殊情形下……可以認定為合理使用”。AIGC代表人工智能內容生產的最新形式,其發展在很大程度上促進了技術創新,拓寬AIGC的合理使用范圍不僅可以減少“鉆空子”行為,保護版權人利益,還可以進一步促進科學技術的發展。
四、結語
AIGC是生產力變革下的產物,也是智能時代人工智能技術發展的必然階段。即使AIGC在技術、商業等方面都發揮著巨大的作用,但其引發的新型版權風險也是各行業不容忽視的問題。從上文可知,AIGC在我國現有著作權框架下是一個不具備責任主體但構成侵權行為的人工智能模式,其數據訓練和內容生成都對數字版權構成極大地威脅和挑戰。盡管文章基于現有著作權法提出相應的版權保護策略,但我們應該清楚地知道,AIGC會在技術革命的浪潮下朝著更加類人化的方向發展,到最后人機不再是主體—客體關系,而是主體—主體之間的關系。到那時候,AIGC已經可能和人一樣具有獨創能力,相對應地就是其有更新型的侵權手段,保護版權的著作權法也應與時俱進。如何提出更加完善的版權保護策略,是法律界和學界應該繼續深究的話題。不過,技術發展和數字版權并非二元對立的關系,社會的發展需要兩者共榮共生,過度限制AIGC對數據和內容的使用會導致“寒蟬效應”,阻礙技術的發展。技術革命背景下,我們只能順流而上,把握好兩者之間的尺度,找到技術發展與數字版權之間的平衡點,最大限度地保護數字版權,促進社會發展。
[參考文獻]
[1]陳昌鳳,張夢.由數據決定?AIGC的價值觀和倫理問題[J].新聞與寫作,2023(04):15-23.
[2]吳漢東.人工智能生成作品的著作權法之問[J].中外法學,2020(03):653-673.
[3]道客巴巴.騰訊研究院-AIGC發展趨勢報告2023[EB/OL].(2023-02-02)[2023-06-17]. https://www.doc88.com/p-04087831829947.html.
[4]黃薇,王雷鳴.《中華人民共和國著作權法》導讀與釋義[M].北京:中國民主法制出版社,2021.
[5]汪民安.文化研究關鍵詞 [M].南京:江蘇人民出版社,2007.
[6]周詳.智能機器人“權利主體論”之提倡[J].法學,2019(10):3-17.
[7]盧海君.著作權法意義上的“作品”:以人工智能生成物為切入點[J].求索,2019(06):74-81.
[8]李喬宇.業內首份AIGC數據版權倡議書出爐 多方共建版權保護新生態[EB/OL].(2023-06-07)
[2023-06-17].http://www.zqrb.cn/huiyihuodong/
2023-06-07/A1686127077317.html.