□ 文 孟 琦
隨著大數據時代的到來,人工智能技術也進入到了新的發展階段,其應用已不再局限于傳統的工業技術領域,在藝術領域,人工智能也創作出了眾多令人驚嘆的藝術作品。在美術領域,“下一個倫勃朗”人工智能可以生成類似倫勃朗風格的畫作,微軟“小冰”更是舉辦過個人畫展,人工智能的藝術創作能力逐漸得到公眾的認可。而隨著技術的普及以及算法的開源,普通人也可以利用開放性的人工智能平臺進行創作,如Stable Diffusion、mimic、Novel AI等。但是,和人類的創作歷程一樣,人工智能在進行創作前也需要學習并積累足夠的素材,而根據我國著作權法的規定,未經許可擅自使用他人享有著作權的作品屬于侵權行為,而人工智能在創作中將不可避免地大量使用他人作品作為素材,倘若無法平衡著作權人與人工智能發展之間的利益,最終將會阻礙文化藝術的發展與科技的進步。目前,學術界關于人工智能創作的研究多集中在人工智能生成物的定性以及著作權歸屬方面,對人工智能所使用的創作素材是否合法關注度不足。對此,本文將在合理使用制度的框架下,分析人工智能繪畫中的著作權侵權困境,以期提出可行的解決方案。
人工智能創作能力的根源在于計算機神經網絡技術,這是一種模仿人類神經元的技術,能夠讓人工智能像人類一樣“學習”與“思考”,因此,與人類的創作過程相同,人工智能創作也經歷了“輸入、學習、輸出”三個階段。
首先是作品的輸入階段。與人類相同,為了能夠正確地總結出不同類型畫作的特征,人工智能也需要以大量的作品作為創作素材,但人工智能并不能直觀地理解作品中的元素、結構與風格,其只能識別圖片中的紅、綠、藍三種顏色的像素,因此,人工智能繪圖在輸入階段需要將大量的數字化作品上傳到數據庫中以供后續的學習之用。
其次是人工智能的學習階段。當大量的素材上傳至人工智能的數據庫后,人工智能將對這些素材進行初步分類與整理,當接收到使用者的創作指令時,人工智能將根據指令中的關鍵詞匹配數據庫中的素材,通過對同題材的作品進行分析,從中提取出這些作品的元素、結構、風格等,神經網絡算法在反復地進行創作與優化過程中,最終總結出正確的創作規律。

最后是人工智能的輸出階段。經過反復地學習與訓練,人工智能已經自主生成了相關的算法模型,使用者只需要輸入相應的關鍵詞,人工智能就可以輸出大量同類型的作品,在經過后續的反饋與優化后,人工智能甚至能夠生成有足夠藝術價值的繪畫作品。
人工智能對作品的使用分為“表達性使用”與“非表達性使用”?!胺潜磉_性使用”僅將他人作品當作事實性信息進行處理,而不涉及他人作品中的一些獨創性表達。例如,為了訓練人工智能的人臉識別能力而大量使用他人的作品就屬于“非表達性使用”,因為這種使用方式僅使用了人臉中的生理特征等事實性元素,不會影響作品在原使用范圍內的價值,此種使用并不屬于著作權法意義上的使用,因此本文不再過多討論。人工智能繪圖主要涉及到作品的表達性使用,“表達性使用”指利用了他人作品中的獨創性表達,最終在使用結果方面體現了原作者在創作中的一些特征。在此種情形下,人工智能會輸出與原作品相似的新作品,對原作品的價值及潛在市場利益產生不利影響,不符合合理使用制度的規范條件,面臨著著作權侵權風險。
繪圖型人工智能數據庫中的素材通常有三種來源:一是使用者將原本非數字格式的作品進行數字化后上傳至數據庫;二是使用者通過授權或非授權的方式將他人已經數字化的作品搬運至數據庫中;三是人工智能利用腳本對選定圖片網站中的作品進行自動抓取。根據我國《著作權法》的規定,以數字化的方式將作品制作一份或多份屬于復制權的規制范疇,而上述三種行為都是在不改變原作品內容的情形下進行的全圖復制,存在侵權的風險。而且與前兩種情形不同,第三種情形對他人著作權的侵犯更為惡劣,這是因為同人類在計算機中保存作品不同,人工智能可以利用腳本輕而易舉地繞過相關保護措施,直接獲取到作品的原圖?!?00px”是一個版權保護措施較為完善的網站,普通用戶若想將網站中的照片保存時,網站會彈出提醒并拒絕該請求。而人工智能則會利用腳本直接通過網頁的開發者模式獲取作品的原始文件,哪怕網站通過各種保護措施使人工智能無法用腳本獲取原圖,人工智能也可以通過截圖的方式獲取到作品。更有一些人工智能直接以盜版網站作為數據庫,以他人上傳的無版權作品作為素材,例如,“Novel AI”平臺使用了爭議極大的“Danbooru”網站作為數據源,該網站中存有大量沒有授權的圖片,因而在使用過程中很容易產生侵犯他人復制權的問題。

除復制權侵權風險之外,人工智能繪圖也可能涉及對他人作品改編權的侵犯。人工智能進行創作時有三種可能的輸出結果:一是輸出具有獨特風格的全新作品;二是輸出與原作品構成實質性相似的作品;三是輸出帶有原作品創作元素等基本表達的新作品。第一種結果是人工智能創作所不懈追求的情形,沒有侵權風險。而在第二種情形下,受限于“思想與表達二分法”原則,如果在作品的畫面上構成實質性相似,則侵犯了他人的復制權;如果在作品的風格上構成了實質性相似,由于思想不受著作權法的保護,因此不構成侵權。但是在人工智能繪圖的過程中,一些低等級的人工智能受限于算力和數據集的規模,很容易出現“過擬合”現象,從而在畫面表達上構成了實質性相似,產生了侵權后果。第三種情形下,人工智能生成的作品雖然有一定的獨創性,但是仍能從畫面中看出其他作品中的一些元素,此種屬于對原作品的改編行為,涉嫌侵犯其他作者的改編權。人工智能“下一個倫勃朗”利用倫勃朗畫作中的創作元素,生成了與原畫作相似又有別于原畫作的演繹物。倫勃朗的作品已經進入公有領域,對其作品的改編行為不構成侵權,但在目前的人工智能繪圖過程中,大量仍在版權保護期的作品被使用,這種情況下將對被學習的作品構成改編權侵權。
合理使用是指他人可以在法律規定的情況下,不經權利人的許可而自由合法地使用享有著作權保護的作品。根據前文所述,人工智能在作圖過程中很可能侵犯他人作品的復制權、改編權等權利,而在我國現行《著作權法》所規定的合理使用框架下,人工智能很難以合理使用作為侵權抗辯的依據。
根據《著作權法》的規定,“為個人學習、欣賞或使用”他人享有著作權的作品構成合理使用。在個人使用人工智能平臺進行創作過程中,如果由使用者個人將他人作品上傳至數據庫中,由于此種情形下的版權作品僅為使用者個人使用,輸出的新作品也沒有產生傳播,因此可以根據“合理使用”規則進行抗辯;但如果使用者將輸出的作品進行傳播或商業化使用,則會侵犯他人的著作權。但是人工智能獲取創作素材還有另外一種方式,既用腳本對網絡中的作品進行大量且無差別的抓取,并形成一個開放性的數據庫,在此種情況下,人工智能創作難以進行合理使用抗辯。這是因為在此種情況下,人工智能所抓取的他人作品并不是針對單個用戶使用,而是開放給了社會公眾,不符合規定中的主體要件。對于微軟“小冰”“下一個倫勃朗”等人工智能來說,其控制者為具有一定技術實力的公司,因此也不符合個人使用的主體要求。而且從目的上來說,“為個人研究、學習、欣賞”要求不具有商業目的,而這些人工智能的創作由于被大型互聯網公司所控制,很難說其沒有商業目的。
根據《著作權法》的規定,在不出版發行的情形下,為科學研究而改編或少量復制他人作品構成合理使用,但是在人工智能的創作過程中很難以此作為抗辯的理由。首先,著作權法是出于公共利益的目的而設立了此種合理使用情形,因而該種情形是專門為科研機構設立的,應當僅限于科研人員使用,但是在目前的繪圖型人工智能創作過程中,使用主體多為普通個人或大型商業互聯網公司,不符合此條規定的主體要求;其次,規定中明確了使用的限度僅為“少量復制”,但是在實踐過程中,為了避免人工智能產出的作品出現“過擬合”,盡可能輸出完善且具有獨特性的作品,人工智能必須大量且無差別地復制他人作品,不符合“少量復制”的要求,因此無法使用此種合理使用類型進行抗辯。
我國法院在司法實踐中?;旌鲜褂盟囊貥藴逝c三步檢測法作為認定合理使用的輔助性方法。合理使用的四要素標準與三步檢測法都要求在一定限度內使用他人的作品,并且不能對他人作品的正常使用產生影響,要考慮到作品的市場價值,不得不合理地損害他人的著作權利益。但是,目前主流的開放性人工智能繪圖平臺對他人作品的使用基本很難滿足上述判斷標準,即便在個案中認定了人工智能對他人作品的使用構成合理使用,但是由于缺少明確的法律規定,對于類似行為是否合法仍然難以產生合理的預測,反而容易因創設新的合理使用而被詬病為法官造法。
由于合理使用制度在繪圖型人工智能的創作過程中存在失靈的現象,無法有效平衡人工智能發展與著作權人之間的利益,因而需要考慮采用其他更為合適的制度來解決問題。在我國著作權法的規定中,法定許可制度是與合理使用相類似的制度,但是與合理使用制度不同,法定許可規定使用作品需要向著作權人付費。但適用法定許可會產生三個問題:一是人工智能創作的侵權行為較為分散,單個作者的維權成本高;二是人工智能的創作過程中會在數據庫中收集大量的作品,但每一件作品對最終輸出結果的貢獻度不同,由此產生了收費標準的問題;三是人工智能的學習過程具有較強的隱蔽性,加之繪圖型人工智能多為開放性的平臺,使用人數眾多,著作權人難以發現自己的作品被侵權。對此可以通過引入著作權集體管理制度,輔以區塊鏈及人工智能反向識別技術來解決。
著作權集體管理組織可以針對人工智能使用作品制定統一的付費標準,將眾多被侵權的作品“化零為整”進行集中維權,有效降低著作權人的維權成本,彌補著作權人維權能力不足的問題。另外,考慮到人工智能所侵犯的主體眾多且分散,對于沒有參加集體管理組織的作者,可以通過引入“延伸性著作權集體管理機制”加以解決,在此機制下,無論著作權人是否屬于集體管理組織的成員,該組織都可以代著作權人向人工智能平臺發放使用許可,并向著作權人轉付版權費。
對于作品的付費標準,需要根據被使用作品的市場價值、對生成內容的貢獻等因素,建立市場化的收費機制。具體來說,在人工智能生成圖片的過程中,使用者需要輸入一些提示詞來指定人工智能學習某一類作品并輸出與之風格相似的作品,這些提示詞不僅包括圖片元素也包括畫家的姓名。人工智能平臺可以在每張生成圖中量化各個關鍵詞的貢獻并將其視為畫家本人的貢獻,據此對畫家進行收益分成。畫家甚至可以進駐人工智能平臺,將自己的高清作品標上關鍵詞后上傳至數據庫中,號召用戶使用其關鍵詞進行創作,只要畫家的關鍵詞出圖效果好,就可以被足夠多的用戶反復使用從而獲取不菲的收益。在這一過程中,著作權集體管理組織需要定期對人工智能平臺進行審核,考察人工智能對版權作品的使用及付費情況。
針對人工智能使用作品隱蔽性強,著作權人難以發現自己作品被侵權的問題,可以引入區塊鏈與AI識別技術加以解決。區塊鏈技術將會以區塊的方式將作品的數據進行固定,并以密碼的方式進行加密,確保作品信息不可隨意篡改與偽造。創作者可以將自己的作品在區塊鏈平臺上發表,作品上鏈后的使用情況都會被完整、詳細地記載在分布式賬本中,以便追蹤作品使用情況及確定許可費用。人工智能平臺同樣需要將輸出的作品上傳至區塊鏈平臺,以便于其他人查詢該作品是否為人工智能創作,創作過程中參考了哪些作品,以及作品的使用情況。而對于沒有使用區塊鏈技術的作品,可以參考目前的論文檢測技術,通過人工智能反向識別技術進行標注,當一件作品被展示性平臺收錄或進行商業化使用之前,可以通過人工智能進行識別,判斷其是否為人工智能創作并標注出主要使用了哪些作品作為參考。
一直以來,藝術創作都是少數人的工作,但人工智能的發展極大地降低了藝術創作的門檻,普通人也可以利用人工智能創作出自己心中的畫作。不可忽視的是,目前的繪圖型人工智能平臺在創作過程中對他人著作權的侵害現象十分嚴重,面對人工智能創作引發的困境,可以通過完善著作權集體管理制度,完善作品收費機制,引入區塊鏈及人工智能識別技術進行規制,以確保在保護著作權人利益的同時,兼顧科技的發展與創新,實現整個社會的進步。