趙睿智 李輝
摘要:AI繪畫作為生成式人工智能的典型代表,在為藝術家們提供全新的創作途徑的同時,也在實際的生產創作中暴露出審美趨同、技術偏差、版權紛爭、失業焦慮等問題。本文以生成式人工智能為研究對象,通過案例分析探究AI繪畫發展現狀中對創意端造成上述困境,并提出相應解決措施,促使生成式人工智能有效推動未來人類的高效生產創作。
關鍵詞:人工智能 生成式人工智能 創意端 AI繪畫
一、生成式人工智能背景概述
生成式人工智能(Artificial Intelligence Generated Content,AIGC),是人工智能在發展過程中衍生出的特殊類型,也是近年來迭代迅速、影響廣泛的新型人工智能模型。所謂“生成式人工智能”是通過模擬人類主觀能動性的創意思維,深度學習現實世界中已有的基礎性數據,從而借助自身設定的算法邏輯,生成合理連貫的文字圖像、音頻視頻等內容。目前,生成式人工智能正在憑借自身獨特的功能與技術手段,為越來越多的民眾所熟知和使用。
與傳統的人工智能模型相比,生成式人工智能不僅可以識別和分類現有的數據,還可以通過學習現有數據的規律和模式,生成新的數據、圖像、語言和聲音。①生成式人工智能之所以成為鏈接人類現實生產生活的新型工具,主要憑借的是神經網絡的深度學習功能和生成對抗網絡兩大技術。一方面,生成式人工智能的深度學習技術模擬了人類大腦神經網絡的結構,打造算法中的“神經元”連接網狀模型,以便逐步學習輸入數據的特征內容,處理圖像、自然語言等較為復雜的問題,更快捷地傳遞和處理數據信息。
另一方面,生成對抗網絡則為生成式人工智能提供了關鍵的核心性模型支撐。生成對抗網絡(Generative Adversarial Network, GAN)的生成器與判別器兩大部分持續形成的“學習—生成—判別”的對抗過程,并在對抗中不斷學習訓練,最終實現模型生成的數據以假亂真的目的,創造出逼真的文字與圖像等內容。
根據生成內容類型和行業領域,現有的生成式人工智能大致可以分為四種類型:首先是能夠處理自然語言翻譯文本和進行基礎邏輯性對話的語言生成式人工智能;其次是通過圖生圖、文生圖等方式生成新圖片修復原圖像、轉變圖像筆觸風格的圖片生成式人工智能;再次是在虛擬偶像模型構筑中常見的音頻生成式人工智能;最后是與圖像音頻相對應的視頻生成式人工智能。正是以這四大類為主要構成部分的生成式人工智能,正在以使用工具的形態席卷具體的生產領域,例如文案生成、自然語言處理、計算機視覺、藝術創作等,嘗試為人類的生產生活帶來創新與發展。
二、AI繪畫對創意端發展的助力
在生成式人工智能的現有門類中,有一類為圖像生成式人工智能模型,而在人工智能對圖像的生成創作過程中,AI繪畫近年來發展趨勢迅猛。2022年初,關于AI繪畫的眾多軟件平臺不斷涌現,短短數月時間便在生成速度和結果質量上有了飛躍性的進步。2022年8月美國科羅拉多州博覽會上,游戲設計師賈森·阿勒(Jason Alle)利用AI繪畫技術生成的作品《太空歌劇院》獲得了一等獎的佳績,而這一比賽結果也引發了藝術界甚至普通民眾的激烈爭論,推廣AI繪畫成為人類愈加密切關注的話題。
AI繪畫的萌芽有兩個標志,一個是20世紀70年代,藝術家哈羅德·科恩(Harold Cohen)通過復雜的編程控制機械臂完成的繪畫創作;另一個是2006年電腦繪畫產品The Painting Fool通過提取照片中的色塊信息進行的繪畫創作。2012年,谷歌公司的吳恩達和杰夫·迪安(Jef Dean)聯手訓練了一個當時世界上最大的深度學習網絡,用來指導計算機畫出貓臉圖片。3天,1.6萬個CPU,1000萬個貓臉圖片,最終生成了一只模糊的貓臉。①這標志著“AI繪畫”領域的技術突破。
所以,AI繪畫從嚴格意義上說并不是特別新興的領域,只是局限于技術水平落后并未得到廣大民眾的關注。人工智能時代下的AI繪畫,則基于深度學習模型來進行繪畫作圖,屬于生成式人工智能,是利用人工智能技術自動生成內容的新型生產方式。程序開發者首先收集海量已有的圖像進行整合,并對這些圖像進行細致分類和輸入預處理,隨后設計程序對這些圖像數據進行全面學習,繼而根據用戶端上傳的關鍵詞和細化需求進行模仿輸出,通過類似拼接的形式融合形成一幅新作品。據《太空歌劇院》作者介紹,在作品創作過程中他將大量關鍵詞輸入到人工智能程序中,歷經了近九百次的嘗試和八十個小時的細化后,才完成了整個創作過程。②
而以AI繪畫為典型案例的生成式人工智能,無論是現在還是未來,對于處于整個文化產業鏈條前端位置的“創意端”有著直接有力的影響。學者張祥志在《文化產業創造力研究:機理、保障機制與激勵政策》一文中,通過對聯合國教科文組織的文化循環規律進行翻譯分析,并結合文化產業各個循環階段的共性,構建出文化產業的“三鏈端結構”:“以產業鏈的始端、中端、末端為劃分區間,我們可以將文化產業以創意端、確權端、商業端之三端結構進行描述。”③創意端處于整個產業鏈的源頭地位,負責為后續的消費環節提供內容,從最本質上影響著產品優劣與產業興衰。而生成式人工智能的出現,使得創意端中創意內容生產工作者的工具更加多樣豐富,使之從單一的人腦靈感創造轉變為智能高效產出,并間接反映在中端的產品保證與末端商業端的價值回饋上。同樣,在擁有圖像生成功能的AI繪畫領域中,AI繪畫這一生成式人工智能的出現,將繪畫領域原有的創意端工作者帶入了全新的世界,影響著創意端的生產邏輯與工作內容。
首先,AI繪畫使得創意端群體規模擴大,平臺如雨后春筍般爭相破土而出。據觀察,目前AI繪畫的核心用戶大致可歸為兩類:一類是年輕人群體,是以大學生和年輕女性為主的興趣類用戶;另一類則是以畫家、商業插畫師和電商賣家等為主的專業型創意端用戶。在2022年下半年的時間里,AI繪畫已經吸引了眾多創業者和用戶,且隨著AI繪畫系統操作的便捷性提升,年輕人群體使用規模愈加擴大,興趣類用戶正借助人工智能實現向專業型用戶群體的身份轉移,最終的愿景便是人們常說的“每個人都是畫家”。與此同時,隨著“AI繪畫”技術的突飛猛進,國外平臺Disco Diffusion、 DALL-E2、Stable Diffusion、Midjourney、Make-A-Scene、NUWA等不斷涌現,并快速迭代。例如 Midjourney模型,僅用短短一個月的時間就從v3升級至v4,能力和效果提高顯著,而Stable Diffusion開源之后,借助它作為基底進行再訓練而成的各類模型更是越來越多,促進了該領域生態的繁榮。④聚焦國內,文心一格、盜夢師、Tiamat、意間等AI繪畫平臺興起,也引發民眾熱切關注。據粗略統計,目前在小紅書軟件中與AI繪畫話題相關的帖子有數萬條之多,在新浪微博平臺上關于AI繪畫的詞條多次登上熱搜榜,嗶哩嗶哩上的藝術類UP主也創作出眾多的AI繪畫作品,并為觀眾提供了經驗豐富的AI繪畫教程。
其次,AI繪畫有效提升了創意端使用者的創意工作效率。AI繪畫出現后,專業型使用人員從事與繪畫藝術、設計圖像相關的工作,能夠更快速有效地創建內容,例如,商業上被委托放的插畫師在確定了畫面風格和元素的基礎上,可以使用AI繪畫系統生成插畫的草稿,給予委托方以進行取舍判斷,并更高效地進行后續的編輯和完善,以便將更多的時間分配在創造力激發等重要的方面,相應的較為機械漫長的部分則被生成式人工智能所取代。
最后,AI繪畫顛覆了創意端的內容生產方式,降低了生產工具的使用門檻,并形成了新的工具使用邏輯。生成式人工智能中的“生成式”意為生成內容、創作內容,出現較早的類型還有用戶創作內容(User Generated Content,UGC)和專業人員創作內容(Professional Generated Content,PGC)兩種方式。部分人將生成式人工智能看作繼UGC和PGC后的新型內容創作方式,但就目前發展現狀而言,生成式人工智能還必須由創意端人員進行輕度操作。在AI繪畫出現前,創意生產者使用的傳統專業工具,如各類畫筆、數位板、Photoshop等難以被領域外的人所使用,所以普通民眾與創意工作者間的行業壁壘就此加深。而當AI繪畫出現后,生產者能夠輕易實現圖生圖甚至是文生圖,輔助UGC和PGC進行生產創作,這種極強的易用性,形成了間接但高效的使用邏輯,降低了生產工具的使用門檻。
三、AI繪畫對創意端產生的現實隱憂
AI繪畫突破了技術難關,吸引了大批用戶與關注者。市場嗅到了機會,谷歌、微軟早已布局AI繪畫,百度、抖音、騰訊也紛紛下注。按照國泰君安研報預計,未來5年AI繪畫在圖像內容生成領域的滲透率將達到10%—30%,AI繪畫已然站上數字時代的風口。①隨著資本紛紛涌入這片嶄新的藍海,AI繪畫也在大眾視野的關注下出現了許多令人擔憂的問題,創意端的審美、技術、倫理、版權、職業等方面也將迎來挑戰,值得業界和學界思考探究。
(一)創意群體良莠不齊,創作審美無限趨同
目前,AI繪畫的主要使用群體由專業團隊、企業創意生成工作者與部分實驗性藝術家構成,但也有部分個人玩家。由于支撐AI繪畫大部分操作過程的深度學習技術已由程序代替,對使用者而言,并不需要像以往繪畫中起稿、勾線和上色等復雜操作流程便能直接生成圖像。因此,創意端群體的專業壁壘被人工智能打破,越來越多的人試圖涌入這片市場。這雖然能激發民眾對于創作的熱情,但隨著創意端群體的門檻被拉低,越來越多的人都能憑借AI繪畫的工具生成精美圖像,甚至部分人憑借人工智能生成的畫作作為資本,以“專業”的插畫師、設計師自居,群體內部真實水平的高低被人工智能包裝遮蔽起來,使消費決策遭受不小挑戰。
創意端群體水平參差不齊,平臺程序的使用情況也各不相同。這就導致了最終生成的內容和作品水平出現極端分化。就目前的AI繪畫系統操作及生成水平而言,生成一幅精美的畫作需要操控者耗費精力反復對關鍵詞、底圖、筆刷力度進行細化調整,往往也需要在初次生成圖基礎上進行二次生成,最終才能得到作品。這對于有審美基礎的專業人員而言,操作是較為便捷的,而對于部分想要通過AI繪畫直接進入藝術領域的人而言,則還需要一段時間的學習過程,盲目生成只會在作品中凸顯低級與無知,這也是AI繪畫極易面臨的現實困境之一。
此外,AI繪畫雖然憑借其先進的深度學習技術,分析了眾多風格的作品數據,也被“喂食”了大量的知名藝術家作品,但再多的風格也是有數量限制的,再多的作品數據也都是目前現有的、已經出現過的,生成式人工智能所能做的不過是將千萬幅作品精細化分解再重新組合。如果未來藝術家更多地依靠人工智能進行創作,反倒會陷入被已有風格局限的怪圈,無法真正創造出新的藝術風格。因此,創意端群體接受、學習的作品若多由AI繪畫生成,其創作審美最終會趨同,而消費者的接受審美也會隨之走向較為“固定”的風格。思維定勢對藝術創作而言是毀滅性的,同質化的作品會慢慢影響人們的審美標準,最終可能徹底顛覆人們的審美,走向趨同。
(二)技術不成熟不穩定,給用戶帶來困惑
由于AI繪畫前期需要收集大量已有的圖像作為后期數據處理來源,所以在不同資本歸屬下的平臺中,會因數據量多少影響生成技術的優劣。目前AI繪畫的使用途徑主要集中在網站、軟件、小程序等,用戶進入客戶端入口后通過輸入關鍵詞、選擇藝術家風格、調整設置參數和上傳參考圖片等步驟完成整個流程。在目前被發布的人工智能生成畫作成品中不乏精美的成功之作,但同時也并不是所有的作品都盡如人意。有時會出現民眾更樂于關注AI“翻車”搞笑作品的奇特情況。
AI繪畫到底是“人工智能”還是“人工智障”?據小紅書平臺數據顯示,在數萬條關于“AI繪畫”話題的筆記中,諸如“AI你沒事兒吧”“AI我真的會告你”“人類馴服AI失敗”等“吐槽”型風格的詞條常在帖子中出現,此類單篇筆記最高點贊量達到了數萬之多,表現出人們似乎很難想象在高精細度的數據算法下還能出現偏差和失誤。有數據顯示,自2022年11月以來,“AI繪畫”相關搜索指數環比增長近500%,也有人專門為AI繪畫創建了話題,截至2022年12月9日總閱讀量達2.1億次。①總體而言,AI繪畫生成失敗的情況主要體現為三類,分別是多人識別不精準、人寵身份難判以及四肢手部刻畫粗糙。AI繪畫即使再智能、再強大、再便利,它目前所能做的,也只不過是以人類提供的數據為學習素材、以人類的認知為基礎,盡可能模仿人類所期望的畫面。歸根到底,失誤的原因還是AI繪畫前期的數據支持量不足以及技術落后。
(三)版權問題糾纏不清,信息安全網絡生態有危機
2022年12月,Artstation網站畫師聯合抵制AI繪畫,最后Artstation網站發布公告表示仍然允許AI繪畫作品的發布,但未來會計劃添加人工智能作品的標簽以實現分類,并會在藝術家發布作品時顯示“是否同意被AI抓取用來訓練”的選項,如若版權遭到侵犯,當事人可以按照流程向官方提交報告進行維權。雖然目前AI繪畫相關的網站也發布了類似內容的公告,但就版權事件進展而言這只是未來的計劃和愿景,或者可以稱之為平息輿論的公關話術。關于AI繪畫所涉及的訓練作品的版權以及生成作品的版權歸屬都沒有明確的定義,版權之爭尚不明晰。
同時,關于個人信息隱私安全的問題也隨之而來。在目前現有的絕大多數AI繪畫程序中,注冊時勾選的用戶協議里都會明文規定,凡是用戶上傳到平臺里的公開內容都默認授權給平臺。這也就意味著用戶在客戶端填寫的所有信息數據和個人生活圖片都會為平臺所用,大量的數據便由此被平臺收集。雖然有部分平臺已發布公告聲明稱,除了公開的生成圖片,用戶隱私數據絕對不會泄露;除了平臺本身不會有任何第三方介入。但僅僅憑借平臺一面之詞也無法判定究竟是否能實現隱私保護,且已有部分民眾反映在注冊了AI繪畫相關小程序后幾天內便收到了詐騙電話,這便使得用戶對個人隱私及信息安全問題更為關注。
此外,早在幾年前便出現過利用AI換臉技術將女明星的臉替換到成人情色視頻的事件,剛開始只是用類似PS的平面化處理技術,但隨著人工智能技術的成熟,目前呈現出的換臉視頻已經很難辨別出真假,這也對民眾的正常生活帶來遭到誹謗和詐騙的巨大威脅。同樣在AI繪畫領域中,隨著人們接觸程度的加深以及對AI繪圖工具使用程度的深入,有部分低素質用戶會利用AI繪畫生成大尺度圖片,在互聯網上傳播甚至售賣,對互聯網的良好生態環境造成不良影響。
(四)價格失衡擾亂市場,失業隱患惹人擔憂
當創作難度降低,生成時間縮短,使用人數激增,按照生產效率提升的公式推算,
生產效率=(生產數量÷生產實際人數)÷(標準小時產能×生產時長÷標準人數)
當AI繪畫被大多數使用群體掌握,勞動生產效率隨之提高,社會必要勞動時間減少的同時商品的價值也在降低,相較通過人力創作出的作品,會出現價格失衡現象。以中國的商業插畫為例,AI繪畫出現前的商業插畫師根據畫作的精美程度與風格差異收費,普遍價格在百元到千元不等。目前,部分AI繪畫平臺呈現免費開放使用狀態,即便收費,價格也較低。
若商業插畫創作者使用AI繪畫軟件輔助其作品產出,則會出現兩種價格失衡情況:一種是AI作品標注的售賣價格過低,薄利多銷,而傳統人力繪制的商業畫作只得跟著降低價格,但這導致其實際工作量和難度與價格并不對等;另一種則是將人工智能生成的畫作以高價賣出,鼓吹親手繪制、工藝復雜的噱頭,混淆藝術品消費者的視聽,破壞整個市場的良好秩序。
此外,創意端群體的職業焦慮問題也值得關注。AI繪畫能夠省略人力繪制過程直接生成,潛在危機便是AI繪畫工具會導致部分以商業插畫師、海報設計師為代表的創意生產藝術家們失業,生成式人工智能會取代創意人員的工作崗位。
四、生成式人工智能的規范管理與展望
面臨高速發展與亂象叢生并行的復雜處境,以AI繪畫為代表的生成式人工智能若想在未來得到長足發展,在人工智能與藝術生產領域占有一席之地,必須針對上述審美、技術、版權、倫理與職業方面存在的問題找出應對之策。
(一)合理使用工具,生成準入門檻
生成式人工智能無論未來如何發展,民眾首先要認清的是:目前的生成式人工智能只是輔助人類進行生產生活的工具,它所依靠的是模擬人腦神經結構的深度學習技術,并不具有個體意義上的主觀能動性和人類真正獨特的創造力。若想規避創作審美趨同,需要在認清其作為工具的被支配地位的基礎上,合理發揮人的主觀能動性去操縱生成式人工智能,創意端工作者不應局限于人工智能生成的有限風格中,應當通過自身的不斷學習發掘潛能,讓更多的靈感與創意涌現世間,才能達成工具的使用目的。
此外,生成式人工智能的出現將創意端群體規模擴大,帶來有利影響的同時,不容忽視的是創意端群體的門檻不能被無限拉低,社會及民眾應當鼓勵人人都能成為藝術家,但并不是人人都能作為藝術家參與后續的商品流通。創意端群體內部還應當生成區分專業人員與興趣人員的隱形門檻,以AI繪畫為例,興趣人員可以通過學會工具使用方法來進行產出,但應建立在審美良好且有繪畫專業基礎的前提下,不斷提升自身素養,再逐漸向專業人員轉化,去接觸后續的商業消費環節,這既有利于維護專業人員的職責工作,也有利于營造良好的誠信氛圍。
(二)彌補技術缺陷,提高生產效率
以AI繪畫為代表的多數生成式人工智能,目前均存在自身技術不完善的問題。作為以創作產出內容為核心的行業,它背后所代表的更是一種數據與算法的強大優勢,部分AI繪畫平臺之所以會出現作品“翻車”的情況,歸根到底還是由于起初環節中圖像數據的收集量不夠,而四肢手部刻畫不精準等細節問題也是畫家在現實中會面臨的難點。所以如果想進一步彌補AI繪畫的技術缺陷,就必須從整個生產流程的初始環節開始,以合法的手段收集更多現有的圖像基礎數據,并在數據分析的過程中細化分類和預處理,從而提高工具的學習能力和儲存量,有效降低作品生成的失敗率。
同理,除AI繪畫外其余類型的生成式人工智能也是如此。要使生成式人工智能真正提升生產效率,一方面要依靠使用者即創意端群體學習能力的提升,積極探尋生成式人工智能的使用技巧,提高操作熟練度,另一方面則需要生成式人工智能的開發者根據使用過程中出現的問題和用戶反饋,運用技術手段彌補缺陷。以AI繪畫對于人體手部繪制失真這一典型缺陷為例,隨著 ControlNet這類能在很大程度上對 AI繪畫模型在構圖、角色動作等方面的不穩定性進行彌補的工具的出現,①AI繪畫在生成效果與可控性上將有更大的提高,從而被越來越多的人接受并使用。
(三)完善版權法規,整治濫用亂象
律師黃群輝曾在采訪中說道:“著作權法保護表達而不保護思想,如果AI軟件是在學習圖片的創作思想,而非簡單地復制粘貼,這種情況下是不侵權的,不需要獲得授權和支付使用費。”②目前,關于人工智能生成作品的版權歸屬全球并沒有明確統一的定義,主流方式是由提供產品服務的平臺定義,而我國法律目前也并沒有將人工智能生成的圖片定義為“作品”,故AI作品尚未享有著作權。但能夠明確的是,AI繪畫不能因尚未統一定義而隨意奪取藝術家們的作品作為數據來源以及進行數據分析,藝術家們也應當增強維權意識,按照個人意愿處理AI繪畫的數據授權。隨著人工智能進入高速發展期,相關部門在法律和監管措施的跟進上,也應加緊腳步,為其良性發展保駕護航。
隨著互聯網時代的來臨,民眾在日常生活中對自身的安全隱私也日益重視,解決AI繪畫領域的隱私保護問題刻不容緩。首先從國家角度來看,應當結合原有的隱私安全保護相關法律法規,結合現狀對AI繪畫甚至人工智能領域進行合理規范。其次,應當各方攜手共同監管AI繪畫行業的隱私保護,一方面運營商在網站軟件的使用條例中應當明確對用戶上傳照片的絕對隱私保護,另一方面用戶在使用平臺軟件時應仔細閱讀使用條例再進行注冊和后續使用,而在使用過程中及以后一旦發現有對自身信息隱私泄露的情況,應當及時向監管部門舉報反映。此外,針對AI繪畫中低俗、色情等不良信息的生成,可設置屏蔽詞匯,限制相關素材圖片上傳,加大審核力度等方式加以監管,營造良好健康的人工智能藝術氛圍。
(四)平衡主觀心態,持續學習創造
隨著生成式人工智能迭代升級,部分創意端人員的工作會被取代,但這并不意味著生成式人工智能能夠在不借助人類力量的基礎上,完全取代生產領域。以AI繪畫為例,AI繪畫的出現正在試圖挑戰部分低端作畫和設計人員的工作崗位,讓那些只會臨摹、拼貼素材的工作人員面臨失業,但這也迫使此類創意端成員轉變思想,通過學習創造得到人工智能目前無法具備的能力。創意端群體應當在意識到會有失業風險的前提下,平衡好自身的心態,將更多的精力投入到提高自身能力、持續學習創造中去,方能不被人工智能反超,不被時代的洪流所淹沒。同時,在生成式人工智能升級發展過程中會產生新的工作崗位,例如應運而生的AI訓練師等。而真正掌握創造力和藝術表現力的畫師,可以在AI工具的助力下更高效地創作。
Abstract: As a typical representative of generative artificial intelligence, AI painting, while providing artists with a brand new way of creation, has also exposed problems such as aesthetic convergence, technical deviation, copyright disputes, unemployment anxiety, and so on, in the actual production and creation. This paper takes generative artificial intelligence as the research object, explores the above dilemmas on the creative end in the development status quo of AI painting through case study, and puts forward the corresponding solution measures to prompt generative artificial intelligence to effectively promote the efficient production and creation of human beings in the future.
Key Words: Artificial intelligence, Generative artificial intelligence, Creative end, AI painting