龐靜
(浙江紡織服裝職業技術學院,浙江 寧波 315211)
隨著自然語言處理NLP 技術、生成對抗網絡(GAN)及擴散模型(Diffusion Model)等技術迭代,利用人工智能技術自動生成內容的新型生產范式AIGC(Artificial Intelligence Generated Content,人工智能生成內容)在2023年成為全球范圍內人工智能研究應用領域的熱點。
我國《數字中國建設整體布局規劃》中提出“2025年數字文化建設躍上新臺階,數字技術創新實現重大突破,應用創新全球領先”等主要目標。涵蓋了數據、人工智能、5G、通信以及計算等工作的數字經濟占我國經濟比重近乎達到40%,足見創新帶動數字消費在我國生產生活領域的重要性。
騰訊研究院《AIGC 發展趨勢報告2023》中,將AIGC 的生態體系架構分為基礎層、中間層和應用層三個層次。基礎層是以預訓練模型為基礎的AIGC技術基礎設施層,在國外以OpenAI等為代表,通過受控API、開源等方式輸出模型能力[1]。中間層是在預訓練模型基礎上,通過訓練和調試形成垂直化、場景化和個性化的應用工具層,以期實現適合按需使用的潛在商業價值。應用層是基礎層和中間層垂直之上的模型層,包括圖像、語音、文字生成等各種面向C 端和B端用戶開放的AIGC 應用,通過降本增效滿足海量用戶的內容創建和消費需求。
文本生成(ChatGPT、文心一言等)和圖像生成(Stable Diffusion、觸手AI等)是當前AIGC應用層中用戶體驗人數較多的生成式智能應用。據Gartner預測,2023 年20%的內容由AIGC 所創建,至2032 年AIGC的市場規模將從當前的5%提升約至20%[2]。艾媒咨詢《2023 年中國AIGC 行業發展研究報告》中預測2028 年中國AIGC 行業核心市場規模將達2767.4 億元,超九成用戶看好AIGC發展前景。
當前內容創作領域普遍面臨產能不足的困境,AIGC海量內容生成實現降本增效的優勢,使動畫、影視、游戲等數字文化產業在2023 年積極投身AIGC 研發。2023年6月8日在上海舉行的“2023‘影視+’產業大會”中,動漫影視文創產業普遍看好AIGC 應用前景,并預測AI 技術與內容創作結合將進入實質階段,繼而引發數字文化產業重大變局。
周葆華的研究表明,當前生成式智能應用作為對象(obect)在“實際如何被使用(實踐行動)、可以如何被使用(功能分析)、存在哪些弊端(算法審計)、倫理風險(價值規范)、如何治理(法治規范)”等方面頗具學術研究價值[3]。而從媒介演進角度看,消費者對媒介消費的評價會對未來消費產生影響[4]。如何更好地掌握和預判用戶的選擇行為,是當前國內外受眾研究急需解決的議題。
1995 年—2009 年出生的Z 世代作為數字文化消費的主要群體,具有參與性高、互動性強、關注碎片化、喜好圈層化等群體特性。嗶哩嗶哩(簡稱B站)是Z世代關注ACG(動漫游戲)文化的虛擬社群,用戶在交流中通過信息獲取、內容創作分享等方式獲得自我滿足與個性釋放的心理需求[5]。虛擬社群中的用戶在知識共享時受到動機、自我效能和態度等個人因素以及信任、互惠規范、社會認同等社群因素的共同影響[6]。
據2022 年QuestMobile 數據統計,B 站近82%的用戶是Z世代用戶,彈幕是B站連接UP主與普通用戶的重要方式。發送彈幕具有行為上的儀式感,通過這種儀式感能夠強化“圈子”與其他組織的區別,形成對自我、群體的認同[7]。點贊+彈幕的方式體現出Z世代用戶互動性和參與性的圈層特征,可以作為Z世代用戶個體態度的表達。AIGC技術強化了生產者與傳播者的融合,新的媒介業態下研究Z世代用戶對新生媒介的內容偏好以及他們對AIGC應用的態度,對AIGC第三層應用的開發有實際價值。
1950年圖靈測試(The Turing test)中提出“機器能否思維”,以技術邏輯與操作實踐肯定了機器作為功能表征思維的存在論意義[8],可以看作人類對生成式人工智能的最早幻想。1957 年首支由計算機創作的音樂作品Illiac Suite問世,由于早期深度學習領域的研究進展緩慢,生成式人工智能并未取得廣泛應用。
2006 年杰弗里·辛頓(Geoffrey Hinton)提出的深度信念網絡(Deep Belief Network,DBN)推進深度學習算法領域的研究進程,2007年首部AI小說I The Road問世,但存在可讀性不強、辭藻空洞、缺乏邏輯等問題[9]。
2012 年IMAGENET 比賽中,Alexnet 網絡的應用開啟深度學習時代。卷積神經網絡、生成式對抗網絡、擴散模型等深度學習算法相繼出現并得以應用。2016 年深度學習網絡層數隨著Transformer 大模型等深度神經網絡結構升級而得到爆發增長至幾百上千層,解決了智能生成圖片與視頻的高清晰度問題。算力和預訓練模型的成熟使得以文本生成為代表(Chat-GPT 等)和以圖像生成為代表(Stable Diffusion 等)的AIGC應用自2022年底呈現出爆發式增長態勢。
AIGC 成為B 站Z 世代用戶討論的熱點。在B 站中以AIGC 為關鍵詞進行搜索,刪除與主題無關內容后,按最高播放、彈幕數、點贊數對前50條熱門視頻進行梳理,發現Z 世代用戶對于AIGC 話題的討論主要集中在以下幾個部分:
其中,圖像生成內容占比最高(計數14),降本增效相關內容占比其次(計數11),人機關系探討領域(計數10)模型訓練技術視頻受到關注(計數7),倫理風險與版權保護(計數6)。從最受關注視頻標題來看,AIGC 在以CG 動畫、數字繪畫等圖像生成領域受到Z世代用戶最多關注;圍繞應用本身降本高效和深度學習能力,從業者產生了被取代的困擾。AIGC 算法復雜、內容浩瀚,限于篇幅,本文僅對生成式智能應用在圖像生成領域展開研究。
從圖像生成的模型構架來看AIGC架構特點有助于了解其在動畫中的應用。圖像生成模式的AIGC 根據應用場景的不同,采用某種特定規則或模型,通過機器學習算法生成內容用以增效降本。模型架構主要包含文本處理、模型訓練、模型部署三個階段:

表1 B站“AIGC”主題50條最高播放視頻內容示例
Stable Diffusion 為代表的圖像生成模型大致可分為三個階段。文本處理階段(文本編碼器)將文字信息通過詞干提取等文本預處理操作后提取文本特征,轉換成模型能理解的語義向量;模型訓練階段由圖片信息生成器和圖片解碼器組成圖片生成器,利用大量的數據集對模型進行預訓練,以便模型能夠更好地理解用戶的意圖。隨后依據評估指標對模型進行評估,重復訓練以求最優解;模型部署階段將訓練生成的低緯圖片通過升維放大得到完整的高清圖像。

圖1 Stable Diffusion模型結構[10]
以百度AI 作畫為代表的國內圖像生成模型有近似結構,包含了提交請求(文本編碼器)創建作畫任務,基于文心ERNIE-ViLG 大模型通過訓練生成圖形,部署結果(輸出圖像)三個階段[11]。以二者模型階段來看,當前AIGC應用生成圖像的過程具有相似性。
2023 年1 月31 日由奈飛(Netflix)、微軟小冰公司(rinna)、日本WIT STUDIO 聯合制作、發行了首部采用AIGC 技術制作的動畫《犬與少年》,講述了一位少年與一只機器狗重逢的故事。該作品采用傳統動畫結合AIGC 技術的方式呈現最終效果。作品中的編劇、導演以及角色繪制均保留傳統動畫制作方式,在場景繪制以及背景音樂生成方面結合AIGC 技術進行呈現。
本節取“犬與少年”為關鍵詞抓取B站相關視頻數據,以最高播放、評論數和點贊數為條件降序排列篩選出3 條相關視頻,分別為:UP 主“WUHU 動畫人空間”(播放32.5 萬評論924 點贊1.4 萬)[12]、UP 主“夏日幻聽MEC”(播放數9.4萬評論768 點贊4764)[13]、UP 主“GGAC”(播放3.2 萬評論215 點贊971)[14]。匯總3 條視頻890條點贊評論進行編碼,得出表2 中的前12 個高頻詞匯。

表2 《犬與少年》890條評論前12個高頻詞匯(數據截至2023.8.20)
依據生成式智能應用在實踐行動、功能分析、價值規范等方面的研究價值,本文將關鍵詞分為功能分析(AI 輔助制作技術)、實踐行動(動畫背景繪畫場景)以及其他議點(問題音樂實用時間)三個方面,對用戶評價進行編碼分析。由于用戶短評普遍存在口語化的情況,因此在數據整理階段盡力保留用戶原意的基礎上,適當進行了書面語的轉寫工作,具體評價示例見表3~5。

表3 Z世代用戶對“AI 輔助制作技術”功能分析關鍵詞的態度

表5 Z世代用戶對“問題音樂實用時間”其他議點關鍵詞的態度
自動情感編碼結果顯示,Z世代用戶對于AIGC作品的態度“較為正向”(218)最高,“非常負向”(167)和“較為負向”(132)其次,“非常正向”(24)最少。呈現出用戶認可新技術的同時抱有謹慎的樂觀心態。
在具體評價內容方面,圍繞作品的AI 討論數最多,普遍認為AIGC技術在作品中更多的是輔助作用,并沒有能代替人工制作的優勢;在圖像效果討論方面,用戶詬病智能圖像生成的輸出畫質,對于畫面效果用戶喜好各有不同。尤為注意的是,用戶普遍對因AIGC海量高速生成圖像技術可能造成動畫產業的顛覆表示出擔憂。
行業對于AIGC技術能在動畫生產領域做什么的討論眾說紛紜,普遍認可AIGC 未來能在動畫生產中以下領域進行運用:首先,角色和場景設計。創作者通過草圖輸入AI繪畫,能便捷地輸出設計師想要的角色場景圖,大幅減少繪圖的時間。其次,角色和場景建模。通過AI技術(如Promethean AI)輔助動畫師完成復雜的場景構建,包括自動生成逼真的背景、物體和光影效果等[15],或通過自動生成或優化角色外觀,減少建模工作量。第三,劇本生成。利用ChatGPT、文心一言等文本生成AIGC應用,自動生成故事情節,協助編劇完成劇本創作等。
結合Z世代用戶在功能分析、實踐行動以及實用性、時間等其他問題的態度,AIGC動畫在生產機制方面可以從設計師定位、模型優化以及個性化生成三方面進行以下考慮。
1)確認AIGC的輔助設計定位
AI技術在現階段更多承載的是輔助設計功能,其設計主體還是設計師。解決用戶對于技術替代崗位的擔憂,一方面通過降低使用門檻(應用設計的便捷化)使得更多用戶能便捷地獲取AIGC技術,破除因技術迷霧帶來的未知恐懼;另一方面肯定人在AIGC+動畫中的主體地位,從編劇到角色場景設計、模型制作、合成輸出等方面明確技術的輔助功能,提升設計師的設計自信。
2)優化AIGC模型提升品質
鑒于用戶集中詬病圖像生成的場景畫質,表明AIGC 在動畫制作方面的開發還處于初期階段,需要通過模型優化、算力提升等方面來實現畫質的提升。同時用戶對于《犬與少年》該作品的AIGC作品定位并不認可,表明AIGC 技術在與人工相結合創作動畫方面還存在不足,技術僅僅停留在場景應用,在角色與場景的合成方面具有較大的提升空間。因此圖形生成模型不僅需要加強角色動畫的設計訓練,也需重點關注合成領域的開發工作。
3)個性化AIGC適用不同范圍
“藝術平民化”是由AIGC引發的整體內容創作趨勢,未來因為AI 工具的便利,更多用戶能參與內容創作之中,動畫內容將更為多元化,個體的創意性得到最大的發揮。但以現有AIGC 模型訓練來看,“喂圖”是圖像生成的基礎,正如用戶評價中所擔憂的AIGC作品在版權方面的爭議,圖像生成模型應在商業化與非營利性個人創作進行區別。
針對商業動畫的模型架構其訓練素材應具備版權使用權限,動畫公司應發掘自身優勢,創建符合自身特點與發展趨勢的個性化素材庫,使行業在深度學習中實現自我更新。在非營利動畫創作方面,圖像生成模型架構設計應更模塊化和多元化,素材庫開發具有更多的包容性。
AI 智能傳播成為當前以及未來趨勢。人工智能所帶來的降本增效價值屬性,一方面破解了海量內容生成的困局,另一方面也帶來了在人工智能環境下該如何定位自身的困惑。深度神經網絡結構升級與模型訓練結構的成熟,使圖像生成在AIGC 領域炙手可熱,而從首部AIGC+動畫商業化作品《犬與少年》的用戶評價可以嗅出,Z 世代為代表的青年用戶在驚嘆智能技術高效的同時也深感崗位替代的危機。
無論接受與否,AIGC 技術與人們深度融合并成為日常的趨勢不會改變。AIGC+動畫在未來開發中不僅需要明確設計師為主體智能輔助的定位,同時也要考慮加深AIGC技術與動畫流程的適配結合。只有技術本身不再成為噱頭被提出時,AIGC 技術才能真正成為用戶的藝術日常,突破技術局限的動畫創作也才能在未來展現出無限可能。