劉澤斌



摘 要:人工智能生成內容(AIGC)開創(chuàng)了“模型”主導內容生成的時代,人類將迎來傳統(tǒng)內容創(chuàng)作和人工智能內容生成并行的時代。藝術設計的本質在于創(chuàng)造和表達,設計師以創(chuàng)造力和技巧,將想法和情感轉化成形式和符號,通過作品與觀眾進行溝通。AI技術在快題設計和高頻設計領域將會被廣泛運用,這必將改變藝術內容的生產方式與市場邏輯,但永遠無法取代傳統(tǒng)人類設計的作用與價值。因此,專業(yè)設計應該參與整個“AI+”的創(chuàng)新設計,貢獻自己對交互的底層認知,讓互聯(lián)網充滿人性的溫度。
關鍵詞:人工智能;藝術設計;AIGC
一、AIGC在繪畫領域引起巨變
2022年8月,美國科羅拉多州博覽會上,數字藝術類冠軍頒發(fā)給了由AI生成的作品《太空歌劇院》(圖1)。11月30日,ChatGPT橫空出世,它不僅可以清晰了解用戶的問題,還能如人類一般流暢回答。目前,AI已經能夠輕松完成一些復雜任務,包括按照特定文風撰寫詩歌、假扮特定角色對話、修改錯誤代碼等。2022年是AI融入人類日常生活的一年,這一年人工智能成為一個廣泛的社會話題,人類獨有的創(chuàng)造力正在受到計算機的挑戰(zhàn)。
2022年下半年,美術院校就出現了學生通過AI生成圖片尋找靈感或表達自己創(chuàng)作意圖的現象。在設計市場,也有許多設計公司用AI生成的圖片進行項目的初期研討。
AIGC讓繪畫門檻無限降低,大量文員在制作公司PPT和海報時,都可以獲得AIGC圖片甚至排版設計資源。借助AIGC,很多網絡小說的封面都可以由作者本人完成,甚至可以生成很多角色和插圖。
目前,AIGC比較適合生成簡單的卡通形象和背景圖,受其影響的主要是那些剛入行的插畫師和圖片庫平臺。現在,AIGC在很多藝術設計公司屬于伴生狀態(tài),AIGC的操作流程雖然對用戶已經十分友好,用戶能通過關鍵詞的反復輸入,最大限度地從系統(tǒng)中獲得意向圖片,但設計往往會對畫面內容、主題有明確訴求,AI生成的內容過于寬泛,所以AIGC目前還只能停留在輸出參考這一環(huán)節(jié),包括動畫、游戲行業(yè)的大量角色設計完稿還必須由插畫師最終手繪輸出。
Diffusion模型應用最廣泛的領域就是AI繪畫,并且迅速表現出了較大的商業(yè)潛力,拓展出了大量相關應用。任何一張圖,通過一次次增加噪點,可以慢慢變成一張完全隨機的噪聲圖像,再將這個過程翻轉,讓神經網絡學習噪聲擴散的過程后逆向擴散(圖2),Diffusion模型就是基于這個思想實現的。
此外,AI繪畫的成功還歸功于CLIP(Contrastive Language-Image Pre-Training,文本-圖像預訓練)模型。CLIP類似人類嬰兒時期認知事物的方法。人們指著圖片告訴計算機“這是向日葵”或者“向日葵在綠葉叢中盛開”,這個過程就發(fā)生了文本和圖像的匹配。OpenAI在互聯(lián)網上搜集到了4億對質量過關的圖像文本,分別將文本和圖像進行編碼,讓CLIP模型學會計算文本和圖像的關聯(lián)程度。
反之,AIGC為我們創(chuàng)作圖像,就必須先輸入一堆描述性關鍵詞。關鍵詞一般架構為主體(服裝配飾、行為動作等)+場景(環(huán)境、天氣、氛圍、光線、視角等)+風格(插畫、水墨、宮崎駿、像素風等)+畫質(質感、渲染器)+設置(參數指令、畫面大小)。
以圖3為例,通過填充以下關鍵詞架構進行生成圖像:插畫設計,近景,仰視,吳道子風格,一個小女孩正在收集露水的圖片,3只在天空中飛翔的鳥,植物,明亮生動的色彩,精致的細節(jié),夸張的手法,漸變背景,平的插畫。
許多公司在CLIP模型和Diffusion模型的基礎上開發(fā)了相關應用工具,其中Stable Diffusion、DALL·E2、Midjourney是最知名的工具。因為數據、算力、算法不同,上述三個知名AI繪畫工具都具有各自的特點。我們仍需要看到,AIGC仍然面對不少挑戰(zhàn)。
首先,生成的圖像往往缺乏多樣性,這是因為生成模型只能學習到數據分布的一個模式,無法捕捉原圖像表達的全部藝術信息。其次,生成模型的訓練過程需要大量的計算資源和時間,限制了其在實際應用中的推廣。最后,生成模型的生成結果往往是無法解釋的,所以有些成功帶有偶然性。
產品評價有三個層級:有用、可用、易用。按此劃分,目前AIGC處于可用向易用的過渡階段。
AIGC在一定程度上為沒有美術基礎的人們提供了草圖再創(chuàng)作的機會,AI繪畫工具根據草圖中簡單的線條、形狀和筆觸可以快速生成效果圖,通過關鍵詞的輔助,不斷優(yōu)化或添加細節(jié),使效果圖更加符合理想中的圖像(圖4)。
AIGC需要對非藝術專業(yè)用戶實現更精準的服務。PPT、微信公眾號對背景圖、氣氛圖有著廣泛的需求,降低圖片生成難度,或進行圖文復合生成,甚至智能生成GIF動畫,這些需求和AIGC技術路徑高度吻合。
AIGC的“易用”,可把大系統(tǒng)細分成更多的專用設計領域,引入有關業(yè)務和用戶信息以及關鍵專項主題(如日本食品包裝、商業(yè)展會、文博展覽等),聯(lián)合細分的設計公司構建更好、更專業(yè)的數據資源,形成數據共享和數據交換等新的商業(yè)模式,最終增強模型的專業(yè)能力。
二、推薦算法重塑影視文化
相較于AIGC在C端的“美麗輸出”,而不是“精準輸出”,AI技術在B端服務方面表現出超越傳統(tǒng)的精準度。傳統(tǒng)產業(yè)迫切需要AI技術來實現降本增效,未來,我們所有的行業(yè)都會被AI改造一遍。
傳統(tǒng)海報是電影制作重要的一部分,海報是電影思想的一次藝術再創(chuàng)作。
《發(fā)條橙》(圖5)是斯坦利·庫布里克在1971年執(zhí)導的犯罪片,其海報也堪稱經典。匕首三角和象征社會尖利的三角通過眼神刺向每一個觀者,像是在咄咄逼問蕓蕓眾生的公德與私欲。
《下班后》(圖6)是馬丁·斯科塞斯早期的作品之一,他借此拿到了1986年戛納電影節(jié)最佳導演獎和1986年獨立精神獎最佳導演獎。劇情的荒誕與瘋狂也同樣出現在了海報當中。
當我們習慣拿著平板電腦追劇的時候,那些充滿才華的海報在不知不覺中消失了,并成為流媒體平臺的普遍現象。打開奈飛網站,人們很難看到一張經過藝術設計的海報,幾乎所有封面都是一個大字標題,再配上突出的主角形象,簡單又粗陋。
在平板或手機上看視頻,屏幕尺寸不大,每屏要呈現2至3排10多部電影或電視劇的縮略圖。2012年,奈飛開始研發(fā)推薦引擎,發(fā)現用戶最多為首頁上展示的視頻停留1.8秒,如果用戶在90秒內沒有點擊任何一個視頻,就可能會直接關閉軟件,去競爭對手的平臺。
一張海報用1.8秒時間,如何讓用戶選擇點擊呢?“大字標題+主角形象”的配置,就是奈飛算法研究出來的最優(yōu)解。這是一種AVA算法,在一部時長一小時的影視劇中有86000幀畫面,算法會逐個分析這些畫面,記下出鏡角色、構圖、亮度、銳度等數據,建立起一個名叫“元數據”的數據庫,然后進行圖像排序,算法會對“元數據”進行分級篩選,再考慮畫面清晰度、有無主要人物、有無劇集特色等,從中找出那些最容易吸引用戶點擊的照片,再讓設計團隊加上標題做成封面(圖7)。
奈飛在海報上還實現了個性化推薦。同一部作品,用戶觀影習慣不同,可能會看到不同的封面。比如,一名常看喜劇的用戶,會看到劇集中串場的知名喜劇演員出現在封面上;更喜歡看愛情片的用戶,則會在封面上看到一對情侶。
當影視內容與用戶觀看被置于推薦算法之下時,用戶的喜好被統(tǒng)計學原則提煉,它替代了以美學為核心的設計和億萬用戶相連接。近年來,推薦算法之于影視節(jié)目數字分發(fā)的重要性日益凸顯,奈飛精心設計的推薦算法已經影響了80%用戶的觀看選擇,只有20%的用戶通過搜索來選擇影片。
傳統(tǒng)流媒體影視的內容生產,在很大程度上仍依賴傳統(tǒng)影視生產經驗和人才資源,但在數字分發(fā)領域,推薦算法卻給傳統(tǒng)影視文化帶來了巨大沖擊。流媒體影視的藝術性、審美性、文化性等柔性維度必然會與推薦算法的數理邏輯等非人類性的、剛性的維度相遇,前者也將被后者改造、重塑。藝術創(chuàng)作中的偶然性、批判性將受到算法的制約。
三、“AI玩家”助力游戲設計
游戲是目前集合大多數字模態(tài)的綜合體,熱門游戲又能做到千萬數量玩家同時在線,這些優(yōu)異條件讓游戲成為研究和驗證AI技術的絕佳場景,游戲也必將在AI技術的發(fā)展過程中起到至關重要的作用。
開發(fā)ChatGPT的OpenAI公司在2023年8月17日宣布了自創(chuàng)立以來的第一筆公開收購案,它收購了一家初創(chuàng)的游戲公司,并將其整個團隊納入麾下。
2022年騰訊官網發(fā)布“王者榮耀AI開放研究環(huán)境”申請及下載,提供用于人工智能研究的驗證場景,以便開發(fā)者能夠快速便捷地測試自己的新算法和模型。這標志著騰訊旗下的開悟平臺邁向了開放科研基礎設施的新征程。從某種意義上說,《王者榮耀》早就超出了一款游戲的范疇,它是一個由上億游戲玩家共同參與的多智能體AI研究平臺,也是一項通往未來的基礎設施。
(一)《王者榮耀》里的“AI玩家”
《王者榮耀》在2020年上線了一個新模塊,名叫“挑戰(zhàn)絕悟”,這個“絕悟”就是“AI玩家”。這位“AI玩家”既要會復雜的走位和動作技巧,也要會考慮團隊配合,更要能贏。為了快速提高“絕悟”的戰(zhàn)斗力,騰訊AI團隊決定邀請上億游戲玩家與之博弈,幫助它進步。“絕悟”花費三年時間,從一開始連地圖小怪都打不過的“弱雞”,到后來可以完爆《王者榮耀》職業(yè)聯(lián)賽冠軍,成為目前世界上最先進的“智能玩家”。
騰訊開發(fā)“絕悟”不是一時興起,而是為了解決一個現實問題。《王者榮耀》會不斷推出新的英雄角色,這個新角色的武力值需要與老角色保持平衡,既不能太強也不能太弱,勝率需要操持在50%左右。保證這個勝率的一般做法是,在新角色發(fā)布前,找專業(yè)游戲測試員,用新角色跟老角色組隊打上幾千場,各種技能和場景都盡量測試一遍。這個方法人力成本高、效率低,還有新角色被提前泄露給公眾的風險。那就需要研發(fā)一個AI系統(tǒng),由它操控各種角色來自動測試,這就是“絕悟”的來歷。
從數學上說,想要搞清楚勝率,需要采用窮舉法,也就是把每一步中所有可能出現的變數全部推演一遍,自然可以得出結果。不過,這種做法只在理論上可行,現實中它需要的算力超越了計算機的極限。單一維度的AlphaGo圍棋程序都無法采用窮舉法,更別說更復雜的“智能玩家”了。
事實上,絕悟1.0版本和AlphaGo一樣,采用了“模仿學習”的辦法。AlphaGo學習的是人類棋譜,而“絕悟”學習的是《王者榮耀》職業(yè)聯(lián)賽的比賽錄像。不過,單純把這些錄像信息錄入系統(tǒng)里,還不夠精準。騰訊AI團隊找了一群游戲高手,手動標記比賽錄像,把經過“提純”后的武功秘籍輸入給“絕悟”。通過“模仿學習”,“絕悟”的水平相當于一個比較厲害的業(yè)余選手。
絕悟2.0版本,和AlphaGo的下一代Alpha Zero一樣,不再是“模仿學習”,而是完全拋開人類經驗,從一張白紙開始,通過自己跟自己對戰(zhàn)、左右手互搏,自己總結戰(zhàn)斗經驗。在人工智能領域為“強化學習”。“強化學習”和“模仿學習”不同,機器“強化學習”的過程是個黑匣子,人類無法理解,更無法干預和引導。研究團隊苦苦琢磨,最后想到雖然無法幫它,但可以給它降低難度。他們?yōu)椤敖^悟”制定了一個從易到難的訓練計劃,在訓練之下,“絕悟”學習曲線直線向上。最終,在2019年《王者榮耀》世界冠軍杯上,“絕悟”戰(zhàn)勝了頂尖職業(yè)選手,一戰(zhàn)封神,成為游戲界的AlphaGo。
(二)網易對游戲中AI的全面研究
網易在游戲+AI方面已然成為國內游戲+AI技術的引領者。在2023年新發(fā)布的手游《逆水寒》中,網易為游戲中400多名NPC角色(非玩家角色,用于推動游戲劇情)配置了智能AI系統(tǒng),為其注入“靈魂”,他們就像活在游戲世界里的真人一樣,有自己的職業(yè)、性格、喜好,會主動跟玩家們聊天、交互。因此,游戲公測后,這些智能NPC就成為很多玩家在閑暇時的傾訴對象。《逆水寒》上線,有兩個月一直穩(wěn)占iOS暢銷榜第二。
目前,網易自研AI技術已應用于游戲工業(yè)化全流程,涵蓋AI語音生成、AI原畫生成、AI視頻動捕、AI模型生成等諸多環(huán)節(jié),推動游戲制作效率全面提升。游戲行業(yè)在前期游戲開發(fā)的美術概念設計、人物合成配音以及后期運營都開始使用人工智能技術。伴隨以ChatGPT為代表的新一代通用性AI算法實現重大突破,未來將有越來越多的AI技術運用于游戲場景中。
四、AIGC對于未來藝術的意義
縱觀互聯(lián)網發(fā)展,我們經歷了Web1.0、Web2.0,正在邁進Web3.0時代。
Web1.0由專家生產內容PGC(Professional-Generated Content),門戶網站形式就是這一時期的代表。此時的互聯(lián)網是靜態(tài)互聯(lián)網,大多數用戶只能在網上瀏覽和讀取信息,內容的創(chuàng)建與發(fā)布只掌握在極少數專家手中。
Web2.0是用戶生產模式UGC(User-Generated Content)再到AIGC的發(fā)展。在抖音、快手等自媒體平臺上,用戶可以拍攝并上傳自己創(chuàng)作的短視頻,并在獲取大眾關注的同時,獲得各種流量變現的獎勵。時代發(fā)展也逐漸從高質量PGC內容,轉向有利于UGC創(chuàng)作者生態(tài)。
用戶生產模式(UGC)極其豐富的內容背后存在著內容質量參差不齊的問題,平臺方需要投入大量精力和成本去進行創(chuàng)作者教育、內容審核、版權把控等方面的工作。雖然從平臺層面,內容生產供給問題得到了解決,但對于每個創(chuàng)作者個體而言,難以在保證內容質量、原創(chuàng)程度的情況下兼顧更新頻率。與此同時,創(chuàng)作者數量的增多使競爭變得更加激烈,許多創(chuàng)作者不得不選擇降低質量、洗稿抄襲等捷徑,用高頻率的更新留住關注者。
Web3.0雖然還沒到來,但可以預見在Web3.0的環(huán)境下,AIGC內容將出現指數級增長。元宇宙的本質是社會系統(tǒng)、信息系統(tǒng)、物理環(huán)境形態(tài)通過數字構成一個動態(tài)耦合的大系統(tǒng),需要大量數字內容來支撐,人工設計和開發(fā)根本無法滿足需求,AIGC可以最終完善元宇宙生態(tài)的底層基礎設施。未來人們必然難以分辨哪些是用戶生成,哪些是人工智能生成。人類社會也必將建立一種新秩序去規(guī)范這種創(chuàng)作邏輯。
五、結 語
本文探討了人工智能生成內容(AIGC)在繪畫和設計領域的運用,指出AIGC使繪畫門檻大幅降低,但人類設計師的作用仍然不可或缺。本文強調了傳統(tǒng)海報作為電影思想藝術再創(chuàng)作的重要性,揭示了人工智能技術在數字化時代對傳統(tǒng)藝術形式的沖擊,以及游戲行業(yè)利用人工智能技術提高游戲的互動性,并通過AI模型生成和語音生成等技術來提高生產效率。本文還探討了AIGC對未來藝術的意義,提出了Web3.0環(huán)境下AIGC內容增長的預期。盡管AI技術將在藝術設計領域扮演越來越重要的角色,但人類的創(chuàng)造力和藝術感知仍將保持其核心價值。
(上海視覺藝術學院)
參考文獻
[1] 杜雨,張孜銘.AIGC智能創(chuàng)作時代[M].北京:中譯出版社,2023.
[2] 陳家洋.推薦算法與流媒體影視的算法文化[J].電影藝術,2021(3):153-160.