劉澤斌



摘 要:人工智能生成內(nèi)容(AIGC)開創(chuàng)了“模型”主導(dǎo)內(nèi)容生成的時代,人類將迎來傳統(tǒng)內(nèi)容創(chuàng)作和人工智能內(nèi)容生成并行的時代。藝術(shù)設(shè)計的本質(zhì)在于創(chuàng)造和表達(dá),設(shè)計師以創(chuàng)造力和技巧,將想法和情感轉(zhuǎn)化成形式和符號,通過作品與觀眾進(jìn)行溝通。AI技術(shù)在快題設(shè)計和高頻設(shè)計領(lǐng)域?qū)粡V泛運用,這必將改變藝術(shù)內(nèi)容的生產(chǎn)方式與市場邏輯,但永遠(yuǎn)無法取代傳統(tǒng)人類設(shè)計的作用與價值。因此,專業(yè)設(shè)計應(yīng)該參與整個“AI+”的創(chuàng)新設(shè)計,貢獻(xiàn)自己對交互的底層認(rèn)知,讓互聯(lián)網(wǎng)充滿人性的溫度。
關(guān)鍵詞:人工智能;藝術(shù)設(shè)計;AIGC
一、AIGC在繪畫領(lǐng)域引起巨變
2022年8月,美國科羅拉多州博覽會上,數(shù)字藝術(shù)類冠軍頒發(fā)給了由AI生成的作品《太空歌劇院》(圖1)。11月30日,ChatGPT橫空出世,它不僅可以清晰了解用戶的問題,還能如人類一般流暢回答。目前,AI已經(jīng)能夠輕松完成一些復(fù)雜任務(wù),包括按照特定文風(fēng)撰寫詩歌、假扮特定角色對話、修改錯誤代碼等。2022年是AI融入人類日常生活的一年,這一年人工智能成為一個廣泛的社會話題,人類獨有的創(chuàng)造力正在受到計算機的挑戰(zhàn)。
2022年下半年,美術(shù)院校就出現(xiàn)了學(xué)生通過AI生成圖片尋找靈感或表達(dá)自己創(chuàng)作意圖的現(xiàn)象。在設(shè)計市場,也有許多設(shè)計公司用AI生成的圖片進(jìn)行項目的初期研討。
AIGC讓繪畫門檻無限降低,大量文員在制作公司PPT和海報時,都可以獲得AIGC圖片甚至排版設(shè)計資源。借助AIGC,很多網(wǎng)絡(luò)小說的封面都可以由作者本人完成,甚至可以生成很多角色和插圖。
目前,AIGC比較適合生成簡單的卡通形象和背景圖,受其影響的主要是那些剛?cè)胄械牟瀹嫀熀蛨D片庫平臺。現(xiàn)在,AIGC在很多藝術(shù)設(shè)計公司屬于伴生狀態(tài),AIGC的操作流程雖然對用戶已經(jīng)十分友好,用戶能通過關(guān)鍵詞的反復(fù)輸入,最大限度地從系統(tǒng)中獲得意向圖片,但設(shè)計往往會對畫面內(nèi)容、主題有明確訴求,AI生成的內(nèi)容過于寬泛,所以AIGC目前還只能停留在輸出參考這一環(huán)節(jié),包括動畫、游戲行業(yè)的大量角色設(shè)計完稿還必須由插畫師最終手繪輸出。
Diffusion模型應(yīng)用最廣泛的領(lǐng)域就是AI繪畫,并且迅速表現(xiàn)出了較大的商業(yè)潛力,拓展出了大量相關(guān)應(yīng)用。任何一張圖,通過一次次增加噪點,可以慢慢變成一張完全隨機的噪聲圖像,再將這個過程翻轉(zhuǎn),讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)噪聲擴散的過程后逆向擴散(圖2),Diffusion模型就是基于這個思想實現(xiàn)的。
此外,AI繪畫的成功還歸功于CLIP(Contrastive Language-Image Pre-Training,文本-圖像預(yù)訓(xùn)練)模型。CLIP類似人類嬰兒時期認(rèn)知事物的方法。人們指著圖片告訴計算機“這是向日葵”或者“向日葵在綠葉叢中盛開”,這個過程就發(fā)生了文本和圖像的匹配。OpenAI在互聯(lián)網(wǎng)上搜集到了4億對質(zhì)量過關(guān)的圖像文本,分別將文本和圖像進(jìn)行編碼,讓CLIP模型學(xué)會計算文本和圖像的關(guān)聯(lián)程度。
反之,AIGC為我們創(chuàng)作圖像,就必須先輸入一堆描述性關(guān)鍵詞。關(guān)鍵詞一般架構(gòu)為主體(服裝配飾、行為動作等)+場景(環(huán)境、天氣、氛圍、光線、視角等)+風(fēng)格(插畫、水墨、宮崎駿、像素風(fēng)等)+畫質(zhì)(質(zhì)感、渲染器)+設(shè)置(參數(shù)指令、畫面大小)。
以圖3為例,通過填充以下關(guān)鍵詞架構(gòu)進(jìn)行生成圖像:插畫設(shè)計,近景,仰視,吳道子風(fēng)格,一個小女孩正在收集露水的圖片,3只在天空中飛翔的鳥,植物,明亮生動的色彩,精致的細(xì)節(jié),夸張的手法,漸變背景,平的插畫。
許多公司在CLIP模型和Diffusion模型的基礎(chǔ)上開發(fā)了相關(guān)應(yīng)用工具,其中Stable Diffusion、DALL·E2、Midjourney是最知名的工具。因為數(shù)據(jù)、算力、算法不同,上述三個知名AI繪畫工具都具有各自的特點。我們?nèi)孕枰吹剑珹IGC仍然面對不少挑戰(zhàn)。
首先,生成的圖像往往缺乏多樣性,這是因為生成模型只能學(xué)習(xí)到數(shù)據(jù)分布的一個模式,無法捕捉原圖像表達(dá)的全部藝術(shù)信息。其次,生成模型的訓(xùn)練過程需要大量的計算資源和時間,限制了其在實際應(yīng)用中的推廣。最后,生成模型的生成結(jié)果往往是無法解釋的,所以有些成功帶有偶然性。
產(chǎn)品評價有三個層級:有用、可用、易用。按此劃分,目前AIGC處于可用向易用的過渡階段。
AIGC在一定程度上為沒有美術(shù)基礎(chǔ)的人們提供了草圖再創(chuàng)作的機會,AI繪畫工具根據(jù)草圖中簡單的線條、形狀和筆觸可以快速生成效果圖,通過關(guān)鍵詞的輔助,不斷優(yōu)化或添加細(xì)節(jié),使效果圖更加符合理想中的圖像(圖4)。
AIGC需要對非藝術(shù)專業(yè)用戶實現(xiàn)更精準(zhǔn)的服務(wù)。PPT、微信公眾號對背景圖、氣氛圖有著廣泛的需求,降低圖片生成難度,或進(jìn)行圖文復(fù)合生成,甚至智能生成GIF動畫,這些需求和AIGC技術(shù)路徑高度吻合。
AIGC的“易用”,可把大系統(tǒng)細(xì)分成更多的專用設(shè)計領(lǐng)域,引入有關(guān)業(yè)務(wù)和用戶信息以及關(guān)鍵專項主題(如日本食品包裝、商業(yè)展會、文博展覽等),聯(lián)合細(xì)分的設(shè)計公司構(gòu)建更好、更專業(yè)的數(shù)據(jù)資源,形成數(shù)據(jù)共享和數(shù)據(jù)交換等新的商業(yè)模式,最終增強模型的專業(yè)能力。
二、推薦算法重塑影視文化
相較于AIGC在C端的“美麗輸出”,而不是“精準(zhǔn)輸出”,AI技術(shù)在B端服務(wù)方面表現(xiàn)出超越傳統(tǒng)的精準(zhǔn)度。傳統(tǒng)產(chǎn)業(yè)迫切需要AI技術(shù)來實現(xiàn)降本增效,未來,我們所有的行業(yè)都會被AI改造一遍。
傳統(tǒng)海報是電影制作重要的一部分,海報是電影思想的一次藝術(shù)再創(chuàng)作。
《發(fā)條橙》(圖5)是斯坦利·庫布里克在1971年執(zhí)導(dǎo)的犯罪片,其海報也堪稱經(jīng)典。匕首三角和象征社會尖利的三角通過眼神刺向每一個觀者,像是在咄咄逼問蕓蕓眾生的公德與私欲。
《下班后》(圖6)是馬丁·斯科塞斯早期的作品之一,他借此拿到了1986年戛納電影節(jié)最佳導(dǎo)演獎和1986年獨立精神獎最佳導(dǎo)演獎。劇情的荒誕與瘋狂也同樣出現(xiàn)在了海報當(dāng)中。
當(dāng)我們習(xí)慣拿著平板電腦追劇的時候,那些充滿才華的海報在不知不覺中消失了,并成為流媒體平臺的普遍現(xiàn)象。打開奈飛網(wǎng)站,人們很難看到一張經(jīng)過藝術(shù)設(shè)計的海報,幾乎所有封面都是一個大字標(biāo)題,再配上突出的主角形象,簡單又粗陋。
在平板或手機上看視頻,屏幕尺寸不大,每屏要呈現(xiàn)2至3排10多部電影或電視劇的縮略圖。2012年,奈飛開始研發(fā)推薦引擎,發(fā)現(xiàn)用戶最多為首頁上展示的視頻停留1.8秒,如果用戶在90秒內(nèi)沒有點擊任何一個視頻,就可能會直接關(guān)閉軟件,去競爭對手的平臺。
一張海報用1.8秒時間,如何讓用戶選擇點擊呢?“大字標(biāo)題+主角形象”的配置,就是奈飛算法研究出來的最優(yōu)解。這是一種AVA算法,在一部時長一小時的影視劇中有86000幀畫面,算法會逐個分析這些畫面,記下出鏡角色、構(gòu)圖、亮度、銳度等數(shù)據(jù),建立起一個名叫“元數(shù)據(jù)”的數(shù)據(jù)庫,然后進(jìn)行圖像排序,算法會對“元數(shù)據(jù)”進(jìn)行分級篩選,再考慮畫面清晰度、有無主要人物、有無劇集特色等,從中找出那些最容易吸引用戶點擊的照片,再讓設(shè)計團隊加上標(biāo)題做成封面(圖7)。
奈飛在海報上還實現(xiàn)了個性化推薦。同一部作品,用戶觀影習(xí)慣不同,可能會看到不同的封面。比如,一名常看喜劇的用戶,會看到劇集中串場的知名喜劇演員出現(xiàn)在封面上;更喜歡看愛情片的用戶,則會在封面上看到一對情侶。
當(dāng)影視內(nèi)容與用戶觀看被置于推薦算法之下時,用戶的喜好被統(tǒng)計學(xué)原則提煉,它替代了以美學(xué)為核心的設(shè)計和億萬用戶相連接。近年來,推薦算法之于影視節(jié)目數(shù)字分發(fā)的重要性日益凸顯,奈飛精心設(shè)計的推薦算法已經(jīng)影響了80%用戶的觀看選擇,只有20%的用戶通過搜索來選擇影片。
傳統(tǒng)流媒體影視的內(nèi)容生產(chǎn),在很大程度上仍依賴傳統(tǒng)影視生產(chǎn)經(jīng)驗和人才資源,但在數(shù)字分發(fā)領(lǐng)域,推薦算法卻給傳統(tǒng)影視文化帶來了巨大沖擊。流媒體影視的藝術(shù)性、審美性、文化性等柔性維度必然會與推薦算法的數(shù)理邏輯等非人類性的、剛性的維度相遇,前者也將被后者改造、重塑。藝術(shù)創(chuàng)作中的偶然性、批判性將受到算法的制約。
三、“AI玩家”助力游戲設(shè)計
游戲是目前集合大多數(shù)字模態(tài)的綜合體,熱門游戲又能做到千萬數(shù)量玩家同時在線,這些優(yōu)異條件讓游戲成為研究和驗證AI技術(shù)的絕佳場景,游戲也必將在AI技術(shù)的發(fā)展過程中起到至關(guān)重要的作用。
開發(fā)ChatGPT的OpenAI公司在2023年8月17日宣布了自創(chuàng)立以來的第一筆公開收購案,它收購了一家初創(chuàng)的游戲公司,并將其整個團隊納入麾下。
2022年騰訊官網(wǎng)發(fā)布“王者榮耀AI開放研究環(huán)境”申請及下載,提供用于人工智能研究的驗證場景,以便開發(fā)者能夠快速便捷地測試自己的新算法和模型。這標(biāo)志著騰訊旗下的開悟平臺邁向了開放科研基礎(chǔ)設(shè)施的新征程。從某種意義上說,《王者榮耀》早就超出了一款游戲的范疇,它是一個由上億游戲玩家共同參與的多智能體AI研究平臺,也是一項通往未來的基礎(chǔ)設(shè)施。
(一)《王者榮耀》里的“AI玩家”
《王者榮耀》在2020年上線了一個新模塊,名叫“挑戰(zhàn)絕悟”,這個“絕悟”就是“AI玩家”。這位“AI玩家”既要會復(fù)雜的走位和動作技巧,也要會考慮團隊配合,更要能贏。為了快速提高“絕悟”的戰(zhàn)斗力,騰訊AI團隊決定邀請上億游戲玩家與之博弈,幫助它進(jìn)步。“絕悟”花費三年時間,從一開始連地圖小怪都打不過的“弱雞”,到后來可以完爆《王者榮耀》職業(yè)聯(lián)賽冠軍,成為目前世界上最先進(jìn)的“智能玩家”。
騰訊開發(fā)“絕悟”不是一時興起,而是為了解決一個現(xiàn)實問題。《王者榮耀》會不斷推出新的英雄角色,這個新角色的武力值需要與老角色保持平衡,既不能太強也不能太弱,勝率需要操持在50%左右。保證這個勝率的一般做法是,在新角色發(fā)布前,找專業(yè)游戲測試員,用新角色跟老角色組隊打上幾千場,各種技能和場景都盡量測試一遍。這個方法人力成本高、效率低,還有新角色被提前泄露給公眾的風(fēng)險。那就需要研發(fā)一個AI系統(tǒng),由它操控各種角色來自動測試,這就是“絕悟”的來歷。
從數(shù)學(xué)上說,想要搞清楚勝率,需要采用窮舉法,也就是把每一步中所有可能出現(xiàn)的變數(shù)全部推演一遍,自然可以得出結(jié)果。不過,這種做法只在理論上可行,現(xiàn)實中它需要的算力超越了計算機的極限。單一維度的AlphaGo圍棋程序都無法采用窮舉法,更別說更復(fù)雜的“智能玩家”了。
事實上,絕悟1.0版本和AlphaGo一樣,采用了“模仿學(xué)習(xí)”的辦法。AlphaGo學(xué)習(xí)的是人類棋譜,而“絕悟”學(xué)習(xí)的是《王者榮耀》職業(yè)聯(lián)賽的比賽錄像。不過,單純把這些錄像信息錄入系統(tǒng)里,還不夠精準(zhǔn)。騰訊AI團隊找了一群游戲高手,手動標(biāo)記比賽錄像,把經(jīng)過“提純”后的武功秘籍輸入給“絕悟”。通過“模仿學(xué)習(xí)”,“絕悟”的水平相當(dāng)于一個比較厲害的業(yè)余選手。
絕悟2.0版本,和AlphaGo的下一代Alpha Zero一樣,不再是“模仿學(xué)習(xí)”,而是完全拋開人類經(jīng)驗,從一張白紙開始,通過自己跟自己對戰(zhàn)、左右手互搏,自己總結(jié)戰(zhàn)斗經(jīng)驗。在人工智能領(lǐng)域為“強化學(xué)習(xí)”。“強化學(xué)習(xí)”和“模仿學(xué)習(xí)”不同,機器“強化學(xué)習(xí)”的過程是個黑匣子,人類無法理解,更無法干預(yù)和引導(dǎo)。研究團隊苦苦琢磨,最后想到雖然無法幫它,但可以給它降低難度。他們?yōu)椤敖^悟”制定了一個從易到難的訓(xùn)練計劃,在訓(xùn)練之下,“絕悟”學(xué)習(xí)曲線直線向上。最終,在2019年《王者榮耀》世界冠軍杯上,“絕悟”戰(zhàn)勝了頂尖職業(yè)選手,一戰(zhàn)封神,成為游戲界的AlphaGo。
(二)網(wǎng)易對游戲中AI的全面研究
網(wǎng)易在游戲+AI方面已然成為國內(nèi)游戲+AI技術(shù)的引領(lǐng)者。在2023年新發(fā)布的手游《逆水寒》中,網(wǎng)易為游戲中400多名NPC角色(非玩家角色,用于推動游戲劇情)配置了智能AI系統(tǒng),為其注入“靈魂”,他們就像活在游戲世界里的真人一樣,有自己的職業(yè)、性格、喜好,會主動跟玩家們聊天、交互。因此,游戲公測后,這些智能NPC就成為很多玩家在閑暇時的傾訴對象。《逆水寒》上線,有兩個月一直穩(wěn)占iOS暢銷榜第二。
目前,網(wǎng)易自研AI技術(shù)已應(yīng)用于游戲工業(yè)化全流程,涵蓋AI語音生成、AI原畫生成、AI視頻動捕、AI模型生成等諸多環(huán)節(jié),推動游戲制作效率全面提升。游戲行業(yè)在前期游戲開發(fā)的美術(shù)概念設(shè)計、人物合成配音以及后期運營都開始使用人工智能技術(shù)。伴隨以ChatGPT為代表的新一代通用性AI算法實現(xiàn)重大突破,未來將有越來越多的AI技術(shù)運用于游戲場景中。
四、AIGC對于未來藝術(shù)的意義
縱觀互聯(lián)網(wǎng)發(fā)展,我們經(jīng)歷了Web1.0、Web2.0,正在邁進(jìn)Web3.0時代。
Web1.0由專家生產(chǎn)內(nèi)容PGC(Professional-Generated Content),門戶網(wǎng)站形式就是這一時期的代表。此時的互聯(lián)網(wǎng)是靜態(tài)互聯(lián)網(wǎng),大多數(shù)用戶只能在網(wǎng)上瀏覽和讀取信息,內(nèi)容的創(chuàng)建與發(fā)布只掌握在極少數(shù)專家手中。
Web2.0是用戶生產(chǎn)模式UGC(User-Generated Content)再到AIGC的發(fā)展。在抖音、快手等自媒體平臺上,用戶可以拍攝并上傳自己創(chuàng)作的短視頻,并在獲取大眾關(guān)注的同時,獲得各種流量變現(xiàn)的獎勵。時代發(fā)展也逐漸從高質(zhì)量PGC內(nèi)容,轉(zhuǎn)向有利于UGC創(chuàng)作者生態(tài)。
用戶生產(chǎn)模式(UGC)極其豐富的內(nèi)容背后存在著內(nèi)容質(zhì)量參差不齊的問題,平臺方需要投入大量精力和成本去進(jìn)行創(chuàng)作者教育、內(nèi)容審核、版權(quán)把控等方面的工作。雖然從平臺層面,內(nèi)容生產(chǎn)供給問題得到了解決,但對于每個創(chuàng)作者個體而言,難以在保證內(nèi)容質(zhì)量、原創(chuàng)程度的情況下兼顧更新頻率。與此同時,創(chuàng)作者數(shù)量的增多使競爭變得更加激烈,許多創(chuàng)作者不得不選擇降低質(zhì)量、洗稿抄襲等捷徑,用高頻率的更新留住關(guān)注者。
Web3.0雖然還沒到來,但可以預(yù)見在Web3.0的環(huán)境下,AIGC內(nèi)容將出現(xiàn)指數(shù)級增長。元宇宙的本質(zhì)是社會系統(tǒng)、信息系統(tǒng)、物理環(huán)境形態(tài)通過數(shù)字構(gòu)成一個動態(tài)耦合的大系統(tǒng),需要大量數(shù)字內(nèi)容來支撐,人工設(shè)計和開發(fā)根本無法滿足需求,AIGC可以最終完善元宇宙生態(tài)的底層基礎(chǔ)設(shè)施。未來人們必然難以分辨哪些是用戶生成,哪些是人工智能生成。人類社會也必將建立一種新秩序去規(guī)范這種創(chuàng)作邏輯。
五、結(jié) 語
本文探討了人工智能生成內(nèi)容(AIGC)在繪畫和設(shè)計領(lǐng)域的運用,指出AIGC使繪畫門檻大幅降低,但人類設(shè)計師的作用仍然不可或缺。本文強調(diào)了傳統(tǒng)海報作為電影思想藝術(shù)再創(chuàng)作的重要性,揭示了人工智能技術(shù)在數(shù)字化時代對傳統(tǒng)藝術(shù)形式的沖擊,以及游戲行業(yè)利用人工智能技術(shù)提高游戲的互動性,并通過AI模型生成和語音生成等技術(shù)來提高生產(chǎn)效率。本文還探討了AIGC對未來藝術(shù)的意義,提出了Web3.0環(huán)境下AIGC內(nèi)容增長的預(yù)期。盡管AI技術(shù)將在藝術(shù)設(shè)計領(lǐng)域扮演越來越重要的角色,但人類的創(chuàng)造力和藝術(shù)感知仍將保持其核心價值。
(上海視覺藝術(shù)學(xué)院)
參考文獻(xiàn)
[1] 杜雨,張孜銘.AIGC智能創(chuàng)作時代[M].北京:中譯出版社,2023.
[2] 陳家洋.推薦算法與流媒體影視的算法文化[J].電影藝術(shù),2021(3):153-160.