當(dāng)藝術(shù)設(shè)計(jì)遇到人工智能

2024-06-16 12:31:56劉澤斌

百花 2024年3期

劉澤斌

摘要：人工智能生成內(nèi)容（AIGC）開創(chuàng)了“模型”主導(dǎo)內(nèi)容生成的時(shí)代，人類將迎來傳統(tǒng)內(nèi)容創(chuàng)作和人工智能內(nèi)容生成并行的時(shí)代。藝術(shù)設(shè)計(jì)的本質(zhì)在于創(chuàng)造和表達(dá)，設(shè)計(jì)師以創(chuàng)造力和技巧，將想法和情感轉(zhuǎn)化成形式和符號，通過作品與觀眾進(jìn)行溝通。AI技術(shù)在快題設(shè)計(jì)和高頻設(shè)計(jì)領(lǐng)域?qū)粡V泛運(yùn)用，這必將改變藝術(shù)內(nèi)容的生產(chǎn)方式與市場邏輯，但永遠(yuǎn)無法取代傳統(tǒng)人類設(shè)計(jì)的作用與價(jià)值。因此，專業(yè)設(shè)計(jì)應(yīng)該參與整個(gè)“AI+”的創(chuàng)新設(shè)計(jì)，貢獻(xiàn)自己對交互的底層認(rèn)知，讓互聯(lián)網(wǎng)充滿人性的溫度。

關(guān)鍵詞：人工智能；藝術(shù)設(shè)計(jì)；AIGC

一、AIGC在繪畫領(lǐng)域引起巨變

2022年8月，美國科羅拉多州博覽會上，數(shù)字藝術(shù)類冠軍頒發(fā)給了由AI生成的作品《太空歌劇院》（圖1）。11月30日，ChatGPT橫空出世，它不僅可以清晰了解用戶的問題，還能如人類一般流暢回答。目前，AI已經(jīng)能夠輕松完成一些復(fù)雜任務(wù)，包括按照特定文風(fēng)撰寫詩歌、假扮特定角色對話、修改錯(cuò)誤代碼等。2022年是AI融入人類日常生活的一年，這一年人工智能成為一個(gè)廣泛的社會話題，人類獨(dú)有的創(chuàng)造力正在受到計(jì)算機(jī)的挑戰(zhàn)。

2022年下半年，美術(shù)院校就出現(xiàn)了學(xué)生通過AI生成圖片尋找靈感或表達(dá)自己創(chuàng)作意圖的現(xiàn)象。在設(shè)計(jì)市場，也有許多設(shè)計(jì)公司用AI生成的圖片進(jìn)行項(xiàng)目的初期研討。

AIGC讓繪畫門檻無限降低，大量文員在制作公司PPT和海報(bào)時(shí)，都可以獲得AIGC圖片甚至排版設(shè)計(jì)資源。借助AIGC，很多網(wǎng)絡(luò)小說的封面都可以由作者本人完成，甚至可以生成很多角色和插圖。

目前，AIGC比較適合生成簡單的卡通形象和背景圖，受其影響的主要是那些剛?cè)胄械牟瀹嫀熀蛨D片庫平臺。現(xiàn)在，AIGC在很多藝術(shù)設(shè)計(jì)公司屬于伴生狀態(tài)，AIGC的操作流程雖然對用戶已經(jīng)十分友好，用戶能通過關(guān)鍵詞的反復(fù)輸入，最大限度地從系統(tǒng)中獲得意向圖片，但設(shè)計(jì)往往會對畫面內(nèi)容、主題有明確訴求，AI生成的內(nèi)容過于寬泛，所以AIGC目前還只能停留在輸出參考這一環(huán)節(jié)，包括動(dòng)畫、游戲行業(yè)的大量角色設(shè)計(jì)完稿還必須由插畫師最終手繪輸出。

Diffusion模型應(yīng)用最廣泛的領(lǐng)域就是AI繪畫，并且迅速表現(xiàn)出了較大的商業(yè)潛力，拓展出了大量相關(guān)應(yīng)用。任何一張圖，通過一次次增加噪點(diǎn)，可以慢慢變成一張完全隨機(jī)的噪聲圖像，再將這個(gè)過程翻轉(zhuǎn)，讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)噪聲擴(kuò)散的過程后逆向擴(kuò)散（圖2），Diffusion模型就是基于這個(gè)思想實(shí)現(xiàn)的。

此外，AI繪畫的成功還歸功于CLIP（Contrastive Language-Image Pre-Training，文本－圖像預(yù)訓(xùn)練）模型。CLIP類似人類嬰兒時(shí)期認(rèn)知事物的方法。人們指著圖片告訴計(jì)算機(jī)“這是向日葵”或者“向日葵在綠葉叢中盛開”，這個(gè)過程就發(fā)生了文本和圖像的匹配。OpenAI在互聯(lián)網(wǎng)上搜集到了4億對質(zhì)量過關(guān)的圖像文本，分別將文本和圖像進(jìn)行編碼，讓CLIP模型學(xué)會計(jì)算文本和圖像的關(guān)聯(lián)程度。

反之，AIGC為我們創(chuàng)作圖像，就必須先輸入一堆描述性關(guān)鍵詞。關(guān)鍵詞一般架構(gòu)為主體（服裝配飾、行為動(dòng)作等）+場景（環(huán)境、天氣、氛圍、光線、視角等）+風(fēng)格（插畫、水墨、宮崎駿、像素風(fēng)等）+畫質(zhì)（質(zhì)感、渲染器）+設(shè)置（參數(shù)指令、畫面大小）。

以圖3為例，通過填充以下關(guān)鍵詞架構(gòu)進(jìn)行生成圖像：插畫設(shè)計(jì)，近景，仰視，吳道子風(fēng)格，一個(gè)小女孩正在收集露水的圖片，3只在天空中飛翔的鳥，植物，明亮生動(dòng)的色彩，精致的細(xì)節(jié)，夸張的手法，漸變背景，平的插畫。

許多公司在CLIP模型和Diffusion模型的基礎(chǔ)上開發(fā)了相關(guān)應(yīng)用工具，其中Stable Diffusion、DALL·E2、Midjourney是最知名的工具。因?yàn)閿?shù)據(jù)、算力、算法不同，上述三個(gè)知名AI繪畫工具都具有各自的特點(diǎn)。我們?nèi)孕枰吹剑珹IGC仍然面對不少挑戰(zhàn)。

首先，生成的圖像往往缺乏多樣性，這是因?yàn)樯赡Ｐ椭荒軐W(xué)習(xí)到數(shù)據(jù)分布的一個(gè)模式，無法捕捉原圖像表達(dá)的全部藝術(shù)信息。其次，生成模型的訓(xùn)練過程需要大量的計(jì)算資源和時(shí)間，限制了其在實(shí)際應(yīng)用中的推廣。最后，生成模型的生成結(jié)果往往是無法解釋的，所以有些成功帶有偶然性。

產(chǎn)品評價(jià)有三個(gè)層級：有用、可用、易用。按此劃分，目前AIGC處于可用向易用的過渡階段。

AIGC在一定程度上為沒有美術(shù)基礎(chǔ)的人們提供了草圖再創(chuàng)作的機(jī)會，AI繪畫工具根據(jù)草圖中簡單的線條、形狀和筆觸可以快速生成效果圖，通過關(guān)鍵詞的輔助，不斷優(yōu)化或添加細(xì)節(jié)，使效果圖更加符合理想中的圖像（圖4）。

AIGC需要對非藝術(shù)專業(yè)用戶實(shí)現(xiàn)更精準(zhǔn)的服務(wù)。PPT、微信公眾號對背景圖、氣氛圖有著廣泛的需求，降低圖片生成難度，或進(jìn)行圖文復(fù)合生成，甚至智能生成GIF動(dòng)畫，這些需求和AIGC技術(shù)路徑高度吻合。

AIGC的“易用”，可把大系統(tǒng)細(xì)分成更多的專用設(shè)計(jì)領(lǐng)域，引入有關(guān)業(yè)務(wù)和用戶信息以及關(guān)鍵專項(xiàng)主題（如日本食品包裝、商業(yè)展會、文博展覽等），聯(lián)合細(xì)分的設(shè)計(jì)公司構(gòu)建更好、更專業(yè)的數(shù)據(jù)資源，形成數(shù)據(jù)共享和數(shù)據(jù)交換等新的商業(yè)模式，最終增強(qiáng)模型的專業(yè)能力。

二、推薦算法重塑影視文化

相較于AIGC在C端的“美麗輸出”，而不是“精準(zhǔn)輸出”，AI技術(shù)在B端服務(wù)方面表現(xiàn)出超越傳統(tǒng)的精準(zhǔn)度。傳統(tǒng)產(chǎn)業(yè)迫切需要AI技術(shù)來實(shí)現(xiàn)降本增效，未來，我們所有的行業(yè)都會被AI改造一遍。

傳統(tǒng)海報(bào)是電影制作重要的一部分，海報(bào)是電影思想的一次藝術(shù)再創(chuàng)作。

《發(fā)條橙》（圖5）是斯坦利·庫布里克在1971年執(zhí)導(dǎo)的犯罪片，其海報(bào)也堪稱經(jīng)典。匕首三角和象征社會尖利的三角通過眼神刺向每一個(gè)觀者，像是在咄咄逼問蕓蕓眾生的公德與私欲。

《下班后》（圖6）是馬丁·斯科塞斯早期的作品之一，他借此拿到了1986年戛納電影節(jié)最佳導(dǎo)演獎(jiǎng)和1986年獨(dú)立精神獎(jiǎng)最佳導(dǎo)演獎(jiǎng)。劇情的荒誕與瘋狂也同樣出現(xiàn)在了海報(bào)當(dāng)中。

當(dāng)我們習(xí)慣拿著平板電腦追劇的時(shí)候，那些充滿才華的海報(bào)在不知不覺中消失了，并成為流媒體平臺的普遍現(xiàn)象。打開奈飛網(wǎng)站，人們很難看到一張經(jīng)過藝術(shù)設(shè)計(jì)的海報(bào)，幾乎所有封面都是一個(gè)大字標(biāo)題，再配上突出的主角形象，簡單又粗陋。

在平板或手機(jī)上看視頻，屏幕尺寸不大，每屏要呈現(xiàn)2至3排10多部電影或電視劇的縮略圖。2012年，奈飛開始研發(fā)推薦引擎，發(fā)現(xiàn)用戶最多為首頁上展示的視頻停留1.8秒，如果用戶在90秒內(nèi)沒有點(diǎn)擊任何一個(gè)視頻，就可能會直接關(guān)閉軟件，去競爭對手的平臺。

一張海報(bào)用1.8秒時(shí)間，如何讓用戶選擇點(diǎn)擊呢？“大字標(biāo)題+主角形象”的配置，就是奈飛算法研究出來的最優(yōu)解。這是一種AVA算法，在一部時(shí)長一小時(shí)的影視劇中有86000幀畫面，算法會逐個(gè)分析這些畫面，記下出鏡角色、構(gòu)圖、亮度、銳度等數(shù)據(jù)，建立起一個(gè)名叫“元數(shù)據(jù)”的數(shù)據(jù)庫，然后進(jìn)行圖像排序，算法會對“元數(shù)據(jù)”進(jìn)行分級篩選，再考慮畫面清晰度、有無主要人物、有無劇集特色等，從中找出那些最容易吸引用戶點(diǎn)擊的照片，再讓設(shè)計(jì)團(tuán)隊(duì)加上標(biāo)題做成封面（圖7）。

奈飛在海報(bào)上還實(shí)現(xiàn)了個(gè)性化推薦。同一部作品，用戶觀影習(xí)慣不同，可能會看到不同的封面。比如，一名常看喜劇的用戶，會看到劇集中串場的知名喜劇演員出現(xiàn)在封面上；更喜歡看愛情片的用戶，則會在封面上看到一對情侶。

當(dāng)影視內(nèi)容與用戶觀看被置于推薦算法之下時(shí)，用戶的喜好被統(tǒng)計(jì)學(xué)原則提煉，它替代了以美學(xué)為核心的設(shè)計(jì)和億萬用戶相連接。近年來，推薦算法之于影視節(jié)目數(shù)字分發(fā)的重要性日益凸顯，奈飛精心設(shè)計(jì)的推薦算法已經(jīng)影響了80%用戶的觀看選擇，只有20%的用戶通過搜索來選擇影片。

傳統(tǒng)流媒體影視的內(nèi)容生產(chǎn)，在很大程度上仍依賴傳統(tǒng)影視生產(chǎn)經(jīng)驗(yàn)和人才資源，但在數(shù)字分發(fā)領(lǐng)域，推薦算法卻給傳統(tǒng)影視文化帶來了巨大沖擊。流媒體影視的藝術(shù)性、審美性、文化性等柔性維度必然會與推薦算法的數(shù)理邏輯等非人類性的、剛性的維度相遇，前者也將被后者改造、重塑。藝術(shù)創(chuàng)作中的偶然性、批判性將受到算法的制約。

三、“AI玩家”助力游戲設(shè)計(jì)

游戲是目前集合大多數(shù)字模態(tài)的綜合體，熱門游戲又能做到千萬數(shù)量玩家同時(shí)在線，這些優(yōu)異條件讓游戲成為研究和驗(yàn)證AI技術(shù)的絕佳場景，游戲也必將在AI技術(shù)的發(fā)展過程中起到至關(guān)重要的作用。

開發(fā)ChatGPT的OpenAI公司在2023年8月17日宣布了自創(chuàng)立以來的第一筆公開收購案，它收購了一家初創(chuàng)的游戲公司，并將其整個(gè)團(tuán)隊(duì)納入麾下。

2022年騰訊官網(wǎng)發(fā)布“王者榮耀AI開放研究環(huán)境”申請及下載，提供用于人工智能研究的驗(yàn)證場景，以便開發(fā)者能夠快速便捷地測試自己的新算法和模型。這標(biāo)志著騰訊旗下的開悟平臺邁向了開放科研基礎(chǔ)設(shè)施的新征程。從某種意義上說，《王者榮耀》早就超出了一款游戲的范疇，它是一個(gè)由上億游戲玩家共同參與的多智能體AI研究平臺，也是一項(xiàng)通往未來的基礎(chǔ)設(shè)施。

（一）《王者榮耀》里的“AI玩家”

《王者榮耀》在2020年上線了一個(gè)新模塊，名叫“挑戰(zhàn)絕悟”，這個(gè)“絕悟”就是“AI玩家”。這位“AI玩家”既要會復(fù)雜的走位和動(dòng)作技巧，也要會考慮團(tuán)隊(duì)配合，更要能贏。為了快速提高“絕悟”的戰(zhàn)斗力，騰訊AI團(tuán)隊(duì)決定邀請上億游戲玩家與之博弈，幫助它進(jìn)步。“絕悟”花費(fèi)三年時(shí)間，從一開始連地圖小怪都打不過的“弱雞”，到后來可以完爆《王者榮耀》職業(yè)聯(lián)賽冠軍，成為目前世界上最先進(jìn)的“智能玩家”。

騰訊開發(fā)“絕悟”不是一時(shí)興起，而是為了解決一個(gè)現(xiàn)實(shí)問題。《王者榮耀》會不斷推出新的英雄角色，這個(gè)新角色的武力值需要與老角色保持平衡，既不能太強(qiáng)也不能太弱，勝率需要操持在50%左右。保證這個(gè)勝率的一般做法是，在新角色發(fā)布前，找專業(yè)游戲測試員，用新角色跟老角色組隊(duì)打上幾千場，各種技能和場景都盡量測試一遍。這個(gè)方法人力成本高、效率低，還有新角色被提前泄露給公眾的風(fēng)險(xiǎn)。那就需要研發(fā)一個(gè)AI系統(tǒng)，由它操控各種角色來自動(dòng)測試，這就是“絕悟”的來歷。

從數(shù)學(xué)上說，想要搞清楚勝率，需要采用窮舉法，也就是把每一步中所有可能出現(xiàn)的變數(shù)全部推演一遍，自然可以得出結(jié)果。不過，這種做法只在理論上可行，現(xiàn)實(shí)中它需要的算力超越了計(jì)算機(jī)的極限。單一維度的AlphaGo圍棋程序都無法采用窮舉法，更別說更復(fù)雜的“智能玩家”了。

事實(shí)上，絕悟1.0版本和AlphaGo一樣，采用了“模仿學(xué)習(xí)”的辦法。AlphaGo學(xué)習(xí)的是人類棋譜，而“絕悟”學(xué)習(xí)的是《王者榮耀》職業(yè)聯(lián)賽的比賽錄像。不過，單純把這些錄像信息錄入系統(tǒng)里，還不夠精準(zhǔn)。騰訊AI團(tuán)隊(duì)找了一群游戲高手，手動(dòng)標(biāo)記比賽錄像，把經(jīng)過“提純”后的武功秘籍輸入給“絕悟”。通過“模仿學(xué)習(xí)”，“絕悟”的水平相當(dāng)于一個(gè)比較厲害的業(yè)余選手。

絕悟2.0版本，和AlphaGo的下一代Alpha Zero一樣，不再是“模仿學(xué)習(xí)”，而是完全拋開人類經(jīng)驗(yàn)，從一張白紙開始，通過自己跟自己對戰(zhàn)、左右手互搏，自己總結(jié)戰(zhàn)斗經(jīng)驗(yàn)。在人工智能領(lǐng)域?yàn)椤皬?qiáng)化學(xué)習(xí)”。“強(qiáng)化學(xué)習(xí)”和“模仿學(xué)習(xí)”不同，機(jī)器“強(qiáng)化學(xué)習(xí)”的過程是個(gè)黑匣子，人類無法理解，更無法干預(yù)和引導(dǎo)。研究團(tuán)隊(duì)苦苦琢磨，最后想到雖然無法幫它，但可以給它降低難度。他們?yōu)椤敖^悟”制定了一個(gè)從易到難的訓(xùn)練計(jì)劃，在訓(xùn)練之下，“絕悟”學(xué)習(xí)曲線直線向上。最終，在2019年《王者榮耀》世界冠軍杯上，“絕悟”戰(zhàn)勝了頂尖職業(yè)選手，一戰(zhàn)封神，成為游戲界的AlphaGo。

（二）網(wǎng)易對游戲中AI的全面研究

網(wǎng)易在游戲+AI方面已然成為國內(nèi)游戲+AI技術(shù)的引領(lǐng)者。在2023年新發(fā)布的手游《逆水寒》中，網(wǎng)易為游戲中400多名NPC角色（非玩家角色，用于推動(dòng)游戲劇情）配置了智能AI系統(tǒng)，為其注入“靈魂”，他們就像活在游戲世界里的真人一樣，有自己的職業(yè)、性格、喜好，會主動(dòng)跟玩家們聊天、交互。因此，游戲公測后，這些智能NPC就成為很多玩家在閑暇時(shí)的傾訴對象。《逆水寒》上線，有兩個(gè)月一直穩(wěn)占iOS暢銷榜第二。

目前，網(wǎng)易自研AI技術(shù)已應(yīng)用于游戲工業(yè)化全流程，涵蓋AI語音生成、AI原畫生成、AI視頻動(dòng)捕、AI模型生成等諸多環(huán)節(jié)，推動(dòng)游戲制作效率全面提升。游戲行業(yè)在前期游戲開發(fā)的美術(shù)概念設(shè)計(jì)、人物合成配音以及后期運(yùn)營都開始使用人工智能技術(shù)。伴隨以ChatGPT為代表的新一代通用性AI算法實(shí)現(xiàn)重大突破，未來將有越來越多的AI技術(shù)運(yùn)用于游戲場景中。

四、AIGC對于未來藝術(shù)的意義

縱觀互聯(lián)網(wǎng)發(fā)展，我們經(jīng)歷了Web1.0、Web2.0，正在邁進(jìn)Web3.0時(shí)代。

Web1.0由專家生產(chǎn)內(nèi)容PGC（Professional-Generated Content），門戶網(wǎng)站形式就是這一時(shí)期的代表。此時(shí)的互聯(lián)網(wǎng)是靜態(tài)互聯(lián)網(wǎng)，大多數(shù)用戶只能在網(wǎng)上瀏覽和讀取信息，內(nèi)容的創(chuàng)建與發(fā)布只掌握在極少數(shù)專家手中。

Web2.0是用戶生產(chǎn)模式UGC（User-Generated Content）再到AIGC的發(fā)展。在抖音、快手等自媒體平臺上，用戶可以拍攝并上傳自己創(chuàng)作的短視頻，并在獲取大眾關(guān)注的同時(shí)，獲得各種流量變現(xiàn)的獎(jiǎng)勵(lì)。時(shí)代發(fā)展也逐漸從高質(zhì)量PGC內(nèi)容，轉(zhuǎn)向有利于UGC創(chuàng)作者生態(tài)。

用戶生產(chǎn)模式（UGC）極其豐富的內(nèi)容背后存在著內(nèi)容質(zhì)量參差不齊的問題，平臺方需要投入大量精力和成本去進(jìn)行創(chuàng)作者教育、內(nèi)容審核、版權(quán)把控等方面的工作。雖然從平臺層面，內(nèi)容生產(chǎn)供給問題得到了解決，但對于每個(gè)創(chuàng)作者個(gè)體而言，難以在保證內(nèi)容質(zhì)量、原創(chuàng)程度的情況下兼顧更新頻率。與此同時(shí)，創(chuàng)作者數(shù)量的增多使競爭變得更加激烈，許多創(chuàng)作者不得不選擇降低質(zhì)量、洗稿抄襲等捷徑，用高頻率的更新留住關(guān)注者。

Web3.0雖然還沒到來，但可以預(yù)見在Web3.0的環(huán)境下，AIGC內(nèi)容將出現(xiàn)指數(shù)級增長。元宇宙的本質(zhì)是社會系統(tǒng)、信息系統(tǒng)、物理環(huán)境形態(tài)通過數(shù)字構(gòu)成一個(gè)動(dòng)態(tài)耦合的大系統(tǒng)，需要大量數(shù)字內(nèi)容來支撐，人工設(shè)計(jì)和開發(fā)根本無法滿足需求，AIGC可以最終完善元宇宙生態(tài)的底層基礎(chǔ)設(shè)施。未來人們必然難以分辨哪些是用戶生成，哪些是人工智能生成。人類社會也必將建立一種新秩序去規(guī)范這種創(chuàng)作邏輯。

五、結(jié) 語

本文探討了人工智能生成內(nèi)容（AIGC）在繪畫和設(shè)計(jì)領(lǐng)域的運(yùn)用，指出AIGC使繪畫門檻大幅降低，但人類設(shè)計(jì)師的作用仍然不可或缺。本文強(qiáng)調(diào)了傳統(tǒng)海報(bào)作為電影思想藝術(shù)再創(chuàng)作的重要性，揭示了人工智能技術(shù)在數(shù)字化時(shí)代對傳統(tǒng)藝術(shù)形式的沖擊，以及游戲行業(yè)利用人工智能技術(shù)提高游戲的互動(dòng)性，并通過AI模型生成和語音生成等技術(shù)來提高生產(chǎn)效率。本文還探討了AIGC對未來藝術(shù)的意義，提出了Web3.0環(huán)境下AIGC內(nèi)容增長的預(yù)期。盡管AI技術(shù)將在藝術(shù)設(shè)計(jì)領(lǐng)域扮演越來越重要的角色，但人類的創(chuàng)造力和藝術(shù)感知仍將保持其核心價(jià)值。

（上海視覺藝術(shù)學(xué)院）

參考文獻(xiàn)

[1] 杜雨，張孜銘．AIGC智能創(chuàng)作時(shí)代[M]．北京：中譯出版社，2023.

[2] 陳家洋．推薦算法與流媒體影視的算法文化[J]．電影藝術(shù)，2021（3）：153-160.