999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

風(fēng)格遷移、指令設(shè)計(jì)與“世界模擬器”

2024-05-02 00:00:00楊俊蕾

摘"" 要: 隨著生成式人工智能技術(shù)在機(jī)器監(jiān)督學(xué)習(xí)和對(duì)抗神經(jīng)網(wǎng)絡(luò)的推動(dòng)下不斷升級(jí),程序化算法對(duì)當(dāng)代藝術(shù)創(chuàng)作的影響也逐漸加大。回溯人工智能技術(shù)在作品生成方面的路徑與方法,有助于理解人工智能藝術(shù)不同于傳統(tǒng)藝術(shù)的新特征。通過(guò)細(xì)審藝術(shù)風(fēng)格遷移的技術(shù)迭代現(xiàn)象,可以發(fā)現(xiàn)人機(jī)交互界面上隱形存在的深層指令設(shè)計(jì)問(wèn)題。圍繞指令文本做出的無(wú)休止調(diào)整,在增強(qiáng)藝術(shù)創(chuàng)作的游戲化體驗(yàn)時(shí),迎來(lái)了動(dòng)態(tài)的涌現(xiàn)現(xiàn)象。作為世界模擬器之一的Sora模型,能夠部分地呈現(xiàn)運(yùn)動(dòng)中的物理世界,卻無(wú)法模擬情感動(dòng)態(tài),藝術(shù)杰作難以產(chǎn)出。

關(guān)鍵詞: AI藝術(shù);風(fēng)格遷移;指令設(shè)計(jì);世界模擬器;生成式AI;Sora;藝術(shù)涌現(xiàn)

中圖分類(lèi)號(hào):TP18"" 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-8634(2024)02-0056-(09)

DOI:10.13852/J.CNKI.JSHNU.2024.02.005

生成式AI是人工智能技術(shù)中的生產(chǎn)方式之一,核心能力在于“人工智能生成內(nèi)容”(AI Generated Content),簡(jiǎn)稱(chēng)AIGC。近年來(lái)在多個(gè)藝術(shù)領(lǐng)域里,包括圖像繪景、音樂(lè)作曲編曲、動(dòng)畫(huà)渲染與制作、2D或3D影視短片以及游戲設(shè)計(jì)等,常常能夠看到生成式AI深度應(yīng)用其中的身影,在應(yīng)用廣度上正向著藝術(shù)門(mén)類(lèi)全覆蓋快速發(fā)展。圍繞“AI藝術(shù)”(AI Arts)的探索與定義層出不窮,比較具有代表性的觀點(diǎn)來(lái)自列夫·馬諾維奇,“AI藝術(shù)指的是人類(lèi)對(duì)計(jì)算機(jī)進(jìn)行編程,使其具有相當(dāng)程度的自主性,創(chuàng)造出藝術(shù)界專(zhuān)業(yè)人士認(rèn)為屬于‘當(dāng)代藝術(shù)’的新藝術(shù)品或體驗(yàn)”。1 馬諾維奇特意在定義中突出了藝術(shù)核心概念中的“創(chuàng)造”(Create)屬性,旨在強(qiáng)調(diào)生成式AI技術(shù)的內(nèi)容新創(chuàng)一面。但在定義的另一方面,經(jīng)由計(jì)算機(jī)完成的程序編定與算法設(shè)計(jì),以及融合人機(jī)交互體驗(yàn)的動(dòng)態(tài)維度,都成了AI藝術(shù)不同于傳統(tǒng)藝術(shù)的新構(gòu)成。由此進(jìn)一步折射出,藝術(shù)領(lǐng)域中的AI技術(shù)所經(jīng)歷的技術(shù)開(kāi)發(fā)過(guò)程與核心工作原理其實(shí)潛在地反映了人工智能的產(chǎn)業(yè)發(fā)展變化。因此,有重點(diǎn)地回顧人工智能技術(shù)的發(fā)展與迭代,能夠更為準(zhǔn)確地把握AI藝術(shù)在技術(shù)遷變中逐漸形成的程序化特征。

一、機(jī)器邏輯、深度學(xué)習(xí)與類(lèi)腦神經(jīng)網(wǎng)絡(luò)系統(tǒng):AI技術(shù)更新中的藝術(shù)創(chuàng)造力迭代

在通常意義上,人工智能指的是“創(chuàng)造機(jī)器來(lái)執(zhí)行人需要智能才能完成的功能”。1 其概念初創(chuàng)于20世紀(jì)40年代,直接受到情報(bào)學(xué)和密碼學(xué)的啟發(fā)。1956年,人工智能在學(xué)界獲得正式命名,并對(duì)外公布了第一代弈棋程序和代數(shù)解題模型。隨后,圍繞機(jī)器翻譯、智能機(jī)器人的研究構(gòu)成了多家專(zhuān)業(yè)機(jī)構(gòu)的中心目標(biāo)。該階段的技術(shù)方案以邏輯理論為主體,在遞歸原理的基礎(chǔ)上進(jìn)行智能化程序設(shè)計(jì),經(jīng)過(guò)數(shù)十年的積累卻遲遲沒(méi)有推出可供大范圍應(yīng)用的通用型產(chǎn)品。技術(shù)的瓶頸期一方面導(dǎo)致人工智能行業(yè)的規(guī)模收縮,另一方面也為新一輪技術(shù)躍遷預(yù)備了賽道轉(zhuǎn)換的可能。

接下來(lái),20世紀(jì)80年代的人工智能研究逐漸集中在三個(gè)領(lǐng)域:計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和知識(shí)工程。借助專(zhuān)業(yè)計(jì)算機(jī)的硬件更新,以及實(shí)現(xiàn)了人機(jī)接口的自然語(yǔ)言軟件升級(jí),訓(xùn)練機(jī)器以完成深度學(xué)習(xí)任務(wù)的新技術(shù)思路構(gòu)成了AI社會(huì)化、公眾化的有效驅(qū)動(dòng)。一臺(tái)“會(huì)學(xué)習(xí)的機(jī)器”在智能程度上已經(jīng)足夠模擬小學(xué)生的水平,更重要的是引發(fā)了人們的普遍好奇:人工智能會(huì)勝過(guò)人類(lèi)智能嗎?AI會(huì)不會(huì)取代人的創(chuàng)作者位置?就像機(jī)器改變了部分體力勞動(dòng)的職業(yè)崗位,一直被視為人類(lèi)智慧結(jié)晶體的藝術(shù)創(chuàng)作是否將遇到相似的問(wèn)題?這些思考在類(lèi)腦神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展成熟后,益發(fā)顯得迫切。

類(lèi)腦神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)科學(xué)系統(tǒng)中的成型與建構(gòu)實(shí)現(xiàn)了人工智能技術(shù)的工程化。它有一個(gè)相對(duì)復(fù)雜的術(shù)語(yǔ)名稱(chēng):使用反向傳播算法訓(xùn)練出的多層神經(jīng)網(wǎng)絡(luò)。如果覺(jué)得這個(gè)術(shù)語(yǔ)太長(zhǎng)、太難、不易理解和不易記憶,那就把重點(diǎn)放在它的后續(xù)成果上:生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,縮寫(xiě)GANs),其中的“生成”二字正是當(dāng)前引發(fā)公眾熱烈討論的生成式AI的技術(shù)內(nèi)核。

大數(shù)據(jù)時(shí)代的到來(lái)為生成式對(duì)抗網(wǎng)絡(luò)的技術(shù)實(shí)現(xiàn)提供了必要的算力基礎(chǔ)和堪稱(chēng)龐大的數(shù)據(jù)規(guī)模,在生成式AI發(fā)展中繼續(xù)起到主干作用的機(jī)器學(xué)習(xí)不會(huì)再因?yàn)橛?xùn)練數(shù)據(jù)的缺乏而流于空談。從生成式AI別具一格的算法模型來(lái)看,博弈論中的“零和游戲”(Zero-sum Game)在根本上提供了數(shù)理創(chuàng)新的技術(shù)思路。它模仿人類(lèi)智能中的“非此即彼”勝負(fù)游戲,在算法模型中構(gòu)建出兩個(gè)類(lèi)腦神經(jīng)網(wǎng)絡(luò),并讓二者持續(xù)不斷地相互競(jìng)爭(zhēng)。其中一方叫作“生成器網(wǎng)絡(luò)”,任務(wù)是不斷捕捉和訓(xùn)練學(xué)習(xí)庫(kù)中的數(shù)據(jù),源源不斷地產(chǎn)出新的樣本;另一方叫作“判別器網(wǎng)絡(luò)”,它要根據(jù)相關(guān)的數(shù)據(jù)標(biāo)準(zhǔn)去判別前者提供的樣本,幫助前者,或者說(shuō)迫使前者修改技術(shù)參數(shù),從原有數(shù)據(jù)中產(chǎn)出更加符合判斷標(biāo)準(zhǔn)的全新內(nèi)容。

與其他數(shù)理邏輯下的智能程序相比,生成式AI的算法復(fù)雜度并不艱深,主要是通過(guò)模仿人腦的機(jī)制來(lái)識(shí)別對(duì)象,包括圖像、聲音和文本。當(dāng)人腦辨識(shí)物體的時(shí)候,會(huì)判斷對(duì)象的屬性,并歸納出類(lèi)型風(fēng)格。同樣,深度學(xué)習(xí)的目標(biāo)任務(wù)是讓機(jī)器學(xué)習(xí)變得更有效率,在超大型的數(shù)據(jù)庫(kù)中獲得樣本基礎(chǔ),又在對(duì)象識(shí)別的工作流程中做出飛速的計(jì)算、比對(duì)。經(jīng)過(guò)判別器給出海量次數(shù)的排錯(cuò)之后,生成器最終得以輸出具有最高兼容性的新內(nèi)容,快速而成功地響應(yīng)用戶(hù)在程序啟動(dòng)時(shí)的提示指令。

上述技術(shù)思路在2014年至2015年之間提出,有效地促使機(jī)器學(xué)習(xí)的產(chǎn)出成果向著人類(lèi)所希望的方向邁進(jìn),在較短時(shí)間內(nèi)鋪展運(yùn)用到多個(gè)領(lǐng)域,其中尤為亮眼的開(kāi)發(fā)當(dāng)屬藝術(shù)方面的場(chǎng)景應(yīng)用與內(nèi)容生成。在藝術(shù)領(lǐng)域中,生成式AI的學(xué)習(xí)對(duì)象最初是由杰出藝術(shù)家的經(jīng)典作品構(gòu)成的。在反復(fù)處理原始數(shù)據(jù)的過(guò)程中,鮮明的風(fēng)格特點(diǎn)被提取出來(lái),由人工完成數(shù)據(jù)標(biāo)注,為下一階段的新內(nèi)容生成構(gòu)建起標(biāo)志明確的共同肌理,一鍵式實(shí)現(xiàn)由藝術(shù)原作到AI作品的風(fēng)格遷移(Style Transfer)。來(lái)自機(jī)器學(xué)習(xí)領(lǐng)域的神經(jīng)風(fēng)格遷移算法標(biāo)志著生成式AI在學(xué)理進(jìn)化方面獲得的實(shí)驗(yàn)室成就,相應(yīng)地,應(yīng)用于藝術(shù)范圍的風(fēng)格遷移逐漸擴(kuò)張,在圖像修改、動(dòng)畫(huà)生成和APP開(kāi)發(fā)等方面成為場(chǎng)景構(gòu)建的高頻手段。通過(guò)反溯風(fēng)格遷移得以運(yùn)行的算法理路,有助于理解人工智能藝術(shù)作為當(dāng)代藝術(shù)代表之一的特性改變。比如,傳統(tǒng)藝術(shù)價(jià)值對(duì)于藝術(shù)家作品的目的追求如何在程序化調(diào)節(jié)中潛在地偏向了過(guò)程體驗(yàn),而本身帶有過(guò)程性的藝術(shù)創(chuàng)作又是如何在超高速運(yùn)行的程序推演中稀釋了審美的凝神靜觀,甚而在無(wú)數(shù)的“瞬時(shí)”疊加中改寫(xiě)乃至湮滅了對(duì)于藝術(shù)創(chuàng)作殊為重要的“決定性頃刻”。

二、圖像風(fēng)格遷移:從機(jī)器監(jiān)督學(xué)習(xí)和對(duì)抗神經(jīng)網(wǎng)絡(luò)的階段試驗(yàn)品到創(chuàng)新性?xún)?nèi)容生成

深度學(xué)習(xí)(Deep Learning)的概念雛形來(lái)自英國(guó)密碼學(xué)家阿倫·圖靈在《計(jì)算機(jī)器與智能》中提出的兒童機(jī)(Child Machine),制造并訓(xùn)練智能機(jī)器來(lái)模擬“兒童心靈程序”,再將其融入“教育過(guò)程”,以便順利進(jìn)入“教機(jī)器學(xué)習(xí)的過(guò)程”。1 在機(jī)器監(jiān)督學(xué)習(xí)的技術(shù)條件成熟后,卷積神經(jīng)網(wǎng)絡(luò)的類(lèi)腦運(yùn)算為編寫(xiě)圖形矩陣提供了更為細(xì)分和多層的程序語(yǔ)言。

當(dāng)圖像識(shí)別作為新的任務(wù)加載進(jìn)入機(jī)器學(xué)習(xí),起初的服務(wù)對(duì)象是決策式AI,而非在后來(lái)大行其道的生成式AI。前者對(duì)于學(xué)習(xí)對(duì)象的程序處理相對(duì)復(fù)雜,在應(yīng)用層面上屬于專(zhuān)業(yè)領(lǐng)域內(nèi)的認(rèn)知型輔助,人機(jī)協(xié)作的行動(dòng)結(jié)果更注重達(dá)到近乎人的模擬性,由此為用戶(hù)提供可信、可靠的決策支持。它和生成式AI擁有相仿的技術(shù)路徑和不同的應(yīng)用方向,在技術(shù)的成熟程度上也有所差異。AI技術(shù)在商業(yè)和藝術(shù)之間的分流應(yīng)用也在此發(fā)生。

滿(mǎn)足決策商用意圖的AI技術(shù)路徑需要分辨數(shù)據(jù)類(lèi)型并做出明確的標(biāo)注,構(gòu)架其中的底層技術(shù)相對(duì)穩(wěn)定且成熟,易于投放在多類(lèi)別的商業(yè)場(chǎng)景中,如基于人臉識(shí)別系統(tǒng)的后臺(tái)用戶(hù)畫(huà)像、自動(dòng)駕駛和風(fēng)險(xiǎn)控制等。然而,生成式AI卻表現(xiàn)出另一種面目,即便不夠成熟,卻還是加速變化,并且將人機(jī)交互中的程序算法編寫(xiě)快速迭代,在互為開(kāi)放的圖集訓(xùn)練網(wǎng)絡(luò)基礎(chǔ)上,頻頻推出具有全球爆款效應(yīng)的現(xiàn)象級(jí)應(yīng)用。生成式AI在機(jī)器學(xué)習(xí)完成了大規(guī)模預(yù)訓(xùn)練之后,進(jìn)一步延伸出創(chuàng)新性?xún)?nèi)容輸出的維度。單從外觀來(lái)看,就像藝術(shù)家創(chuàng)作出世間從未有過(guò)的那幅畫(huà)、那首歌一樣,生成式AI在分析歸納、提取融合海量的數(shù)據(jù)后,再通過(guò)反卷積操作,源源不斷地將云存儲(chǔ)中的數(shù)字組合再度形象化、圖像化、藝術(shù)化,生成分屬于不同藝術(shù)類(lèi)別的內(nèi)容。這種技術(shù)路徑顯然不同于決策式AI,其應(yīng)用場(chǎng)景也主要涉及藝術(shù)類(lèi)的“內(nèi)容創(chuàng)作、人機(jī)交互、產(chǎn)品設(shè)計(jì)等”。2

換到藝術(shù)創(chuàng)作的視角加以衡量,來(lái)自決策式AI技術(shù)的圖像識(shí)別與處理并未達(dá)到藝術(shù)的“上手狀態(tài)”,畢竟藝術(shù)創(chuàng)作中的“用具”或取做“標(biāo)志”的東西“唯通過(guò)它的上手狀態(tài)才能成為可通達(dá)的”。3 對(duì)照風(fēng)格遷移的早期程序指令來(lái)看,僅僅為了提取圖片中的輪廓、紋理,就需要手寫(xiě)出較為復(fù)雜的針對(duì)性算法。接下來(lái)為了將上一步成果的視覺(jué)顯現(xiàn)進(jìn)行加粗、加重,還需要設(shè)置人為的矩陣,把新的紋理“合成”到另外的圖形或圖像上。更為繁難的步驟在于,如果還有其他的別樣風(fēng)格新加進(jìn)來(lái),也需要抽取與操作,則上述流程需要重新設(shè)計(jì)一遍。該流程隨著卷積神經(jīng)網(wǎng)絡(luò)在AI技術(shù)中的下沉應(yīng)用而終結(jié)。

由于神經(jīng)卷積網(wǎng)絡(luò)能夠在每一個(gè)網(wǎng)絡(luò)層次上重復(fù)進(jìn)行圖像元素的抽取,意味著在程序設(shè)計(jì)中無(wú)須另外附加手寫(xiě)程序,而是可以根據(jù)監(jiān)督學(xué)習(xí)后的梯度下降,自動(dòng)地調(diào)動(dòng)抽取功能。著名的物體特征提取器VGG19標(biāo)志著網(wǎng)絡(luò)識(shí)別系統(tǒng)的精度里程碑,使機(jī)器學(xué)習(xí)成為圖像識(shí)別與風(fēng)格遷移的主干通道。VGG是Visual Geometry Group(視覺(jué)幾何組)的縮寫(xiě),數(shù)字19意味著有19層網(wǎng)絡(luò),包括16層卷積層和3層全連接層。小的模塊組成了大網(wǎng)絡(luò),每一層卷積是一個(gè)矩陣,經(jīng)過(guò)非線(xiàn)性的幾何變換,再經(jīng)過(guò)降維操作,由類(lèi)似“三明治”的卷積結(jié)構(gòu)過(guò)濾掉一些信息。圖畫(huà)的信息就像通過(guò)了連續(xù)設(shè)置的“過(guò)濾器”,從一幅大的圖像,有序遞歸變?yōu)樾〉模瑓s又是增厚的方塊。4

以VGG19建構(gòu)的卷積濾鏡為例可以看到,算法驅(qū)動(dòng)下的圖像識(shí)別從原圖的圖像特征起步,按照先行的規(guī)定進(jìn)行有針對(duì)性的提取,如先提取出色彩部分。線(xiàn)程任務(wù)完成后,再切換到其他算法通道(Channel),亦即計(jì)算機(jī)可執(zhí)行的程序指令。通過(guò)構(gòu)建比“色彩”更加有效的其他規(guī)定,組成一組新的三角函數(shù)。原初圖像經(jīng)過(guò)多次的模塊迭代,像素的數(shù)量級(jí)已經(jīng)變得非常小,然而劃分原圖的“特征”數(shù)量卻在積的基礎(chǔ)上成倍增多。整個(gè)過(guò)程就是類(lèi)腦神經(jīng)網(wǎng)絡(luò)的工作,先給圖像做標(biāo)識(shí),再經(jīng)過(guò)多層卷積,某一個(gè)物的圖像最終被編寫(xiě)為一個(gè)數(shù)字符號(hào)。經(jīng)過(guò)特征提取后的向量在神經(jīng)網(wǎng)絡(luò)間層層傳遞,變?yōu)樾碌奶卣飨蛄浚⑹顾ㄓ茫蔀橄乱徊斤L(fēng)格遷移的基礎(chǔ)。

通用的、可遷移的風(fēng)格是反卷積階段的產(chǎn)出。其技術(shù)原理在于,通過(guò)視覺(jué)符號(hào)的前期設(shè)定與識(shí)別達(dá)成,刺激網(wǎng)絡(luò)神經(jīng)元放電,產(chǎn)生大的輸出量,由此標(biāo)注出第一層網(wǎng)絡(luò)偏好的元素,如線(xiàn)條;第二層網(wǎng)絡(luò)偏好,如圖形;第三層網(wǎng)絡(luò)偏好,如紋理;直到網(wǎng)絡(luò)神經(jīng)元出現(xiàn)對(duì)于具體物像的偏好。接下來(lái)的程序設(shè)計(jì)則利用了遷移學(xué)習(xí),借由巧妙設(shè)計(jì)損失函數(shù)來(lái)具體實(shí)現(xiàn)風(fēng)格遷移的通用程度。在該階段,作為機(jī)器學(xué)習(xí)對(duì)象的經(jīng)典畫(huà)作輸入卷積網(wǎng)絡(luò),經(jīng)過(guò)多層擠壓、揉碎,網(wǎng)絡(luò)神經(jīng)元根據(jù)偏好再做不同的輸出。以上這些不同的輸出又通過(guò)函數(shù)恢復(fù)成為不同的樣子,視像因此發(fā)生大的改變,內(nèi)容基本被忽視,留下的是色系、色調(diào)、線(xiàn)條、構(gòu)圖等形式風(fēng)格的視覺(jué)元素。整個(gè)過(guò)程可以被概括描述為:目標(biāo)圖像被導(dǎo)入機(jī)器學(xué)習(xí),大量的神經(jīng)元就此做出基于偏好設(shè)置的輸出,主內(nèi)容被忽視,而風(fēng)格成為獨(dú)立被提取的變量。

按照馬洛維奇對(duì)AI藝術(shù)的理解,計(jì)算機(jī)成為藝術(shù)家的用具,先鋒派的美學(xué)策略被納入“計(jì)算機(jī)軟件的指令和交互界面隱喻”1中。實(shí)現(xiàn)風(fēng)格遷移也就意味著用數(shù)學(xué)計(jì)算來(lái)程序化地度量?jī)?nèi)容,作品被轉(zhuǎn)碼為深層網(wǎng)絡(luò)里的圖像空間,而不再依靠人的主觀智識(shí)去感受和闡釋藝術(shù)作品。需要注意的人機(jī)差異是,在類(lèi)人模仿的機(jī)器視覺(jué)中,圖像由可計(jì)算的像素組成。在空間物理學(xué)的意義上,一個(gè)像素就是一個(gè)點(diǎn)的實(shí)際存在。這個(gè)點(diǎn)進(jìn)入網(wǎng)絡(luò)空間以后,則又復(fù)歸成為一個(gè)向量、一個(gè)二維曲面上的點(diǎn)。進(jìn)一步進(jìn)行模擬空間的想象就可以發(fā)現(xiàn):機(jī)器學(xué)習(xí)的圖像與其說(shuō)是藝術(shù)作品,不如說(shuō)更近似于地形測(cè)繪圖,圖中內(nèi)容相近則距離相近,內(nèi)容相遠(yuǎn)則距離相遠(yuǎn)。只要正確定義了一個(gè)平面上的距離,就可以在相應(yīng)的程序編制內(nèi)反映出高維空間中兩個(gè)點(diǎn)之間的距離。故而,兩張圖像在高維空間中作為兩個(gè)點(diǎn)之間的距離,就可以被理解為度量二者間差距的函數(shù)。因?yàn)樵摵瘮?shù)表現(xiàn)的是圖像間的差距,所以被稱(chēng)為損失函數(shù),對(duì)損失函數(shù)進(jìn)行“好的巧妙設(shè)計(jì)”關(guān)系實(shí)時(shí)決策反應(yīng)和“取勝幾率”。2 只要在后續(xù)設(shè)計(jì)中將這個(gè)損失函數(shù)變得越來(lái)越小,就意味著輸出者能夠使一張圖越來(lái)越像另一張圖,從而在圖像生成中實(shí)現(xiàn)內(nèi)容優(yōu)化。

風(fēng)格遷移在此基礎(chǔ)上進(jìn)一步加大了難度,繼續(xù)使用數(shù)學(xué)算法來(lái)捕捉無(wú)內(nèi)容的風(fēng)格。其思路在于如何用可計(jì)算的設(shè)計(jì)來(lái)測(cè)量風(fēng)格,找到圖像中相似的性質(zhì),亦即圖像通道中的統(tǒng)計(jì)特性——表現(xiàn)為統(tǒng)計(jì)學(xué)意義上的“共同出現(xiàn)”,實(shí)質(zhì)在于各元素之間的“相關(guān)性”。3 算法設(shè)計(jì)不是像上一步驟那樣測(cè)量并計(jì)算圖像元素間的幾何距離,而是調(diào)整為計(jì)算統(tǒng)計(jì)的相關(guān)性,為風(fēng)格遷移打下基礎(chǔ)。

在圍繞統(tǒng)計(jì)特性的程序設(shè)計(jì)中,重新定義一個(gè)矩陣是必要的。矩陣中的一個(gè)層次對(duì)應(yīng)著一個(gè)特征,通過(guò)提取新的積來(lái)表現(xiàn)新特征,繼而再計(jì)算不同的積之間的相關(guān)性,以便完全實(shí)現(xiàn)用數(shù)學(xué)度量風(fēng)格的目的。在矩陣中得到兩兩相關(guān)性組成的數(shù)值,就把帶有主觀判斷的風(fēng)格感受度量為可統(tǒng)計(jì)的數(shù)值之間的相關(guān)性。根據(jù)統(tǒng)計(jì)特性的數(shù)理規(guī)律,數(shù)值接近則矩陣相似,從而風(fēng)格也更加接近。換言之,遷移學(xué)習(xí)是調(diào)動(dòng)已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)參數(shù),在對(duì)兩個(gè)圖像進(jìn)行風(fēng)格遷移的算法設(shè)計(jì)中,只需要讓各自特征的相關(guān)性在統(tǒng)計(jì)特性上達(dá)到相近就是可行的。

進(jìn)一步來(lái)看,在風(fēng)格遷移基礎(chǔ)上繼續(xù)生成一個(gè)新的圖像,不僅要把內(nèi)容和風(fēng)格結(jié)合在一起,做到內(nèi)容素材與風(fēng)格特性相匹配,而且需要繼續(xù)進(jìn)行計(jì)量,測(cè)算出相對(duì)于要達(dá)到的風(fēng)格的那張圖像的距離,制定出優(yōu)化目標(biāo),通過(guò)程序編寫(xiě)來(lái)實(shí)現(xiàn)具體的針對(duì)性。如此一來(lái),即便原初圖像是任意的、隨機(jī)的,甚至在信息學(xué)的意義上是“噪聲”的,也能夠?qū)⑺c目標(biāo)圖像實(shí)現(xiàn)合并,其中的得力工具正是風(fēng)格遷移。作為一個(gè)應(yīng)用場(chǎng)景日益普遍的算法工具,風(fēng)格遷移不對(duì)圖像本身做任何預(yù)先要求,也不強(qiáng)調(diào)甄別初始圖像的來(lái)源、性質(zhì)及未來(lái)用途,而且對(duì)于用戶(hù)體驗(yàn)來(lái)說(shuō),操作越來(lái)越簡(jiǎn)便,指令設(shè)計(jì)越來(lái)越接近自然語(yǔ)言邏輯,且結(jié)果生成和輸出的速度大大縮短。

三、人機(jī)交互過(guò)程中的指令非人化與指令文本的無(wú)休止調(diào)整

如圖1所示,風(fēng)格遷移有效地聯(lián)結(jié)并處理了三種圖像之間的關(guān)系:內(nèi)容圖、風(fēng)格圖和生成的圖片。

(楊俊蕾、鄭丹路制圖)

一般來(lái)說(shuō),經(jīng)典之作常常被作為導(dǎo)出特征的風(fēng)格圖,而內(nèi)容圖大多來(lái)自用戶(hù)的自攝圖片,經(jīng)過(guò)一鍵式的風(fēng)格遷移操作,在接收端獲得仿效大師筆觸的生成圖片。以注冊(cè)量較大的AI繪畫(huà)生成器Deepart.io為例,用戶(hù)只需要三個(gè)步驟就能獲得幾乎是隨心所欲的風(fēng)格:上傳素材(Upload Photo),選定風(fēng)格(Choose Style),一鍵提交(Submit)。嚴(yán)格來(lái)說(shuō),經(jīng)此操作生成的圖片結(jié)果與真正的藝術(shù)作品相去甚遠(yuǎn),原因在于其中不包含藝術(shù)創(chuàng)作所必需的創(chuàng)新性,更多的只是風(fēng)格遷移帶來(lái)的外觀變化。這也是為什么由谷歌DeepMind在開(kāi)源了AI圖像程序DeepDream之后,雖然通過(guò)成熟的風(fēng)格遷移達(dá)成了用戶(hù)照片的繪畫(huà)化,卻在后續(xù)的成品展示中選擇了燈箱(Light Box)作為基本媒介,與提供遷移元素的風(fēng)格圖之間存在著介質(zhì)上的巨大差異。導(dǎo)致這個(gè)差異產(chǎn)生的根本原因有兩個(gè)方面:藝術(shù)的與技術(shù)的。其中,藝術(shù)方面的問(wèn)題是,計(jì)算機(jī)在屏幕上生成的風(fēng)格遷移圖像是后置光源,不適合人們習(xí)以為常的實(shí)在空間里的審美觀照。在技術(shù)方面,則是泛化應(yīng)用的風(fēng)格遷移過(guò)度稀釋了圖像特性,既造成了內(nèi)容損失,也影響后續(xù)的感知損失。生成式AI技術(shù)對(duì)此的解決辦法是提供另一種合成方式,即通過(guò)對(duì)抗生成網(wǎng)絡(luò)來(lái)掌握新內(nèi)容的生成模式。

和上文提到的風(fēng)格遷移前兩個(gè)階段不同,有對(duì)抗生成網(wǎng)絡(luò)加入之后的生成式AI在很大程度上提高了出品的創(chuàng)新性。代表性例證之一是名為Obvious的法國(guó)三人藝術(shù)小組,他們?cè)?018年完成并成功拍賣(mài)出高昂價(jià)格的作品《貝拉米家族的愛(ài)德蒙肖像》(Edmond de Belamy),既順利使用了GANs對(duì)藝術(shù)史中的貴族肖像進(jìn)行深度學(xué)習(xí),又成功驅(qū)動(dòng)了程序員羅比·巴萊特(Robbie Barret)編寫(xiě)并公布在GitHub上的開(kāi)源代碼,連帶驅(qū)動(dòng)了機(jī)械打印給畫(huà)布完成上色環(huán)節(jié)。圍繞這幅畫(huà)作有很多爭(zhēng)議,然而眾說(shuō)紛紜、矛盾叢生的輿論反應(yīng)恰恰是藝術(shù)活動(dòng)中的涌現(xiàn)現(xiàn)象。無(wú)論是題名中的致敬,還是對(duì)古典主義貴族肖像畫(huà)的選材、戲仿與風(fēng)格遷移后的虛擬生成,都成為AI藝術(shù)歷程中的標(biāo)志性事件。自此之后,在藝術(shù)創(chuàng)作的作者位置中有了機(jī)器與程序的一席之地,正像該畫(huà)作在常規(guī)的簽名位置里,石破天驚地寫(xiě)下了一串運(yùn)算代碼:“min G max D x[log(D(x))] + z[log(1–D(G(z)))]。”1 那是整個(gè)系列畫(huà)作得以出現(xiàn)的數(shù)值函數(shù)語(yǔ)言,也是AI工程師為程序運(yùn)行開(kāi)發(fā)的編碼。

不可否認(rèn),風(fēng)格遷移為人類(lèi)視覺(jué)編碼提供了新的可探索路徑。在純屬虛構(gòu)的貝拉米家族譜系圖的訓(xùn)練與生成過(guò)程中,卷積操作變?yōu)榉崔D(zhuǎn)卷積。通過(guò)訓(xùn)練一個(gè)網(wǎng)絡(luò)來(lái)進(jìn)行作品準(zhǔn)備,不再僅僅為每一張圖像進(jìn)行優(yōu)化處理,而是在一個(gè)網(wǎng)絡(luò)集合中進(jìn)行監(jiān)督學(xué)習(xí)。經(jīng)過(guò)再次反轉(zhuǎn)的卷積過(guò)程,由變化得到向量,反抽象的數(shù)學(xué)符號(hào)反過(guò)來(lái)在深層生成了圖像。風(fēng)格遷移在經(jīng)過(guò)技術(shù)迭代后,既可以輕松地將一張或者一類(lèi)圖像的風(fēng)格遷移到其他圖像上,還可以利用圖像編碼進(jìn)行多線(xiàn)程復(fù)雜任務(wù),甚至是直接應(yīng)用已經(jīng)訓(xùn)練好的大公司網(wǎng)絡(luò)產(chǎn)品,通過(guò)合理而巧妙的重新設(shè)計(jì)損失函數(shù)來(lái)達(dá)到目的不一的特定效果,由此來(lái)加強(qiáng)文化藝術(shù)的工業(yè)應(yīng)用,包括且不限于動(dòng)畫(huà)片制作、輔助藝術(shù)創(chuàng)作和圖像類(lèi)APP的開(kāi)發(fā)等。然而需要注意的是,并不是每個(gè)應(yīng)用者都有能力編寫(xiě)出直接輸入機(jī)器的程序指令。真正的現(xiàn)實(shí)恰恰相反,現(xiàn)代技術(shù)最終還是需要落實(shí)到按鍵操作的應(yīng)用層,并以激發(fā)應(yīng)用層的創(chuàng)造力作為核心任務(wù)。隨著應(yīng)用層的創(chuàng)造力趨向成熟,AIGC時(shí)代里的人機(jī)交互也更多地經(jīng)由指令加以連接。指令設(shè)計(jì)因此成了新的藝術(shù)密碼,作為藝術(shù)家獨(dú)有的靈感思維與創(chuàng)作技能,被有意地隱藏在內(nèi)容生成的背后。

2022年,一幅名為《太空歌劇院》(Théatre D’opéra Spatial)的數(shù)碼制圖問(wèn)鼎了美國(guó)某賽事的數(shù)字類(lèi)別一等獎(jiǎng)。這一次的作者署名位置上不再只有一行代碼,而是表現(xiàn)出人機(jī)協(xié)作的交互方式,AIGC繪圖生成工具在前,編寫(xiě)并輸入指令的人在后——“Artist:Midjourney, using a prompt by Jason M. Allen”。需要指明的是,美國(guó)版權(quán)局審查委員會(huì)(the US Copyright Office Review Board)拒絕了人機(jī)聯(lián)合署名對(duì)作品版權(quán)的主張,對(duì)“非人類(lèi)創(chuàng)作”的作品不予知識(shí)產(chǎn)權(quán)保護(hù)。除此之外,還有一些異樣的變化在提示AI藝術(shù)不同于傳統(tǒng)藝術(shù)。

獲獎(jiǎng)?wù)呓苌ぐ瑐愲m然公開(kāi)了這幅作品在定稿之前的修改草圖,也公布了另外幾幅同樣使用Midjourney生成的同名畫(huà)作,卻始終不肯公布他在該畫(huà)作的生成過(guò)程中究竟設(shè)計(jì)了怎樣的指令,以及他是如何在一次次的主題圖像生成后對(duì)指令進(jìn)行文本內(nèi)容調(diào)整的。根據(jù)當(dāng)時(shí)的新聞采訪可以知道,他在調(diào)整中一共使用了“624個(gè)文本指令和輸入修訂”。1

有過(guò)AI制圖經(jīng)驗(yàn)的人都知道,人機(jī)交互界面中的指令輸入與調(diào)整不亞于一場(chǎng)投射在公屏上的大腦思索。無(wú)論是偏工具屬性的Midjourney,還是擴(kuò)散模型Stable Diffusion,抑或是集成了ChatGPT自語(yǔ)言處理系統(tǒng)的DAII·E3,用戶(hù)在對(duì)話(huà)框正式開(kāi)啟之前都會(huì)有不止一次的文本指南出現(xiàn),提醒習(xí)慣了與人交流的使用者們,面對(duì)機(jī)器,一定要降低指令語(yǔ)言中的屬人特征,用簡(jiǎn)潔、清晰、明快、短小的直接語(yǔ)句構(gòu)成指令,而不是相反。機(jī)器理解想要獲得的是描述明確的任務(wù),而不是真的人機(jī)問(wèn)答。任何委婉的、曲折的、含蓄的,甚至是包含常見(jiàn)禮貌用語(yǔ)的語(yǔ)句都不利于人機(jī)交流,指令內(nèi)容的非人化構(gòu)造反而可以更為高效而準(zhǔn)確地抵達(dá)機(jī)器理解,實(shí)現(xiàn)用戶(hù)意圖。究其實(shí)質(zhì),人類(lèi)用戶(hù)在自以為對(duì)AI工具發(fā)出指令之前,其實(shí)已經(jīng)預(yù)先接受了來(lái)自程序編纂者的前期指令導(dǎo)入。所謂天馬行空般的自由想象在啟動(dòng)伊始已經(jīng)被框定上了隱形的指令邏輯與結(jié)構(gòu),再次表明技術(shù)社會(huì)中的人之主體力量,在藝術(shù)活動(dòng)中漸漸消散了具有“在手狀態(tài)”的手藝和工藝,轉(zhuǎn)而更大規(guī)模地使用“上手的工具”。與此相關(guān)的代價(jià)則是,人類(lèi)用戶(hù)將自身思維部分地機(jī)器化,無(wú)休止的指令文本調(diào)整潛在地阻礙了作品創(chuàng)生的靈感思維。對(duì)藝術(shù)而言,非常重要的“決定性頃刻”因指令的反復(fù)修正和文本調(diào)整而逐漸耗散動(dòng)人心弦的激情內(nèi)蘊(yùn),注重獨(dú)特體驗(yàn)的審美契機(jī)在游戲化的人機(jī)交互體驗(yàn)中隱沒(méi)不彰,傳統(tǒng)藝術(shù)視作根本追求的偉大杰作也因此在AI藝術(shù)中不可企及。

四、“世界模擬器”中的“藝術(shù)涌現(xiàn)”與“杰作消失”

生成式AI進(jìn)入藝術(shù)領(lǐng)域后,多模態(tài)之間的跨媒介理解與融合產(chǎn)出在視覺(jué)影像方面的應(yīng)用,成為在整個(gè)世界面前的技術(shù)焦點(diǎn)。從文本提示語(yǔ)的編輯輸入到靜態(tài)的單幀圖像輸出,甚至是時(shí)長(zhǎng)一分鐘以?xún)?nèi)的短視頻直接生成,分屬于不同研發(fā)機(jī)構(gòu)的人工智能模型正在加速彼此間的競(jìng)爭(zhēng),先后推出用戶(hù)端大模型應(yīng)用。其中,谷歌旗下的Genie與OpenAI最新開(kāi)放的Sora作為“世界模擬器”(World Stimulations)的模型代表,旨在合成可操控的虛擬世界。

2024年2月15日,OpenAI的官網(wǎng)頁(yè)面推出了“文本創(chuàng)生視頻”(Creating Video from Text)的新模型介紹,“根據(jù)文本指令就能創(chuàng)生出真實(shí)的和想象的場(chǎng)景”。1 同樣在這個(gè)域名界面上,2023年3月14日發(fā)布的是ChatGPT 4的技術(shù)公告。當(dāng)時(shí)帶給世人們的震驚至今余緒猶存。僅僅三百多個(gè)日夜之后,加速涌現(xiàn)的圖形與視頻AI工具又一次做到了技術(shù)躍遷,將風(fēng)格遷移的指令化操作更為順暢地內(nèi)置于擴(kuò)散模型,并且實(shí)現(xiàn)了AI技術(shù)內(nèi)部的自我完善,具體優(yōu)化的恰恰是上文第三部分討論的“指令非人化”“指令文本調(diào)整”等問(wèn)題。

DALL·E 3是OpenAI開(kāi)發(fā)的文生圖模型(Text to Images),其應(yīng)用插件中有一個(gè)“重新命題”(Re-captioning)的新增功能。該功能吸收了Midjourney應(yīng)用場(chǎng)景中的人機(jī)協(xié)作方法,名為“縮短”(Shorten)的內(nèi)插有效幫助人類(lèi)用戶(hù)將指令文本的編輯傾向機(jī)器思維。另外,由DALL·E 3開(kāi)放應(yīng)用后積累的訓(xùn)練樣本被用作跨模型提高的工具。Sora的文本素材也不再是單純的人機(jī)二元構(gòu)成,而是進(jìn)一步減少人類(lèi)思維含量的AI程序自我疊加。根據(jù)技術(shù)報(bào)告給出的參數(shù)可見(jiàn),如果Sora得到的指令是較為簡(jiǎn)單的描述詞,模型收到后會(huì)自動(dòng)加以擴(kuò)寫(xiě),在局部的、物理的、合邏輯的等維度進(jìn)行補(bǔ)充,達(dá)到高質(zhì)量后再交由模型的執(zhí)行程序,繼而生成內(nèi)容輸出。經(jīng)過(guò)語(yǔ)言模型對(duì)文本描述的高質(zhì)量提升,視覺(jué)圖像的生成性能與視頻輸出的整體質(zhì)量都顯著提高。

Sora的技術(shù)表現(xiàn)讓圍繞在風(fēng)格遷移與指令設(shè)計(jì)上的問(wèn)題進(jìn)一步導(dǎo)向人機(jī)關(guān)系的深層討論。就藝術(shù)領(lǐng)域而言,生成式AI真的有創(chuàng)造力嗎?高速而大量的程序化生成內(nèi)容中是否有真正的杰作?關(guān)于前一個(gè)問(wèn)題的討論需要進(jìn)一步收集人機(jī)協(xié)作過(guò)程中的行為主義參數(shù),接下來(lái)的討論重點(diǎn)在于,作為“世界模擬器”的Sora模型是否有可能在未來(lái)產(chǎn)出堪稱(chēng)杰作的藝術(shù)內(nèi)容。

“杰作”的概念在表面上意味著超群、出色、特別好,實(shí)際上還暗喻著創(chuàng)作者與作品之間不可分割的共在關(guān)系,即“大師之作”(Masterpiece)。杰作思維是生成式人工智能在藝術(shù)領(lǐng)域中得以運(yùn)行的基本邏輯,第一批投喂給圖像模型的作品數(shù)據(jù)來(lái)自藝術(shù)史上公認(rèn)的大師杰作,如凡·高、倫勃朗、野獸派、浮世繪等。那些為人熟知的大師杰作在一定程度上已經(jīng)成為人類(lèi)藝術(shù)的共同財(cái)富,致使提供給生成式AI進(jìn)行深度學(xué)習(xí)的時(shí)候能夠有效規(guī)避版權(quán)風(fēng)險(xiǎn)。同時(shí),風(fēng)格突出、辨識(shí)度高的杰作有利于程序語(yǔ)言對(duì)其進(jìn)行拆分和重組,使風(fēng)格遷移成為可行的技術(shù),就像后人對(duì)前輩作品風(fēng)格的學(xué)習(xí)可以各選精要。譬如南北朝畫(huà)家陸探微的一筆畫(huà)既有秀麗之姿,又有潤(rùn)媚之妙,“顧得其神,陸得其骨,張得其肉”。2

從學(xué)習(xí)杰作開(kāi)始的AIGC能夠繼續(xù)產(chǎn)出杰作嗎?在2018年的“貝拉米”系列肖像中這個(gè)問(wèn)題基本不會(huì)進(jìn)入視野。即便是最寬容的技術(shù)樂(lè)觀主義者,也不能將那些輪廓邊界不清晰、通體由大色塊構(gòu)成的噴涂作品劃入藝術(shù)創(chuàng)作的領(lǐng)域,更不可能與“杰作”產(chǎn)生瓜葛。然而,目前Sora可以達(dá)到的動(dòng)態(tài)世界模擬程度再度震動(dòng)了藝術(shù)行業(yè)。它所實(shí)現(xiàn)的跨模態(tài)融合,以及對(duì)于“運(yùn)動(dòng)中的物理世界”的理解和模擬,在一定程度上幫助人們實(shí)現(xiàn)了與現(xiàn)實(shí)世界的互動(dòng)。人工智能藝術(shù)中內(nèi)容涌現(xiàn)與杰作消失的問(wèn)題需要繼續(xù)加以思考。

事實(shí)上,只需使用任意一種AI模型進(jìn)行藝術(shù)領(lǐng)域內(nèi)的內(nèi)容生成,對(duì)于“涌現(xiàn)”一詞的感受就是直觀而難忘的。在文生圖模型的程序運(yùn)轉(zhuǎn)中,一幅圖像的顯影方式是涌現(xiàn)生成的,在視覺(jué)過(guò)程中完全不同于人類(lèi)藝術(shù)家的作圖方式。由風(fēng)格遷移完成的圖像生成意味著典型的平均行為,“整個(gè)模型的行為可以看作是這些平均行為的組合”。1 一種均質(zhì)化的全同操作將圖像因素解析為同一種算法格式。被算法切分計(jì)算的藝術(shù)家是誰(shuí)已經(jīng)不重要,無(wú)論是凡·高或者倫勃朗,抑或是畢加索,只要他們作品中的風(fēng)格要素能夠以形式分層的編碼做出標(biāo)注,經(jīng)過(guò)文本指令轉(zhuǎn)換后再次輸出的圖像內(nèi)容就會(huì)無(wú)限地涌現(xiàn)出類(lèi)似的風(fēng)格,一幅接著一幅,彼此間的相似度極高。如果指令設(shè)計(jì)針對(duì)圖像中的某些部分做出調(diào)整,新生成出來(lái)的圖像就成為另一種均質(zhì)的系列形態(tài),不能完全地達(dá)成使用者的預(yù)期目標(biāo),很難與此前生成的內(nèi)容保持作品意義上的連貫,在技術(shù)特征上屬于涌現(xiàn)系統(tǒng)的“非線(xiàn)性”關(guān)聯(lián)。這也正是當(dāng)前的生成式AI難以產(chǎn)生杰作的主要原因。

藝術(shù)史家肯尼思·克拉克(Kenneth Clark)認(rèn)為“杰作”和“美”同為抽象定義,都屬于智能訓(xùn)練。“活力”“人性”與“心靈”是藝術(shù)家創(chuàng)造出“杰作”的基石。一旦過(guò)于強(qiáng)調(diào)風(fēng)格的形式主義占據(jù)主導(dǎo),“活力”和“人性”就會(huì)被削減;如果讓主題占了主導(dǎo),則有可能導(dǎo)致“心靈失控”,“在這兩種情況下,創(chuàng)作出杰作的機(jī)會(huì)均被減弱”。2 對(duì)照來(lái)看,AI藝術(shù)工具的發(fā)展使藝術(shù)創(chuàng)新逐漸向藝術(shù)生成靠攏,“現(xiàn)在,整個(gè)藝術(shù)史和流行文化的世界都被編碼寫(xiě)入了大型模型,這將允許任何人隨意探索在以前可能需要花掉一輩子的時(shí)間才能真正掌握的主題和風(fēng)格”。3 成熟的技術(shù)不僅導(dǎo)致藝術(shù)內(nèi)容的加速生成,而且在一些特定領(lǐng)域中制造出快速涌現(xiàn)的現(xiàn)象。在當(dāng)代藝術(shù)中的圖像、編曲、文字?jǐn)⑹隆⒍桃曨l、游戲段落設(shè)計(jì)等諸多領(lǐng)域集中出現(xiàn)的AI應(yīng)用,正在多個(gè)維度上改變著藝術(shù)的現(xiàn)狀與未來(lái)境況,如作者身份擴(kuò)張為人機(jī)協(xié)作、創(chuàng)作過(guò)程偏向動(dòng)態(tài)體驗(yàn)、包含藝術(shù)成分的產(chǎn)出結(jié)果更像是數(shù)家AI公司之間的工具評(píng)測(cè),等等。問(wèn)題的關(guān)鍵在于“系統(tǒng)中的數(shù)量變化必將導(dǎo)致行為發(fā)生質(zhì)的變化”,4 不加節(jié)制的過(guò)度依賴(lài)AI輔助正在消耗創(chuàng)作者的審美能力,很可能造成未來(lái)藝術(shù)難以出現(xiàn)杰作的窘?jīng)r,即使能夠在作品中短時(shí)間模擬動(dòng)態(tài)物理世界,也不足以復(fù)制杰作產(chǎn)生的所有條件。

對(duì)于藝術(shù)史家來(lái)說(shuō),單純的模擬從來(lái)都不是通向杰作的正確道路。杰作需要藝術(shù)家與現(xiàn)實(shí)世界有廣泛的接觸,在特有情境中表現(xiàn)出智力把握、藝術(shù)水平和技術(shù)能力等多方面相結(jié)合的創(chuàng)造力。“杰作是偉大藝術(shù)家在心靈開(kāi)啟的特殊時(shí)刻所創(chuàng)造的作品。”5 杰作所特有的創(chuàng)作節(jié)點(diǎn)決定了它在性質(zhì)上的獨(dú)特性、唯一性,以及整個(gè)藝術(shù)系統(tǒng)中杰作存在的稀缺性。那些在短時(shí)間內(nèi)就大量涌現(xiàn)出來(lái)的內(nèi)容往往經(jīng)不起復(fù)核。OpenAI官網(wǎng)上放出了48個(gè)由Sora生成且未經(jīng)修改的視頻,其中排列在第35個(gè)的“快樂(lè)水獺”(Happy Otter)再次遇到了AI程序不能準(zhǔn)確生成手指(腳趾)數(shù)量的圖像難題。另外,Sora看似開(kāi)放地公布了其他5個(gè)帶有瑕疵(Weakness)的視頻,在列出指令文本的同時(shí)還附帶分析了造成瑕疵的可能原因。然而,另一個(gè)由谷歌開(kāi)發(fā)的世界模擬器Genie卻對(duì)排在第1個(gè)的視頻進(jìn)行反向分析,以機(jī)器鑒別機(jī)器的犀利眼光指出其中對(duì)真實(shí)世界模擬不足的多個(gè)問(wèn)題。

其實(shí),櫻花與雪的矛盾、雪與人物服裝的矛盾都是細(xì)節(jié)。真正阻礙杰作產(chǎn)生的技術(shù)難題是視頻模型無(wú)法模擬出創(chuàng)作者的情感動(dòng)態(tài)。藝術(shù)世界包含廣闊,來(lái)自個(gè)體之間的情感激發(fā)與藝術(shù)靈感至今無(wú)法被算法編程,也無(wú)法模擬呈現(xiàn)。更重要的是,生成式AI的未來(lái)技術(shù)開(kāi)發(fā)重點(diǎn)需要考慮到全人類(lèi)的需求,1不應(yīng)該繼續(xù)擴(kuò)大用戶(hù)與專(zhuān)家之間的技術(shù)鴻溝。以Sora為代表的世界模擬器包含了將AI技術(shù)“黑箱化”的傾向,進(jìn)一步潛在地阻礙了未來(lái)杰作產(chǎn)生的可能道路,就像OpenAI官網(wǎng)上公布的第26個(gè)視頻“畫(huà)廊之旅”(Tour of an Art Gallery)那樣,視頻中不斷涌現(xiàn)出風(fēng)格各異的藝術(shù)品,數(shù)量雖多,卻無(wú)一堪稱(chēng)杰作。

Style Migration, Command Design, and “World Simulator”: On the Possibility of Sora Model to Produce Artistic Masterpieces

YANG Junlei

Abstract: As generative AI technology continues to escalate, driven by machine-supervised learning and adversarial neural networks, the influence of programmed algorithms on contemporary art creation is gradually increasing. Retracing the paths and methods of AI technology in the generation of works helps to understand the new features that make AI art different from traditional art. By scrutinizing the phenomenon of technological iterations of art style migration, it is possible to identify deep command design issues that are invisibly present in the human-computer interface. The endless adjustments made around the text of the instructions result in a dynamic emergent phenomenon when it comes to enhancing the gamified experience of artistic creation. The Sora model, one of the world’s simulators, is capable of partially rendering the physical world in motion, but is incapable of simulating the emotional dynamics that make artistic masterpieces difficult to produce.

Key words: AI art; style migration; command design; world simulator; generative AI; Sora; artistic emergence

(責(zé)任編輯:蘇建軍)

主站蜘蛛池模板: 亚洲黄色网站视频| 四虎影视无码永久免费观看| 亚洲国产欧美自拍| 欧美日韩在线国产| 国产午夜无码专区喷水| 女人爽到高潮免费视频大全| 国产黄视频网站| 九色视频最新网址 | 欧美一级黄片一区2区| 国产欧美日韩va| 日韩精品一区二区三区免费在线观看| 亚洲成A人V欧美综合| 国产成人喷潮在线观看| 秘书高跟黑色丝袜国产91在线| 最新加勒比隔壁人妻| 视频二区国产精品职场同事| 天天综合网色| 色婷婷电影网| 亚洲天堂网2014| 国产免费精彩视频| 狠狠色丁香婷婷| 亚洲人成网址| 欧美第二区| 高清国产在线| 天天色综合4| 国产一区二区人大臿蕉香蕉| 91人妻日韩人妻无码专区精品| 国产精品美女免费视频大全| 成年片色大黄全免费网站久久| 欧美综合中文字幕久久| 欧美色图第一页| 91成人在线观看视频| 中文字幕66页| 欧美国产日产一区二区| 色综合中文| 亚洲无码高清一区| 日韩视频福利| 国产h视频免费观看| 99热这里只有精品5| 国产在线拍偷自揄观看视频网站| 日日拍夜夜操| 国内丰满少妇猛烈精品播| 色噜噜狠狠狠综合曰曰曰| 国产丝袜无码一区二区视频| 农村乱人伦一区二区| 国产精品乱偷免费视频| 97人人做人人爽香蕉精品| 久久人体视频| 精品国产Ⅴ无码大片在线观看81| 欧美一区福利| 最新国产成人剧情在线播放| 久久久久久久久亚洲精品| 精品国产99久久| 欧美日韩国产成人高清视频| 国产一区免费在线观看| aaa国产一级毛片| 青青网在线国产| 日韩高清一区 | 国产欧美日韩另类精彩视频| 免费无码网站| 激情六月丁香婷婷四房播| 国产制服丝袜无码视频| 秘书高跟黑色丝袜国产91在线| 成年人视频一区二区| 日韩欧美国产精品| 高清亚洲欧美在线看| 四虎综合网| 亚洲精品国产综合99| 国产91高清视频| 幺女国产一级毛片| 亚洲AV无码久久天堂| 自拍偷拍欧美日韩| 国产成人精品在线1区| 在线观看国产小视频| 国产欧美日韩一区二区视频在线| 国产精品部在线观看| 亚洲黄色片免费看| 国产在线精品人成导航| 国产91av在线| 亚洲伦理一区二区| 日韩东京热无码人妻| 亚洲欧美不卡|