魏珍珍 周鈿
摘要:隨著人工智能(Artificial Intelligence,AI)的快速發展,其在繪畫方面的應用愈加廣泛。文章分析現有AI繪畫工具,探討其技術發展、局限性與發展趨勢,分析其與藝術的差異和相關道德性,從而引導創作者正確看待和利用AI繪畫。
關鍵詞:人工智能技術;AI繪畫;計算機視覺;藝術創作工具
中圖分類號:TP18;J204 文獻標識碼:A 文章編號:1004-9436(2023)02-0-03
人類對生活情感的記錄和表達是本性,而科技的發展一直影響著人類看待世界的方式。近年來,人工智能技術不斷更新迭代,吸引了大量藝術家的關注,相關研究者也開始探索人工智能技術在藝術創作方面的應用。此外,藝術展示場所出現的人工智能藝術創作產品,其是否稱得上是藝術品,各種觀點也層出不窮,吸引著人們對AI繪畫這一新興技術和藝術相結合的產物展開理論和實踐方面的討論。本文主要介紹AI圖像生成的技術發展與當前存在的局限性,并分析未來AI繪畫的發展趨勢,希望在此基礎上引導創作者正確看待和利用AI繪畫。
1 智能圖像的生成與藝術特性
本文所探討的AI繪畫,主要針對的是基于機器學習模型進行自動數字繪圖的計算機程序。AI繪畫良好的創作能力來源于神經網絡的發展,即通過神經網絡的計算,不斷縮小需求輸入與期望輸出的差距。目前的AI生成技術主要由三個神經網絡相互組合搭建而成,一是文本轉換網絡,將輸入的提示語轉化成網絡能夠理解的字符串;二是生成網絡,收到文本后,與內部數據庫進行匹配,衡量各字符串的權重,模擬計算后輸出匹配圖像;三是放大網絡,將輸出的圖像清晰化,得到符合現階段分辨率限制的圖像。經過大量研究證明,以上生成式AI模型在訓練成本和出圖效果上都有比較理想的成績。
1.1 智能圖像生成的技術發展
AI繪畫創作在過去10年中發展迅速,其中不乏出現了一些重要的技術里程碑。例如,GAN的技術創新對當前人工智能藝術運動的興起作出了重大貢獻。2012年,一些計算機學者通過神經網絡GAN進行上萬張圖片的模型訓練,最終生成了一個非常模糊的貓臉,人們認識到可以通過計算機生成圖像,這成為人工智能與藝術相接的轉折點。將輸入字符串生成的圖像與真實樣本進行對比,經過多次循環后得到的圖像會越來越接近輸入文本需求。該框架的實現使得各種類型的圖像內容生成取得了令人印象深刻的結果,很快成為人工智能最重要的研究領域之一,并且出現了許多高級和特定領域的原始架構變體,如CycleGAN(循環生成對抗網絡)、StyleGAN(風格生成對抗網絡)和BigGAN(龐大生成對抗網絡)等智能圖像生成軟件。
2015年,Mordvintsev(莫爾德溫采夫)等人使用DeepDreams(深度夢想),通過可視化和最大化神經元激活的模式來提高深度CNN(卷積神經網絡)的可解釋性。隨著計算機圖形學和計算機視覺研究的不斷深入,深度神經網絡與手工繪畫相結合,開發了許多渲染和紋理合成算法。其中包括將“繪畫風格”應用于圖像生成過程,在輸出時可以選擇水彩或素描風格的融入。而促使藝術人工智能技術快速發展的最具標志性的人工智能發明之一則是NST(神經風格遷移),這種方法由Gatys(加茨比)等人在工作中引入,計算機將生成圖像的“內容”簡單理解為可識別的相關物體,將“風格”直接理解為一種美學上令人愉悅或有趣的視覺偏差,通過分離與組合圖像“內容”和“風格”,證明了CNN在創建風格化圖像方面的成功。盡管NST方法代表了自動圖像處理領域中一項非常有趣的技術貢獻,但使用NST方法生成的程式化圖像通常表現為有圖像輸入的明顯組合,而不是原創和獨特的藝術創作。
綜上所述,人工智能繪畫有諸多優點。第一,數據庫龐大,既囊括了不同時期不同風格畫家的作品,又存儲了使用者依據AI創作的繪畫作品。第二,使用AI輸出繪畫作品,效率高且操作簡便,哪怕是之前沒有基礎的使用者,在經過指南操作和基礎練習后也能達到正常使用的水平。
1.2 AI繪畫的技術現狀與局限性
如今,AI繪畫模型正在以前所未有的速度爆發性增長。2022年8月22號,Stable Diffusion宣布開源,不僅是程序,還包括訓練好的模型。它是目前水平最高的繪畫AI之一,它的開源意味著接下來會有很多包裝stable fusion(穩定融合)內核的產品出現,這是一個指數型增長的開始。同年10月,能夠自動續寫小說的AI工具Novel AI Diffusion(新型人工智能擴散)將它的配圖功能單獨工具化,這是目前最成功的能夠進行動漫風格繪畫的AI生成器,能夠根據提示詞輸出想要的角色,同時還具有干凈漂亮的線條。但是,Novel AI生成的圖比以往任何一個AI生成的圖的拼貼感都強,甚至能比對上原圖,在網上飽受爭議,主要原因有兩點:第一,Novel AI使用了爭議極大的數據源Danbooru(丹布魯),這個數據源本身存在大量無授權的圖片;第二,Novel AI的計算沒有對輸出模型進行對比檢查,通常導致“過擬合”問題。雖然Diffusion(擴散)的技術原理本質上并不是縫合拼貼,但是基于以上原因,在結果上確實會出現和原作者過度雷同從而引發抄襲和侵權的風險,Novel AI就是最好的例子。
雖然AI的功能令人驚嘆,但目前仍然存在很大的發展空間,主要受制于算法的發展。第一,AI繪畫過度依賴訓練數據。現有的計算僅局限于數據庫中已導入的圖像或者藝術數據,導致目前的AI繪畫只是對過去一段時期的藝術整合,并沒有實時跟進藝術的發展。第二,AI所能理解的提示詞有限,以繪畫風格和繪畫內容為主,且無法繪制文字作品,當輸入詞涉及語義邏輯時會難以計算。第三,AI繪畫不具系列性,在同一AI繪畫軟件上輸入類似的文本,AI會重新進行計算而無法得到與之前相互關聯的同系列輸出圖像,因此,AI繪畫輸出的是一張張獨立圖像,難以進行同系列的創作。
不僅在繪畫領域,AI也在其他領域同樣得到了快速發展和廣泛應用。例如,工業領域在大力發展智能語音識別技術,對人們日常自然語言進行理解與轉化;互聯網領域在發展拍照識物和尋找類似物品的程序;科研領域在不斷進行類似結果的模擬計算,不斷總結與更新,進行比對和驗證得到最佳結果。各個領域最終都會相互結合,AI在繪畫領域的發展勢不可當,必將成為繪畫創作的一大新潮流。
2 正確看待和利用AI繪畫
正確看待和利用AI繪畫,與傳統繪畫進行比較分析是必要的。傳統繪畫是使用一定的物質材料作為工具,運用色彩、線條等進行構圖,必須由藝術家完成,這需要藝術家進行一定時間的訓練。AI繪畫則依據機器數據庫識別輸入文本,通過對以往作品的計算,進行圖像匹配創作繪畫。
2.1 AI繪畫的道德性
在人工智能藝術創作過程中,機器和藝術家二者間的人機關系一直存在爭議。2022年8月,在美國科羅拉多州博覽會藝術比賽中,Jason Allen(杰森·艾倫)的作品《太空歌劇院》奪得頭獎。由于該畫作使用AI繪圖工具Midjourney完成,因此引來了不少人類藝術家的指責,AI繪畫到底算不算藝術呢[1]?除此之外,其他重要問題,如與人工智能藝術的新穎性、原創性和自主性相關的問題,也開始受到藝術史學家、藝術家以及人工智能科學家和開發人員的關注。
這些爭議與計算機在作出被認為對創作過程至關重要的決策時的自主程度有關。計算技術是否仍然被視為單純的工具,還是它們表現出獨立“行為”的特性?盡管原則上藝術作品具有可復制性,這也是人造器物總可以被人仿制的原因所在,但是機械復制代表的則是與之不同的新東西。在《機械復制時代的藝術作品》中,本雅明指出技術復制好比一把雙刃劍,在割裂了本真性,導致“靈韻”丟失,不斷貶低原作價值本質的同時,也極大地增強了作品的空間靈活性,提高了公眾參與度[2]。因此,這就很難確定AI藝術品的價值應該取決于其輸出結果所涉及的技術復雜性和創新性,還是僅取決于最終的視覺表現。Hertzmann(赫茨曼)表示,“人工智能算法不是自主創造者,在可預見的未來也不會出現。它們仍然只是工具,可供藝術家探索和利用”。
另一個值得注意的是作者版權和倫理問題。2018年10月,Obvious(無創意)集體制作的AI藝術品《埃德蒙德·貝拉米》在佳士得拍賣會上以432 500美元的價格售出,這一拍賣引發了關于作者身份和版權問題的討論,并引發了關于在制作、推廣和銷售作品時必須考慮的版權問題的討論[3]。在上述拍賣的情況下,人工智能藝術品雖然是由人工智能系統自主生產,但創建該系統的作者,以及用于運行網絡的代碼的作者,都沒有收到任何正式的版權許可。
盡管爭論不斷,但最近出售的大多數人工智能藝術品的案例表明,目前這些藝術品的著作權歸于使用人工智能技術制作藝術品的藝術家,不管創作過程如何,哪怕在藝術品上明確標注了由AI進行制作,那些計算模型的開發者和軟件運營商的貢獻仍然被忽略,類似計算機行業套用代碼源,僅僅將代碼當成一種公開工具來使用。而在使用AI進行繪畫創作中,數據庫中的部分圖像也可能涉及原始作者創作版權,即在沒有征得作者許可的情況下進行了計算輸出。當然,這在最終作品中幾乎不會被注意到,但仍然需要從道德角度承認,人工智能藝術品中的版權侵權是一個需要系統解決的問題。
2.2 AI繪畫——創作者的工具
目前對AI繪畫的看法主要分為兩大類,一部分激進的人認為AI具有比人類藝術家更強大的學習和計算能力,AI繪畫將取代人類成為更具創作經驗和技巧的“藝術家”。不過,AI繪畫創作出的作品是毫無感情的圖像,將大大減少繪畫的原創性,這意味著人類最神圣且不可冒犯的領域已經接近陷落。而另一部分人認為AI只不過是另一個繪畫工具,將AI繪畫看作藝術技術性載體,而不是作為主體的藝術,它不能替代人類獨有的創造力,因為藝術來源于真實生活,而這是機器所不能感受的人類那種特有的復雜生活閱歷與人生感悟。雖然借助深度學習和神經網絡算法讓AI繪畫創意無限,但提供創作需求的主導者依舊是人,人對表達的持續渴望是本能,并不會被AI所替代[4]。
AI繪畫模型能夠作為人類藝術傳承的工具。自古流傳下來的文墨書畫或石碑壁畫,飽受歲月侵蝕,上面具體的內容或許早已無法識別。而AI繪畫可以借助VAE(重構變分自編碼器)和GAN,通過訓練圖畫的缺失部分,生成圖像記憶,填補受損區域[5]。此外,AI還能通過計算對比鑒別古畫的真偽,將需要鑒別的藝術品拍照上傳后,AI會在數據庫進行匹配,通過每一個組成代碼的比對計算來判斷相似度。
AI繪畫模型能夠作為創作者的繪畫工具。它能夠幫助創作者將靈感具體化,通過在同一主題下更換不同關鍵詞,得到不同的輸出可能性,而內部又具有完整的統一性,具有一種“在明確邊界內的豐富可能性”。類似中國傳統的山水畫創作,墨水流動的不確定性與AI計算類似,給予了畫家源源不斷的創作想法。接下來,畫家會在大致區分開的山水上繪制細節,將自己創作的情感帶入,逐步填充和調整細節。相較于傳統的文檔、草圖、照片等繁雜且耗時的需求來源,創作者將自己一時的靈感轉換成文字關鍵詞輸入給AI,便能將其具象圖像化,囊括氣氛、光線、風格和質感等。
此外,AI繪畫模型還降低了藝術體驗的門檻,讓普通人都可以體驗藝術創作的過程。只需要提供一個粗陋的輪廓或者大致想法,人人都能立即得到自己想要的圖像。這正好迎合了當代藝術的價值方向,即破除了藝術家與普通人的界限,人人皆為藝術家。其中,類似潑墨的過程在AI繪畫創作過程中被簡化,創作者可以根據原始圖像來繪制細節,作為創作者的練習,為后續的藝術創作積累經驗。當然,AI繪畫也存在不合理的取舍細節和缺乏共情感染力、氛圍感的缺點,而這些剛好是人類藝術家擅長處理的方面。
3 結語
當前繪畫創作緊跟科技發展步伐,AI繪畫與傳統繪畫的結合是時代趨勢,隨著繪畫藝術的發展,繪畫藝術的邊界將不斷發生變化。繪畫與科技的結合越來越緊密,AI繪畫的局限性也會不斷縮小。將AI繪畫作為人類藝術傳承和提高創作效率的工具,將其作為人腦的延伸而不會取代人,未來會有越來越多的繪畫藝術形式將在人類和AI的協作下完成。隨著AI算法的不斷更新與AI繪畫相關條例的逐步完善,普通人也能夠用AI生產高質量視覺作品,這將極大改變人類的藝術生活。
參考文獻:
[1] 王方方. AI繪畫引發的思考[J].科技與金融,2022(10):60.
[2] 王子銘.作為藝術事件:本雅明論機械復制時代的藝術作品[J].文藝評論,2022(3):11-19.
[3] 郭霽瑤.偷竊的藝術,還是重新定義原創?AI繪畫背后的藝術變革與爭議[J].中國經濟周刊,2022(23):75-77.
[4] 王少文.數字時代繪畫主體性探討[J].四川戲劇,2022(9):157-159.
[5] 童茵.數字人文范式框架與繪畫文物AI智能研究[J].計算機產品與流通,2020(3):133-135.
作者簡介:魏珍珍(1980—),女,湖北武漢人,碩士,副教授,研究方向:視覺傳達設計。
周鈿(1999—),女,湖北襄陽人,碩士在讀,研究方向:視覺傳達設計。