黨睿才
AI絕對可以稱得上是這幾年最火爆的話題。從Alpha Go擊敗頂尖圍棋選手開始,越來越多人意識到在很多領域,AI已經能夠用接近人類的思維,更高效地完成任務。在很多領域,AI甚至已經可以部分取代之前只能由人類擔任的工作,例如機器翻譯有了AI加持后,譯文的質量在很多場景下已經達到了可用的程度,電腦和互聯網也變得越來越聰明了。
然而長久以來,很多人依然認為,在一些體現人類獨創性思維的領域,仍是AI的禁區。例如藝術和繪畫,很難想象出AI能和人的想象力和手藝一較高下。
但是,近幾年AI在圖形方面的進展,卻讓人驚呼時代真的變了!不少高質量的AI繪畫方案紛紛面世,即使完全不會畫畫,憑借著寥寥幾筆涂鴉,甚至簡單一兩句乃至幾個詞的描述,就能夠通過AI生成美輪美奐的繪畫,簡直如同黑科技,尤其是最近在Google Colab開源的Disco Diffusion,感覺全世界都玩瘋了。
AI繪畫并不是一蹴而就的,隨著算力的增強,以及算法的完善,它慢慢修煉到了如今的功力。那么在這幾年,都有些什么令人印象深刻的AI繪畫方案?今天,就來介紹一些相當值得把玩的AI繪畫
Paintschainer
這可能是最早出圈的AI繪畫方案了。Paintschainer在前幾年就引起了人們的注意,它并不能完全靠自己來畫一幅畫,Paintschainer的主要作用是給線稿上色,其效果已經可以追上一些比較初級的人工上色作品。

Paintschainer在當時之所以突然爆火,是因為人們突然發現,AI居然是可以辨認線稿內容的!Paintschainer的驚人之處,在于它能夠識別線稿的內容,例如一張美少女人像,它可以識別哪部分屬于皮膚、哪部分是頭發、哪部分是衣服、哪部分是背景,然后分別涂上適當的顏色。不僅如此,它的上色范圍還相當精準,盡管線稿沒有封閉,但顏色依然會保留在適當的范圍,而不會涂得滿處都是———用過PS中油漆桶工具上色的朋友,應該知道這是什么意思。
在很多人的固有認知中,電腦很難“理解”圖像,從照片中辨認、總結出內容物是什么。然而Paintschainer卻做到了更高的層次,能夠“理解”線稿這種比寫實照片更加抽象的圖像。盡管Paintschainer并不完美,但它已經足以讓人們對AI的強大有了更加貼切的體驗。
NV GauGAN
NV是顯卡界的“大拿”,無數游戲玩家將其視為偶像。而NV同樣是AI算力的重要貢獻者,它早在AI領域布局了多枚棋子,到如今NV在AI領域無論是硬件還是配套的軟件,都達到了很高的水平———游戲玩家如果用過NV增強畫質的DLSS AI算法,一定深有體會。
DLSS并非是NV在圖像AI領域的唯一體現,實際上,NV近年的一個開源AI項目SPADE/GauGAN,就讓人嘖嘖稱奇。
GauGAN是一個NV使用AI生成圖像的方案,和上文介紹的線稿上色AI相比,GauGAN的強大之處在于它可以生成完成度極高的圖像,而前提是只需要涂抹幾筆,用不同顏色的色塊和線條“意思一下”,GauGAN就可以明白你的意圖,還你一張逼真度極高的照片。
GauGAN一直處于發展中,2022年,GauGAN還推出了第二代,除了依然可以通過簡筆畫生成照片,現在還能夠通過文字描述來生成圖像了!
在GauGAN 2當中,用戶只需要輸入描述畫面的文字,AI就可以自動生成對應的畫面。而且,生成的速度非常驚人,幾乎是即時的。例如,輸入Ocean出現海,繼而輸入waves則會出現波浪,繼續輸入hitting rocks on the beach則又繼續生成海灘和巖石,效果非常驚人。
此外,GauGAN還支持用戶手動涂抹修改,如果想要對生成的內容做調整,可以直接用簡筆涂鴉,AI會如魔法般變出逼真的對應內容。
GauGAN之所以有如此大能,是因為使用了對抗網絡,大量數據經過機器訓練后,使用生成器和鑒別器來識別對應元素,從而匹配數據生成圖像。據了解,GauGAN 2使用了1 000萬張圖像進行訓練,藝術家使用它不僅可以生成現實的風景,還可以生成天馬行空的藝術場景,這超越了很多人對電腦插手藝術的固有印象。
Disco Diffusion
這可能是2022年最為人矚目的繪畫AI了。
Disco Diffusion一經面世,就刷爆了全球各大社交媒體,顛覆了很多人對AI的認知。如果說GauGAN的強大之處,在于可以憑借人的簡單想象就生成逼真圖像,那么Disco Diffusion就更進一步,不僅可以進行復雜的想象,而且還可以生成各種畫風的繪畫!
Disco Diffusion是一個運行在Google Colab上的AI,如果要使用它,需要擁有Google賬號并且能訪問Google,國內的用戶可以自行解決這方面的問題。Disco Diffusion的程序是面向公眾公開的,在使用之前,可以先將其保存到自己的Google Drive網盤,以方便進一步編輯。
Disco Diffusion的強大之處,在于給出一段描述文字,就能夠生成高質量的畫作。盡管它沒有圖形界面,但使用起來并不復雜,進入到Setting當中,可以設置名稱(AI生成的繪畫會保存到Google Drive中對應的文件夾)、尺寸(不要設置太大,保持默認即可)、步數(保持默認即可)等。
接著,進入到(提示詞)Prompts的設置當中,這就是最關鍵的地方了。在Prompts中,可以輸入描述繪畫的詞句,例如官方給出的實例為“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”,“yellow color scheme”,意思大致為“奇異燈塔的美麗繪畫,在洶涌的血海中閃耀著光芒,參考greg rutkowski Thomas kinkade的畫風,及artstation網站上流行的風格“黃色主調”。

然后點擊“代碼執行程序”中的“全部運行”,靜靜等待即可。運算過程可能長達幾十分鐘乃至數小時,運算是在Google的云服務器上運行的,對本機電腦性能沒要求。隨后,Disco Diffusion就生成了這樣一副繪畫。
在很多人眼里,AI能夠生成這樣的一幅畫是非常驚人的,其完成度甚至不輸于一些真正的畫手。而Disco Diffusion生成這樣的一幅畫,流程要比手工作畫來得更快,而且改一下提示詞,又能生成另外不同風格的畫了。
Disco Diffusion有很多潛力可發掘。例如,使用算力更強的云服務、設置更多次的迭代算法、提供更具體的提示詞、甚至給到參考圖片,這些都能夠生成更高質量、更多種風格的畫作。
毫無疑問,Disco Diffusion的出現,顛覆了很多人的三觀。這個AI所生成的繪畫,甚至已經可以說擁有一定的藝術感了。盡管它對于動物和人物的繪制仍存在短板,而且也不能勝任人物、場景設計這樣具體的、需要扣細節的工作,但無論是給普通人一場視覺盛宴,還是給行業人員找找靈感,都已經綽綽有余了。
可以說,Disco Diffusion將繪畫AI推向了一個新高度,自此繪畫這種講究審美、講究靈感的技藝,也不再專屬于人類了。
Tiamat
Disco Diffusion依托在Google Colab上,對于國內用戶來說有網絡方面的門檻,而且界面說不上易用,還需要用英文來撰寫提示詞(盡管可以機翻)。現在,對國人更友好的AI繪畫方案,正在路上。
最近,一款名為Tiamat的繪畫AI在國內展開了測試。根據內測者的體驗反饋,它的界面比較友好,而且可以用中文來給AI命題,效果還相當不錯。
和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根據詩詞來繪畫,畫面效果相當好,還頗有意境。在微博、小紅書平臺上,都可以找到很多這樣的案例。
可見,Tiamat的AI方案還是有吸引人的獨到之處的。不過目前Tiamat仍處于內部測試階段,希望Tiamat能夠盡快推出公開的版本,讓更多國人感受到AI繪畫的魅力。
隨著硬件性能的進步以及算法的改進,AI仍在飛速發展。AI在繪畫方面的建樹,已經讓人咋舌,有條件的話,強烈推薦把玩一下Disco Diffusion,感受AI作畫的魅力。