趙羽
一、引言
人工智能模擬人類思維過程的可能性不僅包括被動任務(目標識別)、反應性任務(自動駕駛),還包括創造性任務(文字音樂創作、圖像生成等)。人工智能實現創造性任務的一個重要方法是靠人工神經網絡(Artificial Neural Network,簡稱ANN)中的深度神經網絡(Deep Neural Network,簡稱DNN)實現的。
生成式對抗網絡(Generative Adversarial Networks,下文簡稱GANs)是一種深度神經網絡模型,由Ian J. Goodfellow等人于2014年10月在論文“Generative Adversarial Networks”中提出。GANs包含兩個模型:生成模型(Generative Model,簡稱G),即以隨機噪聲作為輸入并試圖生成樣本數據;判別模型(Discriminative Model,簡稱D),即以真實數據或者生成數據為輸入,并試圖預測當前輸入是真實數據還是生成數據。生成模型與判別模型都極力優化自己的網絡,直到雙方達到一個動態的平衡即納什均衡,迫使生成數據與真實數據在統計上幾乎無法區分,從而生成與真實數據無法區分的數據。截止到2018年12月,GANs已經有了500多種變體,應用非常廣泛,包括圖片生成、音頻生成、圖像轉換、圖像合成、通過文字生成圖像、圖像修復等。
鑒于GANs可以在計算機視覺環境下通過非監督學習實現生成照片般逼真的圖像樣本的特點,本文認為當以大量的特定產品的已知的圖像作為訓練數據時,GANs及其變體DCGANs(深度卷積生成式對抗網絡, Deep Convolution Generative Adversarial Networks)、WGANs(Wasserstein GANs)、BEGANs(Boundary Equilibrium GANs)、3D-GANs等可以通過對訓練數據的深度學習從大批量無標記圖像中學習到良好的中間特征,從而生成與訓練數據中已知的產品圖像具有相似特征的、清晰的、逼真的圖像,從而生成新的產品設計。
二、采用GANs進行產品設計簡述
采用GANs進行產品設計是指讓GANs從某產品已知的大規模無標記圖像或視頻中學習到良好的中間特征,在計算機視覺環境下創造出可以表達該產品特征與形態的圖像以生成新的產品設計。其中,深度卷積生成式對抗網絡(Deep Convolution Generative Adversarial Networks,以下簡稱DCGANs)是GANs的一個重要變體,比起GANs,DCGANs在機器訓練上表現得更加可控和穩定。DCGANs的生成模型和判別模型無論是在對象個體還是場景方面都可以學習到豐富的層次表達,可以實現生成符合產品設計特點的圖像。本文的實例便采用了DCGANs作為深度神經網絡模型用于生成新款“女士大衣”的圖像,以驗證基于GANs的深度神經網絡可以用于產品設計與創新。
在最早提出DCGANs的篇論文(Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks)中,作者實現了采用DCGANs以273萬張已知的臥室圖像作為訓練數據,經過了5次迭代(迭代,指的是DCGANs針對訓練數據每完成一次深度學習便可以生成指定數量的輸出,這個過程稱為完成一次迭代,通常情況下隨著迭代次數的增加,DCGANs可以從訓練數據中更好地學習到特征并生成更好的輸出)生成了新的臥室圖像(圖1)。
我們可以看到,由DCGANs生成的圖像并不像設計師繪制的臥室設計圖那樣清晰,甚至生成的圖像有些混亂、怪異,以至于有些圖像帶有額外的斑塊或缺失的元素。我們采用GANs進行產品設計的意義不在于追求比設計師的設計更加精美,而在于在沒有向計算機輸入任何關于產品定義、設計方法、設計步驟的情況下,由深度神經網絡以已知的產品圖像作為訓練數據并從中學習到了特征和經驗,模擬了人類設計師通過瀏覽大量的產品圖像后進行創作的過程。將GANs應用于產品設計,一方面為產品設計的生成與創新建立了一個新的途徑;另一方面對由GANs生成的產品圖像我們需要打破思維定勢和對產品的成見,嘗試思考和理解其中的含義,吸取創造性靈感,促進產品創新。
三、采用GANs進行產品設計的實現功能和意義
(一)采用GANs實現無設計師情況下進行產品設計
GANs是在無監督深度學習的環境下對圖像的統計潛在空間進行學習,然后從這個空間中采樣,創造出與模型在訓練數據中所見到的圖像具有相似特征的新圖像,這個過程無需對產品設計進行定義、規劃、分析,也無需對訓練數據進行解釋、描述或標注。鑒于GANs的工作原理,在產品設計領域可以實現在無設計師、無任何產品設計經驗甚至無產品定義的情況下由GANs生成產品設計。
本文運行了一個通過DCGANs進行“女士大衣”設計的實例。本實例由DCGANs通過對7980張從互聯網采集并通過批處理規范為200像素*260像素分辨率的 “女式大衣”圖像經過96800秒的深度學習,完成了300次迭代,以每次迭代生成64張100像素*130像素圖像的方式生成了總計19200張新的服裝設計圖像,實現了采用DCGANs生成產品設計的目標。我們從19200張由DCGANs生成的圖像中選擇了18張圖像為例,展示由DCGANs生成的“女士大衣”產品設計(圖2)。
這個實例是在一臺配備NVIDIA(英偉達)GTX1080 Ti顯卡以Windows 10作為操作系統并連接到互聯網的計算機上實現的。本實例采用NVIDIA顯卡是因為使用顯卡的GPU加速后,神經網絡訓練速度要比使用CPU時快10-20倍,訓練時間從數天甚至數周減少為僅需幾個小時。本實例采用了在計算機安裝Anaconda(一個用于科學計算的Python發行版)的方式,并在Anaconda中配置了Python 3.3、GPU版的TensorFlow(TensorFlow是一個基于數據流編程的符號數學系統,被廣泛應用于各類機器學習算法的編程實現)、SciPy、Pillow等為DCGAN建立了生產環境。本實例的訓練數據來源是通過圖片搜索引擎以“女式大衣”為關鍵詞進行了1000次圖像搜索,從40萬個圖片搜索結果中使用大數據分析技術從中優選出具有“高清晰度”、“正面角度”、“款式受歡迎”、“具有良好銷量”等特征的7980張圖像作為訓練數據。在此需要指出的是,用于深度學習的訓練數據的版權與使用權問題有很多爭論,本文的觀點是深度神經網絡是計算機模擬人類思維對訓練數據進行學習的過程,凡是人類可以看到的或是可以通過合法途徑獲取的數據都可以作為訓練數據,該問題不作為本文討論的重點。
本實例驗證了只需要一臺裝有DCGANs并連接到互聯網的計算機便可以在無設計師參與的情況下由DCGANs成功生成19200個“女士風衣”的圖像。經過300次迭代后,由DCGANs生成的圖像已經非常清晰和逼真,部分圖像可以直接用作新款“女士風衣”的設計圖紙,或為設計師提供了創新思路和靈感。在實際的應用中,在更多數量和更高質量的訓練數據、更強大計算能力的計算機、更優化的程序和參數、更多的迭代次數等因素的作用下DCGANs可以生成更高清晰度、更符合設計需求的產品圖像。
采用GANs實現無設計師情況下進行產品設計的意義:
1. 實現了由人工智能模擬人類思維過程執行了創造性任務。GANs作為深度神經網絡模擬了人類對未知領域的學習與認知過程并嘗試進行創造性地輸出,無論是面對生僻、繁重的任務,還是面對復雜困難的任務,GANs都可以從海量的訓練數據進行認知和學習,替代或輔助人類執行創造性任務。GANs運行的整個過程沒有人類經驗與情感介入,更有機會從全新的角度生成有價值的輸出。GANs可以更好地從大規模的、不局限于產品傳統定義的、不受思維定式約束的訓練數據中學習到良好的、廣泛的、深層的特征,從而生成各種特征相互作用與融合的、更符合產品本質的或是更具有創新的產品設計。例如,當我們采用DCGANs設計一把椅子的時候,無論是傳統的椅子圖片,還是“所有可以為人們提供坐臥休息的物體”比如樹林里的樹墩子、交織的藤蔓、可以騎的動物、海邊的沙堆等都可以作為訓練數據,由此生成的“椅子”可能有藤蔓一樣的椅子腿或是沙堆城堡一樣的椅子背,生成的圖像充滿創意而且非常有趣。采用GANs進行產品設計必將成為一個具有廣闊前景的研究與應用方向,是產品設計方式的革新。
2. 實現大規模、高效率的產品設計。當面對數萬個甚至更多的設計需求時,采用GANs可以在無需設計師參與的情況下對數萬個設計需求分別建立GANs模型,實現自動化高效率設計。例如,需要為一部游戲設計1000棵樹木、500個人物形象、200個房屋建筑、100個地形和600件人物服裝時,可以為上述設計目標分別建立用于生成樹木、人物形象、房屋建筑、地形、人物服裝的5個GANs,并分別通過互聯網采集、素材庫、視頻采集、專家知識庫、數據購買等多種方式獲取訓練數據,從而由5個GANs分別自動生成對應的產品設計圖像,完成產品設計任務。
3. 建立“專家GANs”可以“模仿”特定專家或設計師的風格和經驗生成新的產品設計。GANs的輸出是建立在對訓練數據深度學習基礎上的,因此可以通過對訓練數據的約束與引導實現特定風格的輸出。通過以特定專家或設計師的歷史作品或其認可、推薦的經典作品為訓練數據可以訓練出具有專家或設計師風格、經驗的“專家GANs”,以用于替代專家或設計師延續其風格生成新的產品設計。例如,將達芬奇的歷史作品作為訓練數據訓練“達芬奇GANs”,可以創作出具有達芬奇作品風格的新作品,成為達芬奇的“仿造者”。“專家GANs”是人工智能模擬了專家或設計師的設計風格與經驗,具有了模仿其進行創造的能力,可以在無需專家或設計師參與的情況下生成新的設計。值得指出的是,“專家GANs”只能根據歷史數據“模仿”專家或設計師的風格,不具備創造新風格或創造新元素的能力。
(二)采用GANs實現大規模個性化產品設計
GANs在深度學習過程中采用的是無監督學習,這意味著不需要對訓練數據進行任何的解釋、描述或標注等工作就可以由GANs生成新的產品設計圖像,這個特點可以用來實現大規模個性化產品設計。通過為每一個用戶分別建立個性化GANs的方式并采用對應的個性化訓練數據,實現面對海量用戶的大規模個性化產品設計。
通過對用戶瀏覽行為、分享行為、搜索行為、購買行為、用戶偏好、點評打分等用戶行為數據分析形成一個用戶特征數據集,使用大數據技術對其進行洞察與挖掘,獲取用戶的個性化需求與偏好,最終在大數據分析結果的驅動下建立用戶的個性化訓練數據。例如,某個用戶近1年來頻繁瀏覽的2000件各種款式的大衣、曾經購買過的商品清單甚至喜愛的200位影視演員等都可以作為這個用戶的個性化訓練數據。
采用GANs實現大規模個性化產品設計的意義:
1. 個性化GANs可以實現面向海量用戶進行大規模個性化的產品設計,滿足用戶個性化需求。目前,用戶購買一件商品通常是在基于工業時代標準化設計和大規模機器生產出來的產品庫中選擇,用戶只能購買到基本符合自己需求的產品。當今人類社會進入了大數據和人工智能時代,用戶的個性化需求日益增長,大規模的工業化生產已無法滿足海量用戶的個性化需求,另外,為海量的用戶進行個性化產品設計也是人力所不能及的。個性化GANs結合大數據技術可以實現獲取用戶的個性化需求與偏好并進行深度學習,為每一個用戶生成符合其需求與偏好的產品設計。當個性化產品設計與個性化生產或3D打印技術結合后,將有比目前多數百萬倍數量的個性化產品誕生。例如,當一個用戶打算購買一輛汽車時,汽車的內部空間設計款式是非常有限的。個性化GANs可以為用戶生成符合其需求和偏好的汽車內部空間設計,不同用戶進入同一型號的汽車所看到的設計風格可以是不同的,有的采用了未來科技風格,有的則是采用了藝術風格,還有的采用了復古風格。如今的汽車內部空間設計大量的采用了“電子屏幕”,屏幕上展現的虛擬的儀表盤、人機交互操作界面取代了傳統的機械儀表盤和按鈕操作臺。屏幕的廣泛應用為個性化設計的實現帶來了便捷的展現方式,個性化設計無需生產制造出來,而通過計算機視覺設計展現在屏幕上就可以了。當汽車車身裝載了柔性屏幕時同樣可以展現豐富的個性化設計,用戶便擁有了個性化的汽車。從日常的個性化消費品到個性化香水配方、個性化生物制藥等,個性化GANs都有望成為解決用戶個性化需求的重要途徑。
2. 采用個性化GANs建立個性化“數字化世界”。個性化GANs可以為每一個用戶生成符合其偏好的電腦游戲、數字電影、VR(虛擬現實)場景等。虛擬數字世界的景觀、建筑、人物形象、動物、城市風格、科幻場景等都可以根據每一位用戶的個性化偏好生成,不同用戶在數字化世界的體驗都是不同的。個性化GANs在數字世界的另一個應用是為用戶打造專屬機器人。機器人跨越了數字化世界和現實世界,個性化GANs可以為機器人生成符合用戶偏好的外貌容顏、體型、動作、步態、穿著、聲音等。建立個性化數字化世界是GANs非常重要而廣泛的應用方向之一。
(三)采用GANs與大數據技術結合進行精準的產品設計
大數據分析可以成為GANs的前置模塊,為GANs提供數據支持,輔助GANs進行精準的產品設計。大數據分析是指采用大數據技術對產品的流行趨勢、用戶需求、產品銷量、互聯網輿情、社交網站表現、用戶評論、用戶情緒等等任何對產品設計具有指導價值的數據進行洞察,并從中獲取有價值的觀點和創新。例如,上文中的實例即采用DCGANs進行“女士大衣”產品設計,在建立訓練數據時,以“大衣”作為訓練數據不如以“女式大衣”更有針對性,而以“歐洲+女式+大衣”作為訓練數據就進一步限定了產品的風格,當采用更全面的大數據分析時,例如,以“銷量大于每周20萬件”+“用戶情緒傾向于贊美”+“每天在社交網站分享量達到1萬次”的“女式+歐洲+大衣”等限定下,由DCGANs生成的“女士大衣”會更精準。GANs在大數據技術的驅動下對訓練數據進行約束、篩選、挖掘和創新,使得生成的產品設計更精準、更符合用戶預期以及更具有商業價值。
(四)采用GANs實現面向復雜困難領域的產品設計
在面對諸如自動駕駛、太空探索、醫療人工智能以及生物制藥等復雜困難領域進行產品設計時,傳統的產品設計人員可能需要數十年的知識學習和經驗積累,并根據設計目標目前的發展狀況進行深入學習才能夠勝任;而且在一定時間內生成的產品設計方案有限,產品的進步受到人類思維能力、學習能力、創造能力和工作效率的限制。采用GANs進行產品設計是一個全新的方式,可以以更大規模和更高效率對海量的數據與復雜的情況進行深度學習并生成大量的并具有更多可能性的輸出,輔助人類進行面向復雜困難領域的產品設計。
在自動駕駛領域,當設計人員在訓練自動駕駛神經網絡時,通常讓車輛在實際道路上行駛,通過攝像頭采集行駛中的各種場景來進行自動駕駛的機器學習。這種訓練方式受到很多制約,例如,訓練數據量小、訓練速度慢、缺乏極端環境數據、缺乏道路突發情況數據等,因此設計自動駕駛系統成為一個復雜的問題。GANs可以為自動駕駛系統的早日問世提供支持。GANs通過對已知的街道場景、車輛型號、行人軌跡、道路環境、天氣情況等數據進行深度學習,從而生成數以萬計的新圖像。這些圖像數據量大,不受人類思維定勢限制,充滿各種可能性,可以生成豐富的道路場景、極端環境甚至突發情況,彌補了傳統自動駕駛訓練數據的缺陷,加速了自動駕駛技術的進步。在太空探索領域,人類在進行火箭、衛星、探測器等太空產品設計時,需要對太空環境、星體地形地貌等做出充分的學習、判斷和預測。GANs可以采用基于天文望遠鏡拍照、衛星拍照、探測器拍照等方式對太空環境進行訓練數據的獲取,從而由GANs通過深度學習生成豐富的太空環境與星體圖像,為太空產品設計提供大量的以及具有更多可能性的數據與圖像,輔助人類進行太空產品設計。人類采用人工智能驅動太空探索可以以更大規模和高更效率從未知領域獲取知識和規律,加速對未知領域的了解和發現。例如,采用GANs對由探測器拍攝的火星物體與場景的圖像進行深度學習,從而讓GANs嘗試創造出火星的地形地貌、巖石、土壤、大氣環境等,甚至可以仿造出一個火星。在醫療人工智能領域,采用GANs可以生成大量的疾病病灶圖像,為醫療人工智能的機器學習提供豐富的訓練數據。在生物制藥領域,Insilico Medicine是一家總部位于約翰霍普金斯大學新興技術中心的美國生物技術公司。該公司將基因組學、大數據分析和深度學習結合起來,采用GANs和強化學習,以產生具有所需特性的新型分子結構并預測化合物性質或產生新的分子結構輔助藥物的研發。
三、結束語
2017年7月8日,國務院印發了《新一代人工智能發展規劃的通知》,指出人工智能的迅速發展將深刻改變人類社會生活、改變世界。與此同時,互聯網的高速發展以及人類每時每刻都在產生的海量數據為人工智能的快速發展提供了良好的數字化環境和豐富的應用場景。在人工智能領域,GANs被廣泛認為是具有潛力又發展迅速的深度神經網絡之一,未來可以廣泛應用到產品設計領域,我們所消費的大部分消費產品或文化內容,其設計或創造過程可能都有GANs參與其中。
工業革命利用電力驅動機器運轉促進了工業的發展,實現了基于標準化設計的大規模工業化生產;21世紀,人類社會進入了“萬物互聯”并“實時在線”的互聯網時代,涌現了海量的數據,大數據技術與人工智能的飛速發展將“數據”轉換為“知識”和“經驗”,并實現了由人工智能執行創造性任務,推動了包括從產品研發、產品創新到解決個性化需求、建立個性化數字化世界等領域的發展,為人類社會生產方式甚至生產關系帶來新一輪的革新。在人工智能的深度神經網絡領域,隨著人們對GANs的關注以及GANs在實際生產中的廣泛應用,GANs不但會為人類社會創造出豐富的產品,而且會加速產品迭代,輔助人類面對和解決各種復雜問題。