楊 波 李航高 龔智強 詹 屹
(中南民族大學 武漢 430074)
畢加索,一個勤奮多產的畫家,他的一生中共計創作了6 萬多幅作品。在其作品的藍色時期,因生活不幸,好友自殺,這個時期畫作中充滿了悲涼憂郁的氛圍,頻繁使用藍色。遷居巴黎后,畢加索結識菲爾南德·奧里威爾。這一時期是他人生中難得的幸福時光,繪畫中嬌羞的玫瑰紅代替了陰郁藍色,這一時期的作品被稱為粉色時期。進入古典時期后畢加索在造型上喜歡使用幾何圖形來創作,色調也變成了更加深沉的褐色為主。在結識馬蒂斯后,畢加索從野獸派那里吸收了黑人雕刻手法,并將其應用到作品中,這一時期的顏色偏向于黑褐色。創作了《亞威農的少女》之后,畢加索在創作風格上拋棄了前人的束縛,物體表現上更加的扭曲,色彩也更加的豐富多樣,繪畫的風格多變,從此開創了一個新的繪畫風格——立體主義風格。而后不久,畢加索的作品又迅速轉入超現實主義風格中。畢加索繪畫作品風格有近20 種,對其作品進行藝術風格分類是一件非常有意義和必要的工作[1~2]。
目前有大量文獻利用計算機技術對藝術作品進行分析與研究[3]。Zoe Falomir 基于定性顏色描述符、定量全局特征和機器學習(QArt-Learn)對巴洛克、印象派和后印象派三種風格的多個不同畫家的繪畫進行風格分類[4];陳光喜基于深度學習的油畫分類網絡模型使用CNN 實現油畫風格分類[5]。Shuqiang Jiang 等使用1799 幅工筆、1889 幅寫意畫的數據集,建立支持向量機模型對傳統中國畫進行顏色分類[6]。Gatys,Ecker 使用卷積神經網絡對油畫的繪畫風格和油畫內容實現分離,重新編碼從而實現了機器創作不用風格的油畫的模型[7~9]。江西農業大學的實驗團隊研究水稻的生長成熟過程,使用了HSV 和RGB 色彩空間的不同的特征參數與SPAD 值之間的關系的研究[10],這種研究方法也對本實驗提供了參考。
本文主要針對畢加索繪畫作品實現風格分類,而畢加索在不同的時期和不同風格的作品中,其色彩的色調、明度、飽和度等特征迥異,因此色彩特征可以作為區分繪畫風格的重要特征。本文將通過HSV 和RGB 兩種色彩空間模型描述作品特征,通過建立卷積神經網絡模型和支持向量機模型實現對畢加索繪畫風格分類。
本文選取了畢加索繪畫作品風格中最具代表性的8 種風格,分別為現實主義風格、藍色時期、粉紅時期、非洲原始風格(面具臉)、分析立體主義風格、綜合立體主義風格、新古典主義風格和超現實主義風格,如圖1 所示。并將作品圖像轉換為RGB圖像和HSV圖像如圖2所示。

圖1 畢加索繪畫作品風格

圖2 上排為RGB色彩空間圖像,下排為HSV色彩空間圖像
本文通過爬蟲技術收集各大博物館網站高清彩色圖像1158 張,將圖像和相關的標記存入本地數據庫中,構成自建數據集,如圖3 所示。再將全部圖片轉換成32 像素×32 像素×3 通道的圖片,并將轉化結果作為神經網絡的原始輸入。

圖3 畢加索繪畫作品數據庫
本實驗中將網絡上下載的數據存放在MySQL(8.0.19 MySQL Community Server-GPL)數據庫中。
原始輸入圖像為32像素×32像素,從三個通道進行卷積運算,卷積運算使用的濾波器(卷積核)規格尺寸分別使用5×5 和4×4[11],濾波器數量分別是20 個和40 個,第一層主要提取的是圖像的細節特征,第二層進行更大視野的特征提取,最后會將三維的特征向量轉化為一維特征向量。
模型的詳細設計結構如圖4 所示,原始輸入圖像分別經過兩次卷積和池化運算,再經過全連接層的分類完成模型訓練的流程。

圖4 模型詳細設計結構流程圖
本文的模型訓練流程如圖5 所示,為了防止數據集和模型之間的過擬合問題,加入了dropout層[12],以提高模型對與數據集的通用性,并按0.0001數量級值設置學習率。

圖5 模型訓練完整流程圖
本文使用交叉熵定義模型的損失函數[13],交叉熵函數能體現圖像真實風格和預測風格分類之間的差異性。交叉熵的值越小,預測值和真實值就更加的接近。最為直接的展現就是模型的預測精確度越高。

由式(1)所示,交叉熵計算公式中的p(Xi)和q(Xi)是兩個概率分布,交叉熵衡量的是對一個隨機變量,兩個概率分布的相似度。
本實驗基于TensorFlow 機器學習框架[14~15],實驗流程如圖6 所示,分為訓練模塊、驗證模塊與可視化模塊。使用LibSVM 工具箱進行分類,通過窮舉法對參數進行調整,以得到更優化分類結果。

圖6 實驗完整的流程圖
本實驗原始輸入圖像總共分為RGB 和HSV 兩大類,每類中各有8 種繪畫風格,每種風格的訓練集135 張,驗證集15 張。 每個大類都使用同一個神經網絡進行訓練,最終結果產生兩個數據模型文件。在進行模型驗證的時候,加載不同色彩空間各自對應的模型文件進行驗證。兩大類數據在訓練模型中迭代1000 次,收斂速度非常接近,并不存在特別大的區別,見圖7。

圖7 HSV 和RGB的收斂速度對比(1000次迭代訓練)
收斂速度相同主要原因是使用的相同的算法模型和參數,輸入圖像大小相同,進行卷積運算的時候平均損失值是基本相同的。本實驗還采用了YUV 色彩模型進行計算,所得到的結果在收斂速度上并沒有太多的差異。
根據實驗最后得到的數據,采用RGB 色彩空間模型進行分類的準確率能夠達到50%,采用HSV色彩空間模型分類準確率能為58.2%,如圖8所示。

圖8 HSV 和RGB的準確率對比
由此可知由于HSV 色彩空間模型包含了色相、明度、純度等顏色特征,相對于RGB 色彩空間模型而言更加適合作為風格分類數據輸入。
為了對畢加索不同時期繪畫作品的風格進行分類,本文采用了RGB 色彩模型和HSV 色彩模型對1000 余張圖像進行處理,通過卷積神經網絡模型對風格特征進行提取,使用支持向量機對數據進行分類。實驗結果表明采用兩種色彩空間模型其運算收斂速度相同,而HSV 色彩空間模型相對RGB 色彩模型包含更多顏色特征,比RGB 模型更適合做繪畫風格分類數據輸入。