王棲榕,黃樟燦
(武漢理工大學理學院,武漢 430070)
(?通信作者電子郵箱huangzc@whut.edu.cn)
油畫圖像是一種重要的藝術創作和民族文化遺產,利用優美的表征形式,體現人類文化面貌,傳達人類思想感情,是人類認識世界的一種獨特而美妙的方式。幾千年來,人類創作了大量的油畫圖像,使得大量的、不同藝術風格的中西方油畫作品的分類成為了一項難題[1]。
早在18 世紀末,已有學者利用物理化學方法鑒定油畫作品的歷史年代以及顏料構成,從而判斷油畫作品的真偽以及畫家的身份。Spyros 等[2]提出了一種無損的核磁共振法分析油畫作品的老化程度,從而判斷油畫作品所屬的年代。Chaplin 等[3]利用拉曼光譜法采集顏料的光譜,根據顏料的光譜判斷油畫作品的年代,從而推斷油畫作品畫家的身份。Wang 等[4]提出了一種高光譜圖像的特征融合方法,將物理方法與空間特征方法融合,對國畫進行真偽鑒定。以上物理化學方法為油畫真偽鑒定提供了有效的工具,但其需要作品的實物,操作復雜,且只能針對某一幅作品進行分析,無法對數字油畫作品進行分析,也無法將藝術風格與畫家聯系起來,因此不適用于作家藝術風格的提取研究。
針對以上問題,目前較多學者運用人工智能、機器學習等算法對油畫的筆觸特征提取進行研究。Berezhnoy等[5]針對油畫的筆觸特征提出一種主流方向提取技術,用于自動提取人眼無法識別的油畫筆觸方向。Li等[6]針對梵高作品提出了一種融合邊緣檢測與聚類分割的筆觸特征提取方法,用于提取油畫的筆觸特征,從而區別梵高的作品與其他同期畫家的作品。Lamberti 等[7]針對梵高的作品提出了一種無監督的提取筆觸方向、長度、寬度的方法。對油畫作品筆觸的研究,需要高度清晰的數字圖像數據,這種數據不易獲得,而且文獻[5-7]的研究都是針對梵高的作品進行筆觸的提取,不具有普適性,無法應用于作品的分類。
Sablating 等[8]提出了一種應用于人物臉部的分層特征提取算法,有效提取了油畫的筆觸特征。這項研究只適用于人臉部的特征提取,而且沒有對所提取的特征進行有效性證明。Levy 等[9]提出融合最近鄰判斷的遺傳算法(Genetic Algorithm,GA),但其正確率較低。Shamir等[10]提出通過計算特征相似度的方法對油畫作品進行分類,該方法對于油畫作品所屬流派的分類比較準確,但對于所屬畫家的分類正確率較低。根據流派對油畫作品進行分類的研究方法大多基于神經網絡,需要大量訓練集;但每個畫家的作品數量過少,根據畫家進行分類時,用神經網絡不適合。
以上研究均未考慮油畫關鍵區域對油畫風格的影響,籠統地對油畫進行全局或局部的特征提取,導致其對油畫的描述無法有效體現畫家的藝術風格。
針對上述研究存在的不足,本文結合顏色特征分析油畫每一個區域的信息含量,以及每個特征與畫家風格的關聯程度,提出了一種基于顏色的關鍵區域油畫描述法。首先,結合區域主色調占比與顏色熵定義了油畫區域的信息豐富度,提出了一種選取油畫關鍵區域的方法,通過度量油畫區域的信息豐富度選取具有代表性的區域作為油畫的關鍵區域。其次,本文提出了融合Fisher Score 的關鍵區域特征描述法,選取有效的顏色特征,剔除無效甚至對分類造成干擾的特征,更有效地描述畫家的藝術風格。然后,利用樸素貝葉斯(Naive Bayes Classifier,NBC)分類器對油畫進行分類。最后,通過實驗對比發現,本文方法能夠有效提取代表畫家風格的油畫區域與有效的顏色特征,并更加準確地對油畫進行分類。同時,信息豐富度度量的定義為其他領域研究提供了新的思路。
信息是個很抽象的概念,信息的多少很難衡量,直到信息論之父克勞德·艾爾伍德·香農提出了信息熵的概念并用數學語言闡明了概率與信息冗余度的關系。“信息熵”一詞是從熱力學中借過來的,熱熵表示分子狀態混亂程度,信息熵描述信源的不確定度。信息熵計算式如下:

其中:p(xi)表示事件xi出現的概率,且。
由式(1)可以看出,信息熵具有單調性、非負性、累加性。單調性即如果有某個事件發生概率過高,概率越高,則信息量越低。非負性即信息熵不為負。累加性即多隨機事件同時發生的總不確定性的度量可以表示為不確定性的度量的和。所以信息熵作為有效度量信息多少的量被廣泛應用于集成電路、圖像檢索等領域。
信息熵能夠較為準確地衡量一幅圖像中信息的多少,本文為了選取能夠同時體現油畫整體特征與細節特征的區域,結合信息熵與油畫的特點,提出油畫的信息豐富度度量,具體內容見第2章。
Fisher Score 廣泛應用于特征選擇,其主要思想是認為鑒別能力強的特征的表現是類內差異盡可能小,類間差距盡可能大。假設數據中有n個樣本屬于C個類別,每個類分別包括ni個樣本,則單個特征的Fisher Score為:

其中:k表示第k維;SB、SW分別表示第k維特征在訓練樣本集上的類間方差和類內方差。由式(2)可以看出,當第k維特征的類間方差SB越大,類內方差SW越小,則Jfisher(k)越大。
為了提取油畫更有效的特征,從而更準確描述油畫的藝術風格,本文結合Fisher Score 進行特征選取,具體方法于3.2節中描述。
關鍵區域是一幅油畫的指紋,所以一個關鍵區域應該具有這幅油畫的主要特征并且能夠代表這幅油畫。因此,如何選取油畫的關鍵區域非常重要。油畫作品重視運用色彩深淺、光線明暗來表現物象。油畫色彩具有色相、明度、純度、冷暖等屬性,色彩的精心和巧妙運用可以反映物體的明暗,使整幅作品的質感和空間感更好[1],還能夠傳達畫家的情緒和情感。油畫的顏色分布是油畫識別和搜索的有效工具,所以本文通過油畫的顏色特征定義油畫區域信息豐富度,并根據信息豐富度檢測選取油畫的關鍵區域。
不同的畫家對顏色的偏好不同,多數畫家都有自己無意或有意形成的顏色風格。例如:荷蘭畫家梵高前期的作品善于利用暗色表達對資本主義現實的悲憤之情,后期則鐘情于黃色的植物以表達他對自然與生命的熱愛以及對旺盛生命力的強烈渴望;盧梭癡迷于大自然中綠色的風景,表現他天真直率浪漫的性格;倫勃朗的畫作富含各種赭色、深褐色和大地色調;莫奈則喜歡將白色和綠色作為主色調[11]。這些事實證明主色調的占比對于油畫的識別非常關鍵,是選取關鍵區域的一個重要指標。本文定義了主色調占比,具體如下:

其中:S是區域的面積大小;m=(m1,m2,…,mi,…)為區域中各種顏色的像素點數量,mi表示區域中第i種顏色的數量。
顏色不僅能體現一個畫家的情感與思想,同樣能夠體現一個畫家的繪畫技巧與功底。達芬奇提出利用明暗變化來構造凹凸感[11],不同的畫家在構造明暗變化時有不同的習慣與技巧。盡管盧梭偏好綠色,但是他的作品中運用深淺亮度等不同的綠色生動地刻畫了靜物。而莫奈傾向于運用“凌亂”的色彩展現景色的朦朧美。在一幅油畫中,復雜的區域相較于顏色單調的區域更能夠體現畫家的技術和不同畫家的不同習慣。所以顏色豐富度是關鍵區域選擇的另一個重要指標。
信息熵[12-13]用來度量信息的多少,其定義如式(1)。Zachary[14]提出利用信息熵度量圖片的信息量,也就是將信息熵的應用到圖像中顏色豐富度度量,即為顏色熵。顏色熵[15]的大小反映顏色信息量的多少:

其中:P(i)是顏色值i在區域中出現的頻率。R的值越大,該區域的信息量越豐富,所以本文通過顏色熵衡量區域的顏色豐富度。
在一幅油畫的某個區域中,主色調占比與顏色豐富度是互相影響的。當一個區域的主色調占比高時,很容易導致顏色豐富度低,反之亦然。所以本文根據主色調占比與顏色豐富度的調和定義區域的信息豐富度,具體如下:

其中,S、m、P(i)的含義與2.1、2.2節中相同。
式(5)能夠有效檢測具有代表性的油畫關鍵區域,更大程度地反映油畫的信息,避免無效區域的影響,降低計算復雜度。
畫家的藝術風格主要體現在其對色彩的應用以及運筆的習慣,本文根據式(4)計算油畫區域的信息豐富度,并選取信息豐富度最高的區域作為一幅油畫的關鍵區域。油畫的關鍵區域能夠最大限度地保留油畫的整體特征,體現畫家對色彩的應用,并更加突出表現油畫的細節紋理,體現畫家的運筆習慣。圖1為關鍵區域檢測選取的3個結果示例,左側為油畫原圖,右側(每個箭頭所指圖片)是本文方法選取的關鍵區域。

圖1 關鍵區域選取結果示例Fig.1 Examples of key region selection
提取有效特征是關鍵區域描述的關鍵,在第2 章中已經選取了信息豐富度高的關鍵區域,在此基礎上,對關鍵區域的有效特征進行提取,即能得到一幅油畫圖像的特征。由于油畫圖像具有豐富的色彩,所以本文提取油畫圖像的R、G、B、H、S、V 顏色直方圖特征(包括顏色均值μ、方差σ2、傾斜度μs、峭度μk、能量μN)與由顏色變化而形成的紋理特征(包括對比度CON、角度方向二階矩ASM、熵ENT、均值MEAN),計算式[16]分別如下:

其中,P(i)是第i種顏色在圖像中出現的頻率。

其中:p(i)是第i級灰度差分gΔ(x,y)出現的頻率;gΔ(x,y)的所有可能取值共有b級。取圖像內任意一點(x,y),則該點與其相鄰點(x+Δx,y+Δy)的灰度差分的計算式為:

根據式(6)~(14)分別計算油畫6 個顏色分量H、S、V、R、G、B的上述9個特征,共6×9=54個特征,將這些特征分別記為Ai(i=1,2,…,54)。則每一幅油畫可以被描述為一個54維的向量F=(f1,f2,…,fn),其中:n=54,fi是對特征Ai的度量。
一幅油畫的顏色特征非常多,但是由于油畫的部分顏色特征對于油畫的分類沒有作用,甚至會干擾分類結果。為了能夠更準確地對油畫進行分類,剔除對油畫描述形成干擾的特征,本文對所提取的特征進行評估并選取優秀特征。類內差異越小、類間差異越大的特征,與其所屬類的關聯程度越高,表明特征越優秀。Fisher Score 能夠計算每一個特征與其所屬類的相關聯程度。關聯程度越高的特征得分越高,關聯程度越低的特征得分越低。所以本文利用Fisher Score[17]對每一個特征進行評估。

其中:Wfi是fi對應特征Ai的權重得分,反映特征Ai對分類的影響權重,Wfi越大的特征越重要;N是類別的數目(畫家的個數)是所有訓練集中特征Ai特征值fi的均值;是第c類訓練集中特征Ai特征值fi的均值;是第c類訓練集中特征值fi的方差。特征Ai的Wfi越大,同一個畫家不同畫作之間的特征值越接近,不同畫家畫作之間的特征值差距越大。
通過式(15)對3.1 節中提取的特征進行評估,并選取重要性占比達到80%的前n'個特征,對關鍵區域進行描述,得到油畫的描述F=(f1',f2',…,fn'')。
為了驗證本文關鍵區域算法的有效性,將第3 章所提取的特征利用樸素貝葉斯分類器對油畫進行分類。
為了驗證本文方法所提取的藝術風格特征的有效性,本文利用所提取的特征對油畫進行分類。樸素貝葉斯廣泛應用于文本分類與畫作分類,其分類的結果通常優于其他分類器,本節簡單介紹樸素貝葉斯分類器。
樸素貝葉斯分類器[18-19]是經典的機器學習算法之一,原理簡單,容易實現,對小規模數據表現好,廣泛應用于文本分類[20-22]。樸素貝葉斯的原理是利用條件概率與先驗概率計算后驗概率。每一幅油畫都由一個n維的特征向量F=(f1,f2,…,fn)表述,畫家的集合為C=(c1,c2,…,ck)。樸素貝葉斯分類油畫,即利用一幅油畫的每一個特征fi計算一幅油畫F為某一個畫家cj所作的概率,計算式如下:

其中P(f1,f2,…,fn)對所有類別都為常量。
對于F,后驗概率P(cj|F)越大,則說明F屬于cj的可能性越大。F所屬類別的計算式如下:

由于每個特征相互獨立,則式(17)可轉化為:

分別計算出P(cj)與P(fi|cj)后,返回后驗概率最大的類別,即可得到F的類別。
本文方法流程如圖2所示。首先,根據第2章對油畫信息豐富度的定義度量并選取油畫關鍵區域;然后,提取關鍵區域的顏色特征得到油畫的初步描述F=(f1,f2,…,f54);再通過Fisher Score評估每個特征的重要性并選取部分權重大的特征得到油畫的最終描述F=(f1',f2',…,fn'')。重復此步驟得到m幅油畫的描述,作為訓練數據集,訓練得到樸素貝葉斯分類器。最后用樸素貝葉斯分類器對新的油畫進行分類。

圖2 基于關鍵區域的油畫描述與分類流程Fig.2 Flowchart of oil painting description and classification based on key region
假設訓練數據集的特征維數為n,訓練樣本個數為m。對于一幅油畫,在關鍵區域選取階段,假設一幅油畫被檢測h次;在關鍵區域描述階段,計算n個特征的特征值,利用Fisher Score 對n個特征進行評估,采用快速排序法對n個特征排序;上述步驟為并列操作,則對于描述一幅油畫的算法循環過程,語句的執行頻度為f(h) +g(n)=h+n+n+nlogn=h+nlogn。所以,描述m幅油畫算法的全部循環過程,其語句的執行頻度為mh+mnlogn。對于樸素貝葉斯,本文選取n個特征中重要性占比達80%的前n'個特征,假設標定值為|c|個[23],那么其計算復雜度為O(mn'2|c|)。當每種特征的重要性都相同時,n'的值最大為0.8n,此時樸素貝葉斯的計算復雜度為O(mn2|c|)。因此本文方法的時間復雜度為O(mh+mn2|c|),在可接受范圍內。
為了驗證本文方法的性能,基于Windows 7 操作系統、Intel Core i7-4790 CPU 處理器、8 GB 內存、Matlab R2018a 仿真環境,進行了仿真實驗。一位畫家畢生的作品數量較少,本文盡可能多地搜集數據集,分別建立了數據庫1與數據庫2。數據庫1包括亨利·盧梭、文森特·梵高、克勞德·莫奈3位畫家各40 幅作品,共120 幅油畫,其中,90 幅作為訓練集,30 幅作為測試集。數據庫2 包括文森特·梵高、克勞德·莫奈、皮埃爾·奧古斯特·雷諾阿、馬克·羅斯科、杰克遜·波洛克、瓦西里·康定斯基、薩爾瓦多·達利、馬克斯·恩斯特、喬治·德·基里科9 位畫家各57 幅作品,共513 幅油畫,其中,360 幅作為訓練集,153 幅作為測試集。圖3 為油畫數據的示例(數據來源為https://www.wikiart.org/),本文實驗圖像大小均為768×640。
為了驗證本文Fisher Score 特征提取的必要性,在實驗1中對比了未經Fisher Score 特征選擇的普通分類器與結合Fisher Score 特征選擇的分類器依據畫家與流派的分類結果。為了驗證本文整體算法的有效性,在實驗2 中對比了本文方法與文獻[9]方法、文獻[10]方法對于依據畫家與流派的分類結果。由于文獻[10]的主要工作為提取油畫的多種特征,所以將其方法定義為Features-FS(Feature selected by Fisher Score)。

圖3 10位畫家油畫作品示例Fig.3 Examples of oil paintings by 10 painters
5.1.1 油畫描述
本實驗首先根據式(5)檢測每幅油畫的關鍵區域,然后提取關鍵區域的R、G、B、H、S、V 顏色直方圖特征(包括顏色均值、方差、傾斜度、峭度、能量)與由顏色變化而形成的紋理特征(包括對比度、角度方向二階矩、熵、均值)。
一般的分類直接根據上述方法提取的特征對油畫進行分類。結合Fisher Score 的分類(FS-Classifier),在特征提取后,再根據式(15),計算畫家的訓練集油畫的每個特征的Wf,選取重要性占比80%的前n'個特征,得到每幅油畫的描述F=作為數據集。
本文分別根據畫家的身份與流派將油畫分類。根據畫家的油畫分類,將盧梭、梵高、莫奈3 位畫家的90 幅油畫作為訓練集,30幅作為測試集。首先提取油畫的54維特征對油畫進行描述,并利用Fisher Score 對特征進行評估,按權重由大到小排序選取權重得分最高的前24 個特征,具體為:A1,A3,A5,A7,A8,A10,A11,A14,A15,A16,A17,A18,A19,A21,A25,A28,A32,A36,A37,A43,A45,A46,A52,A54。根據流派的油畫分類,將印象派畫家梵高、莫奈、雷諾阿,抽象表現主義派畫家羅斯科、波洛克、康定斯基和超現實主義派畫家達利、恩斯特、德·基里科等9位畫家的360幅畫作為訓練集,153幅畫作為測試集。同樣提取54 維特征,并利用Fisher Score 進行特征評估,按權重由大到小排序選取權重得分最高的前27 個特征,具體為:A5,A14,A16,A17,A18,A19,A23,A24,A25,A26,A28,A30,A32,A33,A34,A35,A36,A39,A41,A43,A44,A45,A48,A50,A52,A53,A54。
5.1.2 參數尋優
對于每一種分類器,利用未經過Fisher Score 特征選取的54 維油畫描述的90 幅油畫的測試數據集,采用網格搜索算法,設置搜索區間為(0,40],支持向量機(Support Vector Machine,SVM)的參數搜索步長為0.1,其他分類器(K最近鄰(K-Nearest Neighbor,KNN)與隨機森林)參數搜索步長為1。將訓練集以7∶2 的方式進行分割,使用交叉驗證對每組參數的表現進行評估,運行50 次,取平均正確率最高的參數作為最終參數,得到的最優參數如表1所示,最優的SVM 核函數為多項式函數。決策樹C4.5、樸素貝葉斯(NBC)的樹深、節點數等不作限制。

表1 各個分類器使用的參數Tab.1 Parameters of different classifiers
5.1.3 不同分類器分類結果對比
表2 對比了普通方法(一般分類器)的分類結果與結合Fisher Score關鍵區域描述(FS-Classifiers)的分類結果正確率。所用的分類器包括K最近鄰(KNN)算法[24]、SVM[25]、決策樹C4.5、隨機森林[26]與樸素貝葉斯。由表2可以看出,依據畫家分類的結果,一般分類器的分類結果正確率最高達到了83.33%,與目前已有研究的正確率相當,證明了本文關鍵區域提取算法的有效性;且結合Fisher Score 分類結果的正確率明顯要高于普通的分類器。依據流派分類的結果,一般分類器的分類結果最高達到了82.35%,結合Fisher Score 分類結果的正確率達到了90.20%。樸素貝葉斯在一般分類器與結合Fisher Score 的分類器中,性能都是最優的。融合Fisher Score的樸素貝葉斯(FS-NBC)的分類結果正確率最高,依據畫家分類的正確率達到了90%,依據流派分類的正確率達到了90.20%。

表2 普通方法與FS-Classifier的正確率比較 單位:%Tab.2 Accuracy comparison of normal methods and FS-Classifier unit:%
為了驗證本文方法的有效性,本實驗對比本文方法與現有的其他油畫分類方法的分類正確率效果。本文利用式(5)檢測選取得到油畫的關鍵區域,并通過Fisher Score 評價選擇有效特征得到油畫描述F=(f1,f2,…,f24)后,利用樸素貝葉斯對測試集進行分類。文獻[9]方法提取了每幅油畫的30 個特征,沒有對特征進行權重評估,利用融合最近鄰(Nearest Neighbor,NN)的遺傳算法(Genetic Algorithm,NN-GA)對油畫進行分類,依據畫家分類的正確率為80%,比本文方法低10 個百分點;依據流派分類的正確率為82.35%,比本文方法7.85 個百分點。文獻[10]方法不僅提取油畫的顏色直方圖特征、紋理特征,還提取邊緣統計特征、Zernike 特征、Haralick特征等,并通過Fisher Score 選取548 種特征,最后用SVM 對油畫進行分類得到了最高的正確率,依據畫家分類的正確率為83.33%,依據流派分類的正確率為90.84%。
本文方法僅提取油畫的54 個顏色直方圖特征,并通過Fisher Score 選取其中的24 個特征。如5.1 節中表2 所示,本文結合Fisher Score 的SVM 的分類結果,依據畫家分類的正確率為83.33%,與Features-FS 提取多種特征的結果相當,表明了本文方法關鍵區域檢測方法的有效性。如表3 所示,本文方法依據畫家的分類結果正確率為90%,比Features-FS 高6.67 個百分點。本文方法依據流派的分類正確率達到了90.20%,與Features-FS 的正確率90.84%相當,但Features-FS提取的特征數遠多于本文方法。

表3 不同方法的分類正確率比較 單位:%Tab.3 Classification accuracy comparison of different methods unit:%
從以上實驗結果可以看出,本文提出的基于關鍵區域的油畫描述法操作簡單、分類結果正確率高,能更有效地描述油畫的畫家藝術風格。
受人類指紋識別與虹膜識別的啟發,本文提出了基于關鍵區域的油畫描述法。首先,通過計算油畫區域的信息豐富度,選取具有代表性的區域作為關鍵區域,使得所選區域能更有效地體現畫家的藝術風格;其次,提取關鍵區域的顏色特征,并通過Fisher Score 方法計算每個特征對于油畫的重要性,選取重要的特征對關鍵區域進行描述,利用關鍵區域的特征描述油畫。最后,利用樸素貝葉斯對其進行分類。實驗結果表明,本文所提出的方法優于現有的傳統全局與局部特征提取方法,依據畫家的分類結果的正確率達到了90%,依據流派的分類結果正確率達到了90.20%。本文依據油畫的顏色特征對油畫進行分類,未考慮輪廓、筆觸等特征,下一步的工作中,將綜合考慮多個方面提高分類的正確率。