汪瀟,章夏芬,韓德志
(上海海事大學信息工程學院,上海,201306)
基于視覺特征的書法風格識別
汪瀟,章夏芬,韓德志
(上海海事大學信息工程學院,上海,201306)
紙質圖書和書法書籍的數字化及網絡傳播,方便書法學術的研究和書法愛好者的使用。為了對書法風格進行識別,提出基于特征書法風格分類方法:首先,對單字圖像進行特征提取。接著,用爬蟲技術,將單字轉化為筆畫,提取筆畫特征。然后,將提取的24類特征作為特征向量,構造風格模型。最后,提取用戶提交樣本圖的風格特征,與五類風格進行相似性比較,將樣本字歸屬為概率最大的風格類型。
書法風格;風格識別;視覺特征;風格量化
隨著書籍的數字化及網絡技術的推進,大量書法書籍掃描圖像在網絡上傳播,使原本脆弱的、易被大火焚燒的歷史書法書籍得以保存、傳承和傳播,如亞歷山大圖書館由于戰火而遭到永久毀滅。掃描得到的大量書法頁面圖像掃描至中美百萬冊數字圖書館中[1],是全球數字圖書館的重要組成部分[2],采集來的圖像主要由碑帖和書帖組成,碑帖的背景主要為黑色,前景色書法字為白色,如圖1(b)和(e)所示,書帖的背景色主要為灰色或黃色,字體為黑色,如圖1(a)、(c)和(d)所示。掃描來的書法圖像,是由不同朝代的人書寫,與有著同一字體模型的打印體不同,富有情感色彩,風格多變。傳統的將書法作品分為五大類,分別是篆書、隸書、楷書、行書、草書。篆書屬于古文字,其特點是字單純簡單、以直弧筆畫為主、粗細一致、橫平豎直、多圓轉而無方折[3]。隸書的橫畫最有特點,也是最能夠表征隸書區別于其他書體的特征,文字描述就是“蠶頭雁尾、一波三折、雁不雙飛”[4]。楷書的特點為字體方正、中心平穩、筆畫分明,因此,對于楷書的主要衡量方式使用書法字的結體特征能夠比較好地進行表征。行書是楷書的連寫與快寫,草書是對行書的筆畫簡化以及進一步的連寫、快寫。如圖1所示即為五種風格書法的頁面掃描圖像。

圖1 頁面圖像
書法風格的分類,在以往的藝術領域,是由人工操作通過視覺的感觸對書法作品進行分類。在計算機領域對書法識別分類進行初步研究,是基于底層的書法特征對書法進行分類識別。書法風格的分類基于筆記學[5],所以對于書法風格的識別需要從單個筆畫的特征入手。
本文為了使計算機能識別書法風格,將視覺風格特征轉化為可供計算機讀取的書法字圖像底層語義,提取風格特征,判別書法風格。
書法是手寫體的一種,用毛筆書寫而成,書法風格的分類與手寫體筆跡鑒定具有相似的問題。對手寫體數字識別進行了相關研究[6-7],基于手寫體的研究,大量的研究人員對書法風格展開了研究[8-10]。將手寫字分為漢字領域和非漢字領域,在非漢字領域里,Srihari已對手寫字研究數十年,提出手寫體鑒定方法[11],基于統計模型判斷兩種手寫體是否由同一人書寫。Azmi等人提出了基于不等邊三角形提取特征的阿拉伯書法分類[12],但是三角形特征不適用與中國的書法結構。國外的手體結構是一維的,而漢字的構成是二維的,所以研究字的特征并不相同,可以將方法應用到書法的研究上。Bar-Yosef等人對歷史希伯來書法作品進行二值化和書寫識別,通過選取的信件和比較知名的手寫樣本中提取特征向量,他們的目的是識別不同手寫風格的位置、日期和作者,他們的方法雖然使用于漢字筆畫,但是他們的實驗數據量較小,對于復雜度大的筆畫還不適用[13]。
在漢字書法領域的研究上,基于CADAL掃描中心的書法圖像,魯偉明等人為了使用者可以便利地欣賞同一種風格的書法作品,提出了一種基于元數據的方法[14],提取書法風格特征,對書法風格進行研究,但是他們所用的測試圖片有限,構成的數據庫不夠明確,有待改進。莊越挺等人挖掘書法潛在風格模型[15],提出基于多項式概率分布的風格代表來估計可能影響風格模型的因素,用于滿足人們能欣賞到同一種風格的書法作品。這種計算不同風格相似性的想法是可行的,但是他們沒有詳細說明風格特征和風格要素。
上述作者都對手寫體的風格做了一定的研究,不同文字風格識別方法上存在一定相似性,但是特征不同,所以風格模型也不相同。因此,對于書法風格的研究需要新的方法去識別,基于書法的視覺特征對書法風格進行量化識別是現在要完成的工作,其中的首要任務,是根據統計學的原理進行風格特征的提取,將特征進行數字量化。
2.1 系統框架
本文的書法風格識別系統框架如圖2所示,對掃描得到的頁面圖像提取特征,將24類風格特集組成特征向量,對其進行聚類分析,構成風格模型存入書法數據庫。然后對樣本字圖像經過特征提取,用PCA進行風格分類,最后對分類結果進行展示。

圖2 書法風格識別系統
2.2 數據來源
實驗數據是由《中國歷代楷書真跡》、《中國歷代帝王御藏名帖》、《柳公權玄秘塔碑》等54卷書法書籍掃描的得到的頁面圖像,將得到的頁面圖像進行切分,掃描精度的600DPI(Dots Per Inch),圖像格式為*.TIFF,共259頁的頁面圖像被分割成8279個單字圖像。
書法分類前需要對8279個字的訓練樣本進行標注,以頁為單位,將書法風格分為五類(#1,#2,#3,#4,#5)。圖3展示了書法數據庫結構,包括書的信息(book)、頁面信息(page)、作者信息(author)。
本文書法風格特征有兩個層次:基于單字的字級書法特征和基于筆畫的筆畫級書法圖像特征。
3.1 頁面切分
切分書法字的原理是利用字間空白的地方框出書法字,先分離出背景色和字的顏色。然后縱向切分出列,接著橫向把列切分成單個書法字。按照如上方法,將圖1所示的頁面圖像切分至單字圖像,切分的部分單字圖像如圖4所示,每個單字圖像由最小包圍(topX,topY,buttonx,buttonY)和確定字的位置;判斷風格識別是否正確(#1,#2,#3,#4,#5):
3.2 去噪

圖3 五張數據表之間的主外鍵關系

圖4 單字圖像
大部分歷史書籍會有不同程度的噪聲存在,噪聲可以分為兩類:(1)噪聲為印章、毛刺、自然腐蝕,如圖5 (a)所示紅色圈標注的印章噪聲;(2)噪聲是由于書法家對行書和草書的書寫過快,導致了有些筆畫粘連在一起,如圖5(b)所示,這些噪聲的存在都會對視覺特征的提取和書法風格的識別造成影響,不能正確提取書法的骨架,所以我們需要對單字的噪聲進行處理。
如下圖5(b)所示骨架之間出現粘連:
對第二類噪聲的處理,先找到牽絲處,然后斷開牽絲點:
(1)提取每個骨架點:用參考文獻[16]的細化方法,使骨架點為一個像素點;
(2)計算骨架點寬度:如圖6所示,以骨架點為中心的圓,初始半徑為一個像素點,依次增加半徑,以95%為閾值,當圓內有95%是背景色時停止半徑增大,此時的半徑即為該點骨架寬度,即圖中的d;

圖5 帶噪聲的書法字圖像

圖6 骨架某點筆寬
(3)判斷有無牽絲:牽絲即為兩個粗筆中間細小的粘連,譬如圖7(a)中圈出來的地方;計算整個字內骨架點寬的均值u和方差σ,根據實驗測試如果某點大于1.8σ的范圍,則此點為牽絲點;
(4)斷開牽絲:以該骨架點為中心,將此點和周圍兩個像素點置為背景色,即牽絲斷開;如圖7(b)所示;
(5)提取新的骨架;上述處理結果再次細化后的結果如圖7(d)所示,未細化前的處理結果如圖7(c)所示。
3.3 字級特征提取
字級特征是以字為單位,對字的粗細、高寬比等特征進行研究而提取的特征。提取這些圖像上的視覺特征,組成特征向量。因為書法字筆畫的粗細不均勻、變化幅度大,所以平均筆寬、筆寬變化率、最大筆寬值、最細筆寬值可以作為字級風格的特征。同時,研究書法字圖像的其他方面,那些不依賴與骨架和筆畫提取的特征有黑白二值比、高寬比、重心位置、左右墨點比、傾斜率、字在X軸壓力變化、字在Y軸壓力變化、字在X軸傾斜平衡、字在Y軸傾斜平衡。令骨架圖上共有n個像素點,二值化圖像為M×N像素點,(x,y)為坐標,P(x,y)表示二值圖像像素點:

黑白二值比為:

對于每個字,以每個骨架點i為中心,圓內像素點95%以上的點為二值前景色的最大半徑di:
平均筆寬:

筆寬在不同書法風格中是不一樣的,筆寬計算基于上文骨架點,統計該字內所有骨架點平均筆寬即為平均字的平均筆寬。由于隸書和楷書書寫速度比較慢,有著均勻的筆寬和變化率,而草書和行書書寫隨意,經常有粘連出現,筆寬變化較大,可以由最大筆寬值和最細筆寬值來量化表示,最大筆寬值即為所有點寬度的前1/5的平均寬度:

最小筆寬值,就是所有點寬度的后1/5的平均寬度

如圖3(a)筆畫寬度比較細,圖3(b)的筆畫寬度比較粗,各種風格的筆畫寬度都不相同,可作為風格特征向量。
筆寬變化率:

如圖3(a)筆畫寬度粗細比較一致,變化率小,圖3 (b)的筆畫寬度有粗有細,變化率大。
不同書法風格字體的中心位置有上下左右之分,重心位置可作為風格特征之一,重心位置計算公式如下:
字在橫向(X軸)的重心:

由于書寫書法的毛筆較軟,手寫的力度不同會導致墨點的深淺不一,所以墨點比可作為風格特征向量之一,左右墨點比:
字在Y軸壓力變化特征fstress_y如公式(11)。
字在X軸傾斜平衡fslant_x如公式(12)。
字在Y軸傾斜平衡fslant_y如公式(13)。

圖7 斷牽絲處理圖

3.4 筆畫級的特征
對于行書和草書來說,書寫速度快,不容易檢測出橫豎筆劃,而隸書、楷書橫豎筆劃比較容易分辨。根據單個字的筆畫對比,發現可以將筆畫風格分成兩類,即橫筆特征和豎筆特征,包括筆畫個數、平均斜率、橫向碼比值等。
3.5 風格特征向量
將上文的12類字級特征與12類筆畫級特征元素組成具有24個元素的特征向量,如表1所示。
基于上文的特征向量及訓練樣本,風格模型基于高斯概率分布模型構造。接下來需要分析訓練樣本的特征數據統計分布,用于構建書法風格模型。將量化的特征存于特征向量里,計算訓練樣本的概率分布情況,最后計算待識別字的特征概率分布,從而判斷類型。
實驗組穿刺成功率高于對照組,差異具有統計學意義(P<0.05);實驗組穿刺時間短于對照組,差異具有統計學意義(P<0.05);實驗組并發癥發生率低于對照組,差異具有統計學意義(P<0.05)(表2)。兩組并發癥均為誤入頸內動脈,均未發生血胸、氣胸及神經損傷。
4.1 符號說明
本文的符號如下所示:
wk:書法風格分類,其中下標k=1,2,…,5是5種風格的標號;
Mk:每種風格各自具有的樣本數;
Sj,k:數據庫存儲的一個書法字樣本, 其中j= 1,2,...,Mk;
σ2j,k:書法字樣本每類風格的方差;
fl,j,k:書法字Sj,k的24個特征變量,其中l=1,2,…,24;
Fj,k=[f1,j,k,f2,j,k,…,f24,j,k]:每一個書法字樣本的24個特征值fl,j,k組成特征值向量。

表1 風格特征向量表
4.2 聚類中心
基于已標注的五類風格,計算每一類風格的類中心,求得平均值uk,離聚類中心最近的字,即為這種類的風格類型。平均值的計算公式如下:

4.3 類間變化
計算同一類風格訓練樣本的聚類偏差,如下:

4.4 協方差
計算每種風格的訓練樣本的風格特征值向量的協方差矩陣公式如下:

本文選取PCA的分類方法,對于待識別的字,先提取特征,將提取的特征量化作為特征向量,計算待識別字的類分布概率,判斷跟哪一類風格最為相似,從而確定字的風格屬于哪一類。

圖8 五種書法風格的例子
本文所使用的線性分類器是基于高斯特征分布的,計算待識別書法字屬于每一種風格的條件概率Pk,一共有5個條件概率值,根據條件概率的值判斷書法字的風格,條件概率值最高的那個風格即是這個待識別書法字的主要風格,風格概率的計算公式為:

Ck-1是每種風格的訓練樣本的風格特征值向量的協方差矩陣的逆矩陣,uk是每種風格的訓練樣本的風格特征值向量的平均值向量,Q是待識別書法字,F是待識別書法字的風格特征值,wk是書法風格分類標簽。
對樣本屬于哪一類風格的概率值,進行歸一化處理,處理公式:

6.1 數據選取
本文所用實驗數據從CADAL數字圖書館中獲取,共從256頁書法圖像上分割出600像素的單字圖像8279個。從中選取4500個作為訓練樣本,進行風格標
6.2 實驗結果
基于上文的聚類,挑選出離聚類中心最近的前8個字圖像,如圖8所示:每個字下面的阿拉伯數字為character ID的值;第一行為篆書圖像、第二行為隸書圖像、第三行為楷書圖像、第四行為行書圖像、第五行為草書圖像。
對于單個字的分類結果如圖9所示,屬于五類風格的概率圖如下所示:

圖9 樣本字屬于五類風格的概率
從訓練樣本中挑選出 2640個字(529個風格#1,918個風格#2,493個風格#3,211個風格#4,489個風格#5)進行風格識別的正確率統計,結果如下表2所示。

表2 風格分配表
通過上表計算可得,風格#2的識別錯誤率為:1-883/918=0.04;風格#4的識別錯誤率為:1-155/211= 0.27;風格#5的識別錯誤率為:1-118/489=0.76。由此可見,識別率越來越低。
本文通過提取底層書法字級以及筆畫級的圖像特征,構建書法風格模型,將樣本與所構建風格模型進行相似度比較,能初步實現對書法風格的識別功能。對篆書和隸書的平均識別的正確率達到70%。但是,對于草書和行書,這類筆畫粘連過多的書法字,識別率較低,是以后仍要研究的方向,繼續提高書法識別的正確率。
[1]CADAL書法.http://www.cadal.zju.edu.cn、.訪問日期:2015年9月28日
[2]全球數字圖書館.http://www.ulib.org.訪問日期:2015年9月28日
[3]巨保銘.漢字書法風格淺析[J].滄桑,2008,,(5):237-238.
[4]曹云鵬.歷代書法風格轉換與書法創新分析[J].藝術百家,2012.
[5]H.Clifford.Graphology:How to Read Character from Handwriting,with full Explanation of the Science,and Many Examples Fully Analyzed,Penn Pub.Co.,Philadelphia,1905.
[6]K.Hanusiak R,S.Oliveira L,Justino E,et al.Writer Verification Using Texture-Based Features[J].Document Analysis&Recognition,2012,15(3):213-226.
[7]Mori S,Suen C.Y.,Yamamoto K.Historical Review of OCR Research and Development[J].Proc.IEEE.,1992,80(7):1029-1058.
[8]X.Zhang,G.Nagy.Style Comparisons in Calligraphy,Procs.SPIE/IST/DRR,San Francisco,Jan,2012.
[9]Han C C,Chou C H,Wu C S.An Interactive Grading and Learning System for Chinese Calligraphy[J].Machine Vision and Applications,2008,19(1):43-55.
[10]L.Yang and L.Peng.Local Projection-Based Character Segmentation Method for Historical Chinese Documents.Proc.SPIE8658,86580O,2014.
[11]S.N.Srihari.Computational Methods for Handwritten Questioned Document Examination.Final Report,Award Number:2004-IJCX-K050,U.S.Department of Justice.
[12]M.S.Azmi et al..Arabic Calligraphy Identification for Digital Jawi Paleography Using Triangle Blocks[J].in International Conf.on Electrical Engineering and Informatics,Malaysia,2011:1-5.
[13]I.Bar-Yosef et al..Binarization,Character Extraction,and Writer Identification of Historical Hebrew Calligraphy Documents[J].Int. J.Doc.Anal.Recognit,2007,9(2-4):89-99.
[14]Wei-ming Lu,Yue-ting Zhuang,Jiang-qin Wu.Discovering Calligraphy Style Relationships by Supervised Learning Weighted Random Walk Model[J].Multimedia Systems,2009,15:221-242.
[15]W.Lu,Y.Zhuang,and J.Wu.Latent Style Model:Discovering Writing Styles for Calligraphy Works.[J].Vis.Commun.Image Represent,2009,20(2):84-96.
[16]劉峽壁,賈云得.一種字符圖像線段提取及細化算法[J].中國圖象圖形學報,2005,10(1):48-53.
Calligraphy Style Identification Based on Visual Features
WANG Xiao,ZHANG Xia-fen,HAN De-zhi
(College of Information Engineering,Shanghai Maritime University,Shanghai 21306)
The digitalization of calligraphy paper books enables convenient use for academic researchers and calligraphy learners.Identifies the calligraphy style by extracting and modeling calligraphy image features in character level and stroke level:Firstly extracts characters features.Second,extracts features of stroke by the crawler and stroke features are extracted.Totally,24 style features are used as the feature vector,when a user submits an unknown character,its 24 style features are extracted and compared with those features of 5 styles in the database five styles eventually,the style which has the biggest similarity probability assigned to the unknown.
Calligraphy Style;Style Identification;Visual Features;Style Quantification
1007-1423(2016)21-0039-08
10.3969/j.issn.1007-1423.2016.21.009
2016-04-25
2016-07-15
汪瀟,女,碩士研究生,研究方向為圖像處理與模式識別章夏芬,女,講師,研究方向為圖像處理與模式識別
韓德志,男,教授,研究方向為大數據、信息管理