閆文耀,郭銘濤,王志曉,3,張九龍
(1.延安大學西安創新學院 數據科學與計算機學院,陜西 西安 710100;2.西安理工大學 計算機科學與工程學院,陜西 西安 710048;3.陜西省網絡計算與安全技術重點實驗室,陜西 西安 710048)
2017年初,國家在關于實施中華優秀傳統文化傳承發展工程的意見中對書法提出發揚、普及和創新應用的要求。當前,基于圖像分析的書法研究在傳統文化保護和普及方面發揮著重要的作用。國內已有相當多的書法研究成果,主要集中在碑帖圖像去噪及增強[1-2]、書法字庫檢索[3-6]、書法體鑒別與評價[7]、特定風格生成[8]、書寫質量評價等方面[9-10]。就本質而言,書法字檢索、相似風格檢索、體識別、風格生成等諸多應用的核心都是對字體的圖像特征提取問題,包括手工設計的特征算子[11]和機器學習方法生成的統一特征[12],如何設計符合書法特點直觀感受以及手寫字特點專家評價的圖像特征算子,使得機器與人的評價結果具有較為一致的可解釋性,對高質量的書寫質量評價產生重要的理論研究價值。針對傳統書寫質量評價方法所建立特征描述子往往僅適合某一種字體、風格的缺陷,肖建國等人領導的團隊對漢字按偏旁部首進行切分,進而應用美學度評價準則,取得了較好的效果[13],但該方法需要較多的部首切分和美學評價規則制定。近期,該團隊又針對藝術象形文字圖像的自動生成問題探索性提出了一種新的模型AGIS-Net,該模型是一種一階段模型,在只需少量樣本的情況下就可以同時傳遞形狀和紋理樣式,并且取得了良好的效果[14-15]。雖然基于圖像統計特征的方法結果的解釋性不強,但其適應性廣、評價有效,故仍不失為一種重要的研究途徑。吳江琴等在書法字識別[16]及體識別[17]中應用了該類方法,取得較好的成果。該文提出將Gabor特征應用于書寫質量評價中,研究書寫漢字的紋理特征,進一步應用SVM進行評級,分為優良和一般兩個級別,與專家打分的質量評價表進行對照分析,形成手寫漢字質量評價的新途徑。
Gabor濾波器是圖像特征表示的主要方法之一,具有良好的多尺度及多方向性。生物學家通過實驗證明了Gabor函數能夠很好地模擬人類視覺細胞在受到外界刺激時做出的反應。Gabor濾波器的應用關鍵在于頻率、高斯核大小、方向等參數的選擇上。Gabor函數定義如下:
W(t,t0,ω)=e-σ(t-t0)2eiω(t-t0)
(1)
那么Gabor變換可以表示為:

(2)
把式(1)代入式(2),整理可得:

(3)
對式(3)展開后可得:
(4)
其中,C(x(t))(t0,ω)表示原始信號x(t)在時間為t0、頻率為ω上的頻率信息,它是一個復數形式,可按式(5)分為實部和虛部來表示。
C(x(t))(t0,ω)=αreal+iαimag
(5)
因此,C(x(t))(t0,ω)便能通過極坐標系下的幅值α和相位角φ來表示:
(6)
(7)
漢字的紋理特征提取本質上是使Gabor函數φμ,v(z)對漢字樣本做卷積運算。設漢字圖像的灰度分布為I(z),則與φμ,v(z)卷積的過程表示為:
Gμ,v(z)=I(z)*φμ,v(z)
(8)
其中,Gμ,v(z)是復數,其幅值與相位用以下兩個公式來表示:
(9)
Pμ,v(z)=tan-1[Im(Gμ,v(z))/Re(Gμ,v(z))]
(10)
鑒于常見的漢字部首主要為橫、豎、撇、捺四個方向,恰好對應Gabor濾波空間的0,π/4,π/2,3π/4,因此只需選定這4個方向對漢字圖像進行Gabor紋理特征提取即可,字庫中樣本“樂”字的濾波后圖像如圖1所示。再提取漢字的5個尺度,4個方向,將Gabor濾波器的頻率選為fmax=0.22,取圖像大小的一半尺寸作為濾波器窗口的大小,圖2和圖3分別為實驗所得的幅度圖像和實部特征。

圖1 “樂”字的濾波后的實驗效果

圖2 “阿”字濾波后幅度特征

圖3 “阿”字濾波后實部特征

在獲取圖像特征后,需要使用分類器進行書寫質量的等級評價,即分為優良和一般兩種等級。雖然更精細的評價在于為每篇作品在各個指標上打分評價,但在目前的探索研究中,僅考慮使用圖像特征及分類器進行粗分類作為嘗試。SVM是基于統計學的機器學習分類方法,準確率較高,推廣性也較好。它具有核函數、最優超平面等解決方案,可解決過擬合等問題。該文選取常見的SVM方法進行二值分類。在計算完每個漢字濾波圖像的均值和方差后,得到40維特征向量,以此作為特征輸入支持向量機。
漢字特征提取具體過程如下:
Begin
gamma←0.5;
theta←pi/4;
a←sqrt(2);
fmax←0.22;
r←m/2;c←n/2;
i←1;
j←21;
foru←0:4
do
f←fmax*a^(-u);
lambda←1/f;
forv←0:3
do
sigma←0.56*lambda ;
GK←getGaborKernel(r,c,v*theta,sigma,lambda,gamma)
x←conv2(pic,GK);
mea←mean2(x);
colvector(i,1)←mea;
i←i+1;
var←std2(x)^2;
colvector(j,1)←var;
j←j+1;
End
End
End
設pic為所有訓練樣本的集合,訓練樣本為灰度圖像,n為所有訓練樣本的總量。對Gabor核函數進行參數設置:m,n分別為當前圖像的高和寬,把Gabor核窗口設置成圖像窗口的一半[18],gamma的取值為(0,1)之間,由于Gabor濾波器的仿生特性,0.5是比較符合人類視覺的。設定五個尺度,四個方向(0,pi/4,pi/2,3pi/4)。f決定了Gabor濾波器的尺度特性,Gabor濾波器頻率變化公式為f[k]=a^(-k)*fmax,sigma為高斯函數標準差。函數getGaborKernel返回一個方向一個尺度的Gabor核,函數conv2(pic,GK)取pic樣本集合中一個樣本與四個方向五個尺度二十個Gabor核函數進行卷積。函數mean2和std2分別為卷積過后的均值和標準差,向量colvector內存儲的是二十個卷積圖像分別取的均值和方差,組成40維向量。每個樣本都有一個colvector,最終組成列向量集合,然后利用SVM進行分類。
下面主要介紹SVM參數優化的過程:
基于統計方法的SVM算法,其中的參數在于核函數的選取以及懲罰因子的系數,這兩個參數的選擇直接決定了分類效果的優劣。經過尋優的參數其效果可以遠遠超過未尋優的參數。常見的方法有基于網格的窮舉篩選法和基于遺傳算法的尋優方法。窮舉法的思路較簡單,易實現。給定參數的最大最小值范圍,確定搜索步長即平面上網格大小,逐網格進行搜索。在每個網格參數點上,將數據集5等份,進行5重交叉驗證,獲取識別率。最終搜索完網格后確定最佳參數。
雖然該文只是進行了二值分類,但在SVM的輸出中,是存在回歸函數的具體數值的,施加了閾值判斷,從而形成二值決策,所以文中方法對其稍加改進,即可用于書寫質量的打分上來。
實驗數據來源于北京大學計算機科學技術研究所字形計算技術實驗室孫榕鞠等人整理的CHAED字庫,它包含30個人書寫的100個漢字,每字收集10種寫法構成1 000個字的字庫,并有33個人工打分數據。圖4為字庫中不同書寫質量以及不同結構的漢字樣本示例。

圖4 字庫部分漢字樣本示例
本部分研究以Gabor特征衡量書寫線條的勻稱性及筆畫的清晰度。好的書寫,筆劃之間清晰,結構勻稱;差的作品,由于筆劃扭曲,比例失調等形變造成筆劃不清晰,結構不勻稱的效果。清晰和勻稱是兩個較相近的特征,所以選用同一組樣本進行實驗。實驗中選取書寫勻稱、符合規范的100個漢字,另外選取不具備這些特征的100個漢字,提取Gabor特征,用于決策分類。實驗數據集如圖5所示。

圖5 筆劃清晰勻稱性實驗數據集
通過實驗測得最終的分類識別率為91%,反映出Gabor特征可以表示書寫的勻稱性。
同一個人書寫的漢字風格是統一的,不同人的風格是不同的,本部分實驗使用Gabor特征進行書寫風格一致性判斷。實驗數據的準備是這樣的,針對同一篇楷書作品,不同的人通過透明紙覆蓋在其上進行摹寫,鑒別不同的書寫風格。實驗數據集如圖6所示,選取兩個人的摹寫樣本各100個漢字,訓練集和測試集分別包括兩個人的100個漢字,風格一致性的測試結果為65%。

圖6 書寫風格一致性判斷實驗數據集
這部分實驗風格鑒別率不高的原因是兩個人的樣本都來自同一書法字帖的摹寫,原有的風格是一致的。這里只是每人在摹寫時附加了個人的特點,這種算法在公安部門圖偵室的書寫同一驗證中有重要作用。
本部分進行漢字書寫質量評價的綜合實驗,需要機器給出優秀和一般兩種判斷。實驗數據集如圖7所示,通過和人工打分進行對比,得出文中算法的識別率為95%。

圖7 漢字書寫質量評價實驗數據集
綜上,文章從三方面對Gabor濾波器在書法特征鑒別方面的性能進行了測試,實驗表明其效果較為理想。
針對漢字書寫質量的評價問題,提出了基于Gabor濾波器特征表示的二值評價方法,根據5個尺度4個方向的Gabor特征,以均值和方差作為統計特征,輸入SVM進行分類判別,分別檢驗了Gabor特征在筆劃清晰結構勻稱性及風格一致性方面的性能,并進行了綜合的質量評價實驗,取得了良好的效果。書法質量評價的研究是一個具有廣泛應用價值的研究領域,其涉及到特征提取、圖像形態學和圖像語義理解等問題,提出的方法不依賴于字體分割精度,這為探索基于統計學習的書法質量評價研究提供了新的研究思路和方法。