手寫漢字評價(jià)方法研究進(jìn)展

2022-01-25 18:54:00李成城

計(jì)算機(jī)工程與應(yīng)用 2022年2期

肖雪，李成城

內(nèi)蒙古師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院，呼和浩特 010022

互聯(lián)網(wǎng)的不斷發(fā)展、創(chuàng)新以及與教學(xué)領(lǐng)域的融合，給教學(xué)設(shè)備帶來許多新的機(jī)遇。如今人們已經(jīng)積累了豐富的計(jì)算機(jī)輔助教學(xué)經(jīng)驗(yàn)，教學(xué)體系也在逐步完善。盡管計(jì)算機(jī)輔助教學(xué)設(shè)備發(fā)展得非常迅速，但也存在許多問題[1]，如計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評價(jià)軟件不充足、資源共享度不高，缺乏書寫質(zhì)量評價(jià)的相關(guān)研究等。

目前“提筆忘字”的現(xiàn)象普遍存在，這將成為傳統(tǒng)文化丟失的先兆。為了提高書寫水平，教育部對小學(xué)生的書寫要求下發(fā)相關(guān)文件[2]，而手寫漢字的指導(dǎo)工作主要由教師完成，教師對學(xué)生的手寫漢字進(jìn)行評價(jià)時(shí)會存在以下兩方面的缺點(diǎn)[3]：（1）評測專家具有極強(qiáng)的主觀性。如教師對相同書寫水平的手寫漢字打分時(shí)，會受到經(jīng)驗(yàn)、耐心等自身因素影響，導(dǎo)致分值出現(xiàn)不同程度的偏差。（2）教師不能及時(shí)對學(xué)生的手寫漢字作品做出反饋。在實(shí)際生活中，受書法課程時(shí)間以及教師精力的限制，學(xué)生作品無法隨時(shí)得到評價(jià)，容易產(chǎn)生書寫錯(cuò)誤的累積。而手寫漢字書寫質(zhì)量評價(jià)的計(jì)算機(jī)輔助教學(xué)設(shè)備，可以克服傳統(tǒng)手寫漢字評價(jià)中存在不公正和反饋不及時(shí)等問題，提高教學(xué)質(zhì)量。教師可以把更多精力和時(shí)間放在教學(xué)與輔導(dǎo)階段，極大提高了工作效率。

在教學(xué)領(lǐng)域，一個(gè)高效的計(jì)算機(jī)輔助書寫質(zhì)量評價(jià)設(shè)備具有以下三種特點(diǎn)：（1）改變傳統(tǒng)手寫漢字評價(jià)方法。（2）改正人工評價(jià)時(shí)容易出現(xiàn)主觀性和精力有限等問題。（3）找出手寫漢字中存在的不規(guī)范問題，有助于學(xué)生書寫規(guī)范漢字，實(shí)現(xiàn)及時(shí)評價(jià)[3]。此外，手寫漢字評價(jià)技術(shù)在反饋形式與反饋內(nèi)容方面已成為數(shù)據(jù)到文本生成、自動問答、字形匹配以及圖形輔助等技術(shù)發(fā)展的支持或潛在支持部分。如手寫漢字與模板漢字產(chǎn)生的數(shù)據(jù)差可實(shí)現(xiàn)數(shù)據(jù)型文本的自動生成；學(xué)生對手寫漢字的評價(jià)提出問題，利用自動問答解決問題；通過手寫漢字評價(jià)產(chǎn)生的筆畫數(shù)據(jù)，利用字形匹配以及圖形輔助等內(nèi)容，可以使反饋形式更加生動、形象有較好的用戶體驗(yàn)，有助于學(xué)生充分理解評價(jià)含義。由此可見，手寫漢字評價(jià)具有重要的研究意義與開發(fā)價(jià)值。

初期手寫漢字的特征提取主要在漢字結(jié)構(gòu)方面[4]，這類方法只能解決手寫漢字的整體規(guī)范性問題。為了解決以上問題，研究者開始嘗試提取手寫漢字的細(xì)節(jié)特征進(jìn)行書寫質(zhì)量評價(jià)，實(shí)驗(yàn)證明此想法在書寫質(zhì)量評價(jià)的準(zhǔn)確性方面確實(shí)有了很大的提升，但手寫漢字的特征提取始終依賴專家的先驗(yàn)知識獲取，既費(fèi)時(shí)又耗力。隨著深度學(xué)習(xí)的發(fā)展，研究者正在試圖利用深度學(xué)習(xí)的方法解決書寫質(zhì)量評價(jià)不全面的問題，它不但能夠提取一般特征，而且還能獲取到一些人工無法獲取的隱藏特征，有利于手寫漢字的評價(jià)。但基于深度學(xué)習(xí)的手寫漢字評價(jià)方法目前處于剛剛起步狀態(tài)，還需要研究者不斷深入的鉆研。

1 文獻(xiàn)統(tǒng)計(jì)及相關(guān)概念

1.1 文獻(xiàn)統(tǒng)計(jì)

文中對手寫漢字評價(jià)的參考文獻(xiàn)進(jìn)行收集整理，以書寫評判（handwriting evaluation）、水平評測（level assessment）、書寫質(zhì)量（handwriting quality）、計(jì)算機(jī)評價(jià)（computer evaluation）等作為關(guān)鍵詞，輸入Google scholar、ACM digital library、IEEE xplore digital library以及Springer link等途徑查找，通過閱讀文獻(xiàn)標(biāo)題以及摘要等涵蓋論文重要信息部分對論文進(jìn)行篩選，并對收集到53篇手寫漢字評價(jià)的文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析，得到圖1的結(jié)果。

圖1 文獻(xiàn)分布情況Fig.1 Literature distribution

由圖1可知，超過70%的文章發(fā)表于2009年之后，從2011年期間起，發(fā)表關(guān)于手寫漢字評價(jià)文章的數(shù)量正在逐步增加，占總數(shù)量50%左右。最初利用基于規(guī)則的方法對手寫漢字進(jìn)行評價(jià)，隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展以及手寫漢字可提取的特征越多，利用機(jī)器學(xué)習(xí)以及特征相似度的手寫漢字評價(jià)方法在近幾年呈現(xiàn)上升趨勢。

根據(jù)目前統(tǒng)計(jì)的文章，手寫漢字評價(jià)相關(guān)的綜述性文章較少。僅有安維華[5]總結(jié)了計(jì)算機(jī)輔助漢字教學(xué)的相關(guān)研究，其中包括數(shù)字化演示、書寫規(guī)范性評測以及書寫水平評測等任務(wù)，并且著重介紹書寫規(guī)范性評測中的即時(shí)評價(jià)和事后評價(jià)，未涉及到評價(jià)方法原理的介紹，也未對反饋形式做出具體分析。

1.2 書寫質(zhì)量評價(jià)相關(guān)概念和一般框架

手寫漢字的書寫質(zhì)量評價(jià)不僅包括書寫規(guī)范性評價(jià)，還包括書寫美觀、筆畫質(zhì)量、結(jié)構(gòu)、章法等多方面的評價(jià)[3]。傳統(tǒng)手寫漢字的書寫質(zhì)量評價(jià)是指，教師對學(xué)生書寫作品做出評分并對書寫細(xì)節(jié)提出改正建議，通常評價(jià)的準(zhǔn)確性容易受教師主觀性的影響。計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評價(jià)是指，利用計(jì)算機(jī)對各類手寫漢字進(jìn)行評分及評價(jià)。相對而言，傳統(tǒng)手寫漢字評價(jià)與計(jì)算機(jī)輔助的手寫漢字評價(jià)，二者具有極大的共通性。傳統(tǒng)手寫漢字評價(jià)通過教師的經(jīng)驗(yàn)以及觀察手寫漢字整體結(jié)構(gòu)、筆畫等細(xì)節(jié)與模板漢字對應(yīng)部分進(jìn)行對比給出評價(jià)。計(jì)算機(jī)輔助手寫漢字的書寫質(zhì)量評價(jià)，通過計(jì)算機(jī)提取出手寫漢字的特征與模板漢字的特征進(jìn)行比對，相似度越高則手寫漢字的書寫質(zhì)量水平越高。書寫質(zhì)量評價(jià)的一般框架如圖2所示。

圖2 書寫質(zhì)量評價(jià)一般框架Fig.2 General framework for handwriting quality

根據(jù)計(jì)算機(jī)評價(jià)手寫漢字的時(shí)間不同，可將手寫漢字的書寫質(zhì)量評價(jià)分為即時(shí)評價(jià)和事后評價(jià)兩種（表1給出了兩種評價(jià)的對比）。

表1 評價(jià)對比Table 1 Evaluation and comparison

1.2.1 即時(shí)評價(jià)

即時(shí)評價(jià)是指用戶每完成漢字的一個(gè)筆畫，系統(tǒng)就立即與模板漢字的相應(yīng)筆畫進(jìn)行相似度計(jì)算，評判筆畫的正確性（形狀正確性與位置正確性），并提出修改意見，為漢字的規(guī)范性奠定基礎(chǔ)。及時(shí)發(fā)現(xiàn)手寫漢字的錯(cuò)誤并且給予反饋是非常重要的。有些教學(xué)系統(tǒng)根據(jù)即時(shí)評價(jià)獲得手寫漢字的筆畫、筆序、部件相對位置等基本信息后，用于檢測書寫錯(cuò)誤并評估書寫質(zhì)量[6-7]。也有一些教學(xué)系統(tǒng)對手寫漢字信息進(jìn)行歸納，將手寫漢字以動畫等另一種形式展示指導(dǎo)，加深學(xué)生的記憶[8-9]。

在即時(shí)評價(jià)中信息的雙向展示非常重要[10]。學(xué)者進(jìn)行實(shí)踐練習(xí)的同時(shí)及時(shí)得到反饋，是加深印象的關(guān)鍵。然而，如何全面地發(fā)現(xiàn)手寫漢字問題，并且突出顯著錯(cuò)誤的反饋也是研究者致力解決的問題。

為了解決輸入字符與模板字符進(jìn)行匹配時(shí)，因漢字結(jié)構(gòu)復(fù)雜和書寫風(fēng)格差異較大等原因?qū)е虏荒軠?zhǔn)確找到筆跡錯(cuò)誤位置的問題。胡智慧等人[11]設(shè)計(jì)出一套實(shí)時(shí)評測與反饋的漢字書寫質(zhì)量系統(tǒng)，該系統(tǒng)通過屬性關(guān)系圖實(shí)現(xiàn)即時(shí)檢測筆畫信息，對筆畫與筆畫之間的關(guān)系（相鄰、相交、相接）、筆畫順序以及筆畫類型（橫、豎、撇等）及時(shí)作出反饋評價(jià)，并利用剪枝策略提高評測速率。但這套系統(tǒng)僅對以筆畫為基礎(chǔ)的漢字進(jìn)行匹配評價(jià)，忽略了手寫漢字結(jié)構(gòu)因素（對稱性、勻稱性等）的影響。目前存在大量即時(shí)評價(jià)的書寫質(zhì)量評價(jià)系統(tǒng)，它們主要關(guān)注筆畫和筆順的特征，忽略了字體結(jié)構(gòu)對書寫質(zhì)量的影響，而筆畫、筆順等特征只能證明此手寫漢字是否可識別，手寫漢字結(jié)構(gòu)的判斷卻是書寫質(zhì)量的一種衡量標(biāo)準(zhǔn)（可以評價(jià)手寫漢字）[12]。莊崇彪等人[13]根據(jù)計(jì)算機(jī)可識別出手寫漢字常見的十一種錯(cuò)誤，引入單筆畫框（局部特征）以及多筆畫框（全局特征）的概念，制定出筆畫、筆畫間特征以及特征分類的規(guī)則，該算法可以對筆勢、多筆畫等特征進(jìn)行正誤和工整評判。但筆畫起始點(diǎn)位置工整性的判斷，并不能代表筆段是否書寫工整。現(xiàn)實(shí)生活中，初學(xué)者及一些具有獨(dú)特書寫風(fēng)格的學(xué)者并不能按照標(biāo)準(zhǔn)筆段進(jìn)行書寫，所以該算法只能進(jìn)行初步的工整性評價(jià)，并且識別手寫漢字錯(cuò)誤的數(shù)量由制定的規(guī)則決定。

即時(shí)評價(jià)主要關(guān)注手寫漢字的局部特征，能夠及時(shí)發(fā)現(xiàn)手寫漢字的首發(fā)錯(cuò)誤并作出反饋，訓(xùn)練書寫者對漢字筆畫等基礎(chǔ)結(jié)構(gòu)的掌握。但即時(shí)評價(jià)會頻繁打斷書寫者的學(xué)習(xí)過程，與書寫者的交互形式不是很友好，影響其對整體漢字的認(rèn)識。

1.2.2 事后評價(jià)

事后評價(jià)是指對書寫完成的漢字一次性指出書寫質(zhì)量中存在的問題并給出反饋意見。事后評價(jià)的主要技術(shù)是特征比對[14-15]與反饋指導(dǎo)[16]。特征匹配是指目標(biāo)圖像或特征在數(shù)據(jù)庫中利用相似性搜索匹配結(jié)果。反饋指導(dǎo)是指根據(jù)匹配結(jié)果給出反饋意見（筆畫數(shù)目是否正確、筆畫之間的比例等關(guān)系）。事后評價(jià)的方法主要關(guān)注手寫漢字的全局特征，有利于書寫者對整體漢字的認(rèn)識，卻存在書寫錯(cuò)誤積累（初學(xué)者常見錯(cuò)誤），無法及時(shí)提醒書寫者首發(fā)錯(cuò)誤的問題，所以事后評價(jià)比較適合有一定基礎(chǔ)的書寫者。

事后評價(jià)的一般步驟為：（1）提取手寫漢字的特征，特征包括部件（筆畫、關(guān)鍵點(diǎn)等）、整體（骨架、章法布局等）；（2）特征匹配；（3）根據(jù)匹配相似度結(jié)果給出規(guī)范性指導(dǎo)。也可將步驟（1）和步驟（2）在圖像處理中一起實(shí)現(xiàn)。其中閆文耀等人[17]針對現(xiàn)實(shí)生活中手寫漢字存在連筆、個(gè)性化書寫風(fēng)格等問題導(dǎo)致手寫漢字分割困難，提出基于圖像紋理的書寫質(zhì)量評價(jià)方法。該方法通過Gabor對全局特征進(jìn)行提取，利用支持向量機(jī)的統(tǒng)計(jì)學(xué)習(xí)方法對書寫質(zhì)量進(jìn)行評價(jià)。在CHAED數(shù)據(jù)集下，手寫漢字的書寫質(zhì)量評價(jià)準(zhǔn)確率達(dá)到了95%。其優(yōu)點(diǎn)是放棄了分割的過程，避免由分割失誤對評價(jià)結(jié)果產(chǎn)生誤差。但是此評價(jià)結(jié)果只有優(yōu)秀和一般兩種，不能具體指出手寫漢字特征錯(cuò)誤位置及原因。

1.3 評價(jià)指標(biāo)

手寫漢字的評價(jià)指標(biāo)主要由反饋指導(dǎo)的形式?jīng)Q定。目前關(guān)于手寫漢字的反饋指導(dǎo)形式主要有：文字評價(jià)、評分以及圖形輔助三種。在書寫質(zhì)量評價(jià)的一般框架下，不同手寫漢字評價(jià)方法需要依據(jù)手寫漢字的字體、評價(jià)結(jié)果以及數(shù)據(jù)規(guī)模大小的不同進(jìn)行改進(jìn)，為了驗(yàn)證手寫漢字評價(jià)效果，可參考以下評價(jià)指標(biāo)。

1.3.1 人工評價(jià)

當(dāng)反饋指導(dǎo)的形式為文字評價(jià)時(shí)，好的文字評價(jià)指標(biāo)應(yīng)該滿足：（1）準(zhǔn)確性。從評價(jià)文本的內(nèi)容來看，評價(jià)文本能正確體現(xiàn)手寫漢字的缺點(diǎn)以及對缺點(diǎn)的分析。（2）流暢性。由于評價(jià)文本是基于自然語言進(jìn)行描述，因此文本需要語法正確并且流暢，方便書寫者閱讀理解。（3）相似性。生成的評價(jià)文本與參考評價(jià)文本之間的相似度越高表明模型的訓(xùn)練效果越好。

人工評價(jià)時(shí)，將得分項(xiàng)設(shè)為1~5（1為最低等級，5為最高等級），研究者會邀請有一定經(jīng)驗(yàn)的教師閱讀評價(jià)文本進(jìn)行打分。不同教師存在個(gè)性、認(rèn)真態(tài)度、評價(jià)經(jīng)驗(yàn)等差異性導(dǎo)致評分存在偏差，可通過金字塔方法[18]解決以上問題。雖然人工評價(jià)的成本較高，但此評估方法依舊是當(dāng)前研究工作中重要的一部分。

1.3.2 自動評價(jià)

（1）BLEU

BLEU（bilingual evaluation understudy）指標(biāo)用于比較生成文本與參考文本之間n元詞組的重合程度，其中共有四元詞組，BLEU-1代表一元詞組，以此類推。BLEU指標(biāo)的取值越高（n元詞組重合程度越高），生成文本質(zhì)量越高，其公式如下：

其中，Wn表示權(quán)重，pn表示精度，BP是懲罰因子。

（2）METEOR

METEOR（metric for evaluation of translation with explicit ordering）指標(biāo)在考慮詞性的同時(shí)還擴(kuò)充了同義詞集。在評價(jià)生成文本流暢度時(shí)應(yīng)用了chunk，每個(gè)chunk的平均長度越長，生成文本與參考文本的語序越一致。其公式如下：

其中，c表示生成文本的長度，r表示參考文本的長度，m為參考文本中能夠被匹配的一元組數(shù)量，pen為懲罰因子（懲罰生成文本與參考文本詞序差距過大），其計(jì)算公式為：

其中，#chunk是指chunk的數(shù)量，chunk是指既在輸出文本中相鄰又在真實(shí)文本中相鄰的一元組聚集而成的單位。

（3）ROUGE

ROUGE（recall-oriented understudy for gisting evaluation）指標(biāo)可以分為ROUGE-N和ROUGE-L。其中，ROUGE-N主要用于計(jì)算兩個(gè)句子之間n元詞組的重合率，ROUGE-L計(jì)算最長公共子序列的重合率。其公式為：

其中，Countmatch(gramn)表示生成文本與參考文本中同時(shí)出現(xiàn)n-gram的個(gè)數(shù)，count(x)表示x出現(xiàn)的次數(shù)，{RefSummaries}是參考文本。

ROUGE-L的計(jì)算公式如下：

其中，X表示輸出文本，Y表示真實(shí)文本，m表示生成文本的長度，n表示輸出文本的長度。

（4）CIDER

CIDER（consensus-based image description evaluation）指標(biāo)通過度量生成文本與參考文本之間的相似性來判定質(zhì)量。利用TF-IDF的余弦夾角對每個(gè)參考句子與生成句子之間的相似度進(jìn)行度量。其公式如下所示：

其中，gn(ci)和gn(sij)是TF-IDF向量，ci是生成文本的句子，參考文本句子集合si={si1,si2,…,sim}，當(dāng)使用了長度不同的n元詞組時(shí)，存在以下公式：

2 手寫漢字評價(jià)方法

為了實(shí)現(xiàn)手寫漢字的準(zhǔn)確評價(jià)，研究人員不斷利用各種方法實(shí)現(xiàn)手寫漢字評價(jià)，其正在成為不需要教師參與就可以自動生成評價(jià)的可行技術(shù)。現(xiàn)有的技術(shù)可分為以下幾種方法：基于規(guī)則、基于特征相似度計(jì)算、基于模糊矩陣以及基于機(jī)器學(xué)習(xí)。這些方法存在各自的優(yōu)缺點(diǎn)，具體情況如表2所示。

表2 手寫漢字評價(jià)方法Table 2 Classification of handwritten Chinese character evaluation methods

2.1 基于規(guī)則的方法

基于規(guī)則的方法是根據(jù)理論描述成分與成分之間的結(jié)構(gòu)關(guān)系和意義關(guān)系，并應(yīng)用其中的關(guān)系對事物進(jìn)行分析。將基于規(guī)則的方法與手寫漢字結(jié)合，領(lǐng)域?qū)＜覐母髯圆煌慕嵌瘸霭l(fā)，制定不同的規(guī)則對手寫漢字進(jìn)行評測[19]。此方法遵循以下步驟：首先從手寫漢字中找到可以描述手寫漢字特征的表示，然后通過決策樹等不同的算法對特征表示進(jìn)行判斷，進(jìn)而得到手寫漢字的書寫質(zhì)量評價(jià)。這是一種最基礎(chǔ)的手寫漢字評價(jià)方法，而對每種筆畫制定規(guī)則限制了它在大規(guī)模數(shù)據(jù)下的評價(jià)任務(wù)。

莊崇彪等人[13]利用單筆畫框、多筆畫框以及筆段八方向編碼對筆畫特征以及筆畫間特征制定了規(guī)范性規(guī)則，通過閾值對特征的限制實(shí)現(xiàn)等級分類。實(shí)驗(yàn)結(jié)果表明此方法只對規(guī)范的漢字特征提取效果較好，并且書寫錯(cuò)誤類型判斷是否全面由規(guī)則決定，這限制了評價(jià)的準(zhǔn)確性與多樣性。

特征描述的貼切程度對書寫質(zhì)量評價(jià)的準(zhǔn)確性起到?jīng)Q定作用，特征描述越詳細(xì)評價(jià)效果越好。韓睿方等人[20]為了提高識別手寫漢字中錯(cuò)誤的效率，利用決策樹實(shí)現(xiàn)手寫漢字筆畫關(guān)鍵點(diǎn)之間的距離差以及筆段的水平傾角、彎曲程度等細(xì)節(jié)的不同等級分類。該方法通過收集50個(gè)不同學(xué)歷的人書寫的手寫漢字筆畫，每個(gè)筆畫采集10~20次，在此數(shù)據(jù)集上進(jìn)行測評，結(jié)果顯示宏觀特征的評判效果達(dá)到了100%的召回率，微觀特征評判效果的準(zhǔn)確率與召回率都在80%以上。Tan[21]提出了低整數(shù)編碼對原始筆畫特征和字符特征進(jìn)行表示，可識別出手寫漢字筆畫類型、順序等問題。與韓睿方提出的方法相比，此方法對筆畫等特征的評判要求較低，并且缺少漢字結(jié)構(gòu)的評價(jià)，更適合初學(xué)者練習(xí)手寫漢字。

這種基于規(guī)則的方法是手寫漢字評價(jià)最初成功的方法，為接下來的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。此方法雖然簡單但存在局限性：第一，需要對數(shù)據(jù)庫里每一個(gè)手寫漢字（筆畫）制定規(guī)則。若出現(xiàn)一個(gè)從未出現(xiàn)的漢字（筆畫），需要添加新的規(guī)則，并且新添加的規(guī)則容易與前面制定的規(guī)則發(fā)生沖突。手寫漢字評價(jià)廣泛地應(yīng)用于中小學(xué)等不同人群，其需要的數(shù)據(jù)不同，并且不斷要求有新字出現(xiàn)，而字庫卻相對固定，所以基于規(guī)則的方法無法滿足所有用戶的需求。第二，規(guī)則的覆蓋性較差。有些手寫漢字的筆畫、結(jié)構(gòu)書寫復(fù)雜，手寫漢字的規(guī)則很難總結(jié)全面，這也是這類方法進(jìn)行書寫質(zhì)量評價(jià)結(jié)果不理想的原因。

2.2 基于特征相似度計(jì)算的方法

這類方法主要受到文字識別研究的啟發(fā)[22]。在評價(jià)手寫漢字時(shí)，手寫漢字與模板漢字之間的差異大小，由特征相似度決定。該方法主要執(zhí)行以下步驟：（1）提取手寫漢字的特征。（2）與模板漢字特征進(jìn)行相似度計(jì)算，以相似度高低作為評價(jià)書寫質(zhì)量的指標(biāo)。

漢字大多結(jié)構(gòu)復(fù)雜，在一定程度上限制了手寫漢字進(jìn)行相似度計(jì)算的速率，在保證特征信息完整的情況下，如何快速地進(jìn)行相似度計(jì)算是提高書寫質(zhì)量評價(jià)效率的關(guān)鍵步驟。不同手寫漢字特征，相似度計(jì)算的速率不同。在書法字檢索中[23]，利用骨架以及輪廓特征與數(shù)據(jù)庫中的漢字進(jìn)行特征相似度計(jì)算實(shí)現(xiàn)檢索，骨架特征相比輪廓特征檢索的時(shí)間減少了70%，提高了檢索效率，實(shí)現(xiàn)在較大規(guī)模的漢字集中能夠快速完成特征匹配問題。手寫漢字特征包含能夠描述手寫漢字特性、結(jié)構(gòu)、整體等的特征，進(jìn)行評價(jià)時(shí)不僅需要考慮不同特征組合對評價(jià)的影響，還應(yīng)該考慮特征自身特點(diǎn)對評價(jià)的影響。鄧學(xué)雄等人[24]將局部和整體特征一起作為評價(jià)手寫漢字的粒度，他們認(rèn)為初學(xué)者進(jìn)行臨帖練習(xí)效果的好壞由臨帖字體與原帖字體之間的相似度決定，并且利用PS工具提取手寫漢字的筆畫（局部特征），分別利用數(shù)學(xué)形態(tài)細(xì)化法以及圖像投影的方法提取手寫漢字的骨架特征和章法布局（整體特征），對手寫漢字的局部特征以及整體特征與模板漢字相應(yīng)部分進(jìn)行歐氏距離計(jì)算，由相似度決定書寫質(zhì)量。但此方法的缺點(diǎn)是：（1）適用于初學(xué)者。毛筆字練習(xí)者初期臨摹原貼中字的形態(tài)、結(jié)構(gòu)等，后期應(yīng)在初期的基礎(chǔ)上不斷創(chuàng)新，形成具有風(fēng)格的字體。而漢字風(fēng)格特征是一種附著在骨架特征上的輪廓形態(tài)特征[25]，所以骨架相似度計(jì)算并不適合后期的學(xué)習(xí)。（2）不適用于數(shù)據(jù)量大的毛筆字臨帖評價(jià)。此方法中筆畫的提取是利用PS工具，對數(shù)據(jù)量較大的手寫漢字進(jìn)行評價(jià)時(shí)，提取筆畫特征將花費(fèi)大量時(shí)間。其中李牧[26]認(rèn)為鄧學(xué)雄的算法沒有考慮到筆畫簡單的疊加進(jìn)行相似度計(jì)算的結(jié)果將受到結(jié)構(gòu)信息的影響。為了筆畫特征不受旋轉(zhuǎn)、形狀區(qū)域平移的影響，李牧利用Hu矩進(jìn)行筆畫的相似度計(jì)算。而吳楚洲[27]認(rèn)為李牧在進(jìn)行骨架相似度計(jì)算時(shí)，很難取到不同骨架相同的對應(yīng)點(diǎn)，所以將骨架進(jìn)行米字格或九宮格的劃分，與模板漢字相同區(qū)域內(nèi)的骨架利用Hu矩進(jìn)行相似度計(jì)算。該方法對書寫等級較低的用戶來說，臨摹時(shí)容易出現(xiàn)手寫漢字筆畫與模板漢字對應(yīng)筆畫不在同一區(qū)域內(nèi)的缺點(diǎn)。

在以上實(shí)驗(yàn)中模板漢字是事先提供的，不存在檢索模板漢字的過程，也不需要考慮識別模板漢字的計(jì)算速率。而在現(xiàn)實(shí)生活中，進(jìn)行考試等評估工作時(shí)不允許提供模板漢字，而平時(shí)的書寫練習(xí)可以提供模板漢字，所以將書寫質(zhì)量評價(jià)系統(tǒng)設(shè)置為考試模式和練習(xí)模式才具有廣泛的適用性。邵榮棠[28]對書法字檢索效率低以及如何全面評價(jià)手寫漢字問題進(jìn)行解決，設(shè)計(jì)出練習(xí)模式的評價(jià)系統(tǒng)。解決方法主要包括四個(gè)步驟：首先，提出一種改進(jìn)的書法字雙層檢索方法提高手寫漢字識別的準(zhǔn)確率，從數(shù)據(jù)庫中快速查找出手寫漢字的模板漢字。接著，針對檢索出的模板漢字提出基于Z-S算法改進(jìn)的單像素化處理算法，得到手寫漢字整體骨架特征并且進(jìn)行相似度計(jì)算。然后，對處理完成的書法字骨架進(jìn)行九宮格的切分，利用Hu矩對切分出的骨架與模板漢字對應(yīng)九宮格區(qū)域內(nèi)的骨架進(jìn)行相似度計(jì)算，得到筆段特征相似度值。最后，通過計(jì)算手寫漢字到邊框的距離與手寫漢字的整體布局得到布局特征相似度。此方法有效利用手寫漢字特征，實(shí)現(xiàn)在不影響特征信息的前提下對特征進(jìn)行處理，加快特征相似度計(jì)算的效率，但忽略了筆畫的對比信息，對手寫漢字的評價(jià)信息未能達(dá)到具體精細(xì)并且其評價(jià)指標(biāo)較少不能得到客觀評價(jià)。

該方法雖然實(shí)現(xiàn)簡單卻有較多的缺點(diǎn)：（1）手寫漢字的特征選擇代表了當(dāng)前手寫漢字的特性，如果沒有充分考慮手寫漢字特征僅將幾個(gè)特征進(jìn)行計(jì)算，就會造成手寫漢字評價(jià)不全面。這是此類方法結(jié)果不理想不可避免的原因。（2）手寫漢字特征提取的效果影響評價(jià)結(jié)果。如手寫漢字骨架提取效果影響全局特征，而骨架提取過程中毛刺的產(chǎn)生是不可避免的，所以將骨架的毛刺去除至光滑或只存在較少的毛刺對手寫漢字的評價(jià)是至關(guān)重要的。

2.3 基于模糊矩陣的方法

手寫漢字評價(jià)不能僅局限于與模板漢字對比，其書寫風(fēng)格也應(yīng)該被接納。由于每個(gè)人的書寫習(xí)慣以及學(xué)習(xí)背景不同，所以手寫漢字具有其自身的特點(diǎn)。而模糊矩陣恰好可以實(shí)現(xiàn)在不忽略每種手寫漢字風(fēng)格的基礎(chǔ)上，進(jìn)行相似度計(jì)算。這類方法將需要評判的特征構(gòu)成模糊子集，選取適合當(dāng)前特征的隸屬度函數(shù)進(jìn)行計(jì)算得到隸屬度，由當(dāng)前手寫漢字隸屬度與模板漢字隸屬度之間的相似度決定手寫漢字評價(jià)。特征的選擇對手寫漢字是否可以得到全面評價(jià)起到關(guān)鍵作用[29]。易于提取的手寫漢字大小、重心等全局特征對手寫漢字只起到了宏觀范圍的指導(dǎo)，全局特征與局部特征相結(jié)合才會較全面地評價(jià)手寫漢字。

王耀等人[30]首先對52個(gè)大小寫英文字母構(gòu)建模式庫，將模板字母的比例質(zhì)量、位置質(zhì)量、大小質(zhì)量以及筆畫質(zhì)量的分析參數(shù)進(jìn)行存儲，然后針對不同特征選擇不同的函數(shù)進(jìn)行模糊化得到隸屬度，最后與模板字母隸屬度進(jìn)行相似度計(jì)算，根據(jù)閾值的劃分得到不同的評價(jià)。該方法對250個(gè)不同書寫形狀“A”的書寫質(zhì)量進(jìn)行評價(jià)，實(shí)驗(yàn)結(jié)果表明其最高有效率達(dá)到97.8%。此方法僅適用于構(gòu)成元素較少的書寫體中，而漢字?jǐn)?shù)目眾多且結(jié)構(gòu)復(fù)雜，對每個(gè)漢字建立模式庫是不現(xiàn)實(shí)的，所以此方法不適用于手寫漢字的書寫質(zhì)量評價(jià)中。樊亮[31-32]發(fā)現(xiàn)學(xué)者在觸摸屏上進(jìn)行書寫時(shí)，因書寫能力不同產(chǎn)生筆力均勻、筆力過輕和筆力過重三種現(xiàn)象，并且利用模糊數(shù)學(xué)實(shí)現(xiàn)筆力模糊評價(jià)。該方法首先根據(jù)書寫特點(diǎn)建立8種關(guān)鍵點(diǎn)類型，然后通過高斯函數(shù)得到手寫漢字每個(gè)筆畫關(guān)鍵點(diǎn)的隸屬度，與模板漢字關(guān)鍵點(diǎn)隸屬度進(jìn)行相似度計(jì)算，最后根據(jù)隸屬度的貼近程度得到手寫漢字的等級評價(jià)。與王耀提出的方法相比，該方法并沒有存儲所有模板漢字關(guān)鍵點(diǎn)的分析參數(shù)，而是將模板漢字與手寫漢字一起利用算法得到隸屬度，避免了存儲筆畫數(shù)據(jù)帶來數(shù)據(jù)臃腫的缺點(diǎn)，具有更廣泛的應(yīng)用性。但筆力僅是書寫質(zhì)量中的一部分，還需要其他指標(biāo)（大小、比例、傾斜等）的分析才可以得到較全面的手寫漢字評價(jià)[33]。

書寫質(zhì)量區(qū)間是評價(jià)的最重要部分，以上方法都是研究者設(shè)置書寫質(zhì)量區(qū)間，區(qū)間范圍的設(shè)置難免會存在主觀性。而葛佳敏[34]首先利用模糊概率分布可以解決多值分析的問題，得到每個(gè)分類值的權(quán)重和每個(gè)特征的期望值。然后利用模糊綜合評價(jià)將不同特征期望值在模型中計(jì)算，進(jìn)而得到整個(gè)字的期望值。最后將期望值與得到的期望值范圍進(jìn)行比較，得出手寫漢字的評價(jià)。其中，期望值范圍指手寫漢字整體期望值在某一值以上時(shí)書寫質(zhì)量較為規(guī)范。這種方法不再需要人為設(shè)置評價(jià)標(biāo)準(zhǔn)，也不需要大量的模板漢字作為參照對象，使評價(jià)結(jié)果具有公正客觀性。

對于書寫質(zhì)量區(qū)間的設(shè)置，王求真等人[35]的算法具有較好的效率。其主要針對評價(jià)手寫漢字時(shí)常見的幾種問題：（1）字形結(jié)構(gòu)復(fù)雜。（2）不同的書寫風(fēng)格。（3）筆畫模糊不規(guī)范等等，提出模糊分析方法。該算法的基本思路為：首先根據(jù)聯(lián)機(jī)設(shè)備獲得手寫漢字的局部特征（關(guān)鍵點(diǎn)）和全局特征（比例、大小和位置等）的信息，分別利用高斯法和統(tǒng)計(jì)實(shí)驗(yàn)進(jìn)行模糊化。

手寫漢字的特征向量模糊計(jì)算如以下公式所示[24]：

其中，式（14）中xs表示當(dāng)前手寫漢字的特征向量（除重心外），as為特征分布的中心，b和c分別為分布情況圖范圍的最大值與最小值。式（15）為手寫漢字重心的模糊計(jì)算，其中xw表示當(dāng)前手寫漢字的重心特征向量，x與y分別為當(dāng)前手寫漢字重心的橫坐標(biāo)與縱坐標(biāo)，xˉ與yˉ分別為模板漢字重心的橫坐標(biāo)與縱坐標(biāo)。

最后與模板漢字相應(yīng)的特征進(jìn)行相似度計(jì)算，其中筆畫特征相似度計(jì)算的公式為：

A、B分別代表手寫漢字和模板漢字，表示手寫漢字A中第i筆畫的模糊度。

結(jié)構(gòu)特征值進(jìn)行相似度計(jì)算的公式為：

其中，μai表示手寫漢字A中結(jié)構(gòu)質(zhì)量的3個(gè)指標(biāo)（大小、比例、位置）模糊度集合。根據(jù)獲得的筆畫相似度和結(jié)構(gòu)相似度通過權(quán)值分配的方法得到手寫漢字的評分，若手寫漢字的筆畫和結(jié)構(gòu)與模板漢字對應(yīng)部分的相似度任意一項(xiàng)小于0.5，則取其中最小值作為評價(jià)分?jǐn)?shù)。

研究者通過收集200個(gè)常見漢字進(jìn)行500次隨機(jī)書寫并進(jìn)行實(shí)驗(yàn)，結(jié)果表明其準(zhǔn)確率最高可達(dá)90.42%。其中書寫質(zhì)量閾值的設(shè)置來源于統(tǒng)計(jì)模板漢字區(qū)間分布，但區(qū)間選擇只選取統(tǒng)計(jì)模板的高頻區(qū)間，使評價(jià)不能達(dá)到絕對的公正客觀。

這類研究充分利用手寫漢字特征，如手寫漢字的關(guān)鍵點(diǎn)、重心和筆畫等，其評價(jià)的效果也隨著特征信息的增加而不斷變好，但其本質(zhì)是忽略手寫漢字的細(xì)節(jié)與模板漢字進(jìn)行相似度計(jì)算，雖然解決了手寫漢字風(fēng)格描述困難的問題，但對于一些難以區(qū)分的漢字（如“士”“土”，其各自的模糊矩陣非常相似）需要定量分析才可以解決。并且每種特征應(yīng)該選取合適的隸屬函數(shù)，若提取出多種不同屬性的特征，其隸屬函數(shù)的選擇與構(gòu)建是一個(gè)相當(dāng)繁瑣且耗時(shí)的事情，所以隸屬函數(shù)的泛化是解決此問題的關(guān)鍵。

2.4 基于機(jī)器學(xué)習(xí)的方法

機(jī)器學(xué)習(xí)是研究計(jì)算機(jī)模擬人類學(xué)習(xí)的科學(xué)，主要學(xué)習(xí)如何利用有效信息，從數(shù)據(jù)中獲取隱藏的、可理解的知識。在手寫漢字評價(jià)任務(wù)中，利用機(jī)器學(xué)習(xí)從大量數(shù)據(jù)中學(xué)習(xí)手寫漢字特征與評價(jià)之間的關(guān)系，避免人工評價(jià)效率低、具有主觀性等缺點(diǎn)。

2.4.1 基于深度學(xué)習(xí)的方法

深度學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動的端到端的方法，其通過學(xué)習(xí)樣本數(shù)據(jù)內(nèi)在規(guī)律，組合低層特征形成高層特征，用來發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示，更能夠刻畫數(shù)據(jù)的內(nèi)在信息，其在各個(gè)領(lǐng)域都有很多成果[36]。在手寫漢字評價(jià)任務(wù)中，運(yùn)用深度神經(jīng)網(wǎng)絡(luò)自動對手寫漢字中隱藏的特征進(jìn)行挖掘，在模板漢字中查找與輸入漢字特征最相近的模板漢字，對其進(jìn)行排序，繼而實(shí)現(xiàn)手寫漢字評價(jià)，其一般流程如圖3所示。

圖3 基于深度學(xué)習(xí)的手寫漢字評價(jià)方法Fig.3 Handwritten Chinese character evaluation method based on deep learning

這些方法可以高效地代替人工提取特征，尤其在大規(guī)模的數(shù)據(jù)集上改變傳統(tǒng)筆畫、部件間距等繁雜的特征提取過程，可以更深層次地挖掘手寫漢字的特征信息，使手寫漢字評價(jià)結(jié)果的準(zhǔn)確率提高。常用的深度學(xué)習(xí)技術(shù)包括卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network，CNN）、BP神經(jīng)網(wǎng)絡(luò)（BP neural network，BPNN）等。

（1）基于BP神經(jīng)網(wǎng)絡(luò)的方法

以上方法大多利用歐氏距離進(jìn)行相似度計(jì)算，而歐氏距離的計(jì)算容易受到特征結(jié)構(gòu)、旋轉(zhuǎn)等因素的影響，并且如何找到不同骨架的對應(yīng)點(diǎn)也是值得考慮的地方。而人工神經(jīng)網(wǎng)絡(luò)可以通過自身的訓(xùn)練學(xué)習(xí)規(guī)則，并不需要事先指定輸入與輸出之間的關(guān)系，就可以得到最接近期望的結(jié)果，可避免特征結(jié)構(gòu)、旋轉(zhuǎn)等因素的影響以及找不準(zhǔn)對應(yīng)點(diǎn)帶來的誤差。

其中BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程由正向傳播和反向傳播組成，正向傳播過程輸出的結(jié)果與實(shí)際期望不相符時(shí)，則轉(zhuǎn)入反向傳播。反向傳播通過誤差分?jǐn)偟乃枷耄拐`差沿梯度方向下降。正向傳播與反向傳播是周而復(fù)始地進(jìn)行的，是權(quán)值不斷調(diào)整以及網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程，直到輸出的誤差減少到可接受的程度或達(dá)到預(yù)先設(shè)置的學(xué)習(xí)次數(shù)為止，其中BP神經(jīng)網(wǎng)絡(luò)模型如圖4所示。

圖4 BP神經(jīng)網(wǎng)絡(luò)模型圖Fig.4 BP neural network model diagram

其中前向傳播首先根據(jù)屬性的個(gè)數(shù)設(shè)置輸入層神經(jīng)單元的個(gè)數(shù)，除了輸入層外其他各層的輸入值為上一層輸出值與各自權(quán)重wij乘積后累加的結(jié)果加上偏置θj，每個(gè)結(jié)點(diǎn)的輸出值等于輸入值在激活函數(shù)f(?)的作用下作變換，則前向傳播輸出層的計(jì)算過程如下式所示：

因最初神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置都是隨機(jī)獲取，因此需要根據(jù)網(wǎng)絡(luò)的輸出層調(diào)整網(wǎng)絡(luò)的權(quán)重值和偏置值縮小差異。逆向傳播過程如公式（21）所示：

其中，Ej表示第j個(gè)結(jié)點(diǎn)的誤差值，Oj表示第j個(gè)結(jié)點(diǎn)的輸出值，Wjk表示當(dāng)前層的結(jié)點(diǎn)j到下一層結(jié)點(diǎn)k的權(quán)重值，Ek表示下一層結(jié)點(diǎn)k的誤差率。

權(quán)重值和偏置值調(diào)整公式如下所示：

其中，λ∈(0,1)，表示學(xué)習(xí)率。

BP神經(jīng)網(wǎng)絡(luò)因其具有較強(qiáng)的自適應(yīng)性和自學(xué)習(xí)能力，以及能夠以任意精度逼近任何非線性連續(xù)函數(shù)使其很好地求解內(nèi)部機(jī)制復(fù)雜的問題，而被應(yīng)用于手寫漢字評價(jià)中，將手寫漢字中提取的特征作為BP神經(jīng)網(wǎng)絡(luò)輸入值，通過學(xué)習(xí)輸入數(shù)據(jù)的隱藏規(guī)則輸出手寫漢字的評價(jià)。

為了手寫漢字的書寫質(zhì)量評價(jià)效果更優(yōu)秀，實(shí)驗(yàn)采用了神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)計(jì)算方法相結(jié)合的方法。手寫漢字的特征值越詳細(xì)，BP神經(jīng)網(wǎng)絡(luò)對手寫漢字進(jìn)行評價(jià)的效果以及反饋越好。一些研究人員借助聯(lián)機(jī)工具，獲取到更多可利用的手寫漢字信息[37]。例如，根據(jù)筆畫的起點(diǎn)和端點(diǎn)、筆勢的走向、筆畫的像素點(diǎn)集合等，這些信息在圖像處理過程中較難獲取，并且通常都會對手寫漢字評價(jià)是否全面起到關(guān)鍵作用。

黃峰[38]利用聯(lián)機(jī)設(shè)備獲取到每個(gè)手寫漢字的關(guān)鍵點(diǎn)以及筆畫端點(diǎn)坐標(biāo)等信息，通過外包矩陣以及重心的距離比值等方法得到手寫漢字的筆畫、部件特征，將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練，從而構(gòu)建了手寫漢字評價(jià)模型。Sun等人[39]通過3個(gè)4層的BP神經(jīng)網(wǎng)絡(luò)，分別對全局特征、布局特征以及混合特征進(jìn)行美感分析，并且使用支持向量機(jī)對全局特征進(jìn)行分類，這種方法更多專注于手寫漢字的全局特征，不能滿足漢字書寫質(zhì)量評價(jià)的細(xì)節(jié)需求。耿曉艷等人[40]利用三層BP神經(jīng)網(wǎng)絡(luò)分別構(gòu)建了四個(gè)評價(jià)模型，對9項(xiàng)（復(fù)雜度、形態(tài)結(jié)構(gòu)特征、黑像素總數(shù)等）特征進(jìn)行不同組合作為輸入值，得到11個(gè)角度的手寫漢字評價(jià)，該方法只對標(biāo)準(zhǔn)體的漢字具有較好的評價(jià)效果。

以上方法進(jìn)行手寫漢字的書寫質(zhì)量評價(jià)時(shí)，其準(zhǔn)確性與運(yùn)行速率將受到BP神經(jīng)網(wǎng)絡(luò)和手寫漢字特征兩方面的影響。

BP神經(jīng)網(wǎng)絡(luò)方面：（1）因BP神經(jīng)網(wǎng)絡(luò)需要解決復(fù)雜的非線性化問題，權(quán)值是通過局部改善的方法逐漸調(diào)整，從而權(quán)值容易收斂于局部極小點(diǎn)，使手寫漢字評價(jià)的訓(xùn)練結(jié)果達(dá)不到最優(yōu)效果。（2）BP神經(jīng)網(wǎng)絡(luò)對初始權(quán)值非常敏感，而隨機(jī)獲取的不同初始化權(quán)值極易出現(xiàn)收斂于不同局部極小值的情況，導(dǎo)致每次訓(xùn)練得到不同結(jié)果。相同手寫漢字在同一評測規(guī)則下評分結(jié)果應(yīng)該保持一致，而BP神經(jīng)網(wǎng)絡(luò)的運(yùn)算結(jié)果并不滿足以上評分條件。（3）BP神經(jīng)網(wǎng)絡(luò)算法本質(zhì)為梯度下降法，調(diào)整權(quán)值的方向由誤差與權(quán)值的一階導(dǎo)數(shù)決定，而在BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中，慣性因子是固定的，這導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)的收斂速度達(dá)不到理想狀態(tài)，并且為了保證BP神經(jīng)網(wǎng)絡(luò)的收斂性，學(xué)習(xí)率必須小于某一閾值，這同樣導(dǎo)致收斂速度不理想，影響手寫漢字評價(jià)的運(yùn)行速度。

手寫漢字特征方面：目前并沒有總結(jié)出可以完全描述手寫漢字特點(diǎn)的特征值，而是將獲得的信息全部進(jìn)行手寫漢字評價(jià)，但有些手寫漢字特征的信息包含在其他組合手寫漢字特征中[41]。例如手寫漢字的重心、面積和長寬比數(shù)值的組合特征就可得出手寫漢字距離各邊框的長度，特征提取時(shí)就可以忽略被包含的特征，所以分析出一組可得到手寫漢字全面評價(jià)的特征是非常重要的。該方法為了獲得更多有用信息，得到較全面的評價(jià)使用了聯(lián)機(jī)設(shè)備，而在生活中每個(gè)人擁有聯(lián)機(jī)設(shè)備是不現(xiàn)實(shí)的。為了廣泛普及手寫漢字評價(jià)，如何在不使用聯(lián)機(jī)設(shè)備的情況下，高效、準(zhǔn)確地提取出手寫漢字特征，獲得更多有價(jià)值信息是值得去研究的。

（2）基于卷積神經(jīng)網(wǎng)絡(luò)的方法

卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在計(jì)算機(jī)視覺領(lǐng)域取得了巨大的成功，其不僅具有表達(dá)效果隨著網(wǎng)絡(luò)層數(shù)的增加而增加的優(yōu)點(diǎn)，而且無需手動選取特征。在手寫漢字評價(jià)中，之前所有方法都需要人工參與提取特征，算法只是根據(jù)特征進(jìn)行分類或預(yù)測，因此人工提取的特征才對書寫質(zhì)量評價(jià)的性能起到了關(guān)鍵作用。特征提取不僅需要專業(yè)知識而且還花費(fèi)大量人力。目前，因手寫漢字結(jié)構(gòu)復(fù)雜，局部特征的提取效果較差并且提取的特征數(shù)量有限等問題在一定程度上限制了評價(jià)的全面性，而卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)似乎打破了這種僵局[42]。

典型的卷積神經(jīng)網(wǎng)絡(luò)通常包括卷積、池化以及全連接三種基本操作，對圖像不斷進(jìn)行卷積和池化運(yùn)算，在保留圖片重要信息的前提下提取圖片的抽象特征。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示。

圖5 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Convolutional neural network structure

卷積層（convolutional layer）是卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算的核心。卷積層利用不同尺度的卷積核對輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算，當(dāng)前層的特征是利用激活函數(shù)將輸出值進(jìn)行非線性變換得到，如式（26）所示：

池化層（pooling layer）主要對卷積層的特征進(jìn)行降維，將像素矩陣大小降為原來尺寸的1/n，可減少計(jì)算數(shù)量，避免由特征數(shù)量過多造成溢出現(xiàn)象，其公式如下所示：

全連接層（full connection layer）實(shí)現(xiàn)了特征到類別的轉(zhuǎn)換，用于綜合前向提取的特征，可以將卷積層或池化層中具有類別區(qū)分性的局部信息進(jìn)行整合。每個(gè)神經(jīng)元的輸出公式如下所示：

其中，wki表示第k層與前i層的連接強(qiáng)度，bk表示偏置，f(?)表示激活函數(shù)。

Dropout層也是卷積神經(jīng)網(wǎng)絡(luò)的常用結(jié)構(gòu)，其通過隨機(jī)減少單元之間的連接，在整體網(wǎng)絡(luò)中隨機(jī)采樣一個(gè)網(wǎng)絡(luò)并且更新采樣網(wǎng)絡(luò)的參數(shù)，提高網(wǎng)絡(luò)的泛化能力。

卷積神經(jīng)網(wǎng)絡(luò)能夠自動從圖片中提取特征，通過卷積層自行抽取圖像的形狀、圖形的拓?fù)浣Y(jié)構(gòu)以及圖片內(nèi)部一些人工無法提取的復(fù)雜結(jié)構(gòu)特征，避免了傳統(tǒng)算法中特征提取和數(shù)據(jù)重建過程，所以將其應(yīng)用在手寫漢字評價(jià)上可提高特征提取的質(zhì)量。其中莊子明[43]提出利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行手寫漢字評價(jià)，主要利用以下三部分對手寫漢字的美觀度進(jìn)行評價(jià)：CNN網(wǎng)絡(luò)提取手寫漢字特征值；CNN網(wǎng)絡(luò)監(jiān)督信號；相似度檢索以及美感評分。其思路為將手寫漢字與具有分?jǐn)?shù)的手寫漢字?jǐn)?shù)據(jù)庫進(jìn)行相似度檢索，根據(jù)檢索出具有分?jǐn)?shù)的手寫漢字確定輸入手寫漢字的分?jǐn)?shù)，手寫漢字相似度檢索包括：特征提取和特征的距離計(jì)算，其中特征提取的網(wǎng)絡(luò)圖如圖6[43]所示。

圖6 手寫漢字特征提取CNN網(wǎng)絡(luò)Fig.6 Handwritten Chinese character feature extraction CNN network

在手寫漢字特征提取CNN網(wǎng)絡(luò)中，研究者構(gòu)造了基于maxout結(jié)構(gòu)的特征提取CNN網(wǎng)絡(luò)，包括4個(gè)卷積層、4個(gè)池化層、4個(gè)maxout層、1個(gè)dropout層、1個(gè)全連接層以及2個(gè)不同的損失層。

卷積層和全連接層使用了ReLU激活函數(shù)，其公式如下所示：

在卷積神經(jīng)網(wǎng)絡(luò)中，不同激活函數(shù)適用的網(wǎng)絡(luò)類型以及領(lǐng)域不同，而激活函數(shù)的選取一般由經(jīng)驗(yàn)或?qū)嶒?yàn)決定，但由于經(jīng)驗(yàn)可能出現(xiàn)不準(zhǔn)確的情況，實(shí)驗(yàn)的驗(yàn)證時(shí)間較長，所以激活函數(shù)的選擇成了難點(diǎn)。而兩個(gè)或兩個(gè)以上的maxout單元可以很好地逼近任意一個(gè)連續(xù)函數(shù)，使其不僅能在后向傳遞梯度時(shí)避免梯度消失/溢出等問題，還能阻止ReLU函數(shù)存在單元失活的問題，并且maxout單元還可以學(xué)習(xí)隱含單元之間的關(guān)系和激活函數(shù)，避免非線性激活函數(shù)引起的單元非活性化。Maxout的提出解決了激活函數(shù)選擇困難的問題，但maxout存在激活值不稀疏的缺點(diǎn)，限制了分類精度，而ReLU函數(shù)不僅可以增加網(wǎng)絡(luò)的稀疏性并且可以緩解過擬合問題。

Dropout能夠訓(xùn)練共享參數(shù)的單元模型，并且均衡這些單元模型，避免在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象，提高模型特征學(xué)習(xí)能力。Dropout在后向傳播中更新不同訓(xùn)練子集上的不同模型，而傳統(tǒng)模型在激活函數(shù)的限制下都是總體訓(xùn)練，不能滿足dropout理想的總體分塊訓(xùn)練。Maxout利用自身的單元連續(xù)線性分段特性和特征子空間池化作用，將dropout根據(jù)掩碼的不同選擇使梯度變化傳播到網(wǎng)絡(luò)的最底層，從而確保模型中每個(gè)參數(shù)都可進(jìn)行dropout訓(xùn)練，促進(jìn)了dropout優(yōu)化并且提高了dropout快速近似模型平均技術(shù)的準(zhǔn)確性。所以在圖6中maxout、dropout以及ReLU函數(shù)結(jié)合使用可有效地提高各自性能，在保留圖片重要信息的前提下多次卷積和池化運(yùn)算可以提取圖片的抽象特征，用于特征的距離計(jì)算。

根據(jù)不同漢字書寫圖像提取的特征值相似度較低這一特征設(shè)置了漢字識別監(jiān)督信號；相同漢字書寫圖像提取的特征值相似度較高這一特征設(shè)置了漢字驗(yàn)證監(jiān)督信號。漢字識別監(jiān)督信號和漢字驗(yàn)證監(jiān)督信號這兩方面組成了監(jiān)督信號。

漢字識別監(jiān)督信號以及漢字驗(yàn)證監(jiān)督信號的損失函數(shù)如以下公式[43]所示：

其中，式（30）中X、Y分別表示樣本集合以及樣本分?jǐn)?shù)類標(biāo)號，W表示卷積網(wǎng)絡(luò)的參數(shù)。表示為第i個(gè)樣本前向傳遞到softmax層第j個(gè)單元的概率值，m為批處理參數(shù)，l{?}為指示性函數(shù)。式（31）中x1和x2表示為一個(gè)批處理中的所有圖像。Z表示這對手寫漢字圖像是否為同一個(gè)字。表示這對手寫漢字特征值的距離。

該網(wǎng)絡(luò)總體損失函數(shù)為：

其中，λ表示兩個(gè)損失函數(shù)的平衡系數(shù)。

在相似度檢索和美感評分部分中，利用余弦距離計(jì)算提取出手寫漢字的特征值與k類預(yù)先訓(xùn)練好的模板漢字特征之間的距離，得到k個(gè)概率值，則手寫漢字的分?jǐn)?shù)為概率值最大的模板漢字分?jǐn)?shù)。

余弦距離的計(jì)算如下所示：

其中，x1和x2分別表示不同手寫漢字的特征向量。

實(shí)驗(yàn)在收集的109 655張小學(xué)生手寫漢字上進(jìn)行測評，結(jié)果表明手寫漢字的美感評分總體準(zhǔn)確率可以達(dá)到95.78%。

上述基于神經(jīng)網(wǎng)絡(luò)的方法在手寫漢字評價(jià)任務(wù)上取得了較好的效果。運(yùn)用深度學(xué)習(xí)的方法自動學(xué)習(xí)手寫漢字中的特征，避免人工提取特征過程中的誤判，并且深度學(xué)習(xí)的分布表示隨著數(shù)據(jù)量的增加而變好。目前需要人工特征提取的方法存在以下兩種缺點(diǎn)：（1）在不使用聯(lián)機(jī)設(shè)備的情況下，獲取到手寫漢字的特征僅限于重心、邊距和筆畫等，對手寫漢字進(jìn)行全面評價(jià)任面臨一系列困難。（2）手寫漢字評價(jià)系統(tǒng)最受初學(xué)者的歡迎，但初學(xué)者在進(jìn)行漢字書寫時(shí)，將每一個(gè)筆畫當(dāng)做繪畫處理并沒有體現(xiàn)出漢字的結(jié)構(gòu)化，而手寫漢字的結(jié)構(gòu)化也是書寫質(zhì)量的評價(jià)標(biāo)準(zhǔn)之一[44]。所以初學(xué)者的手寫漢字很容易出現(xiàn)筆畫與模板漢字筆畫差距較大導(dǎo)致筆畫匹配問題。筆畫匹配主要通過尋找手寫漢字相對模板漢字筆畫的不同幾何變換參數(shù)來判斷[45]，對不規(guī)范漢字筆畫的匹配存在主觀性的閾值限定。因此，利用深度學(xué)習(xí)進(jìn)行手寫漢字評價(jià)可有效解決人工提取特征困難以及筆畫匹配等缺點(diǎn)，所以深度學(xué)習(xí)將推動手寫漢字評價(jià)發(fā)展。

2.4.2 基于機(jī)器學(xué)習(xí)的其他方法

除了以上基于深度學(xué)習(xí)的方法，手寫漢字的書寫質(zhì)量評價(jià)還涌現(xiàn)出其他方法。其中祁亨年等人[46]提出利用概率分布計(jì)算漢字的對稱性、勻稱性以及緊湊性，以此作為書寫結(jié)構(gòu)的評價(jià)指標(biāo)，利用支持向量機(jī)對手寫漢字進(jìn)行三種不同級別的分類。此方法可在宏觀上對手寫漢字進(jìn)行評測，較難對手寫漢字的筆畫、部件等細(xì)節(jié)形成指導(dǎo)意見，并且用分?jǐn)?shù)的方式對書寫質(zhì)量進(jìn)行評價(jià)，用戶無法知道手寫漢字的錯(cuò)誤位置以及如何改正。溫麗敏[47]在書法審美評價(jià)中提出將手寫漢字的筆段端點(diǎn)、筆段拐點(diǎn)和運(yùn)筆力度節(jié)奏三個(gè)特征以及其他信息輸入EMD（earth mover’s distance）模型進(jìn)行相似度的計(jì)算，得到手寫漢字評價(jià)。黃峰[38]利用“質(zhì)點(diǎn)—彈簧”能量模型（mass spring method，MSM）對手寫漢字進(jìn)行評測，此模型可以容易地識別出手寫漢字與模板漢字的變形程度。通過計(jì)算手寫漢字特征值與模板漢字特征值之間的能量差實(shí)現(xiàn)手寫漢字的評價(jià)。實(shí)驗(yàn)結(jié)果說明在相同數(shù)據(jù)集、冗余度為10的情況下，彈性網(wǎng)格評價(jià)效果的一致率為92.14%，BP神經(jīng)網(wǎng)絡(luò)評價(jià)效果的一致率為93.21%。“質(zhì)點(diǎn)—彈簧”能量模型的評價(jià)效果較低的原因是利用手寫漢字的特征值比BP神經(jīng)網(wǎng)絡(luò)少，僅利用筆畫的起點(diǎn)、終點(diǎn)等信息很難判斷筆畫變形的原因，所以生成指導(dǎo)意見的效果也沒有BP神經(jīng)網(wǎng)絡(luò)的評價(jià)效果好。

2.5 小結(jié)

以上方法促進(jìn)了手寫漢字評價(jià)的發(fā)展。這些方法遵循以下步驟：（1）利用不同的方法提取手寫漢字特征。（2）特征匹配。（3）特征相似度計(jì)算。基于規(guī)則的方法依賴專業(yè)領(lǐng)域人工制定規(guī)則，通過規(guī)則匹配識別各種手寫漢字特征，此方法雖然在研究者制定的數(shù)據(jù)集上收獲較高的提取效果，但構(gòu)建這些規(guī)則不僅耗時(shí)耗力，難以概括所有規(guī)則，而且可移植性較差。基于特征相似度的方法對手寫漢字的規(guī)范性起點(diǎn)要求比較高，其中字體大小對書寫質(zhì)量評分影響較大，而無法體現(xiàn)手寫漢字本質(zhì)的評分。模糊矩陣的方法更適合評價(jià)具有獨(dú)特風(fēng)格的手寫漢字。這兩種方法相比規(guī)則的方法，在特征提取方面不但可以更簡便地提取結(jié)構(gòu)復(fù)雜的筆畫等特征，并且提取特征的質(zhì)量有了很大的提升。基于神經(jīng)網(wǎng)絡(luò)的方法相比其他方法，具有兩大優(yōu)勢：（1）卷積神經(jīng)網(wǎng)絡(luò)可以從圖片中學(xué)習(xí)更復(fù)雜的特征；（2）可以處理大規(guī)模數(shù)據(jù)。其缺點(diǎn)是在網(wǎng)絡(luò)訓(xùn)練的過程中，可能會忽視手寫漢字中重要的特征，所以重要特征還需要人工提取與卷積神經(jīng)網(wǎng)絡(luò)一同進(jìn)行評價(jià)。并且基于深度學(xué)習(xí)的手寫漢字評價(jià)需要擁有樣本豐富且數(shù)據(jù)量較大的數(shù)據(jù)集，而現(xiàn)實(shí)中這樣的數(shù)據(jù)集十分稀少，大部分研究者自己構(gòu)建數(shù)據(jù)集。這樣造成了面對同一任務(wù)時(shí)因數(shù)據(jù)集的不同而無法對比各種方法的效果。

3 反饋形式

近年來，大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)為傳統(tǒng)的手寫漢字評價(jià)方法帶來了巨大變革，其可以在花費(fèi)極少的人力、物力以及財(cái)力的基礎(chǔ)上，完成手寫漢字評價(jià)。手寫漢字評價(jià)的核心問題是通過特征值之間的差距完成評價(jià)，因此本質(zhì)上可以看做手寫漢字的特征值差異與評價(jià)的映射問題。而如何將手寫漢字的評價(jià)在內(nèi)容以及視覺上反饋給用戶已經(jīng)成為數(shù)據(jù)到文本生成、字形匹配以及圖形輔助等技術(shù)發(fā)展的支持部分[4]，其關(guān)系如圖7所示。

圖7 手寫漢字評價(jià)反饋形式Fig.7 Feedback form of handwritten Chinese character evaluation

3.1 數(shù)據(jù)到文本生成

數(shù)據(jù)到文本生成是文本生成任務(wù)中重要的一類，主要利用給定的數(shù)據(jù)庫、電子表格以及專家系統(tǒng)知識庫等數(shù)據(jù)，生成貼近事實(shí)、描述流暢的相關(guān)文本[48]。數(shù)據(jù)到文本生成可以作為手寫漢字評價(jià)任務(wù)的輔助技術(shù)：將手寫漢字與模板漢字特征之間的差值作為輸入，旨在生成貼近事實(shí)的文本描述數(shù)據(jù)。其目標(biāo)是實(shí)現(xiàn)計(jì)算機(jī)與人類有效的溝通，加深用戶對手寫漢字評價(jià)的理解，實(shí)現(xiàn)評價(jià)自動撰寫，有效減少教師的工作。

現(xiàn)如今，數(shù)據(jù)到文本的生成任務(wù)主要利用基于規(guī)則和模板的方法，因其具有極強(qiáng)的可控性和可解釋性，容易確保輸出文本的準(zhǔn)確性[49]。其中Gkatzia等人[50]針對天氣預(yù)報(bào)的生成，利用不確定信息推薦準(zhǔn)則與模擬專家的方式提出了兩種基于規(guī)則的方法。此方法中模板的抽取離不開人工特征，并且生成內(nèi)容的多樣性與流暢性也存在問題。

基于神經(jīng)網(wǎng)絡(luò)模型主要依靠數(shù)據(jù)驅(qū)動，不需要較多的人工干預(yù)，也容易產(chǎn)生流暢的文字描述，但無法掌控內(nèi)容生成，難以確保輸出文本同輸入數(shù)據(jù)中的信息吻合[51]。其中文獻(xiàn)[52]改變了原有模型中沒有明確模擬文本生成順序的弊端，而將端到端的訓(xùn)練模型分為了內(nèi)容規(guī)劃、句子規(guī)劃以及表面實(shí)現(xiàn)三種模塊，文本生成效果有了很大的提升，但此方法無法充分利用數(shù)據(jù)結(jié)構(gòu)的信息，對具體數(shù)值推理存在巨大問題。針對以上問題，許曉泓等人[53]對內(nèi)容規(guī)劃進(jìn)行改進(jìn)，采用基于Transform的內(nèi)容規(guī)劃用于上下文數(shù)據(jù)信息的推理，并且通過生成指引序列控制輸出文本的流暢性。實(shí)驗(yàn)結(jié)果說明，改進(jìn)的內(nèi)容規(guī)劃使性能有了較大的提高。

相比基于規(guī)則的數(shù)據(jù)到文本生成方法，數(shù)據(jù)驅(qū)動的方法不需要專家參與，生成的文本可能與領(lǐng)域無關(guān)，但需要大規(guī)模的數(shù)據(jù)集進(jìn)行訓(xùn)練數(shù)據(jù)，數(shù)據(jù)的訓(xùn)練質(zhì)量影響訓(xùn)練結(jié)果。將其應(yīng)用于手寫漢字評價(jià)中，存在手寫漢字與模板漢字特征之間的差值數(shù)據(jù)選擇由計(jì)算機(jī)進(jìn)行挑選，生成的文本不一定滿足復(fù)雜數(shù)據(jù)的問題。例如，在一章手寫漢字中找到一個(gè)整體書寫質(zhì)量最差的漢字，則其筆畫或字體大小等某一特征一定存在分?jǐn)?shù)較差的問題，而這并不代表其所有特征在這一章中是最差的。

3.2 字形匹配

字形匹配是指將手寫漢字的筆畫與模板漢字的筆畫進(jìn)行匹配，找到一個(gè)筆畫數(shù)量最多的匹配集合，集合找到手寫漢字筆畫集合中的交叉關(guān)系與模板漢字筆畫集合中的交叉關(guān)系是一致的，以上就完成了手寫漢字筆畫與模板漢字筆畫之間的對應(yīng)關(guān)系。將字形匹配與手寫漢字評價(jià)相結(jié)合，字形匹配可以結(jié)合圖形輔助以圖的方式出現(xiàn)，使用戶更加了解自己書寫漢字的缺點(diǎn)，增強(qiáng)用戶體驗(yàn)感。Hu等人[54]利用屬性關(guān)系圖表示漢字，建立漢字筆畫之間的空間關(guān)系模型，并利用容錯(cuò)圖匹配筆畫和部件關(guān)系的錯(cuò)誤。劉穎濱等人[55]提出在三維空間建立高斯混合型模型，利用三維空間可以充分定義字形信息，改善字形匹配的效果。Chen等人[56]根據(jù)輸入筆畫順序關(guān)鍵信息、筆畫之間全局結(jié)構(gòu)關(guān)系以及對歸類的筆畫與模板漢字匹配等問題進(jìn)行反饋，輔助教師進(jìn)行手寫漢字評價(jià)。

該類方法只適用于小范圍的數(shù)據(jù)集，很難接受變形較大的手寫漢字。例如，對于手寫漢字的初學(xué)者，他們對手寫漢字的書寫僅是模仿，下筆的力度也不能靈活掌握，這會產(chǎn)生想象不到的筆畫形變，這時(shí)字形匹配的效果也達(dá)不到想要的效果，所以字形匹配的方法還需要研究者進(jìn)一步探索。

3.3 圖形輔助

規(guī)范且易于理解的反饋形式具有更好的用戶體驗(yàn)感。現(xiàn)有的手寫漢字評價(jià)反饋形式主要有以下幾種：評價(jià)文本、打分、圖形輔助等。評價(jià)文本可以直接將手寫漢字的缺點(diǎn)以文本的形式展示出來，但表現(xiàn)形式不夠直觀，不易用戶理解，并且對于一部分閱讀經(jīng)驗(yàn)不足的用戶來說，并不能全部理解評價(jià)文本的內(nèi)容。評價(jià)以打分或等級的形式出現(xiàn)，只是通過這種方法評價(jià)用戶的手寫漢字達(dá)到規(guī)范的程度，用戶無法知道手寫漢字的具體錯(cuò)誤、如何修改等信息，用戶體驗(yàn)較差，如圖8（a）所示[56]。圖形輔助的手寫漢字評價(jià)可以利用幾何圖形在圖中標(biāo)注出手寫漢字具體不規(guī)范的位置，如圖8（b）所示[57]，圖中將模板漢字與用戶書寫的漢字疊加展示并且使用動物圖片提供更多的視覺反饋，激勵用戶更好地認(rèn)識漢字。與文本生成和字形匹配這兩種方式相比，圖形輔助這種方式更加直觀，具有較好的用戶體驗(yàn)。

圖8 評價(jià)的反饋方式Fig.8 Feedback mode of evaluation

以上三種方式都是靜態(tài)的反饋形式，在規(guī)范性指導(dǎo)方面還不夠具體。例如無法與用戶交流書寫錯(cuò)誤如何改正，并提供正確的修改事例。所以在圖像輔助方面還需要借助各種動畫技術(shù)以及自動問答技術(shù)的支持，對手寫漢字的評價(jià)進(jìn)行反饋指導(dǎo)和改進(jìn)指導(dǎo)，這樣才能加強(qiáng)用戶體驗(yàn)，充分發(fā)揮計(jì)算機(jī)的輔助作用。

4 問題與挑戰(zhàn)

近年來研究者針對手寫漢字評價(jià)進(jìn)行了大量研究工作并且獲得了不錯(cuò)的研究成果，但仍存在許多要解決的問題，目前關(guān)鍵問題如以下幾點(diǎn)：

（1）數(shù)據(jù)來源匱乏

手寫漢字的書寫質(zhì)量評價(jià)系統(tǒng)需要一個(gè)大規(guī)模且樣本豐富的數(shù)據(jù)集。而目前手寫漢字的數(shù)據(jù)集大多關(guān)于手寫漢字識別，缺少對每個(gè)漢字的評價(jià)以及分?jǐn)?shù)。也有一部分?jǐn)?shù)據(jù)集數(shù)據(jù)樣本數(shù)量較少，這給研究帶來了一定的困難。例如孫榕鞠等人整理的CHAED字庫，它包括30個(gè)人書寫10種不同字體的100個(gè)漢字，由33個(gè)專業(yè)人士對此數(shù)據(jù)集進(jìn)行評分。此數(shù)據(jù)集中手寫漢字種類數(shù)量較少，無法全部代表復(fù)雜的漢字，并且評價(jià)的反饋形式只有評分，這對生成一個(gè)完備的評價(jià)存在一定困難。

目前研究者的數(shù)據(jù)集根據(jù)反饋形式大多自行采集，收集和整理這些數(shù)據(jù)需要花費(fèi)大量的人力、物力以及財(cái)力。例如黃峰[38]的數(shù)據(jù)是通過收集某三年級學(xué)生手寫漢字集成，每個(gè)學(xué)生需要書寫8遍具有28個(gè)漢字的樣本，還需要專家在每個(gè)實(shí)驗(yàn)樣本中隨機(jī)挑選20個(gè)漢字進(jìn)行評分。沒有全面且公開的手寫漢字評分?jǐn)?shù)據(jù)集，很難對不同方法進(jìn)行效果比較，給手寫漢字書寫質(zhì)量評價(jià)的研究和發(fā)展帶來困難。面對數(shù)據(jù)來源困難可參考自然語言處理或計(jì)算機(jī)視覺領(lǐng)域的數(shù)據(jù)擴(kuò)建方法，利用半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)實(shí)現(xiàn)數(shù)據(jù)的自動構(gòu)建以及遷移學(xué)習(xí)等方法都可以作為解決該問題的方法。而如何將遷移學(xué)習(xí)應(yīng)用在手寫漢字評價(jià)中，還需要進(jìn)一步研究。

（2）脫機(jī)手寫漢字筆序難判斷

根據(jù)計(jì)算機(jī)最終得到手寫漢字的信息不同，可將其分為聯(lián)機(jī)手寫漢字[58]和脫機(jī)手寫漢字[59]。聯(lián)機(jī)手寫漢字是指直接在電子屏等電子儀器上書寫，可以實(shí)時(shí)檢測筆畫的順序以及筆畫總數(shù)等多種信息，較容易提取漢字的多種特征值。脫機(jī)手寫漢字是指沒有電子屏等電子儀器的參與，計(jì)算機(jī)得到的只有手寫漢字圖片信息。脫機(jī)手寫漢字相比聯(lián)機(jī)手寫漢字提取的漢字特征值比較少，所以評價(jià)的效果不如聯(lián)機(jī)手寫漢字的評價(jià)好。

規(guī)范的漢字書寫要求筆序必須書寫正確。成授昌[60]提出手寫漢字的統(tǒng)一、對稱等方面都與筆序相關(guān)，正確的書寫順序可以提高手寫漢字的書寫質(zhì)量和書寫速度，所以筆序?qū)σ?guī)范的漢字書寫是非常重要的。教師在“三筆一畫”與小學(xué)生的語文考試中，手寫漢字的筆序也占一定的分?jǐn)?shù)。聯(lián)機(jī)手寫漢字較容易獲得筆序等信息，所以評價(jià)手寫漢字筆序的效果較好[61]。因脫機(jī)手寫漢字進(jìn)行手寫漢字評價(jià)時(shí)，得到的只有手寫漢字圖片，所需要的信息只能利用圖片處理等技術(shù)得到，筆序等信息無法在圖片上體現(xiàn)。為了得到手寫漢字筆序相關(guān)信息，有研究者利用規(guī)則的方法判斷手寫漢字的正確筆序，卻得不到書寫者的筆序信息。所以如何評判脫機(jī)手寫漢字中筆序的正確性，還具有一定的挑戰(zhàn)難度。

（3）手寫漢字的筆畫拆分難

筆畫質(zhì)量是書寫質(zhì)量評價(jià)中重要的評估項(xiàng)之一。而手寫漢字的筆畫拆分過程是一個(gè)十分困難的過程。筆畫與筆畫之間的關(guān)系有：相接、相交、相離[18]。筆畫相離的手寫漢字比較容易進(jìn)行筆畫拆分，但漢字大部分都具有結(jié)構(gòu)復(fù)雜、筆畫數(shù)較多的特點(diǎn)，其中存在大量的相接、相交、相離關(guān)系，僅解決相離問題是不能完成筆畫的拆分過程。

目前關(guān)于脫機(jī)手寫漢字筆畫拆分的解決方法之一[38]是，利用PS工具圈出所要提取的手寫漢字筆畫。此方法雖然提取的效果較好，但如果評價(jià)的書法字?jǐn)?shù)據(jù)量大時(shí)，則需要花費(fèi)大量的時(shí)間拆分筆畫。除此之外，朱欣蔚等人[62]利用PBOD算法找出手寫漢字的交叉區(qū)域以及端點(diǎn)區(qū)域，將手寫漢字的端點(diǎn)區(qū)域以及交叉區(qū)域在無向圖中表示出來，利用規(guī)則對各區(qū)域進(jìn)行組合實(shí)現(xiàn)拆分筆畫。但PBOD算法只對規(guī)范漢字進(jìn)行筆畫提取的效果較好，卻無法較好地分離不規(guī)范漢字的筆畫。關(guān)于聯(lián)機(jī)手寫漢字的筆畫拆分方法是筆段的拆分與合并[63]，該方法需要提前建立大量的工作：建立32種不同筆畫的筆畫庫，對難以區(qū)分的筆畫通過建立規(guī)則以正確區(qū)分筆畫。該方法利用拐點(diǎn)將筆畫分為筆段，對于初學(xué)者來說，由于手寫漢字中存在變形較大的筆畫，對筆畫的分段存在劃分不準(zhǔn)確的情況，致使筆畫編碼錯(cuò)誤，所以該方法對初學(xué)者的筆段提取精確率不高。

雖然在光學(xué)字符識別（optical character recognition，OCR）領(lǐng)域還有許多關(guān)于筆畫提取的成果[64]（如細(xì)化的方法、區(qū)域分解法等），但這些方法允許結(jié)果有一定的誤差，且對每個(gè)手寫漢字提取筆畫計(jì)算時(shí)間過長[65]。所以如何快速、準(zhǔn)確地得到筆畫的特征值是一個(gè)值得去思考的問題。

（4）手寫漢字評價(jià)的標(biāo)準(zhǔn)量化困難

評價(jià)標(biāo)準(zhǔn)是評價(jià)的核心，用來規(guī)定當(dāng)前手寫漢字中筆畫等特征達(dá)到不同范圍的對應(yīng)分值準(zhǔn)則。研究者對手寫漢字的評價(jià)關(guān)注點(diǎn)從對稱性、勻稱性等描述手寫漢字全局的特征，逐步轉(zhuǎn)到筆畫、部件等描述手寫漢字局部的特征，評價(jià)手寫漢字的書寫質(zhì)量效果在不斷地改善，但評價(jià)手寫漢字的特征越細(xì)致，其評價(jià)標(biāo)準(zhǔn)范圍的選取越嚴(yán)格。

不同研究者對同一等級的手寫漢字制定規(guī)則時(shí)具有主觀性，所以會制定出不同的規(guī)則[3]，不同的規(guī)則導(dǎo)致對同一等級的手寫漢字評價(jià)不同，這在手寫漢字的書寫質(zhì)量評價(jià)中是不合理的。為了初學(xué)者獲得自信，有些研究者制定的規(guī)則范圍較為寬松[66]，也有一些研究者針對不同學(xué)習(xí)背景的人群，分別制定出較難和簡單兩個(gè)等級的評價(jià)標(biāo)準(zhǔn)，這種評價(jià)標(biāo)準(zhǔn)更適合應(yīng)用于大眾[56]。但因不同研究者對規(guī)范的定義不一致，即使不同的系統(tǒng)都選擇簡單的評價(jià)指標(biāo)，也存在評價(jià)分?jǐn)?shù)不同的現(xiàn)象。為了解決以上問題，葛佳敏[34]利用模糊概率分布和模糊綜合評價(jià)方法結(jié)合得到一個(gè)期望值范圍，解決了傳統(tǒng)評價(jià)方法簡單、具有主觀性的單一評價(jià)標(biāo)準(zhǔn)的問題。此方法中評價(jià)標(biāo)準(zhǔn)制定的數(shù)據(jù)來源于模板漢字和機(jī)器人書寫的漢字，由此得到的期望值范圍并不適用于所有書寫質(zhì)量評價(jià)。所以如何獲得一個(gè)適合大眾、具有專業(yè)性的評價(jià)標(biāo)準(zhǔn)還是值得去思考的。

5 結(jié)束語

目前關(guān)于手寫漢字書寫質(zhì)量評價(jià)方法的研究比較少，處于剛剛起步的狀態(tài)，還有許多地方需要改進(jìn)。這項(xiàng)技術(shù)的發(fā)展必將促進(jìn)計(jì)算機(jī)輔助書寫教學(xué)的進(jìn)步[5]。文中對近幾年的研究做了總結(jié)，其中包括手寫漢字的相關(guān)概念、評價(jià)方法、評價(jià)難點(diǎn)以及反饋形式等部分。由于傳統(tǒng)的手寫漢字評價(jià)方法需要大量人力資源，研究者逐漸把目光轉(zhuǎn)移到神經(jīng)網(wǎng)絡(luò)的評價(jià)方法上，神經(jīng)網(wǎng)絡(luò)評價(jià)方法的出現(xiàn)為手寫漢字評價(jià)提供了許多新思路，但目前只是處于剛剛起步的狀態(tài)，由此可以預(yù)見，手寫漢字的評價(jià)方法還有很大的發(fā)展空間需要繼續(xù)去研究。