


【摘 要】當下,中小學的書法評分方法是按照一定的鑒賞標準來設計評分要點的,由評閱專家進行主觀評分。但是由于不同專家的個人喜好、審美不同,所以很難解決公平、公正的問題。在書法評分標準中,所設計的評分要點看起來很細致、具體,但實際進行評分操作時,那些描述精細的評分標準很難落實到具體的評分上。而且,不同的專家和教師評分結果參差不齊,評分標準懸殊較大。目前,機器學習,特別是深度學習在圖像識別、自然語言處理等方面取得了較大的進展,只要有足夠大的數據集,它們在圖像分類方面的精確性非常高。機器學習,特別是深度學習圖像分類法,為解決中小學書法作品分級評分提供了全新的思路和解決方案。
【關鍵詞】書法評價;機器學習;數據集;深度學習
【中圖分類號】G471? 【文獻標志碼】B? 【文章編號】1005-6009(2021)30-0017-05
【作者簡介】許兵,江蘇省鹽城市日月路小學(江蘇鹽城,224005)黨支部書記、校長,高級教師,江蘇省語文特級教師。
基于機器學習的書法評價需要大量的數據和訓練才能得以驗證其評價結果的有效性。目前,國內外已有不少學者在文字識別領域取得了豐碩的研究成果,并很好地應用在了印刷體和部分手寫體文字識別方面。但是,目前基于機器學習的書法評價體系方面的相關研究還非常少,尚處于起步階段。國內只有湖北工業大學的邵榮堂、西安理工大學的張福成有了一些探索和研究。實踐證明,基于機器學習的書法評價方法可以發現很多傳統人工評價難以觀察到的規律,有很強的實用價值和現實意義。本文系統地闡述國內外書法評價體系的現狀以及基于機器學習的書法評價模型,還提出一種自建數據集的全新書法評價模型和后續研究的建議。
一、中小學書法評價體系研究綜述
目前常見的書法評價體系研究主要可以分為定量研究、定性研究和機器學習研究三大類型。
1.定量研究。
定量研究中最常見的指標建構方法是因子分析法:因子分析法(或稱因素分析、指數分析)是定量研究中得到最普遍應用的指標建構方法,它屬于社會科學實證研究方法,一般通過統計學統計軟件包SPSS等軟件來完成計算,其操作相對簡單、易學。因子分析法包括探索性因子分析和驗證性因子分析兩種進路。指標建構時所采用的因子分析法一般是前者。
因子分析的前提是獲得大量資料,并通過“概念化”的操作,將其轉換為可分析的數據。關于這一點,白謙慎曾多次提議中國書法家協會的研究人員利用投稿登記表進行一些基礎性的實證研究。
因子分析的原理是將收集到的盡可能多的各項細分標準加以量化,通過計算機“巴雷特球形檢驗”等檢驗方法,看原始數據是否具備指標建構的可能性。檢驗之后進行統計,將分散的要素進行歸納整理,再進行坐標軸轉換,最后利用人工判斷對所歸納出來的各主要成分進行因子命名。
因子分析的優勢,是由計算機對各類數據進行統計歸納,所建構出的因子邏輯性較強。但此方法比較簡單,且仍需經過研究者的人工命名,最終結果又具有研究者的主觀性。
2.定性研究。
德爾菲法是書法評價定性研究中普遍使用的指標建構方法。在這方面,海南師范大學的代晴做了較為深入的研究。建立一個學科教學評價體系是非常復雜的過程,需要綜合教育學、心理學、統計學、數學,甚至哲學等多個學科的知識來完成。閉門造車、單一化的構建方法都無法探索出一套科學的、符合客觀實際的教學評價體系。在此基礎上,德爾菲法作為一種匿名式的、征詢多輪專家意見的、具備集體經驗判斷的方法,近些年受到了教育界人士的關注,并逐漸被更多的教育工作者運用到教學評價體系中。德爾菲法是建立在一個結構化的收集和提取過程基礎上的方法論,通過一系列問卷調查與意見反饋交叉獲取到共識目標。
3.機器學習研究。
當前對于書法字的識別大多采用輪廓相似性以及骨架相似性的方法。吳媛等人提出的一種基于數學形態學的脫機手寫體漢字識別方法,此方法識別率很高,但遇到檢索數據量大的情況時速度會明顯變慢。俞凱等人在此基礎上又提出一種基于骨架相似性的書法字檢索方法,在保證查全率與查準率的基礎上,檢索速率方面有顯著的提升。但是此方法建立的特征數據庫比較大,并不能滿足系統的設計要求。之后,章夏芬等人提出根據樣本字特征而進行動態變化的自適應匹配法,在效率沒有改變的前提下,查全率與查準率都得到了一定的提升。此方法很大程度上解決了算法計算量大、耗時長、效率低的問題。
在識別樣本完成之后,書法評價系統方面的研究同樣復雜。目前,絕大多數采用的是將要評價的樣本與標準書法作品進行相似度計算的方法。例如,湖北工業大學的邵榮堂首先進行計算書法練習作品樣本中書法字的骨架與字帖中書法字骨架的相似度,骨架提取的算法采用本文中提出的一種基于Z-S 算法改進的單像素化處理算法,從而得到基于整體結構特征的相似度值;而后采用九宮格的形式對書法字骨架進行切分,將每一部分的骨架對比字帖書法字相同位置的骨架,利用Hu矩與皮爾遜相關系數對相似度進行計算,得到基于筆畫形體特征的相似度值;最后利用書法字距離邊框的值與整個書法字在邊框中的布局來綜合計算字體布局特征面的相似度值。整體評判的標準依據書法初級考試的標準制定。
但是以上方法都沒有充分利用機器學習的優勢,沒有采集大量的數據、建立專用數據集,更沒有用深度學習的方法訓練系統,從而達到自動打分的目的。
二、書法識別與評價研究綜述
1.手寫漢字識別國內外研究現狀。
德國的Taushek首次通過實驗,利用光學模板匹配的方法獲得了英文光學字符識別的專利,拉開了利用機器學習進行文字識別歷史的帷幕。美國IBM公司的Casey和Nagy通過基于漢字結構的匹配法來進行印刷體漢字識別的研究,同時該方法得到了廣泛的應用。Pittsburgh大學的Zobark提出利用漢字筆跡的方向特征來對在線漢字進行識別。麻省理工學院的Liu等人則提出通過漢字筆畫來實現在線漢字識別。受到這些技術的啟發,日本也著手開始了對漢字識別技術的研究。東芝公司率先生產出第一個印刷體漢字識別系統,其所能識別的漢字達2000個。
相較于其他國家,我國開始著手漢字識別的時間較晚。20世紀70年代末,我國才開始了漢字識別的研究。在漢字識別的起始階段,我國實現的漢字識別效果并不是很理想,往往對于已完成訓練的樣本的識別準確率很高,但是以現實場景的實際文字來看,識別準確率仍然達不到預期,其緣由是因為在漢字識別的起始階段,由于技術不成熟,我國漢字識別系統的抗干擾能力以及泛化能力并不是很強。隨著我國對漢字識別技術的深入研究,部分產品已經在市場中受到廣泛關注。沈陽自動化研究所與清華大學計算機系研發出了可以識別3755個印刷體漢字的技術。朱夏寧團隊等提出了能夠識別6763個印刷體漢字的識別方法。中科院自動化研究所也研制出了可用于一定人群的脫機手寫漢字識別系統。隨著我國漢字識別技術研究的不斷深入,許多成熟的漢字識別系統也已在市場得到了廣泛的應用,例如曙光OCR、清華文通、漢王OCR等。
2.書法評價國內外研究現狀。
在基于機器學習的書法評價研究方面,萬華林等人提出了比較圖像幾何形狀的方法來比較兩幅圖像的相似度,并將其應用在了書法字幾何形狀的提取上。俞凱等提出了基于骨架相似性的書法檢索方法。首先提取檢索字與被檢索字的骨架信息,然后計算檢索字上每一點像素周圍規定范圍內與被檢索字骨架上對應點的距離,最后通過兩者骨架相似度進行選擇。劉洋通過提取結構等特征的方法提取出了書法字的部分及整體布局,從而提取出了書家的特征點,并將此方法用于書法字真偽鑒別。簡麗瓊通過文字識別的方法進行區分書法字,該方法首先提取圖像的Zemike矩和Hu矩,然后通過K近鄰進行識別,該方法具有很強的魯棒性。陳頡提出了一種分層的特征匹配法,該方法基于骨架結構相似性。首先通過分層模板獲取二值圖像的精細骨架,然后通過形狀不變矩把相似圖像放在一起,最后進行第二次檢索,并根據相似度來顯示同一漢字的不同字體。李牧采用歐式距離法計算骨架相似度。該方法首先尋找臨摹字骨架圖像上每個與原帖字骨架圖像上距離最小的像素點,然后通過最小距離和來評價臨摹作品。需要指出的是,該方法僅適用于結構簡單的書法字體,對于結構復雜的漢字效果并不理想。
三、書法評價網絡模型與訓練研究綜述
目前,常見的有兩種進行書法評價的深度學習網絡模型,一種是采用Keras搭建的卷積網絡模型,另一種是曲延直等人采用的深度殘差網絡ResNet50模型。
1.卷積網絡模型。
卷積神經網絡作為深度學習在計算機視覺應用上的主要方法,研究價值與應用前景與日俱增。作為區別于全連接神經網絡的多層神經網絡,卷積神經網絡具有更高的工作效率,在圖像處理,特別是大圖像處理方面有著較大的優勢。
卷積網絡模型主要由卷積、卷積核、池化、全連接層、損失函數、激活函數等構件組成。為達成不同目的,選擇構建網絡的組件往往不同,構筑的模型也不同。曲延直等人主要使用Keras框架進行卷積網絡模型的訓練與測試實驗。Keras是用Python編寫的開源人工神經網絡庫,它能夠進行模塊化的程序設計,同時還能夠在此基礎上進行擴充,具有簡易性、快速性的特點。
2.深度殘差網絡ResNet50模型。
卷積神經網絡能夠提取不同級別的特征,網絡層數越多,意味著能夠提取到越豐富的不同級別的特征。但當深度卷積網絡達到一定深度后,再單純地增加層數并不能帶來網絡性能的提高,反而會導致網絡收斂變得更慢,分類準確率也會變得更差。在2014年提出的 GoogleNet僅有14層,為保證在準確率較高的前提下增加網絡層數,何凱明等4名來自微軟研究院的華人在2015年提出了ResNet殘差網絡模型,該模型具有152層。這大大提升了網絡層數的數量級,同時解決了增加網絡深度帶來的副作用,使通過單純增加網絡深度來提高網絡性能的構想成為可能。
傳統網絡結構是將每層的輸出直接傳遞給相鄰的下一層,作為下一層的輸入值。而ResNet網絡結構通過改變映射方式,降低了擬合殘差的難度。實驗表明,殘差網絡更容易優化,并且能夠通過增加相當的網絡深度來提高準確率。
四、書法評價系統實現與展望
目前,云服務功能強大,市場主流的云服務供應商如AWS、阿里云和騰訊云都提供了功能強大的機器學習服務,如AWS的Machine Learning、阿里云的機器學習平臺PAI和騰訊云的智能鈦機器學習(如圖1)。三者功能大同小異,都提供基于TensorFlow的機器學習服務。
以采用亞馬遜AWS服務搭建基于機器學習的書法評分體系為例,將采集的書法圖片和老師人工打分上傳到在AWS虛擬主機,建立的專用數據集,選用適合的模型進行訓練,將書法作品按結構、書寫、篇幅三個方面,各項按一定的分值評分,并將該三個評分加權綜合評分,給出最終評分結果,很好地解決了公平公正和評判速度等問題。AWS服務系統操作流程如下:
1.首先在AWS注冊一個賬號,需要填寫Visa或者Mastercard信用卡信息。
購買一個合適的實例,運行TensorFlow(如圖2)。
a.登錄控制臺。
b.在控制臺首頁,選擇數據準備 ,再選擇數據集管理。
c.在數據集管理頁面,單擊注冊數據集。
3.電腦和AWS實例配置過程如下:
在電腦上端安裝Python 3.5及以上的版本(TensorFlow從1.2開始支持 Python3.6,之前的版本官方是不支持的)。
4.導入文件實現訓練。
導入文件,打開winscp使用公有DNS把文件放在home→ubuntu 這個文件夾里面,上傳完畢以后,查看你第一次連接實例的時候刷出的環境信息,比如打開TensorFlow環境就用source activate tensorflow_p36。最后上傳數據,進行訓練即可。
這種基于機器學習的采用亞馬遜AWS服務的書法評價系統有很好的實用價值。但由于其使用的樣本總數偏少,導致算法不夠完美,所以目前機器學習系統打分打出來的分數還不夠準確,后續需要進一步完善。
【參考文獻】
[1]張福成. 基于卷積神經網絡的書法風格識別的研究[D].西安:西安理工大學,2018.
[2]郭鵬. 深度卷積神經網絡及其在手寫體漢字識別中的應用研究[D].成都:四川師范大學,2016.
[3]尹成娟. 基于深度學習的手寫漢字集識別方法的研究[D].天津:天津科技大學,2019.
[4]邵榮堂. 基于機器學習的書法字識別與智能評判[D].武漢:湖北工業大學,2020.
[5]周潤物,李智勇,陳少淼,等.面向大數據處理的并行優化抽樣聚類K-means算法[J].計算機應用,2016,36(2):311-315,329.
[6]王民,曾寶瑩,要趁紅,等.中國書法的特征提取及識別[J].信息通信,2015(7):19-20.
[7]曲延直.基于深度學習的漢字書法識別研究[J].電子測試,2019(24):44-46,61.