

【摘 要】隨著深度學習技術在各個領域的廣泛應用,人工智能與書法藝術的結合也越來越緊密。目前,人工智能主要應用在手寫文字識別領域,一般采用“選用數據集—搭建網絡—模型訓練”的方法,依據輪廓、骨架相似性等原理,構建手寫文字識別系統。當下,在書法評價領域,我們通過自建專用書法作品數據集進行深度學習訓練,努力構建全面的書法智能評價系統。隨著科技和工業制造水平的不斷提高,人工智能將會在書法作品的評價、書寫乃至創作方面有很好的應用前景,迎來書法藝術發展的春天。
【關鍵詞】人工智能;深度學習;書法評價
【中圖分類號】G420? 【文獻標志碼】B? 【文章編號】1005-6009(2021)30-0007-03
【作者簡介】王開玲,江蘇省鹽城市日月路小學(江蘇鹽城,224005)副校長,高級教師,鹽城市小學語文學科帶頭人,鹽城市小學語文基本功大賽一等獎。
技術與藝術一向被視為光譜的兩端。技術意味著可量化、可復現、可批量產出,藝術則恰恰相反。大多數人都認為藝術本身的創造性很難被取代,而人工智能的可解釋性、可遷移性、可靠性同樣非常重要。如果將可解釋性人工智能應用到藝術領域,可以提升人對藝術的理解,比如什么樣的藝術能夠產生美感、如何創造美的藝術,甚至影響藝術品的評價內容和估值等。
基于機器學習的書法評價是非常復雜的系統問題,需要大量的數據和訓練才能得以驗證,從而取得有效的評價結果。目前,國內外已有不少學者在文字識別領域取得了顯著成果,文字識別技術已經在印刷體和部分手寫體文字識別方面得到了很好的應用。但是目前在基于機器學習的書法評價體系方面,相關研究還非常少,處于起步階段。
一、深度學習在手寫文字識別領域的應用
筆者在國內近幾年文字識別方面的研究中發現,當前對于書法字的識別大多采用輪廓相似性以及骨架相似性的方法。吳媛等人提出的一種基于數學形態學的脫機手寫體漢字識別方法,在識別率方面有顯著的提升,但移植到數據量很大的書法字的檢索系統中時,會出現檢索速度變慢,檢索的效果不如手寫的字好等問題。在此方法的基礎上,俞凱等人提出一種基于骨架相似性的書法字檢索方法,在保證查全率與查準率的基礎上,檢索速率有了顯著的提升,但是建立的特征數據庫比較大,并不能滿足系統的設計要求。為了解決相關算法計算量大、耗時長、效率低等問題,章夏芬等人提出根據樣本字特征進行動態變化的自適應匹配法,在效率沒有改變的前提下,查全率與查準率得到了一定的提升,但隨著數據量增大,檢索所需的時間也會呈線性增長。
目前,很多大公司,比如科大訊飛和百度AI都已經推出了成熟的手寫文字識別系統。系統可基于深度神經網絡模型端到端文字識別系統,將圖片(來源于掃描儀或數碼相機)中的手寫字體轉化為計算機可編碼的文字。
以上所述的研究和實現方法都是大同小異的,基本上都是先選用數據集,再搭建網絡,對數據集進行模型訓練。
1.搭建網絡。
其實文字識別就是一個多分類任務,如一個手寫漢字數據集的分類就屬于文字識別任務。用來定義它的網絡非常簡單,基本就是LeNet網絡。LeNet由Yann LeCun等人于1989年提出,它是一種用于手寫體字符識別得非常高效的卷積神經網絡,推動了深度學習的發展。LeNet5通過巧妙的設計,利用卷積、參數共享、池化等操作提取特征,避免了大量的計算成本,再使用全連接神經網絡進行分類識別。這個網絡是卷積神經網絡架構的起點,后續許多網絡都以此為范本進行優化。
2.模型訓練。
訓練之前應設計好數據,使其能高效地喂給網絡訓練。首先,創建數據流圖,這個數據流圖由一些流水線的階段組成,階段間用隊列連接在一起。第一階段將生成文件名,我們讀取這些文件名并且把他們排到文件名隊列中。第二階段從文件中讀取數據(使用Reader),產生樣本,再把樣本放在一個樣本隊列中。根據個人的設置,實際上也可以拷貝第二階段的樣本,使得他們相互獨立,這樣就可以從多個文件中并行讀取。在第二階段的最后是一個排隊操作,就是入隊到隊列中去,在下一階段出隊。我們一旦開始運行這些入隊操作的線程,訓練循環就會使得樣本隊列中的樣本不斷地出隊。流程如圖1所示。
<f:\教育8本書\江蘇教育2021\江蘇教育4期\書法4期\書法4期圖片\2.論人工智能在傳統書法藝術的中的應用與探索(1)(1)-357D\image1.png>[enqueue_many][dequeue][enqueue][Decoder][圖1 數據讀入流程]
二、深度學習在書法評價領域的探索
目前在書法作品評價方面,大多采用將要評價的樣本與標準書法作品進行相似度計算的方法。例如,湖北工業大學的邵榮堂對書法練習作品中書法字的骨架與字帖中書法字的骨架進行相似度的計算。他首先采用本文中提出的一種基于Z-S 算法改進的單像素化處理的骨架提取的算法,從而得到基于整體結構特征的相似度值;而后采用一種九宮格的形式對書法字的骨架進行切分,將每一部分的骨架對比字帖中書法字相同位置的骨架,利用Hu矩與皮爾遜相關系數對相似度進行計算,得到基于筆畫形體特征的相似度值;最后利用書法字距離邊框的值與整個書法字在邊框中的布局來綜合計算字體布局特征面的相似度值。整體評判的標準依據書法初級考試的標準制定。
現有的許多書法評價系統都要先區分書法作品的字體,如行、草、隸、篆、楷五種字體,使用者可以根據自身喜好選擇合適的書法字體以及書寫風格。系統利用基于向量誤差的書寫評析模型,通過書法字跡智能提取、智能書法評分、智能書寫指導等過程,將單字書法中書寫失誤部位用紅色標記,將書寫準確部位用綠色標記。
但以上方法有局限性。當選取小學生書法作品進行評價的時候,很難通過識別字體來評判優劣。并且目前大多是以學者和研究人員為對象的書法評價系統研究,都是采用現有的局限性較大的公共數據集來進行模型訓練的,沒有大量的中小學生書法作品數據集,很難更準確地實現人工智能打分的目的。因此,中小學書法教師在自建專用書法作品數據集進行深度學習訓練方面還需要展開相關工作。
三、深度學習在書法創作領域的展望
很多藝術家認為機器不會取代藝術家的所有藝術創作,實際上人工智能藝術取代一部分藝術創作是有可能的。這一部分到底是多少?誰又有可能被率先取代呢?
就目前音樂創作情況來看,機器人已經能作曲,并取得了不錯的應用效果。隨著3D打印和雕刻機械的智能化,部分雕塑也要面臨人工被機器取代的趨勢。接下來可能就是書法了。
理論上講,與書法評價一樣,只要有足夠的深度學習數據集,有足夠好的算法,深度學習就可以讓人工智能學會書法創作,再結合靈活高效的機械控制裝置,人工智能很有可能完成甚至超過人類的書法創作。從目前機器手臂書寫我們可以看出,唯一阻礙機器不能像人一樣流利書寫的瓶頸就是筆。機器書寫字形和提按比較輕松,而控制筆在書寫過程中筆毛形狀的變化和筆的干濕度把握是機器的短板。隨著科技和工業制造水平的不斷提高,日后應該可以逐步解決機器控制筆的問題,到那時,書法領域將會有重大變革。
人工智能對人類造成的沖擊,將使人們對自身的生命價值產生新的焦慮與追問,從而迫使人們靜下心來審視書法以及其他藝術的本質意義,到那時,自然的書寫、精神的交流與創造將成為人們內在的迫切需求。人們迫切需要以審美的力量解答心靈歸屬問題,對心靈的渴望予以真正的滿足,給焦躁孤獨和漂泊的靈魂以意義和價值的安頓,對人類困境給出審美的精神層面的回應和引導。
若真的如此,書法的春天就真的來臨了。就算機器人能寫出漂亮的書法,但它無法完成人們通過書寫來抒發真情實感而創造的內在精神需求。從唯物辯證法的視角看,事物總是遵循否定之否定的規律,在螺旋式上升的過程中向前發展,從古代書家的自然書寫,到當下的功利性書寫,再到人工智能時代的全新歷史階段的自然書寫與精神創造,或將迎來書法藝術發展的全新境界。<F:\教育8本書\江蘇教育2021\江蘇教育4期\書法4期\KT1.TIF>
【參考文獻】
[1]劉仁坤.利用現代信息技術提高書法教學實效[J].基礎教育論壇,2019(3):58-60.
[2]邵榮堂. 基于機器學習的書法字識別與智能評判[D].武漢:湖北工業大學,2020.
[3]顧剛. 漢字識別關鍵算法研究與應用[D].杭州:浙江大學,2017.
[4]殷良鷹. 非線性度量學習算法研究[D].北京:北京理工大學,2016.
[5]周潤物,李智勇,陳少淼,等.面向大數據處理的并行優化抽樣聚類K-means算法[J].計算機應用,2016,36(2):311-315,329.
[6]曲延直.基于深度學習的漢字書法識別研究[J].電子測試,2019(24):44-46,61.