鄭昊辰,姜 維
(1.中國(guó)人民大學(xué) 附屬中學(xué),北京100080;2.華北水利水電大學(xué) 軟件學(xué)院,河南 鄭州 450045)
閱卷系統(tǒng)是現(xiàn)代化教學(xué)過(guò)程中評(píng)估教學(xué)效果的重要工具,手寫(xiě)漢字識(shí)別是閱卷系統(tǒng)的重要組成部分[1-3]。精準(zhǔn)、高效的手寫(xiě)漢字識(shí)別算法能夠大幅提高閱卷系統(tǒng)的準(zhǔn)確度和便捷性。但是由于漢字識(shí)別存在類別多、結(jié)構(gòu)復(fù)雜、相似字多、書(shū)寫(xiě)差異大[4-8]等問(wèn)題,手寫(xiě)漢字識(shí)別算法已成為制約閱卷系統(tǒng)發(fā)展的瓶頸。雖然經(jīng)過(guò)多年的研究,漢字識(shí)別已經(jīng)有了許多成果,但其在實(shí)際應(yīng)用中的性能仍需改善。對(duì)于無(wú)約束的手寫(xiě)漢字識(shí)別,尚無(wú)簡(jiǎn)單的方案能滿足高識(shí)別率和識(shí)別精度的要求[9]。近年來(lái),研究人員主要從兩個(gè)方向?qū)h字識(shí)別方法進(jìn)行改善:(1)運(yùn)用神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫、支持向量機(jī)(Support Vector Machine,SVM)、數(shù)學(xué)形態(tài)學(xué)等方法進(jìn)行預(yù)處理、特征提取和分類;(2)采用信息集成的方式從多角度對(duì)手寫(xiě)字符進(jìn)行綜合分析[10]。
在信息處理領(lǐng)域,關(guān)于超完備基的稀疏線性表示計(jì)算問(wèn)題,即壓縮傳感理論(Compressive Sensing,CS)是近年來(lái)的研究熱點(diǎn)之一[11-12]。壓縮感知理論也可應(yīng)用在模式識(shí)別問(wèn)題上,文獻(xiàn)[13]將訓(xùn)練樣本作為超完備基,利用稀疏表示的判別性實(shí)現(xiàn)了人臉識(shí)別。若每類樣本足夠充分,則測(cè)試樣本可表示為同類樣本的線性組合,對(duì)于整個(gè)樣本集而言,其表示是非常稀疏的,使得分類問(wèn)題可通過(guò)壓縮感知的方法來(lái)實(shí)現(xiàn)。文獻(xiàn)[14]同樣利用這種方法,對(duì)手寫(xiě)數(shù)字進(jìn)行了有效的識(shí)別。本文基于上述思想,將壓縮感知理論應(yīng)用到更為困難的手寫(xiě)漢字識(shí)別領(lǐng)域。……