袁莉 蔡文霞 李愛華
【摘 要】漢字信息提取技術是寫字機器人中的關鍵技術之一,機器人能夠寫出準確美觀的文字的基礎是必須要有正確的文字信息輸入。本文闡述了三種文字識別技術:字庫提取技術、機器視覺文字提取技術和模仿學習提取漢字信息技術,介紹了它們的關鍵技術點及實現方法,最后展望了書寫機器人及漢字識別提取技術的發展方向。
【關鍵詞】書寫機器人;模仿學習;機器識別
漢字文化博大精深,經過6000多年的變化,漢字數量達8萬之多,標準的書法字體有甲骨文、金文、小篆、隸書、楷書、行書等等,因此,漢字的書寫不同于英文的書寫,其書寫更為復雜,更為講究,筆劃、筆順、用筆力度、停頓等都是書寫時要注意的問題,寫字機器人要寫出結構美觀的漢字,首先要獲取準確的漢字信息。機器人漢字信息提取主要有三種途徑:已有字庫、機器視覺和智能模仿學習。在信息提取的過程中,涉及多種技術和方法,本文對機器人漢字信息提取技術做了全面分析研究,并展望智能機器人中漢字提取技術的發展趨勢。
1 字庫漢字信息提取技術
書寫機器人從現有字庫中獲取漢字信息,對其進行再現書寫。字庫一般選取文字矢量文件或矢量信息,如AutoCAD公司的.shx文件和早期的UCDOS漢字矢量庫,現在使用較廣泛的是Windows平臺下的TrueTypeFont矢量字庫,TTF字庫是Microsoft公司和Apple公司共同推出的一種輪廓字體。TTF是一種矢量字體,它用一系列點構造字型輪廓,在此基礎上用一系列指令調節,使輪廓線變的平滑,可以得到良好的顯示效果。一個字符由一系列閉合輪廓線組成,每條閉合輪廓對應一個TTPOLYGONHEADER數據結構,而一條輪廓包含至少一條曲線(包括折線和二次樣條),曲線由TTPOLYCURVE數據結構定義。利用Win32的API函數GetGlyphOutline()提取所需漢字的輪廓線數據或位圖數據,通過編程把TTPOLYGONHEADER結構中POINTFX形式的點坐標轉換為Cpoint坐標,分離出組成輪廓線的各條折線和Bezier曲線。將漢字輪廓線數據中點坐標保存在一個數組中,用于控制寫字機器人的筆尖移動軌跡控制。
如果寫字機器人要求書寫的漢字尺寸很小,書寫雙線字效果不好,這時就需要繪制單線字。單線字繪制一般選取點陣字庫,文字提取主要采用輪廓提取和輪廓跟蹤技術。用“0”和“1”分別表示無筆劃和有筆劃,將漢字點陣信息形成字符矩陣,從筆劃的始點出發,在其8個相鄰點中選定跟蹤方向,在此方向上連續跟蹤,直到沒有后繼點為止。
2 機器視覺提取文字信息技術
機器視覺提取文字信息技術可以使機器人靈活的寫出任意字體的漢字。將任意字體的漢字放在攝像頭下,攝像頭將拍攝的圖像傳送到計算機,計算機處理圖像得到文字的坐標文件。計算機接收到圖像后,首先要對圖像進行去除噪聲、傾斜校正、閾值化運算、行列切分、閉運算、細化運算和去毛刺處理,將圖像處理成黑白的二值圖像,而且要輪廓光滑,突出漢字骨架。然后進行提取文字筆劃工作,提取筆劃的最大難點是鏡頭下的漢字的不可預測性及隨意性,尤其手寫連筆漢字。一條連續曲線對應一個筆劃,把漢字進行連通域的劃分處理,然后按照先左后右、先上后下的順序在每個連通域內提取筆劃保存筆劃坐標,按照1中提到的輪廓跟蹤方法確定筆順。
3智能模仿漢字書寫技術
我們讓機器人書寫一個漢字,我們稍微示范一下,機器人就能學會!一旦機器人具備這樣的模仿學習能力,機器人就擁有了類似人類的模仿學習能力,智能機器人通過自主學習獲得具有切實的類人的智能行為能力,這是機器人的終極理想狀態。寫字機器人模仿學習主要是通過人手牽引,與機械手臂相互協作使之獲取相應漢字信息,最終實現書寫。Toru Tsumugiw提出了一種基于延時定位的人機交互的可變阻抗的控制方法[4],由壓力傳感器實時獲取操作者手臂前端的力度,使機器人末端傳感器實時獲取壓力和位置數據,實時獲取壓力與位置數據,使人機協作系統更加穩定。Andre Lemme[5] 以人形機器人iCub為平臺,構建了一個運動基元庫,通過人類的引導能夠自監督地從復雜軌跡中感知并學習運動基元,學會相應的軌跡動作,并能使用復雜的手寫軌跡進行評價。
另一種模仿學習的方式就是通過觀察和模仿人類,獲取對應的漢字信息并進行漢字的書寫。例如V. Mohan等人[6] 以嬰兒人型機器人iCub 為平臺,通過綜合系統學習繪制從簡單到復雜的形狀圖案,即通過觀察示范者的動作,特別是示范者末端執行器的軌跡,來學習模仿示范者的動作。在此基礎上,也有研究者通過觀察人的手勢來實現機器人手臂的書寫。通過運動傳感器輸入設備實時捕捉示范者的手勢軌跡,采用簡化的分類集成器識別人體不同的動作手勢,來控制機械臂書寫不同的筆畫,最終實現整個漢字的書寫。
4 結束語
目前寫字機器人漢字信息提取技術主要是字庫提取和機器視覺提取,模仿學習技術還不是很成熟,寫字機器人的應用面也比較窄。隨著計算機技術、圖像處理技術、傳感器技術和人工智能技術的不斷發展,寫字機器人必將從只能重復單一工作發展為像人類一樣能模仿學習,并能隨著經驗的積累自動提高性能,甚至可以自我創作書法。強調機器人的自主學習方式,研制能夠使人類的生產生活發生深刻變革的具備“通用智能”的機器人,無疑是機器人未來的發展方向。
參考文獻:
[1]何薇,錢增磊 等.基于機器視覺的機器人寫字技術的設計[J].江南大學學報(自然科學版).2011,10(5):513-516
[2]曾華琳,黃雨軒,晁飛,周昌樂.書寫機器人研究綜述[J].智能系統學報,2016,11(1):16-26..
[3]王光建,梁錫昌.寫字機器人的文字矢量化及應用[J].現代制造工程,2004(7):40-42.
[4]TSUMUGIWA T,YOKOGAWA R,KHARA R.Variable impedance control based on estimation of human arm stiff-ness for human-robot cooperative calligraphic task[C]//Proceedings of IEEE International Conference on Robotics and Automation.Washington,DC,USA,2002:644-650
[5]LEMME A,REINHART R F,STEIL.J.J.Self-super Vised bootstrapping of a movement primitive library from complex trajectories[C]//Proceedings of the 14th IEEE-RAS International Conference on Humanoid Robots(Humanoids).Madrid,2014:726-732.
[6]MOHAN V,MORASSO P,ZENZERI J,etal.Teaching a humanoid robot to draw’Shapes’[J].Autonomousrobots,2011,31(1):21-53.
(作者單位:1石家莊學院機電學院;2陸軍工程大學無人機工程系)