劉昕宇
(南寧市第三中學,廣西南寧,530000)
隨著科學技術的發展,人工智能中的圖像識別技術已被廣泛應用于人類生活中[1]。人工智能中的圖像識別技術已成為信息技術發展的重要標志,在信息發展中占有重要地位。圖像技術作為重要的發展研究項目引入工業智能,科學科學研究中國對未來發展有著良好的期待[2-3]。智能圖像識別技術融入工作中,智能圖像識別技術正處于中國科技時代,在快速發展的同時,也必須關注智能圖像識別技術的技術原理和生活中圖像識別技術的應用[4-5]。人工智能圖像識別技術的關鍵要素是圖像模式識別,模式識別不僅是圖像識別原理的重要組成部分,也是人工智能技術的組成部分[6]。模式識別主要應用于處理不同類型的平面和立體圖像以實現圖像和實體分析的圖像處理技術。由于圖像識別技術主要使用人工智能來協調虛擬物體的分析與模式識別,物體的分析不再需要面對真實的物體,人工智能和模式識別可以使圖像立體化[7-8]。
機器視覺技術當下應用廣泛,其包含計算機科學,人工智能、電子信息等[9]。它通過相關設備將攝取的目標轉換成圖像,再由專門的圖像處理系統進行分析,從而得到數字信號指揮現場設備進行運轉。其不僅能很好的模擬人眼視覺,且能執行人類無法完成的高精度任務[10]。
糾錯,顧名思義,是將錯誤的題目重新糾正,便于之后復習時能更快找到之前出錯的題目,以防止相同的錯誤重復出現。糾錯過程中,需要學生將待糾錯的題目謄抄到筆記本上,并且有時候還需要摘抄部分的參考答案。因此,在糾錯過程中會產生大量需要抄寫的字符。得益于糾錯的方便快捷,可以隨意記錄錯題與筆記,隨時隨地都可以復習,以及其較強的可操作性、效率高等優勢,糾錯開始成為一種主流的學習方法。
當前,中學生的學習開始趨于追求更高效、更方便的學習方式、學習方法,糾錯慢慢為大多數的中學生和老師青睞。而在糾錯的過程中,大學多數的學生面臨著同樣一個問題:進行糾錯時需要摘抄題目,而題目常常配有大量文字和符號,摘抄時費事費力,而且容易抄錯。可以在摘抄時極大限度地解放雙手并且進一步提高效率,能方便學生的學習和人們的日常工作。目前,國內許多辦公軟件和手機系統附帶有文字識別功能。諸如此類的軟件一般較好地完成對清晰、干凈、簡單資料的文字識別,并將其轉換成為電子版。但是,一旦出現大量文字和符號時,對于結構復雜、生僻字以及特殊符號等的識別速度和準確的便大大降低,甚至會出現亂碼。而機器視覺的題目符號智能識別系統能提高識別的準確度和穩定性,提高字符識別質量。
因此,提出了一種機器視覺的題目符號智能識別系統,該系統能夠較好的進行題目符號的識別,并且正確率高,穩定性強。
該系統主要包含硬件和軟件兩個部分,其主要工作的原理是:首先,當圖像傳感器被激發之后,會向相機發出指令,相機接到指令后,進行圖像的采集,即題目字符等圖像的采集,采集結束之后,圖像會被送到題目字符檢測系統,系統通過所開發的題目字符信息特征識別算法完成對題目字符的自動識別和檢測。系統框架圖如圖1所示。

圖1 系統框架圖
針對待測字符的特點,本次研究我選取了MER-201-25GM工業相機,它的幀率為20fps,由于彩色圖像的灰度值相差較大,處理起來比較麻煩,所以我采用了黑白的工業相機,它能夠快速的對字符進行識別檢測。

圖2 工業相機
型號為MER- 2 01 - 25GM的工業相機的感光曲線特性圖如圖3所示。

圖3 感光曲線特性圖
鏡頭方面我選擇了型號為AFT-0614MP的100萬像素的工業鏡頭,因為所測字符位置為平面,該鏡頭能夠更好的滿足要求。圖4為研究所用工業鏡頭。

圖4 鏡頭
如圖5是型號為AFT-0614MP的100萬像素的面陣工業相機的MFT曲線特性圖。

圖5 MFT曲線特性圖
攝影是光的藝術,由于拍攝環境的不同,為了保證拍攝需求,需要使用光源來保證拍攝環境。由于紙張表面光滑且反光,所以此次研究我選擇了條形紅光光源來配合圖像采集。它的燈帶角度為45°,能夠較好的抑制從紙面反射光,獲得高質量的圖像。同時它也能夠使拍攝周圍的光照環境更符合要求。

圖6 條形光源
傳感器是一種檢測裝置,能夠將接收到的信息,轉換成電信號,在題目字符識別系統中,使用了采集觸發傳感器和圖像處理器,能夠將接受的字符信號進行處理。各傳感器的選型及參數如表1所示。

表1 硬件型號與參數
軟件處理部分如圖7所示,主要工作流程是:傳感器接收到信號之后,相機開始采集圖像,并將采集之后的圖像進行預處理,輸入到字符識別檢測系統,系統在進行完一系列工作之后,輸出顯示結果。

圖7 軟件框架圖
研究所用系統是基于軟件開發平臺,結合OpenCv開發的不同學科不同題目類型的多種題目符號融合的圖像處理算法嵌入在題目符合智能識別系統里面。通過該系統,我們可以對多種題目符號融合的試卷題目進行實時信息采集,首先設置好相關的參數,然后再打開相機進行實時的圖像采集,采集后的圖片經過處理后被輸送到字符檢測系統中,字符檢測系統將處理之后的結果顯示在操作界面上。

圖8 顯示界面
能夠快速實時的對多種字符符合融合的題目符號進行識別和檢測,并將識別檢測結果實時反饋到控制端,輔助進行糾錯,顯得尤為重要。無論是數學學科的題目,還是物理等其他學科的題目,都會有2種或2種以上的字符符合融合而成,這些因素都會給檢測帶來一定的難度。現利用系統來識別兩批相同數量的題目符合圖像,在相同環境的情況下進行對比試驗如表2所示。

表2 試驗數據
系統識別了兩批相同數量的50張題目符合圖像,然后在同樣的環境下進行了6組識別試驗,從表中數據可知,識別一批的誤檢率大致在4.0%內,比較穩定,識別二批的誤檢率在8.0%以內,且比較穩定。識別所用時間在110s以內,識別效率較高。
此次研究,我設計出了一款基于機器視覺的字符智能識別系統,該系統能夠針對不同學科多種字符進行識別檢測,展現了較好的性能。軟件系統識別檢測所用時間均在110s以內,且誤檢率在8%以內。表明該檢測系統可以高效、實時的完成對不同學科、多種字符符合融合下的題目符合特征的識別和檢測。實際推廣應用價值大,市場前景廣闊。