劉 學(xué)
(承德石油高等專科學(xué)校,河北 承德 067000)
當(dāng)前自動駕駛技術(shù)發(fā)展迅速,已經(jīng)取得了很多成果,如果農(nóng)機(jī)巨頭與互聯(lián)網(wǎng)巨頭相攜手,專門研發(fā)智能農(nóng)機(jī)和智慧農(nóng)業(yè),一定會掀起無人農(nóng)機(jī)技術(shù)新浪潮。2018年,雷沃重工與百度簽署戰(zhàn)略合作協(xié)議,共同實現(xiàn)自動駕駛量產(chǎn)的目標(biāo),在自動駕駛技術(shù)及大數(shù)據(jù)分析等業(yè)務(wù)領(lǐng)域展開深度合作。這是雷沃作為農(nóng)機(jī)企業(yè),為農(nóng)業(yè)生產(chǎn)提供更智能、更具開放性的農(nóng)機(jī)裝備和便捷高效的信息化服務(wù),在深刻把握行業(yè)發(fā)展趨勢的基礎(chǔ)上做出的又一重大舉措。具備無人駕駛技術(shù)的農(nóng)機(jī)需要有自動導(dǎo)航功能,需要更加智能化的機(jī)器視覺系統(tǒng),如果將字符識別技術(shù)引入到收割機(jī)的機(jī)器視覺系統(tǒng)中,可以有效提高導(dǎo)航系統(tǒng)的自動識別能力和識別精度。
OCR技術(shù)是光學(xué)字符識別技術(shù)的縮寫,通過掃描等光學(xué)輸入方式將各種印刷品轉(zhuǎn)換為圖像信息,然后再利用字符識別技術(shù)將圖像轉(zhuǎn)換為文字輸入到計算機(jī)中。在英語字符翻譯過程中,一些翻譯工具也采用了字符識別技術(shù)(如迅捷英語翻譯工具),通過將圖像文字進(jìn)行字符識別,可以自動地將印刷品上的文字進(jìn)行翻譯,大大提高了翻譯的效率。
在進(jìn)行無人駕駛收割機(jī)視覺系統(tǒng)設(shè)計時,為實現(xiàn)自動導(dǎo)航,可在作業(yè)區(qū)域設(shè)置導(dǎo)航線,視覺系統(tǒng)識別導(dǎo)航線位置后沿著導(dǎo)航線行走,從而實現(xiàn)自主導(dǎo)航。在視覺系統(tǒng)對導(dǎo)航線進(jìn)行識別時,為提高識別的智能化水平和識別精度,可將字符識別技術(shù)引入到視覺系統(tǒng)的設(shè)計上。整個導(dǎo)航線的識別流程如圖1所示。

圖1 導(dǎo)航線識別流程
工作時,收割機(jī)視覺系統(tǒng)首先對導(dǎo)航線進(jìn)行圖像采集,初步對導(dǎo)航線進(jìn)行定位,然后利用翻譯工具的字符識別技術(shù)對導(dǎo)航線進(jìn)行分割,最后識別導(dǎo)航線,收割機(jī)沿著導(dǎo)航線行走實現(xiàn)自主導(dǎo)航。
為了實現(xiàn)收割機(jī)的自主導(dǎo)航,在收割機(jī)作業(yè)區(qū)域設(shè)置導(dǎo)航標(biāo)線,收割機(jī)視覺系統(tǒng)識別導(dǎo)航標(biāo)線位置后可實時地沿著導(dǎo)航線行走,從而實現(xiàn)自主化作業(yè)。在導(dǎo)航線識別時,收割機(jī)首先要通過視覺系統(tǒng)對導(dǎo)航線圖像進(jìn)行采集,然后通過圖像處理技術(shù),依據(jù)字符識別理論對導(dǎo)航線進(jìn)行識別。在進(jìn)行圖像處理時,為了有效提取導(dǎo)航線,首先要排出因為作業(yè)環(huán)境造成的圖像干擾,因為干擾后的圖像會發(fā)生退化。一般來說,退化圖像的數(shù)學(xué)模型可以簡單地描述為
g(x,y)=Hf(x,y)
(1)
其中,f(x,y)為成像景物,H為綜合退化因子,g(x,y)為退化圖像。
圖像f(x,y)可以表示為
(2)
用卷積符號表示為
f(x,y)=f(x,y)·δ(x,y)
(3)
f(x-a,y-β)=f(x,y)·δ(x-a,y-β)
(4)
其中,f(α,β)為像素點的特性函數(shù),δ(x-α,y-β)為沖擊響應(yīng)。假定成像系統(tǒng)是線性移不變系統(tǒng),干擾圖像模型如圖2所示。

圖2 干擾圖像模型
為了使圖像復(fù)原,可以采用逆濾波的方法,將圖像進(jìn)行空間域和頻域的傅里葉變換,通過逆濾波將圖像由頻率域再變換回空間域,從而可以得到復(fù)原圖像。在理想條件下,則
(5)
式(5)兩邊進(jìn)行傅里葉變換得
G(u,v)=F(u,v)H(u,v)
(6)
則原始圖像為
(7)
為了提取圖像中的導(dǎo)航線,需要對圖像進(jìn)行灰度化處理。灰度化處理主要是將24位的真彩圖像轉(zhuǎn)換為8位的灰度圖像,公式為
C=xR+yG+zB,x+y+z=1
(8)
其中,R、G、B為三基色,x、y、z為3種最基本的顏色系數(shù),C為轉(zhuǎn)換之后的顏色。在進(jìn)行導(dǎo)航線識別時,依據(jù)字符識別的原理,提前做好視覺系統(tǒng)導(dǎo)航線的模板,通過將采集得到的導(dǎo)航線和模板導(dǎo)航線進(jìn)行對比,最終識別確定導(dǎo)航線。在進(jìn)行導(dǎo)航線識別時,首先要對導(dǎo)航線進(jìn)行位置定位,基本流程如圖3所示。

圖3 導(dǎo)航線初步定位
在導(dǎo)航線初步確定時,首先要采集導(dǎo)航線的圖像,然后將其進(jìn)行邊緣提取,通過簡單的圖像處理后進(jìn)行一次定位;定位完成還要進(jìn)行二次準(zhǔn)確定位,再繼續(xù)進(jìn)行圖像處理。流程如圖4所示。

圖4 導(dǎo)航位置線識別過程
在對導(dǎo)航線采集圖像進(jìn)行二值化處理后,利用垂直投影的方法對導(dǎo)航線進(jìn)行切分,然后進(jìn)行識別,最后輸出相應(yīng)的結(jié)果。收割機(jī)在進(jìn)行作業(yè)時,可以沿著導(dǎo)航位置線行走,實現(xiàn)自主化作業(yè)。
基于字符識別的圖像分割技術(shù)在機(jī)器視覺系統(tǒng)中有著廣泛的應(yīng)用,如果將其引入到收割機(jī)的視覺系統(tǒng)中,對于實現(xiàn)收割機(jī)的無人駕駛具有重要的意義。目前,我國已經(jīng)研發(fā)出無人駕駛收割機(jī),如圖5所示。
圖5為江蘇農(nóng)場我國首臺無人駕駛收割機(jī)作業(yè)場景。收割機(jī)作業(yè)時,完全依靠自身的視覺系統(tǒng)對作業(yè)區(qū)域進(jìn)行定位,實現(xiàn)了自主導(dǎo)航和自動化作業(yè)。本次模擬這種作業(yè)場景,以翻譯工具OCR字符識別為理論依據(jù),采用圖像處理技術(shù)對收割機(jī)的視覺系統(tǒng)進(jìn)行設(shè)計,主要以導(dǎo)航線的識別來說明設(shè)計的視覺系統(tǒng)的基本原理。導(dǎo)航線的定位過程如圖6所示。

圖5 無人駕駛收割機(jī)作業(yè)場景

圖6 導(dǎo)航線定位過程
為了實現(xiàn)收割機(jī)的自主導(dǎo)航功能,在作業(yè)區(qū)域設(shè)置了導(dǎo)航位置線,主要通過視覺系統(tǒng)的字符識別方法對導(dǎo)航線進(jìn)行提取識別,通過對原始圖像的采集、圖像增強處理、邊緣提取及圖像別等,最終對導(dǎo)航線進(jìn)行定位。在定位導(dǎo)航位置線時,采用了垂直投影掃描的方法,通過垂直掃描投影可以得到圖像的灰度值曲線,如圖7所示。

圖7 圖像灰度值掃描曲線
由圖7可知:通過圖像垂直投影,可以成功地得到二值化圖像,利用圖像增強處理后可以使圖像的輪廓更加清晰,便于邊緣的提取。最終得到的視覺導(dǎo)航線如圖8所示。

圖8 垂直投影圖像
通過基于字符識別技術(shù)的圖像處理,可以成功地得到清晰的導(dǎo)航線。收割機(jī)在進(jìn)行自主作業(yè)時,可以沿著導(dǎo)航線的位置實現(xiàn)自主化作業(yè)。
通過收割機(jī)視覺系統(tǒng)的識別技術(shù)還可以得到導(dǎo)航線的位置坐標(biāo)(見圖1),收割機(jī)在進(jìn)行自主行走時還可以根據(jù)實時位置坐標(biāo)來修正行走路線,最終實現(xiàn)準(zhǔn)確的自主導(dǎo)航。

表1 導(dǎo)航線位置坐標(biāo)表
為了提高收割機(jī)視覺系統(tǒng)的圖像識別能力,將基于翻譯工具的字符識別技術(shù)引入到了視覺系統(tǒng)的設(shè)計上,通過對導(dǎo)航線圖像的濾波、灰度處理和圖像增強后,實現(xiàn)導(dǎo)航線的定位和提取,從而實現(xiàn)自主導(dǎo)航功能。為了驗證方案的可行性,以導(dǎo)航線圖像的處理和識別為研究目的進(jìn)行了測試,結(jié)果表明:采用基于翻譯工具的字符識別技術(shù)可以成功地實現(xiàn)導(dǎo)航位置線的提取,且可得到實時位置坐標(biāo),為收割機(jī)的自主行走提供了準(zhǔn)確的數(shù)據(jù)支持。