王 炎,賀俊吉
(上海海事大學 物流工程學院,上海201306)
集裝箱箱號定位主要采用以下方法:基于邊緣檢測和形態學的方法[1-4],這類方法適應性較強,能有效去除噪聲,但文獻 [1]中用連通區域填充度篩選箱號區域的方法以及文獻 [2,3]中直接根據連通區域寬高比篩選的方法在復雜背景中效果不佳,而文獻 [4]中去除干擾邊緣的方法較復雜,運算量大;基于箱號區域位置和投影的方法[5],該方法在箱號區域處于圖像中固定位置時,定位效果較好,但對拍攝的圖像要求較高,同時需要較多的箱號先驗知識;基于邊緣點數量統計的方法[6],該方法在干擾字符較少時定位準確,但應用于復雜背景及對比度較低的圖像時,容易導致定位誤差較大。因此,在復雜背景的集裝箱圖像中有效去除干擾,快速定位箱號區域十分必要。
為了快速、正確地定位出集裝箱箱號。本文在分析了箱號區域特性的基礎上,使用少量先驗知識對運用形態學后的二值圖像,通過連通區域匹配度和面積篩選箱號區域。同時,因為形態學運算的優點之一是能將基本的邏輯運算與移位運算相結合,使許多原本對二值圖像十分繁雜的運算變的簡單。因此本文算法選擇在二值化后圖像上進行。這樣做不僅使算法運算時間變短、提高了實時處理的能力,而且算法不復雜、更加有利于集裝箱箱號區域的定位[7]。本文中各部分模塊組成的流程如圖1所示。

圖1 各模塊組成的框架
在圖像預處理模塊中包括4個步驟:灰度變換、濾波、背景消除和二值化。預處理模塊如圖2所示。

圖2 預處理模塊框架
(1)對圖像進行灰度變換。灰度變換的原因是由于集裝箱圖像的采集是通過數碼相機得到的。在預處理之前的圖像全是彩色圖像,而彩色圖像包含的信息量很大,這樣需要的更大的存儲空間,因此圖像處理的速度也會隨之變慢。因此對圖像進行灰度變換可以使圖像只包含亮度信息,不包含彩色信息。灰度變換的目的是為了提高圖像的處理速度,使圖像在處理中更加方便計算。
(2)對圖像進行維納濾波。對圖像濾波的原因是,在對集裝箱圖像進行處理的時候,會遇到噪聲帶來的影響。噪聲對圖像的信息是一種損害。所以對采集到的集裝箱圖像進行濾波十分必要。維納濾波器在假設噪聲是高斯以及加性的,而且信號與噪聲相互獨立的基礎上得到最小均方誤差意義下的最優濾波[8]。維納濾波的目的是為了將細小的噪聲去除。
(3)對濾波后的圖像進行背景消除。這樣處理的原因是由于拍攝的圖像常會有光照不均的情況,加之集裝箱箱體受到沙塵污染,涂刷在上面的字符也會受到影響,從而降低了對比度。由于本文拍攝的集裝箱圖像中相機與集裝箱的距離為3至4m,因此本文中集裝箱背景消除的方法為:①選擇大小為6×6的正方形結構元素對圖像進行開運算得到背景圖;②用原圖像減去背景圖即得到背景消除后圖像。
(4)對消除背景后的圖像進行二值化。本文使用Otsu法對圖像進行二值化。這樣處理的原因是因為天氣、拍攝時的角度和箱體上的油污等因素會對采集的集裝箱圖像造成影響,導致采集到的很多集裝箱圖像的質量比較低。有的圖像中會存在嚴重的光照不均、對比度較低和不明顯的字符邊緣。Otsu法相較于傳統方法更能滿足本文對二值圖像的要求。
集裝箱箱號區域的定位與提取是集裝箱箱號自動識別系統的一個重要的環節,箱號定位提取的準確與否直接影響著后續的自動識別工作。定位提取模塊如圖3所示。

圖3 箱號區域定位與提取模塊框架
本文運用形態學方法對二值化后的圖像進行處理。目的是為了生成較大的連通區域。這樣做可以更好地去除干擾區域,從而為后面篩選出真正的集裝箱箱號區域打下良好基礎。
在數字圖像處理中,形態學是借助集合論的語言來描述的。通常將用于處理某幅圖像且較小的圖像成為結構元素。二值圖像中的基本形態學運算包括4種,分別為腐蝕運算、膨脹運算,以及由前面兩者相結合而產生的開、閉運算。形態學中直接影響處理結果的因素有兩個:結構元素的選擇和形態學運算的選擇。本文的具體算法為:
(1)在選擇結構元素時,選擇符合集裝箱箱號區域寬高比的矩形結構元素。目的是為了正確地使箱號區域中的字符形成連通區域;
(2)用步驟 (1)中的結構元素對圖像進行閉運算,目的是為了彌合字符間狹窄的間斷并且填充例如數字6、9以及字母A、B等中的孔洞;
(3)用比步驟 (1)中小的結構元素對圖像進行開運算。目的是為了使圖像的輪廓變得光滑,同時還能消除毛刺;
(4)通過設定閾值將連通區域面積遠小于或是遠大于拍攝圖像中可能的箱號區域面積去掉。這樣處理的原因是由于集裝箱圖像背景復雜,在圖像中形成了許多孤立的較小的連通域與較大的連通域,這些連通域明顯不是集裝箱箱號區域。目的是為了在篩選箱號連通區域的時候更加方便快速;
(5)對經過步驟 (4)處理后的連通域進行標記。目的是為了更好地將目標區域與背景區分開來。
本文采用基于箱號區域的寬高比和面積特征的方法篩選出箱號區域。分析集裝箱箱號區域的特點將有助于在候選區域中篩選出箱號區域。根據國際通行的規則,集裝箱號碼應噴涂于集裝箱的前、后、左、右、上5 個面,箱號末尾還有校驗碼和箱型代碼。在5個面上的號碼雖然相同,但字形、排列卻可能有區別,分為橫向一行、橫向兩行、豎向一列和豎向兩列4種。因此本文的算法如下:
(1)本文借鑒車牌定位的方法,采取如下處理:假設某種排列方式的箱號區域寬高比大約為M:N,則面積和周長的平方存在如下關系

這樣處理的原因是考慮到連通域并非規則矩形,因此如果直接根據連通域寬高比進行篩選,正確率不高,加之長度與寬度的統計要難于面積和周長的統計;
(2)以式 (1)為特征,令

式中:metric——箱號區域的匹配度。判斷時可將匹配度與1進行比較,如式 (3)所示

式中:ε——匹配度與1之差的絕對值,并將區間 [-ε,ε]作為領域范圍。由此可知,ε越小則與之相對應的連通域是長寬比為M:N 的矩形的可能性就越大;
(3)然后根據步驟 (2)中的判斷方法,逐個掃描由上一小節得到的標記過的連通域,并且計算每個連通域的周長和面積;
(4)接著按照式 (3)計算出ε的值進行判斷,經反復實驗,本文中若ε=0.1,即metric的范圍在0.9至1.1時,能更加精確地判斷出集裝箱箱號區域。若ε的值過大,則有可能增加候選區域,反之則可能將箱號區域剔除。因此當匹配度滿足式(3)時,將此區域作為箱號區域的候選區域;
(5)如果ε的值大于0.1,則對下個區域進行掃描,即執行步驟 (3)和步驟 (4),直到掃描完圖像中的所有連通域為止;
(6)雖然此時箱號候選區可能不止一個,但是考慮到一般情況下箱號區域形成的連通域面積較大,因此對候選區域不是一個的情況,則將面積按大小進行排序,將面積最大者判定為集裝箱箱號區域;
(7)最后根據篩選后區域的坐標從預處理后的二值圖像中提取箱號區域。首先獲得箱號區域所在連通域的外界矩形上每一點的坐標;然后分別求出連通區域在X 軸方向的最大值和最小值,以及在Y 軸方向的最大值和最小值,即連通域外界矩形4個頂點的坐標;最后將坐標映射到二值圖像中從而提取集裝箱箱號區域。
本文所有實驗在MATLAB 2011b中進行。并且通過對背景不相同的集裝箱圖像進行實驗,進一步證明了算法的實用性與可靠性。其中一次實驗的完整過程及其結果如圖4與圖5所示。

圖4 集裝箱箱號預處理過程

圖5 集裝箱箱號定位過程
圖4 (a)為原始集裝箱圖像;圖4 (b)為灰度轉換后的集裝箱圖像;圖4 (c)為維納濾波后的圖像;圖4 (d)為集裝箱圖像中的背景圖像;圖4 (e)為背景消除后圖像;圖4 (f)為二值化后圖像。
圖5 (a)和圖5 (b)為閉運算與開運算處理后的圖像;圖5 (c)為標記連通域、刪除較小連通域和較大連通域后的圖像;圖5 (d)為集裝箱箱號區域篩選后的圖像;圖5 (e)為定位提取后的箱號區域圖像。
在圖5 (a)和圖5 (b)中本文選擇了大小分別為5×45的矩形結構和5×5的正方形結構元素對二值化后的圖像分別進行閉運算和開運算。結構元素大小的選擇是根據箱號排列方式的規律 (本文中箱號的排列方式為橫向一行排列,此時,箱號區域的寬高比為8—10)以及拍攝圖像的大小結合實驗統計得到的。從兩幅圖中可以看出形態學運算在保留連通域形狀特征的同時,也將圖像中不同的部分重新生成了新的連通域。在對圖像進行開運算后,圖像中的連通域僅剩下了區域特征,同時去除了毛刺。雖然圖像中箱號區域的形狀特征經處理后有小的畸變,但整體形狀特征得到了較好的保留。
在圖像5 (c)中的連通域個數由圖5 (b)中的7個減少到了3個。實驗中經過統計發現箱號區域的面積大約在3000至4000pixel。因此本文中將面積小于1500pixel的連通域以及大于6000的連通域剔除。這樣處理的目的在于減少來自背景的干擾,同時很大程度上減少了后面篩選區域時的運算量,提高了運算速度。
對于橫向一行排列的集裝箱箱號。經實驗,M∶N 的值取8.5∶1時效果最好。圖5 (d)為經過匹配度和面積篩選后圖像。
由圖5 (e)中可以看出本文算法正確地篩選出了被標記的集裝箱箱號區域。實現了集裝箱箱號的定位與提取。
在不同背景下另外兩幅集裝箱圖像的定位實驗結果如圖6所示。

圖6 原始集裝箱圖像與定位結果
從圖6也可以看出,在不同背景下集裝箱箱號區域提取完整、無殘損。即使在對比度較低的時候,本文的算法也能正確定位出集裝箱箱號區域,為后續的傾斜校正與字符分割打下了良好的基礎,滿足集裝箱箱號快速、正確的定位要求。
本文實驗中采集了具有代表性的集裝箱圖像共計128幅。圖像尺寸為530×706pixel,除了理想拍攝條件下的圖像外,也包含了在非理想拍攝條件下的圖像,如陰天、光照不均、箱體表面有油污、字符缺損、對比度較低、箱號區域在圖像中位置發生變化等,如圖7所示。

圖7 各種拍攝條件下的集裝箱箱號圖像
本文算法在經過維納濾波和背景消除等預處理步驟后,使得復雜背景下的箱號被更好得和背景區分開,有效并且快速地排除了非箱號區域的干擾。同時本文對例如字符間距、大小等集裝箱箱號的先驗知識依賴相對較少。并且對復雜背景下拍攝的集裝箱圖像有一定的自適應能力。本文算法和文獻 [1]算法的定位結果見表1。

表1 定位結果
由表1可以看出,本文算法的定位率和文獻 [1]相比更高。原因之一是本文在預處理模塊中添加了背景消除步驟,增強了程序對對比度較低和光照不均的集裝箱圖像的處理能力;原因之二是在定位與提取模塊中,通過去除較小面積和較大面積,從而有效的減少了箱號候選區域的數量。并且在對候選區域篩選時,利用匹配度和箱號區域面積兩種箱號區域特征進行篩選,和文獻 [1]中僅僅依靠連通區域占有度的方法相比,定位結果更加準確。
從表1中可以看出,雖然本文算法的定位率較高,但仍存在一定的錯誤。定位錯誤的原因是在拍攝時,集裝箱箱面與攝像頭不平行程度非常嚴重,導致拍攝的圖像產生嚴重畸變。從而使集裝箱箱號區域的匹配度與1的差值不在領域范圍內,導致定位錯誤。
對集裝箱箱號的定位進行了應用性的研究,提出了一種快速集裝箱箱號定位算法。通過本文的研究結果發現,對預處理后的圖像采用形態學方法處理并進行篩選后能快速、有效地定位集裝箱箱號。完善了目前集裝箱箱號系統中定位部分的方法。適用于堆場和碼頭等背景較復雜以及對比度較低的場合。實驗結果表明,本文方法簡單實用、同時運算速度快有利于實時處理,可用于集裝箱箱號自動識別系統。在分析了文獻 [1]至文獻 [6]中定位方法的基礎上,將文獻[1]中的定位結果和本文結果進行了比較。本文中的算法對于對比度非常低以及拍攝距離變化很大的集裝箱圖像容易導致定位錯誤,這是后續研究中需要解決的問題。
[1]WANG Yongliang.Research and implementation of container number identification based on video [D].Dalian:Dalian Maritime University,2010 (in Chinese).[王永亮.基于視頻的集裝箱號碼識別方法的研究與實現 [D].大連:大連海事大學,2010.]
[2]HU Ting.A Research of container character recognition based on neural network [D].Wuhan:Wuhan University of Technology,2012 (in Chinese).[胡婷.基于神經網絡的集裝箱字符識別的研究 [D].武漢:武漢理工大學,2012.]
[3]SUN Linghong.Study of container number smart recognition algorithm [D].Wuhan:Wuhan University of Technology,2012 (in Chinese).[孫凌紅.集裝箱箱號智能識別算法研究[D].武漢:武漢理工大學,2012.]
[4]TAN Wei,FANG Chao,DU Jianhong.Improved container code segmentation algorithm based on mathematical morphology[J].Computer Engineering and Applications,2011,47 (13):174-177 (in Chinese).[譚偉,方超,杜建洪.基于數學形態學的集裝箱箱號分割改進算法 [J].計算機工程與應用,2011,47 (13):174-177.]
[5]TANG Xiaodong.Studies on container’s box number recognition based on BP neural network [D].Wuhan:Wuhan University of Technology,2007 (in Chinese).[唐曉東.基于BP神經網絡的集裝箱箱號識別研究[D].武漢:武漢理工大學,2007.]
[6]ZHANG Min,WANG Xihuai,XIAO Jianmei.A new method of the container codes’localization and character segmentation[C]//Chinese Control and Decision Conference.IEEE,2009(in Chinese).[張敏,王錫淮,肖健梅.一種集裝箱箱號定位及字符切割技術 [C]//中國控制與決策會議.IEEE,2009.]
[7]YANG Shubin,ZHANG Yang.Fast morphological locating algorithm of vehicle license plate in complex vehicle images[J].Computer Technology and Development,2008,18 (6):50-53 (in Chinese).[楊述斌,張陽.復雜車輛圖像中的車牌快速形態定位算法[J].計算機技術與發展,2008,18 (6):50-53.]
[8]GUO Shuixia.Extension of wiener filtering when noise could be non-additive in image processing [J].Computer Engineering and Applications,2007,43 (12):184-185 (in Chinese).[郭水霞.圖像處理中非加性噪聲情形下維納濾波的推廣 [J].計算機工程與應用,2007,43 (12):184-185.]
[9]XU Qinyan.License plate location in complex background based on texture and color[D].Shanghai:Donghua University,2013 (in Chinese). [徐勤燕.復雜背景中基于紋理和顏色的車牌定位研究 [D].上海:東華大學,2013.]
[10]SHI Linlin.The research of license plate location for license plate recognition [D].Shanghai:Donghua University,2012(in Chinese). [史琳琳.車牌識別中車牌定位技術的研究[D].上海:東華大學,2012.]
[11]Wang Wei,Xie Mei.A novel location method of characters in container codes[C]//2nd International Conference on Education Technology and Computer,2010:383-385