王文 袁君奇 王成林


摘 要:實(shí)現(xiàn)鋼板號(hào)點(diǎn)陣噴印字符的自動(dòng)識(shí)別是鋼廠生產(chǎn)線實(shí)現(xiàn)自動(dòng)化生產(chǎn)物料跟蹤的關(guān)鍵環(huán)節(jié),對(duì)字符的準(zhǔn)確定位又是字符能夠準(zhǔn)確識(shí)別的重要步驟。針對(duì)某鋼廠寬厚板1號(hào)生產(chǎn)線鋼板檢測(cè)所涉及到的點(diǎn)陣噴印字符定位問(wèn)題,提出了一種基于角點(diǎn)檢測(cè)的鋼板號(hào)點(diǎn)陣噴印字符定位算法。運(yùn)用改進(jìn)的meanshift聚類算法找出角點(diǎn)的中心,并以該中心為字符區(qū)域的中心,進(jìn)而完成鋼板點(diǎn)陣噴印字符的定位。結(jié)果表明,該定位算法能快速、準(zhǔn)確地完成鋼板號(hào)點(diǎn)陣噴印字符的定位,具有更好的準(zhǔn)確性和快速性,能滿足實(shí)際生產(chǎn)的需求。
關(guān)鍵詞:自動(dòng)化生產(chǎn)、字符定位、角點(diǎn)檢測(cè)、meanshift
引言:
OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備檢查打印在各種物品上的字符(如產(chǎn)品LOGO、生產(chǎn)日期、編碼等),通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程。1929年,德國(guó)人Tausheck提出了光學(xué)字符識(shí)別的定義[1]。近年來(lái),國(guó)內(nèi)外掀起了新一波圖像字符識(shí)別的熱潮,國(guó)內(nèi)外許多機(jī)構(gòu)致力于OCR的研究。光學(xué)字符識(shí)別技術(shù)大致包括四個(gè)步驟,它們分別是圖像預(yù)處理,字符定位,字符分割,字符識(shí)別[2]。
目前,大多鋼廠檢測(cè)鋼板表面的點(diǎn)陣噴碼字符都是通過(guò)人工檢測(cè)的方式,此種方式存在一定缺陷,不足之處表現(xiàn)為:(1)鋼廠生產(chǎn)線環(huán)境較為惡劣,產(chǎn)品往往附帶高溫燙傷、運(yùn)動(dòng)造成的機(jī)械傷害、粉塵污染等對(duì)工人身體造成身體損傷的危險(xiǎn)因素,安全性較差;(2)工人工作效率低,檢測(cè)的鋼板需要肉眼判定,人工錄入,且長(zhǎng)時(shí)間工作易產(chǎn)生視覺(jué)疲勞,出現(xiàn)誤檢漏檢現(xiàn)象,從而影響鋼板的處理,導(dǎo)致鋼板質(zhì)量受到不可逆的影響。伴隨著鋼鐵產(chǎn)業(yè)在國(guó)內(nèi)的持續(xù)發(fā)展,鐵水產(chǎn)量和鋼水產(chǎn)量不斷創(chuàng)出新高,鋼鐵廠生產(chǎn)線生產(chǎn)速度加快,產(chǎn)品質(zhì)量要求提高,人工檢測(cè)鋼板號(hào)的傳統(tǒng)方法已不能滿足現(xiàn)代鋼鐵工業(yè)生產(chǎn)的需求,迫切需要研究鋼板號(hào)點(diǎn)陣噴碼識(shí)別技術(shù)替換人工檢測(cè)的方法,提高鋼鐵生產(chǎn)的智能化水平,實(shí)現(xiàn)鋼鐵廠生產(chǎn)過(guò)程中的智能檢測(cè)和識(shí)別。通過(guò)對(duì)現(xiàn)有字符區(qū)域定位算法的研究,分析了現(xiàn)有字符區(qū)域定位算法的優(yōu)缺點(diǎn),以鋼廠實(shí)際生產(chǎn)線上點(diǎn)陣噴印字符區(qū)域定位為目標(biāo),借鑒了多種算法的思想,提出了應(yīng)用于實(shí)際生產(chǎn)中的鋼板點(diǎn)陣噴印字符區(qū)域的定位算法,并與以往傳統(tǒng)算法在準(zhǔn)確率和時(shí)間上做了對(duì)比,通過(guò)實(shí)地測(cè)試,驗(yàn)證了該算法能精確定位出鋼板點(diǎn)陣字符區(qū)域,能較好地應(yīng)用于復(fù)雜多變的鋼廠生產(chǎn)環(huán)境,具有較高的可靠性和有效性。
當(dāng)前金屬生產(chǎn)標(biāo)記方法介紹
冶金產(chǎn)品的標(biāo)識(shí)方式有:金屬標(biāo)簽打印,墨水噴印,涂料噴印,金屬粉末單槍噴印,壓印,熱態(tài)針打印或者刀片壓印等,也有采用電化學(xué)方法對(duì)金屬表面進(jìn)行蝕刻來(lái)標(biāo)記[3]。
另外,也有輥壓式,沖打式的標(biāo)記方法[4]。寬厚板廠1號(hào)生產(chǎn)線采用點(diǎn)陣熱噴碼技術(shù)噴印在鋼板上的。
難點(diǎn)
(1)寬厚板生產(chǎn)線現(xiàn)場(chǎng)環(huán)境復(fù)雜,鋼板在生產(chǎn)線上動(dòng)作速度不均勻,持續(xù)的高溫和為了降溫采取的噴水霧造成字符模糊情況,諸多不穩(wěn)定的現(xiàn)場(chǎng)圖像采集條件等都不利于相機(jī)的拍攝,直接導(dǎo)致相機(jī)采集到的圖片質(zhì)量不高,從而間接影響了鋼板點(diǎn)陣噴印字符定位的準(zhǔn)確度。
(2)現(xiàn)場(chǎng)的線陣相機(jī)實(shí)際采集到的圖片大小為2048*10000,而字符區(qū)域從180*450到220*650不等,且由于客戶需求不同,生產(chǎn)的鋼板大小不一從而導(dǎo)致字符區(qū)域在整個(gè)鋼板的位置變化不定,這加大了字符定位的難度。圖1.1為線陣相機(jī)采集到的鋼板圖像。
(3)鋼板表面粗糙、易生銹,且處理環(huán)節(jié)較多,一些使用噴水霧對(duì)鋼板降溫的過(guò)程導(dǎo)致拍攝到的圖片中字符背景顏色復(fù)雜且噪聲多。
(4)鋼板在輥道上運(yùn)動(dòng)時(shí)噴印點(diǎn)陣字符,采集鋼板圖像時(shí)鋼板也處于運(yùn)動(dòng)狀態(tài)。而點(diǎn)陣噴印設(shè)備的機(jī)械故障以及噴嘴口堵塞會(huì)造成字符區(qū)域傾斜、變形等,增大了鋼板號(hào)點(diǎn)陣噴印字符的定位難度。
大多數(shù)字符區(qū)域定位方法都是基于特定的場(chǎng)合或者特定字符,例如:Shekar采用梯度作為紋理特征并結(jié)合啟發(fā)式規(guī)則對(duì)字符區(qū)域進(jìn)行定位[5]。Tian YingLi和Li ChunCai等人利用字符區(qū)域的梯度特征和顏色均勻性來(lái)形成候選字符區(qū)域,并利用結(jié)構(gòu)分析形成文本行[6]。胡正平采用筆畫(huà)作為紋理特征并利用支持向量機(jī)來(lái)區(qū)分字符和非字符區(qū)域[7]。Mariano等人對(duì)圖像進(jìn)行顏色聚類操作,并分析聚類結(jié)果獲得候選字符區(qū)域[8]。本文研究的內(nèi)容是從線陣相機(jī)采集到的鋼板圖片中,圖像采集質(zhì)量不穩(wěn)定。因此,一般的字符區(qū)域定位方法不能適用于復(fù)雜生產(chǎn)線上鋼板號(hào)點(diǎn)陣噴印字符,無(wú)法準(zhǔn)確定位出鋼板點(diǎn)陣噴印字符的具體位置,并提取出鋼板號(hào)點(diǎn)陣字符。
4.1 meanshift聚類算法
meanshift算法是一種基于密度的非參數(shù)聚類算法,它是通過(guò)迭代尋優(yōu)找到概率分布的極值。meanshift最初的含義是偏移的均值向量。現(xiàn)在,meanshift算法通常指一種迭代的步驟,具體步驟為:算出當(dāng)前中心點(diǎn)的偏移均值,將當(dāng)前中心點(diǎn)移動(dòng)到偏移均值點(diǎn)上,然后以此為新的起點(diǎn)計(jì)算出該點(diǎn)的偏移均值后繼續(xù)移動(dòng),不斷重復(fù)上述步驟,直至滿足一定要求后結(jié)束。
基本的Meanshift推導(dǎo)過(guò)程如下:
Meanshift算法是將中心點(diǎn)持續(xù)不斷的沿著概率密度增大的方向上移動(dòng),直至中心點(diǎn)移動(dòng)到密度最大處。中心點(diǎn)移動(dòng)步長(zhǎng)和概率密度、梯度有關(guān),越靠近概率密度峰值的概率密度大的地方移動(dòng)的步長(zhǎng)就會(huì)越小一些,而在概率密度小的地方,中心點(diǎn)移動(dòng)的步長(zhǎng)比較大。但是基本的meanshift聚類算法缺點(diǎn)較為明顯,易受到初值影響,初值設(shè)定不恰當(dāng)可能會(huì)陷入局部最優(yōu)。
4.2 改進(jìn)的meanshift聚類算法
基本的meanshift算法能很好找出角點(diǎn)集的中心,但它受設(shè)定初值的影響較多,可能陷入局部最優(yōu),無(wú)法解決偏離設(shè)定初值較多時(shí)出現(xiàn)異常情況的問(wèn)題。本文針對(duì)此問(wèn)題,根據(jù)寬厚板廠1號(hào)生產(chǎn)線鋼板號(hào)點(diǎn)陣噴印字符區(qū)域的特點(diǎn),提出了改進(jìn)的meanshift聚類算法,并將其運(yùn)用在鋼板號(hào)點(diǎn)陣字符區(qū)域定位上。
生產(chǎn)線上采集到的鋼板圖片是二維圖像,且鋼板點(diǎn)陣噴印字符區(qū)域?yàn)榫匦味菆A形,因此,meanshift算法中指定區(qū)域采用圓形區(qū)域并不能很好地涵蓋字符角點(diǎn)區(qū)域。經(jīng)過(guò)現(xiàn)場(chǎng)大量測(cè)試,本文針對(duì)鋼板號(hào)點(diǎn)陣字符矩形區(qū)域的特點(diǎn),將圓形區(qū)域改為矩形區(qū)域,大小為字符區(qū)域的最大值即220*650,當(dāng)Meanshift算法移到密度中心的時(shí)候,檢測(cè)區(qū)域與字符區(qū)域可保證基本重合。
由于采集圖像的異常情況較多,用改進(jìn)的FAST角點(diǎn)檢測(cè)算法檢測(cè)出的角點(diǎn)中,仍有部分角點(diǎn)為噪聲角點(diǎn),這些角點(diǎn)大多是零散的分布在圖像的各個(gè)地方,使用傳統(tǒng)的meanshift算法進(jìn)行聚類,若初始中心點(diǎn)為一個(gè)孤立的噪聲角點(diǎn)則會(huì)出現(xiàn)局部最優(yōu)的問(wèn)題,針對(duì)此問(wèn)題,本文在傳統(tǒng)的meanshift算法中加了一個(gè)判定從而避免了噪聲角點(diǎn)造成定位錯(cuò)誤的情況出現(xiàn)。改進(jìn)的meanshift算法具體步驟如下:
(1)程序?qū)z測(cè)區(qū)域設(shè)置為220*650的矩形區(qū)域,從點(diǎn)集中隨機(jī)選取一點(diǎn)為中心點(diǎn)。
(2)程序計(jì)算該矩形檢測(cè)區(qū)域內(nèi)的偏移均值,計(jì)算公式為式1.1。
(3)程序?qū)⒅行狞c(diǎn)的位置加上M_h (x)得到新的偏移均值點(diǎn)。
(4)程序?qū)⒅行狞c(diǎn)移到新的偏移均值點(diǎn)處。
(5)程序重復(fù)步驟(2)-(4),直至滿足設(shè)定要求后進(jìn)行下一步操作。
(6)程序統(tǒng)計(jì)檢測(cè)區(qū)域內(nèi)角點(diǎn)的數(shù)量,若小于設(shè)定閾值為陷入局部最優(yōu),則從步驟(1)中重新開(kāi)始;若大于設(shè)定閾值則聚類完成。
在改進(jìn)的meanshift算法中,實(shí)際字符區(qū)域大小與檢測(cè)區(qū)域的大小基本相同,字符區(qū)域中心點(diǎn)與聚類的中心點(diǎn)基本重合。
4.3準(zhǔn)確定位鋼板點(diǎn)陣噴印字符區(qū)域
通過(guò)對(duì)改進(jìn)檢測(cè)算法檢測(cè)到的候選角點(diǎn)進(jìn)行分析,發(fā)現(xiàn)采集到的不噴印點(diǎn)陣鋼號(hào)字符的鋼板圖片即空?qǐng)D中只有少數(shù)的幾個(gè)噪聲角點(diǎn),而有噴印字符的圖片中,角點(diǎn)數(shù)量基本穩(wěn)定在算法設(shè)定的范圍區(qū)間之內(nèi),根據(jù)這一特征,算法先根據(jù)檢測(cè)到的角點(diǎn)數(shù)量區(qū)分空?qǐng)D和有字符圖。如果總角點(diǎn)數(shù)量大于設(shè)定值,判定為有效字符圖,程序進(jìn)行處理分析;但如果總角點(diǎn)數(shù)量小于設(shè)定值則為判定為空?qǐng)D,程序直接越過(guò)meanshift算法,進(jìn)行下一張圖像的檢測(cè)。
通過(guò)分析對(duì)比發(fā)現(xiàn),有效圖中字符角點(diǎn)分布密集且有規(guī)律性,角點(diǎn)集的中心一般為字符區(qū)域的中心,因此考慮用聚類算法找出角點(diǎn)集的中心并進(jìn)行定位。
經(jīng)過(guò)大量的實(shí)驗(yàn)證明,改進(jìn)的meanshift聚類算法能通過(guò)檢測(cè)角點(diǎn)集的中心的方法確定字符區(qū)域的中心,從而準(zhǔn)確定位出鋼板號(hào)點(diǎn)陣噴印字符區(qū)域,且不易出現(xiàn)噪聲角點(diǎn)造成定位錯(cuò)誤的情況。
4.4 實(shí)驗(yàn)結(jié)果分析
圖4.2展示了對(duì)比度較大、噴印清晰的正常的圖像。由圖4.2可以看出,對(duì)于對(duì)比度大、噴印清晰的正常圖片,該算法能準(zhǔn)確的定位出點(diǎn)陣字符的位置。在生產(chǎn)線采集的圖像中上,大部分圖片是類似于圖4.2的噴印清晰、字符對(duì)比度和背景對(duì)比度較大的圖片,而字符區(qū)域相對(duì)整張圖片來(lái)說(shuō)十分小。與普通字符的定位不同,該鋼板圖片是灰度圖,字符與背景的灰度都是無(wú)法采用固定參數(shù)設(shè)定,加之該鋼板點(diǎn)陣字符是由一個(gè)個(gè)油漆點(diǎn)噴印組成,具有離散性,無(wú)法形成大片的連通區(qū)域,對(duì)字符的定位增加了不小的難度。而本文的定位算法能快速、準(zhǔn)確的定位出點(diǎn)陣噴印字符區(qū)域。
從實(shí)驗(yàn)結(jié)果看,本文的算法能很好的滿足寬厚板廠1號(hào)生產(chǎn)線生產(chǎn)需求,可以準(zhǔn)確、快速的定位出鋼板號(hào)點(diǎn)陣噴印字符區(qū)域,對(duì)于背景與字符對(duì)比度比較小、字符區(qū)域較小或者噴印效果差的圖像也能較高的定位準(zhǔn)確率。
對(duì)測(cè)試集中的圖像進(jìn)行測(cè)試,總的實(shí)驗(yàn)結(jié)果如下:
總結(jié)
本文在來(lái)源于某鋼廠寬厚板1號(hào)線物料跟蹤項(xiàng)目的背景下,通過(guò)對(duì)現(xiàn)有OCR定位算法的研究,分析現(xiàn)有OCR定位算法的優(yōu)缺點(diǎn),并以實(shí)際生產(chǎn)線上點(diǎn)陣噴印字符區(qū)域定位為目標(biāo),借鑒多種算法的思想,提出了應(yīng)用于實(shí)際生產(chǎn)中的鋼板號(hào)點(diǎn)陣噴印字符區(qū)域的改進(jìn)定位算法,并與傳統(tǒng)算法在準(zhǔn)確率和時(shí)間上做了對(duì)比,通過(guò)大量實(shí)驗(yàn)驗(yàn)證了該算法能精確定位出鋼板點(diǎn)陣字符區(qū)域,能較好地適合生產(chǎn)環(huán)境復(fù)雜多變的鋼廠生產(chǎn)線物料跟蹤項(xiàng)目,解決物料跟蹤項(xiàng)目中的實(shí)際問(wèn)題,因此該算法具有較高的可靠性和有效性。
參考文獻(xiàn)
[1]Mori S. Historical Review of OCR Research and Development[J]. Proceedings of IEEE, 1992, 80(7): 1029-1058
[2]Liu C, Wang C, Dai R. Text detection in images based on unsupervised classification of edge-based features[C]//Document Analysis and Recognition, 2005. Proceedings. Eighth International Conference on. IEEE, 2005: 610-614.
[3]王燕.金屬工業(yè)中的標(biāo)記[J].鍛壓技術(shù),1982(05):64+63.
[4]呂福在. 鋼鐵產(chǎn)品標(biāo)識(shí)技術(shù)的現(xiàn)狀及其發(fā)展[A]. 中國(guó)金屬學(xué)會(huì)青年委員會(huì)、北京機(jī)械工程學(xué)會(huì).第三屆先進(jìn)軋鋼精整、包裝及鋼材加工配送技術(shù)學(xué)術(shù)研討會(huì)論文集[C].中國(guó)金屬學(xué)會(huì)青年委員會(huì)、北京機(jī)械工程學(xué)會(huì):,2010:9.
[5] Shekar, ?B.H.; ?Smitha, ?M.L., ?"Text ?localization ?in ?video/scene ?images ?using ?Kirsch Directional Masks," in Advances in Computing, Communications and Informatics (ICACCI), 2015 International Conference on , Aug. 2015, pp.1436-1440.
[6] Yi ?C, ?Tian ?Y ?L. ?Text ?string ?detection ?from ?natural ?scenes ?by ?structure-based ?partition ?and grouping[J]. Image Processing, IEEE Transactions on, 2011, 20(9): 2594-2605.
[7] 胡正平,王瑾.多尺度-方向筆畫(huà)結(jié)合 SVM 驗(yàn)證的文字區(qū)域定位[J]. ?儀器儀表學(xué)報(bào),2010,04:916-922.
[8] Mariano V Y, Kasturi R. Locating uniform-colored text in video frames[C]//Pattern Recognition, 2000. Proceedings. 15th International Conference on. IEEE, 2000, 4: 539-542.
中國(guó)電氣工程學(xué)報(bào)2020年9期