劉 巍
(紅云紅河煙草(集團)有限責任公司昆明卷煙廠,云南 昆明 650202)
煙草行業競爭越來越激烈,搶占市場,產品質量是重中之重。煙草企業生產出質量出眾的產品,不僅是提升企業品牌形象的重要舉措,更是踐行“國家利益至上、消費者利益至上”的行業價值觀要求。如何生產出“支支精良、包包精美”的產品,減少和杜絕不合格品流入市場,是各卷煙企業質量控制的關鍵環節。
目前,小包煙外觀檢測大多采用傳統的圖像處理方法,通過圖像特征提取來做識別,使用這種方法,遇到新的問題需要找新的特征。針對此問題,本文提出一種基于卷積神經網絡的卷煙小包外觀檢測算法,模擬人的識別過程,通過大量數據的學習,獲得的算法能達到與人一致的評判效果,杜絕了人工找圖像特征。
卷積神經網絡在訓練過程中可自動生成特征提取器,不需要人工設計,它是一種特殊的深度神經網絡,網絡中的權重在訓練過程中確定。卷積神經網絡包含提取輸入圖像特征的神經網絡和一個進行圖像分類的神經網絡,如圖1 所示。特征提取神經網絡由成對的卷積層和池化層組成,接收輸入圖像后,把提取到的特征信號傳遞給分類神經網絡。隨后分類神經網絡基于圖像特征進行運算,并產生分類輸出。

圖1 卷積神經網絡的典型結構
本文所使用的圖像數據來自于某卷煙廠52# 號機FOCKE-FXS 機型視覺成像系統,所采圖像為近半年的數據,包括缺陷剔除圖像與正常圖像,其中缺陷剔除圖像587 張,正常圖像295 張。
小包正面外觀缺陷包括商標缺陷與印花缺陷兩種,其中商標缺陷有商標內外反折、商標上下反折、商標左右移位、商標歪斜、商標破損、商標膠印、商標粘異物、商標露鋁箔紙等典型的缺陷類型,如圖2 所示。

圖2 商標典型缺陷
印花缺陷是指煙包印花未正確成型產生的缺陷,有印花反折、印花未粘牢、印花歪斜、印花翹曲、印花長短、印花露白、多張印花、無印花等典型的缺陷類型,如圖3所示。

圖3 印花典型缺陷
針對小包外觀檢測,設計了一種卷積神經網絡架構(圖4)。輸入的圖像數據是經過裁剪及壓縮的小包外觀圖片,得到128×128 的輸入圖像數據,作為網絡的輸入層。接下來是2 層卷積層與池化層,共4 層。C1 層為第1層卷積層,卷積過濾器大小是5×5,卷積過濾器共20 個,卷積步長為1;S2 層為池化層,步長為2,經過2×2 的最大池化;C3 層為第2 個卷積層,卷積過濾器大小是5×5,卷積過濾器共20 個,步長為1;S4 層為池化層,步長為2,經過2×2 最大池化。模型通過以上結構提取出圖像特征,獲得20 個29×29 的圖像特征。C5 層為全連接層,將二維的圖像數據轉換為一維的數據,便于進行分類。最后一層為輸出層,使用softmax 函數對小包外觀進行分類,得到小包缺陷與正常兩種情況的識別概率。此外,在C1、C3 兩個卷積層后的激活函數為ReLU 激活函數。

圖4 卷積神經網絡架構
圖像進入卷積神經網絡的兩個卷積層后分別得到20 張特征圖,圖5 為印花歪斜煙包的特征圖,圖6 為正常煙包的特征圖。經過卷積層提取的特征,如圖中線框所示,印花歪斜的煙包與正常的煙包,相同位置處差別較大,因此可以得出,卷積層提取特征能有效地區分出外觀有缺陷的煙包。

圖5 印花歪斜煙包特征圖

圖6 正常煙包特征圖
按照設計的模型結構,在MATLAB 中使用神經網絡工具箱生成卷積神經網絡,學習率設定為0.001,訓練輪數為1 000 輪,Minibatch 取128,即每批次計算128 個輸入圖像,動量系數取0.9,選擇交叉熵損失函數作為優化函數,使用訓練數據集對小包外觀識別的訓練結果如圖7 所示,迭代2 000 次以后,模型逐漸趨于穩定,準確率達到90%以上。

圖7 訓練集迭代識別準確率曲線
訓練過程中的損失函數曲線如圖8 所示,隨著迭代的逐漸增加,損失函數逐漸降低并趨于穩定,穩定后的數值保持在0.1 以下。

圖8 損失函數
用事先分配好的10%隨機驗證集,在每次迭代完成,計算得到權重值后,使用驗證集進行驗證,驗證數據集與測試數據集基本一致,在迭代2 000 次以后,達到穩定。
進行6 000 次迭代(1 000 輪)后,得到模型最終權重值,之后使用全新數據集進行算法檢驗,結果如表1 所示。

表1 數據集識別結果
由表可知,新數據集識別準確率達到99.15%,效果較好,說明使用的卷積神經網絡模型是有效的。
近年來,深度學習技術在學術界和工業界都得到了廣泛的應用和傳播,在各行各業都取得了非常好的效果。本文從卷煙工廠實際生產情況,創新性采用卷積神經網絡對卷煙小包外觀進行檢測,模擬人對圖像的判斷過程,準確識別出有缺陷的煙包與正常的煙包,經過驗證,使用的模型是有效的,識別準確率達到99.15%,獲得較好的效果,具備在煙草行業小包外觀檢測中推廣應用的價值。