崔云月,管一弘,孫 娜,王端生,楊雄飛,黃 崗
(1.昆明理工大學理學院;2.昆明聚林科技有限公司,云南 昆明 650000)
煙梗是卷煙的重要原料,梗絲或顆粒狀煙梗具有較好的填充性和燃燒性。因此,對于煙梗的檢測成了煙草加工過程中不可缺少的環節[1]。煙梗的長梗率和短梗率是煙草打葉復烤過程中一個關鍵的加工質量檢測指標,長短梗率的高低,直接影響著卷煙企業制絲生產中梗絲的出絲率[2-3]。目前,長短梗率的檢測方法主要通過人工篩選長短梗,再稱重得到長短梗率,該方法不僅工作強度大、耗時長,也存在著人工篩選時的偏差。因此,研究高效準確地長短梗率檢測方法,對于煙草制絲過程的提質增效、降本降耗具有重要意義。
目前,國內外對煙梗的長短梗率檢測方法相關研究較少。武凱等[4]發明了測定煙梗長梗率的設備,該設備通過采集可見光下的煙梗圖像,利用圖像分析法對煙梗進行識別,從而檢測煙梗長梗率。由于可見光無法穿透煙葉,因此該方法很難識別出部分被煙葉包裹住的煙梗。朱文魁等[5]提出一種基于X 射線透射圖像定量檢測煙梗中粗細梗率和長短梗率的測定方法,該方法利用煙梗與煙片在X 射線下成像的特征差異對煙梗長度進行識別,采用定量的檢測算法實現了長梗率和短梗率的測定,但是該方法操作復雜且準確性有待提高。
針對上述煙梗的長短梗率檢測問題,本文提出一種基于BP 神經網絡的長短梗率檢測方法。首先利用閾值分割方法對煙梗圖像進行分割,通過最小外接矩形方法識別出煙梗圖像中的長短梗,然后建立BP 神經網絡質量擬合模型從而實現長短梗率的檢測。結果表明,該方法能夠較為準確地擬合煙梗質量,極大提高了煙梗長梗率和短梗率檢測效率。
本文研究的煙梗圖像是在X 射線透射成像下的灰度圖像。X 射線的透射能力與X 射線光子的能量有關,X 射線波長越短,光子能量越大,穿透力越強;X 射線的透射力也與物質密度有關,透射密度越大的物質,X 射線衰減程度越強;透射密度越小的物質,X 射線的衰減程度也就越弱[6-10]。由于這種性質,圖像中煙梗灰度值與背景之間存在很大差異。以某幅煙梗的圖像為例,繪制煙梗圖像的三維灰度直方圖如圖1 所示。

Fig.1 Three dimensional gray histogram of tobacco stem image圖1 煙梗圖像的三維灰度直方圖
從圖1 可以看出,背景灰度值大多高于6×104,而煙梗的灰度值相對較小。因此,本文采用閾值分割法對煙梗圖像進行分割。閾值分割是圖像分割中比較簡單而且計算速度較快的一種算法[11]。具體公式定義如下:

對比多個閾值發現,當閾值為58 000 時,煙梗圖像分割效果最優。煙梗圖像分割結果如圖2 所示。
由圖2 可以看出,閾值分割效果較好,但是在實際采圖過程中難免存在噪聲干擾,還需對閾值分割后的圖像提取連通域,刪除面積較小的孤立噪聲[12]。

Fig.2 Threshold segmentation results圖2 閾值分割結果
打葉復烤加工過程中,大部分煙梗形態都比較筆直,因此,本文采用旋轉法求取煙梗的最小外接矩形,從而識別出煙梗長度。具體過程如下:
(1)獲取目標物的最小外接框,即二維形狀各頂點中的最大橫坐標、最小橫坐標、最大縱坐標、最小縱坐標定下邊界的矩形。
(2)將目標物的邊界以每次1°左右的增量在90°范圍內旋轉。每旋轉一次記錄一次其坐標系方向上的外接矩形邊界點的最大和最小值。旋轉到某一個角度后,取面積最小時外接矩形的參數為主軸意義下的長度和寬度[13]。
(3)畫出目標物的最小外接矩形,并標注其長度值。煙梗的長度值是通過一定長度的標準件對相機進行標定,得到實際圖像尺寸與X 射線所成像素點個數的關系約為1∶2.5,從而得到圖像中煙梗的實際長度,煙梗長度特征提取結果如圖3 所示。

Fig.3 The result of stem length feature extraction圖3 煙梗長度特征提取結果
國家煙草專賣局發布的《打葉煙葉 質量檢驗》(YC/T147-2010)中規定,長度大于20mm 的煙梗為長梗,長度小于等于20mm 的煙梗為短梗[14]。長短梗識別結果如圖4 所示。

Fig.4 The results of long and short stem identification圖4 長短梗識別結果
BP 神經網絡實際為多層感知器,通常由3 層及以上網絡構成,一個典型的三層BP 神經網絡結構為輸入層、隱含層和輸出層[15-17],其拓撲結構如圖5 所示。

Fig.5 Three layer BP neural network structure圖5 三層BP 神經網絡結構
BP 神經網絡的訓練過程分為信號前向傳播和誤差反向傳播兩個過程[18-19]。輸入層信號經神經元傳遞到隱含層,通過各神經元間的權值和激活函數的相關計算將結果傳遞到輸出層。若輸出結果與期望值間誤差較大則進入誤差反向傳播過程,利用梯度下降法不斷調整網絡權值與偏置,進而使網絡預測輸出值不斷逼近期望值,最終達到預期效果并停止訓練[20]。具體步驟如下:
(1)構建一個神經網絡,輸入隱含層個數及每層神經元個數。
(2)初始化網絡權重和偏置參數,設置最高迭代次數、誤差函數及收斂精度。
(3)分別計算隱含層和輸出層各神經元的輸出Hj和Yk,Hj和Yk的表達式為:

(4)比較輸出值Yk與期望值Dk,誤差為Ok=Yk-Dk,Ok的表達式為:

(5)利用梯度下降法不斷更新權重和偏置參數。輸入層與隱含層之間的連接權值和偏置值的更新如式(6)、式(7),隱含層與輸出層之間的連接權值和偏置值的更新如式(8)、式(9)。

(6)判斷網絡誤差是否滿足要求,若不滿足,則轉到步驟(3)繼續調整參數;若滿足,則停止迭代。
2.2.1 網絡結構設計
通過上述方法可得到煙梗圖像中長短梗的灰度值,將煙梗所在的灰度值范圍均分為十段,以灰度級在每一段范圍內的占比作為網絡輸入,則輸入層節點個數為10;以煙梗的質量(歸一化質量)作為網絡輸出,則輸出層節點個數為1。隱含層的節點個數根據Kolmogorov 定理確定[21],該定理計算公式如式(10)。

式中,h為隱含層的節點個數,m和n分別為輸入層和輸出層的節點個數,a為1~10 之間的調節整數。設置不同的網絡結構對煙梗圖像進行質量擬合實驗,得到不同網絡結構下的煙梗質量擬合結果如表1 所示。

Tabel 1 Fitting results of stem quality under different network structures表1 不同網絡結構下煙梗質量擬合結果
由表1 可以看出,第二組的網絡性能最好。因此,本文采用10-4-2-1 型的四層拓撲結構構建BP 神經網絡結構模型。
2.2.2 網絡參數設定
利用newff 函數構建四層BP 神經網絡模型,經過多次實驗后,最終確定網絡參數。隱含層和輸出層神經元傳遞函數分別為tansig、tansig 和purelin。最高迭代次數為12 000,收斂誤差為0.000 01,學習率為0.2,網絡訓練函數為trainscg 函數。
通過BP 神經網絡質量擬合模型分別得到煙梗圖像中長梗和短梗質量,從而得到長梗率和短梗率,具體計算公式如式(11)、式(12)。

式中,M長為長梗率,M短為短梗率,m長為測試中的長梗質量,m短為測試中的短梗質量。
分別稱取25 組不同質量的長梗和短梗,從長梗和短梗中各取一組煙梗進行混合,同一質量下的混合煙梗在設備上重復過料5 次進行采圖,以其中20 組混合煙梗圖像作為BP 網絡的訓練樣本集,其余5 組混合煙梗圖像作為BP 網絡的測試樣本集。利用上述神經網絡模型進行實驗,模型訓練誤差變化曲線如圖6 所示,對不同質量的煙梗擬合結果如表2 所示。
由圖6 可知,BP 神經網絡達到預設收斂誤差自動停止訓練,此時網絡迭代189 次,收斂于9.674 2×10-6,并且收斂速度較快。

Fig.6 Neural network error curve圖6 神經網絡誤差曲線
其中,擬合均值是指同一質量下5 次過料的混合煙梗圖像擬合得到質量的平均值。由表2 可以看出,本文設計的BP 神經網絡模型的最大相對誤差為7.12%,最小相對誤差為1.92%,平均相對誤差為3.91%,對于煙梗質量的擬合重復性與準確性均較好。
上述5 組實驗對應的長短梗率檢測結果如表3 所示。
由表3 可以看出,采用本文方法所得到的長短梗率與實際值較為接近,其中最大絕對誤差為1%,滿足實際生產要求。

Tabel 2 Fitting results of stem quality表2 煙梗質量擬合結果

Tabel 3 Calculation results of long and short stem ratio表3 長短梗率計算結果
為了比較網絡模型中不同訓練函數對煙梗質量擬合結果的影響,本文釆用訓練函數traingdx 和trainbfg 與上述實驗結果進行對比。模型訓練誤差變化曲線分別如圖7 和圖8 所示,煙梗質量擬合結果的相對誤差值如表4 所示。
由圖7 和圖8 可以看出,這兩種網絡訓練模型迭代次數很高且收斂誤差遠高于預設值,對比分析可知,本文采用的訓練函數trainscg 訓練效果最優。
對比表4 中不同訓練函數下煙梗質量的擬合結果可以看出,本文選取的trainscg 訓練函數得到的質量擬合結果相對誤差最小,并且相對誤差的波動性也較小。因此,無論是從訓練模型還是預測精度上都有較好效果。

Fig.7 Error curve when training function is traingdx圖7 訓練函數為traingdx 時的誤差曲線

Fig.8 Error curve when training function is trainbfg圖8 訓練函數為trainbfg 時的誤差曲線

Tabel 4 Comparison of fitting results of different training functions on tobacco stem quality表4 不同訓練函數對煙梗質量擬合結果對比
本文提出了一種基于BP 神經網絡的煙梗長短梗率檢測方法,通過檢測多組不同質量的煙梗進行對比實驗,驗證了該算法的準確性與穩定性,并通過對比不同的神經網絡訓練函數,找到了網絡的最佳擬合參數,實現了對煙梗質量較為精準的預測。本文不僅為煙草企業準確高效地檢測長梗率和短梗率提供了一種新方法,也為相關領域的預測問題提供了一定參考。然而,該方法的檢測結果仍存在一定偏差,算法的普適性還需作進一步驗證,這些都是下一步需要解決的問題。