翟乃琦,云利軍,葉志霞,王一博,李亞召
(云南師范大學信息學院,云南 昆明 650000)
我國作為煙草大國,每年因煙葉霉變問題導致了巨大的經濟損失。因此,及時有效地預防煙葉霉變具有重要的研究意義。煙葉本身含有較多的營養物質,為霉菌在生長繁殖過程中提供了必要的物質條件,同時倉儲環境的溫度和濕度等外部因素會影響霉菌在煙草中的繁殖[1]。防止煙葉霉變的關鍵在于通過實時監測倉儲環境的變化,對煙葉霉變實現提前預警,從而減少經濟損失[2 - 4]。
傳統人工檢測煙葉霉變的方法主要分為2種:一是通過感官進行評測,二是通過鏡檢鑒別方式檢測[5]。傳統的檢測方法不僅耗時且經濟成本較高。隨著物聯網技術和人工智能的發展,通常應用電子鼻技術來檢測煙葉的霉變狀態[6,7],如利用電子鼻來檢測煙氣從而判斷卷煙的品牌[8],還可用于區分白肋煙的成熟度[9]。模式識別算法多采用機器學習的方法(如采用人工神經網絡)對卷煙品牌進行區分[10]。
在機器學習方法中,BP(Back Propogation)神經網絡作為一種自適應的多層前饋網絡,具有自組織、自學習和聯想等特征。程龍等[11,12]將影響煙葉霉變的各個因素作為網絡輸入,通過訓練得到與霉變狀態相關的非線性映射關系,進而預測煙葉霉變情況。運用BP神經網絡雖解決了不少應用問題,但網絡自身伴有局部極小化、收斂速度慢等問題,影響了網絡的部分性能。針對這些問題,王榮等[13,14]使用粒子群優化算法解決局部最優問題或通過多種算法綜合的方式提高預測準確率。近年來,深度學習技術也逐漸應用于各個行業,隨著對傳統網絡的不斷改進和深度學習方法的產生,預測準確率也在不斷提高。
本文提出了一種基于一維卷積神經網絡1D-CNN(One-Dimensional Convolutional Neural Network)的方法來預測煙葉霉變的狀態,使用TGS系列半導體氣敏傳感器采集數值作為特征來訓練網絡模型,預測煙葉霉變的概率。最后,開發出一套煙葉霉變實時監測系統,具有一定的工程實用價值。
本文所使用的實驗材料是由云南省某煙廠提供的正常煙葉樣本,通過對部分樣本進行霉菌培養,將樣本分為正常煙葉和霉變煙葉2大類[15]。實驗儀器采用課題組自主研發的電子鼻系統(如圖1所示),主要采集TGS系列氣敏傳感器(TGS2600、TGS2602、TGS2603、TGS2611、TGS2620、TGS822)的響應值。部分原始測量典型數據如表1所示,第2列中的6個數字分別對應TGS2600、TGS2602、TGS2603、TGS2611、TGS2620、TGS822等6個傳感器的響應值;在狀態列中,0代表正常煙葉,1代表霉變煙葉。

Figure 1 Electronic nose system physical map圖1 電子鼻系統實物圖

編號傳感器響應值 狀態1247 1011 1175 583 396 58002254 1074 1192 597 404 58403256 1133 1200 601 411 587 04459 2146 1293 910 770 84615459 2148 1302 912 765 84716461 2150 1302 911 766 847 1
利用課題組自主研發的電子鼻系統對正常煙葉與霉變煙葉進行測定的方法為:在測定之前首先對采集設備上電預熱1 h,確定設備處于正常工作狀態后,將實驗樣品放入檢測箱內,采樣頻率為10秒/次,采樣時間為5 min。采樣數據通過設備中的無線模塊傳輸到服務端進行存儲分析。在每次采樣結束之后,對采集設備進行狀態恢復,以保障下一次樣本采集工作的順利進行。
本文選用TGS系列氣敏傳感器氣體響應值作為基本的特征組成成分。在得到基本特征之后,使用歸一化函數將輸入特征進行歸一化處理,歸一化函數如式(1)所示:
(1)

一維卷積神經網絡可以很好地用于分析傳感器數據的時間序列,因此本文選用一維卷積神經網絡作為模型進行訓練。神經網絡的結構如圖2所示,每組煙葉樣本數據包含180條實時采集數據,每一條實時數據中包含6種氣敏傳感器數據,從而得到大小為30×6的矩陣,在輸入到模型之前,需要先將其平展成長度為180的向量,然后在第1層卷積層再將其變形為原始的大小為30×6的矩陣。

Figure 2 Basic structure of neural network model圖2 神經網絡模型的基本結構
(1)網絡的第1層和第2層為卷積層(Conv Layer),卷積窗口的大小設定為2,步長設定為1,卷積核數量設定為200。
(2)第3層為平展層(Flatten Layer),該層將多維度數據平展成一維數據,從而連接全連接層。
(3)第4層與第5層均為全連接層(Dense Layer),其中,第4層連接神經元數量為200,第5層的神經元數量為50。
(4)第6層為丟棄層(Droupout),Droupout的比例一般設定為0.5,隨機失活網絡中一半的神經元,防止過擬合現象的發生。
(5)最后一層為輸出層(Output),該層使用Sigmoid激活函數,將輸入向量通過矩陣乘法運算變換成長度為2的向量,分別代表正常煙葉和霉變煙葉的預測概率。
在網絡的每一層,使用激活函數對輸出結果進行非線性化處理。網絡中的前幾層均使用ReLU激活函數,最后一層使用Sigmoid激活函數。ReLU和Sigmoid函數如式(2)和式(3)所示:

(2)
(3)
本次實驗使用Keras模型搭建和訓練神經網絡。在構建過程中,為了提高模型的性能,本文主要通過改變網絡模型中卷積層的層數以及卷積層中卷積核的數量和大小來優化網絡結構,使模型達到最優。
在網絡訓練過程中,本文選用Adam優化算法替代傳統的隨機梯度下降算法,基于訓練數據迭代更新網絡權重,在Loss損失函數中選用交叉熵函數。交叉熵函數式(4)所示:

(4)
其中,p為真實樣本值,q為預測樣本值,i代表向量p、q中元素的位置。
在模型訓練過程中,設置網絡訓練迭代次數為20,設定目標誤差為0.01,批處理大小設置為64,多次訓練之后保存訓練誤差最小的網絡模型。
本文所解決的是一個二元分類問題,樣本類別分為正常煙葉和霉變煙葉2大類,即正類和負類。根據數據集中獨立測試集的真實標簽和預測標簽,可將每個樣本的預測結果分為4種情況:TP(True Positive)、FP(False Positive)、TN(True Negative)和FN(False Negative)。具體如表2所示。

Table 2 Confusion matrix
表2中,TP表示本來是正樣本,分類為正樣本;FP表示本來是負樣本,分類成正樣本;TN表示本來是負樣本,分類成負樣本;FN表示本來是正樣本,分類成負樣本。在此標準之上,研究人員推演出了特異性Spe(Specificity)、準確性Acc(Accuracy)和敏感性Sen(Sensitivity)等評價指標[16]。
(5)
(6)
(7)
本文將一個采樣周期所得到的一組數據作為訓練數據。在模型訓練的過程中,會根據網絡模型的結構動態調整學習速率、迭代次數和批處理樣本大小等參數,每調整一次重新進行一次網絡訓練,訓練結束之后,使用測試集數據對當前的網絡進行測試。模型訓練Loss曲線如圖3所示。從圖3中可以看出,Loss曲線隨著訓練次數的增加不斷收斂,大概經過8輪次訓練后,模型收斂接近目標訓練誤差,最終確定出模型網絡結構。隨機選取5組測試集樣本進行網絡模型的性能測試,其準確率結果如表3所示。

Figure 3 Loss curve圖3 Loss曲線

%
從表3中可以看出,在多次網絡訓練后,訓練集的平均準確率為99.46%,測試集的平均準確率為99.14%。結果表明,本文方法對煙葉霉變的識別是可行的、高效的,且模型具有一定的輕量化和實用性。
在煙葉倉儲霉變預測方法的相關研究進展中,對于煙葉霉變狀態的預測多采用BP神經網絡模型。為了驗證本文所提模型相較于其它模型的優勢,基于本文所采用的數據集,選用BP神經網絡對正常煙葉與霉變煙葉進行分類,并與本文所提出的模型的分類結果進行對比。
在BP神經網絡模型中,對實驗所采集的數據進行特征提取,隨機選擇正常煙葉樣本與霉變煙葉樣本各30組。模型訓練完成后隨機選擇5組測試集樣本進行測試,多次測試之后取模型預測準確率的平均值進行比較,結果如表4所示。

Table 4 Classification accuracy of different medels表4 不同模型的分類正確率 %
從表4中可以看出,相較于傳統的BP神經網絡,本文所提出的1D-CNN模型預測準確率更高。
基于本文所構建的煙葉霉變預測模型,作者設計并實現了一套煙葉倉儲環境智能監測管理系統。該系統通過氣敏傳感器陣列采集倉儲環境數據,通過窄帶物聯網無線通信技術發送到監控中心數據服務器,在服務器中部署霉變預測模型與煙葉倉儲環境智能監測信息管理系統。智能監測管理系統主要分為用戶管理、倉儲管理、煙垛區域管理、倉儲環境信息監測和煙葉霉變預警5大功能模塊。其中在煙葉霉變預警模塊中,將環境監測數據輸入到一維卷積神經網絡中進行霉變預測,及時提醒管理人員進行處理。該系統經過一段時間的試運行,取得了較為滿意的效果。
本文主要研究了煙葉霉變狀態的預測問題,使用TGS氣敏傳感器采集數據作為網絡訓練特征,基于一維卷積神經網絡,完成了對煙葉倉儲霉變狀態的預測,預測結果具有較高的準確率,并且應用此模型實現了一套煙葉倉儲環境智能監測系統,具有一定的工程實用價值。