萬 薇卜瑩雪王 祥栗 超
(1. 江西經濟管理干部學院,江西 南昌 330088;2. 江西理工大學,江西 贛州 341000;3. 東華理工大學,江西 撫州 344000)
食品的新鮮度直接關系到人類的健康和生命安全,因此備受關注[1]。在食品深加工中,水果、蔬菜、肉類較為常見,隨著貯藏時間的不斷延長,這些食品質量有不同程度的變化,現有方法檢測時間長且需要專業人員操作[2]。
目前,有關食品新鮮度識別方法的研究主要集中在電子鼻和深度學習等方法上[3-6]。電子鼻通過對食品腐敗相關的特征氣體進行檢測,可以區分食品新鮮度,但無法應用于實時性較強的場合。深度學習方法在自動學習圖像特征方面優勢較為明顯,可以處理大量復雜的數據,其準確率和效率均較高。沈海軍等[7]將Fisher判別用于蘋果的新鮮度識別,對多個品種的蘋果新鮮度進行感官評定、聚類分析及Fisher判別,具有較高的識別精度(95.00%左右)。劉雪等[8]針對蛋類食品新鮮度檢測特征差異不明顯的問題,將改進的MobileNetV3-Large模型用于蛋類新鮮度識別。所提方法能較快速準確識別蛋類新鮮度,識別精度達97.26%,參數量為4.45 M。焦俊等[9]為提高食品識別的準確性,將改進的殘差網絡與遷移學習相結合用于食品新鮮度識別。加入遷移學習后,模型收斂速度和識別性能均有一定提高,總體識別精度達94.50%,是一種高效的食品新鮮度識別方法。董鑫鑫等[10]通過便攜式拉曼光譜儀快速測定食品新鮮度,建立了全波段PLSR模型。所提方法性能比較理想,有效提高了識別精度,降低了運行時間。上述方法可以實現食品新鮮度的檢測,但檢測的精度和效率有待進一步加強。
研究擬將改進的殘差神經網絡(ResNet)模型用于生產線食品新鮮度識別,引入改進的LReLU激活函數提高模型識別性能,引入批量歸一化層提高模型訓練效率,引入Dropout層丟棄一定比例的神經元降低過擬合的影響,以期為食品新鮮度無損檢測技術的發展提供依據。
食品生產線的圖像采集系統主要由攝像機、光源、暗箱、計算機、傳送帶等組成(圖1)。攝像機選用DFK23U274型彩色CCD工業相機,光源采用額定電壓12 V、額定功率5 W的LED燈,其發光顏色為暖白,色溫為3 500 K。為了防止外部環境光線的干擾,圖像采集在密閉型暗箱內完成[11]。暗箱為尺寸50 cm×50 cm×40 cm的長方體木箱,內壁全部涂黑,底部也作為背景色涂黑,使圖像中的目標和背景具有較大對比度,簡化后續圖像處理難度[12]。CCD工業相機被固定在暗箱上部的正中間,采集到的食品圖像發送至計算機,進行新鮮度識別。采集圖像存在一定的干擾,不利于后期識別,需對采集圖像進行預處理,試驗采用的預處理方法為高斯濾波和對比度拉伸。

圖1 圖像采集結構
目前,許多領域都采用深度學習技術實現分類檢測。當待處理圖像尺寸較大時,由于全連接網絡的參數較多,所以處理時間冗長及網絡過擬合等問題難以滿足使用需求。卷積神經網絡在處理圖像時通過特殊的數據排列方式解決前者的問題,ResNet作為特殊的卷積神經網絡在其基礎上通過添加Shortcut Connection可進一步提高網絡性能[13]。
ResNet是一種卷積神經網絡,在ImageNet大型視覺識別競賽中獲得圖像分類和物體識別冠軍。殘差神經網絡的特點是易于優化,通過增加相當的深度可以提高準確率[14]。經典ResNet模型結構如圖2所示。

圖2 經典ResNet模型結構
ResNet結構由卷積1~5和全連接層組成,結構與CNN相似,就是通過在網絡中嵌入多個殘差塊,卷積層間實現殘差連接[15]。圖3為ResNet殘差塊結構。

圖3 ResNet殘差塊結構
圖3中的原始映射為
H(x)=F(x)+x,
(1)
式中:
x——輸入;
H(x)——輸出。
其中殘差映射為[16]
F(x)=H(x)-x。
(2)
通過殘差映射參數的調整幅度更大,通過增加相當的深度可以提高準確率。因此,ResNet模型識別效果優于CNN模型。
2.4 AKT2、CD44、EIF4E、ERBB2在侵襲性乳腺導管癌中mRNA表達升高 與非侵襲性乳腺導管癌相比,在侵襲性乳腺導管癌中AKT2、CD44、EIF4E、ERBB2 mRNA表達量均升高,差異有統計學意義(P<0.05),見圖4。即促進乳腺癌轉移基因AKT2、CD44、EIF4E、ERBB2在侵襲轉移性乳腺癌中表達升高,且與TEX14的表達均呈正相關。
殘差神經網絡作為一種具有Shortcut Connection的特殊神經網絡,該網絡在保持卷積神經網絡低復雜度的優點下,進一步加深了網絡的深度,提高了網絡的性能。經典ResNet模型共有152層,但層數較多會增加運行時間且精度不一定提高。試驗選擇ResNet-34模型,同時引入改進的LReLU激活函數提高模型的識別性能,在卷積層1后加入批量歸一化層提高模型訓練效率,在全連接層后加入Dropout層丟棄一定比例的神經元以降低過擬合的影響[17]。
(1) 改進的LReLU函數:為了解決ReLU激活函數中的梯度消失問題,LReLU函數對輸入數據中的負值賦予非零斜率,LRELU函數解決了ReLU函數梯度消失問題,但函數平滑度不高。Softplus函數具有優異的平滑性,但該函數的輸出偏移會影響網絡的收斂性??紤]到LRELU和Softplus函數的特點,結合這兩個函數特征,試驗設計了改進的LRELU激活函數[18]。
(3)
式中:
a——常數,取a=0.25。
(2) 批量歸一化層:批量歸一化層布置在卷積層1和激活函數層之間,以加快網絡訓練并防止梯度消失。即在進入下一層之前,對前一層的輸入進行歸一化。具體如式(4)~式(7)所示[19]。
(4)
(5)
(6)
(7)
式中:

m——每個標準化樣本;
μ——輸出值平均值;

ε——一個很小的常數;
α、β——學習參數(由CNN訓練得到,用來代替偏置)。
(3) Dropout層:將Dropout層置于全連接層后,加入Dropout層丟棄一定比例的神經元,可以有效地降低過擬合現象。通過使神經元的激活值以一定的概率p(伯努利分布)停止,不太依賴于一部分的局部特征,可以提高模型的泛化性[20]。
為了驗證所提方法的有效性,以黃魚為例進行說明,黃魚重量為(500±50) g,外觀完整。該測試基于Python環境中的Pytorch-深度學習框架。根據GB 2733—2015,揮發性鹽基氮在每100 g黃魚肉中含量<13 mg為一級新鮮度,含量在13~30 mg為二級新鮮度,含量>30 mg為腐敗。數據集為黃魚圖像1 200張,一級新鮮度400張,二級新鮮度400張,腐敗400張,將數據集分為訓練集、驗證集和測試集,比值為8∶1∶1。系統參數見表1,試驗參數見表2。

表1 系統參數

表2 試驗參數
采用準確率作為模型識別精度評估指標。
(8)
式中:
P——識別準確率,%;
f(xi)——模型對第i個樣本的識別類別;
Yi——樣本i的實際類別;
n——樣本總數。
為了驗證試驗模型的訓練效果,利用能夠度量實際樣本分布與識別樣本分布差異的交叉熵損失函數,監督試驗模型的訓練過程,訓練時的模型損失率如圖4所示,訓練時的模型精度變化曲線如圖5所示。

圖4 訓練時模型損失率變化

圖5 訓練時模型準確率變化
由圖4、圖5可知,當迭代次數≤35時,試驗模型對黃魚的訓練和驗證loss值快速降低,loss值有振蕩情況,但總體上趨于下降。迭代40次后,loss值逐漸穩定。經過40代的遍歷,訓練集和驗證集的識別準確率趨向于99.50%,說明試驗設計的基于改進殘差神經網絡的食品新鮮度識別模型具有較好的圖像識別性能。為了避免模型過度擬合,使用迭代50次訓練的模型來識別測試集。
為了驗證模型訓練后的效果,通過測試集對訓練后模型的識別效果進行驗證,訓練后模型識別結果見表3。

表3 模型訓練后測試集識別結果
由表3可知,試驗方法在不同等級黃魚新鮮度識別中精度較高且波動小,一級新鮮度識別差錯率為0,二級新鮮度識別差錯率為2.50%。腐敗新鮮度識別差錯率為5.00%,其中一級新鮮度0個,二級新鮮度2個。試驗方法的平均錯誤率為2.50%,總體識別準確率為97.50%,試驗樣本較少,當樣本較多時,準確率可能有一定的提高。綜上,試驗模型對黃魚新鮮度圖像有較高的識別準確率。
為進一步驗證試驗方法的優越性,將試驗方法與改進前的殘差神經網絡和文獻[21]改進的CNN方法進行比較分析,通過試驗訓練集對不同模型進行訓練,并將訓練后模型用于試驗測試集識別。不同方法的識別精度和運行時間見表4。

表4 不同方法的識別結果
由表4可知,試驗方法的識別準確率為97.50%,平均識別時間為9.80 ms,與改進前的殘差神經網絡相比,識別準確率提高了5.41%,平均識別時間降低了58.47%。這是因為試驗方法在殘差神經網絡中引入了改進的LRELU激活函數,提高了模型的識別性能,引入批歸一化層提高了模型的訓練效率,引入Dropout層降低了過擬合現象。與文獻[21]改進的CNN相比,試驗方法的識別精度提高了4.00%,平均識別時間降低了80.49%。這是因為試驗方法解決了退化和梯度消失等問題,通過優化提高了識別精度和降低了識別時間。綜上,試驗方法的識別精度和平均識別時間較優,能夠滿足食品生產線食品新鮮度識別要求。
研究提出了一種改進的殘差神經網絡模型用于生產線食品新鮮度識別,引入改進后的LReLU激活函數提高模型的識別性能,引入批量歸一化層提高模型的訓練效率,引入Dropout層降低過擬合現象。結果表明,與常規方法相比,試驗方法對食品圖像新鮮度識別具有較高的識別準確度和較短的識別時間;與殘差神經網絡和文獻[21]相比,試驗方法的識別準確度分別提高了5.41%,4.00%,平均識別時間分別下降了58.47%,80.49%。試驗方法在識別精度和識別時間方面優勢明顯,可滿足食品生產線對食品新鮮度識別的需要。后續將擴充樣本數量和增加食品種類,以進一步優化和完善整個系統。