鄭義姚,鄭力新
(福建華僑大學工學院,泉州362000)
中國是一個人口大國,在這樣一個人口眾多的國家,糧食問題已經成為一個更值得關注的問題,因此中國特別重視農業生產。金針菇是現在最常見的一種菌類食品,好吃又有營養。此外,金針菇具有寒性、咸味,有益肝、益胃腸、增智、抗癌、抗癌的作用。因此,我國對金針菇的需求量在不斷增加,但據中國食用菌協會統計[1]:2017 年食用菌總產量3712 萬噸,2016 年超過3596.66 萬噸,增長3.21%。通過統計得出,前7 種菌類分別為:香菇(986.51 萬噸)、黑木耳(751.85 萬噸)、蠔菇(546.39 萬噸)、雙孢蘑菇(289.52 萬噸)、金針菇(247.92 萬噸),2017 年毛霉菌(168.64 萬噸)、杏菇(159.71 萬噸)產量較2016 年下降7.12%。可以看出,在上述蘑菇分類中,金針菇的總產量排在第五位,并且有下降的趨勢。造成這種情況的緣由有兩個:一是栽培的產出率,二是人工分類效率低。在金針菇分類中,工人首先要根據工人自身的經驗分析頭部和根部是否符合工廠的標準,然后進行分類,這需要處理大量的數據。因此,在分級階段,用機械操作代替人工分級將是金針菇生產的一大進步。
在對金針菇進行分類的過程中,工作人員首先分析金針菇的特性,然后判斷其是否符合要求。這樣的工作流程恰巧類似于當今發展迅速的深度學習。深度學習不同于傳統的方法,通過自動獲取大數據來反映數據差異的特點,其分層處理方法類似于人類的視覺機制。卷積神經網絡是模擬人腦的工作機制[2]。2012 年,Hinton 團隊通過構建CNN 網絡AlexNet 獲得ImageNet冠軍,該網絡結構相對簡單,擅長小數據集[3]。然后,經過幾代人的改進和創新,出現了ZFNet、VGGNet、GoogleNet 和ResNet 等優秀的神經網絡,VGG-16[4]率先證明了神經網絡的深度對大規模數據精度的影響,而后續的神經網絡大多是基于VGG-16 來去除或添加其他層。ResNet 提出了一個新的模塊,稱為“殘差塊”[5],它將網絡的深度提升到了一個新的高度,并且在網絡層數的加深上沒有過度擬合。接著,出現了許多目標檢測模型,從R-CNN、Faster R-CNN、SSD、直到YOLOv3、YOLOv4。
通過查詢發現,Andreas Kamilaris 在《農業的深度學習:一項調查》中發現,深度學習在農業中的研究中有40 多種,并取得了良好的效果。如Jihen Amara 等人用CNN[6]對香蕉葉實行分類,準確率達98.67%。Josef Haupt 使用ResNet-50 和2 個DenseNet201 網絡對大型植物進行分類[7],Inkyu Sa 通過深度神經網絡實現了對水果的測試[8]。雖然CNN 在很多方面都做得很好,但本文對金針菇的研究還存在幾個難點:①金針菇屬于自然生長,形式多樣。一張金針菇圖像上可能存在幾十個金針菇頭,需要對金針菇頭部圖像進行合適的特征提取。②數據集的收集。數據集對最終結果至關重要,需要收集數據集,但沒有公開的金針菇數據集。本文基于深度學習的方法上,采用數據增強和遷移學習的方法來防止小數據集中可能出現過擬合的情況。在對圖像進行預處理時,對所有數據進行歸一化處理,以防止仿射變換的影響,減小幾何變換的影響,同時加快梯度下降來求解最優解。

圖1 金針菇菇頭示意圖
金針菇工廠采用4096×2160 像素的工業相機拍攝金針菇的頭部,并在背景上添加一張黑色的卡紙以消除其他背景因素的影響,省去了后期圖像處理部分對背景影響的考慮。將采集好的數據集按8:2 的比例分成訓練集和測試集。如圖1 所示,金針菇菇頭大小差別較大,且水菇較多。
收集到的圖像尺寸為4096×2160,像素在0~255之間。對這些圖像進行歸一化處理,將像素范圍轉換為0-1 之間。采用max 和min 值的方法對圖像實現規范化,轉化的公式如(1)所示:

在公式中,像素Y 代表經過變換后的像素,像素X代表原始像素值,像素M 和L 分別是樣本像素的最大值和最小值。這種分配的目的是將多維表達式轉換成無量綱,以避免不同物理意義和維數的輸入變量的不平等使用和大數據對小數據的覆蓋。
為了得到更好的模型,需要進行大量的訓練以獲得足夠的訓練參數,從而提高模型的規范化程度。為此,本文采用數據增強[9],通過對訓練圖像進行隨機剪裁,得到4134 幅訓練圖像,并將其像素放大到256×256,以解決數據集不足導致的過擬合問題。
進行預處理并且打好標簽的數據集,分別放入YOLOv3[10]和YOLOv4[11]進行訓練,得到訓練好的模型,使用測試集在模型上進行測試,得到如表所示指標,可以看出YOLOv4 的準確率比YOLOv3 的準確率高2.1%,在檢測速度上快了0.3s,更適用于工業使用。YOLOv4 檢測的效果圖如圖2 所示,將大部分菇頭的都檢測出來,效果明顯。

表1 四個評價指標對比

圖2 檢測效果圖
如圖3 所示是根據檢測結果繪制的PR 圖,可以看出YOLOv4 在本數據集之下的檢測穩定性和準確性要高于YOLOv4,也進一步證明了,YOLOv4 在金針菇頭部的檢測中的實用性。

圖3 YOLOv3和YOLOv4網絡Precision-Recall曲線
目前,將深度學習在應用到農產品中的實例較少,原因之一是大部分農產品是在多種自然條件下生長的,因此很難提取出有效的特征。另一個原因是數據集很難去收集,目前可用于農產品的數據集較少,大部分需要根據具體要求進行收集。本文根據對金針菇頭部的標定,發現在YOLOv3 網絡上檢測的精度和速度優秀一些,通過這樣的方法,可以實現金針菇頭部的檢測,但由于對其他優化算法的研究還不多,因此結果仍有很大的改進空間。