孟德堯,吳榮海,楊鄧奇
(1.大理大學數學與計算機學院,大理 671003;2.大理大學工程實訓中心,大理 671003)
隨著全球經濟的不斷發展,居民的生活水平不斷提高,生活垃圾的生產量也在逐年增加。由于城市人口多,環境容量有限,城市地區的生活垃圾污染問題變得更加嚴重。垃圾回收任務是緩解環境和改善整個國家經濟的有效途徑。垃圾回收工作的效率和質量在很大程度上取決于垃圾分揀的有效性。針對人工分揀垃圾存在的工作量大、易出錯、分揀效率低等問題,一些學者提出了智能垃圾識別與分類方法,通過機器識別垃圾圖像實現自動分類,降低人工成本,進一步提高資源的再利用率。
近年來,深度學習在圖像識別領域取得了突出的成績,被廣泛應用于垃圾分類。例如,文獻[8]用DenseNet169模型在自制的垃圾數據集NWNU-TRASH(廢玻璃、廢織物、廢紙、廢塑料和廢金屬,共18911張)上實現垃圾分類,取得了82%的準確率。文獻[9]使用支持向量機(SVM)和ResNet50(SVM)模型在TrashNet標桿數據集(包括玻璃、紙張、紙板、塑料、金屬和普通垃圾六個類別)上進行垃圾分類,準確率分別為63%和87%。文獻[10]通過數據增強的方法,將TrashNet上的圖像分別做了水平翻轉、垂直翻轉和隨機25 °旋轉,將數據集擴充了四倍,其中90%作為訓練集,10%作為測試集,利用遺傳算法優化DenseNet121的全連接層,取得了99.6%的準確率?,F有基于深度學習的垃圾分類主要基于TrashNet數據集來實現,取得了很高的準確率。
然而,受限于垃圾圖像數據集,現有垃圾分類的研究沒有考慮生活垃圾的組成成分問題。生活垃圾往往包括廢舊電池、過期藥品等有害垃圾。有害垃圾和無害垃圾的處理方式不同,將有害垃圾誤當作無害垃圾處理,對環境和生命造成嚴重的威脅。在實現垃圾自動識別和分揀時,如何盡可能降低有害垃圾的漏判誤差(將有害垃圾誤識別為無害垃圾的誤差)是個亟待解決的問題。
本文采用網絡爬蟲和手動拍照的方式建了一個包含廢舊電池、過期藥品等有害垃圾的數據集,并提出了基于保守集成策略的垃圾自動識別方法,實現有害垃圾的低漏判自動分揀。本文的主要貢獻:
(1)構建了一個包含有害垃圾和無害垃圾的垃圾圖像數據集,包括3281張垃圾圖像,分為七類:廢舊電池、過期軟膏、過期藥物、廢玻璃、廢紙、廢塑料和廢金屬。
(2)提出了基于保守集成策略的垃圾自動識別方法,降低了有害垃圾的漏判誤差。
本文通過網絡爬蟲和手動拍照構建了生活垃圾(Domestic Trash,DTrash)數據集,包括廢舊電池(321張)、過期藥物(448張)、過期軟膏(387張)、廢玻璃(501張)、廢紙(522張)、廢金屬(551張)、廢塑料(551張)七個類別,其中廢舊電池、過期藥物、過期軟膏是有害垃圾,有害垃圾圖像的比例為35.23%。DTrash數據集中所有圖像均為RGB格式,大小不一。我們使用Python3.5.3平臺的Python Imaging Library中的resize()方法調整了所有圖像的大小,以滿足DNN模型對輸入圖像大小的要求。DTrash數據集的圖像示例如圖1所示。

圖1 DTrash數據集的圖像示例
實際生活中無害垃圾往往比有害垃圾多,因此,本文對數據集的各個類別不做平衡處理。隨機地將DTrash數據集按8∶1∶1的比例劃分為訓練集、驗證集和測試集,見表1。

表1 訓練集、驗證集和測試集詳細信息
為了提高模型的性能,本文先對VGG-16、ResNet-50、ResNext-50、Vision Transformer(ViT)和Vision Transformer Hybrid(ViTHybrid)在DTrash數據集上進行了測試,結果表明,ViT模型、ViT-Hybrid模型具有更好的性能。因此,本文的集成學習方法采用了這兩個模型。ViT和ViT-Hybrid模型的描述見表2。

表2 ViT和ViT-Hybrid模型的信息
本文設計了基于保守策略的垃圾圖像自動識別集成學習方法,如圖2所示。該方法的目的是在實現垃圾分類時,盡可能減小將有害垃圾預測為無害垃圾的概率。
圖2(a)部分是將ViT、ViT-Hybrid在ImageNet上預訓練的權重遷移到訓練DTrash的模型上。ViT、ViT-Hybrid模型在DTrash訓練集上訓練后得到集成模型。將測試集輸入集成模型得到預測結果。

圖2 集成學習方法用于自動識別垃圾圖像
基于保守策略的集成學習方法使用了遷移學習,將在ImageNet數據集上預訓練的ViT和ViT-Hybrid模型的權重參數遷移到DTrash數據集,對全連接層和SoftMax進行微調,再采用保守策略將兩個模型集成,得到集成模型。在本文的保守策略中,如果模型ViT和ViT-Hybrid對同一輸入圖像的預測結果至少有一個是有害垃圾時,集成模型會將該圖像預測為有害垃圾(0)。如果模型ViT和ViT-Hybrid對同一輸入圖像都無法識別時,集成模型會將該圖像預測為不確定圖像()。否則,集成模型會將圖像預測為無害垃圾(1)。保守集成策略定義見式(1)。

現有的研究將所有垃圾類別平等對待,通常使用準確率來評價模型性能。本文旨在有效分離有害垃圾和無害垃圾,盡可能地減小有害垃圾被錯誤地識別為無害垃圾的概率。因此,本文使用三個評價指標:有害垃圾圖像的漏判誤差(E)、無害垃圾圖像的誤判誤差(E),圖像總體誤差(E),分別定義為公式(2)、(3)和(4)。

其中表示實際是有害垃圾,模型也將其預測為有害垃圾的照片數量。表示實際是無害垃圾,模型也將其預測為無害垃圾的照片數量。表示實際是無害垃圾,模型將其預測為有害垃圾的照片數量。表示實際是有害垃圾,模型將其預測為無害垃圾的照片數量。記有害垃圾圖像集合為,無害垃圾圖像集合為。定義有害垃圾標簽集合L={過期藥品、廢舊電池、過期藥品};無害垃圾標簽集合L={廢玻璃、廢紙、廢金屬、廢塑料}。那么,,,和可分別定義為公式(5)、(6)、(7)和(8):“::=”表示“定義為”,“()”表示集成模型為圖像“”分配的預測標簽。對任意一張有害垃圾圖像,模型只要將其預測為集合L中的任一標簽都屬于;對任意一張無害垃圾圖像,模型只要將其預測為集合L中的任一標簽都屬于;對任意一張無害垃圾圖像,模型只要將其預測為集合L中的任一標簽都屬于;對任意一張有害垃圾圖像,模型只要將其預測為集合L中的任一標簽都屬于。

E直觀地反映模型錯誤預測的有害垃圾圖像占測試集有害垃圾圖像總數的比例。E直觀地反映模型自動預測為有害垃圾圖像中無害垃圾圖像的比例。
有害垃圾圖像和無害垃圾圖像二分類的實驗結果如表3所示,集成模型漏判誤差(E)、誤判誤差(E)和總體誤差(E)分別0%,11.63%和4.57%。實驗結果表明,盡管集成模型的誤判誤差和總體誤差都有所增加,但保守的集成策略有效地降低了有害垃圾的漏判誤差,防止了將有害垃圾識別為無害垃圾。圖3為集成模型和兩個DNN模型對應的二分類混淆矩陣。

圖3 集成模型(左)、ViT(中)、ViT-Hybrid(右)對有害垃圾、無害垃圾的預測結果

表3 單模型與集成模型各指標對比
基于保守策略的集成學習方法在識別垃圾時,保證了有害垃圾不會被識別為無害垃圾。但是垃圾分類的總體準確率也是值得關注的指標。圖4給出了多分類實驗結果的混淆矩陣。混淆矩陣左上方3×3的矩陣是有害垃圾內部的預測結果,右下方4×4的矩陣是無害垃圾內部的預測結果。

圖4 多分類實驗結果混淆矩陣
多分類的準確率()計算公式如(9)所示:

其中X表示實際為第類別,模型將其預測為第類別的標簽的圖像數,為類別數。
從圖4可以發現,實際為有害垃圾,集成模型也將其預測為有害垃圾的圖像(114張)中,其準確率為96.49%;實際為無害垃圾,模型也將其預測為無害垃圾的圖像(198張)中,其準確率為91.92%。實驗結果表明,集成模型在有效控制了有害垃圾漏判誤差的同時,將有害和無害兩類垃圾內部類別間的誤識別誤差控制在一個較低的水平。
針對如何盡可能降低有害垃圾的漏判誤差問題,本文設計了基于保守策略的垃圾圖像自動識別集成學習方法,在自制DTrash數據集上訓練集成模型,測試結果顯示,集成模型獲得了較低的漏判誤差(0%),有效地防止了有害垃圾被誤識別為無害垃圾,并將有害和無害兩類垃圾內部類別間識別誤差維持在一個較低的范圍。