權國杰 童彤 李夢瑤



摘 要:垃圾分類,一般是指按一定規定或標準將垃圾分類儲存、分類投放和分類搬運,從而轉變成公共資源的一系列活動的總稱。分類的目的是提高垃圾的資源價值和經濟價值,力爭物盡其用。進行垃圾分類收集可以減少垃圾處理量和處理設備,降低處理成本,減少土地資源的消耗,具有社會、經濟、生態等幾方面的效益。生活垃圾由于種類繁多,具體分類缺乏統一標準,大多人在實際操作時會“選擇困難”,基于遷移學習技術建立準確的分類模型,利用技術手段改善人居環境。
自今年 7 月 1 日起,上海市將正式實施 《上海市生活垃圾管理條例》。垃圾分類,看似是微不足道的“小事”,實則關系到13億多人生活環境的改善,理應大力提倡。
垃圾在分類儲存階段屬于公眾的私有品,垃圾經公眾分類投放后成為公眾所在小區或社區的區域性準公共資源,垃圾分類搬運到垃圾集中點或轉運站后成為沒有排除性的公共資源。從國內外各城市對生活垃圾分類的方法來看,大致都是根據垃圾的成分、產生量,結合本地垃圾的資源利用和處理方式來進行分類的。
遷移學習是指在一個數據集上,重新利用之前已經訓練過的卷積神經網絡,并將其遷移到另外的數據集上。卷積神經網絡前面的層提取的是圖像的紋理、色彩等特征,而越靠近網絡后端,提取的特征就會越高級、抽象。所以常用的微調方法是,保持網絡中其他參數不變,只修改預訓練網絡的最后幾層,最后幾層的參數在新數據集上重新訓練得到。其他層的參數保持不變,作為特征提取器,之后再使用較小的學習率訓練整個網絡。因為從零開始訓練整個卷積網絡是非常困難的,而且要花費大量的時間以及計算資源,所以采取遷移學習的方式是一種有效策略。
通常在非常大的數據集上對ConvNet進行預訓練,然后將ConvNet用作初始化或者是固定特征提取器,以下是兩個主要的遷移學習方法:
1.微調卷積網絡。使用預訓練的網絡來初始化網絡而不使用隨機初始化,比較常用的方法是使用在ImageNet數據集上訓練好的模型參數進行初始化,然后訓練自己的數據集。
2.將卷積網絡作為固定特征提取器。凍結除了全連接層外的所有其他層的權重,將最后的那個全連接層替換為具有隨機權重的層,然后只對該層進行訓練。
要使用遷移學習方法來解決垃圾圖像識別分類問題,就需要大量的垃圾圖片數據集,因為當數據集太小時,一旦加深模型結構,就很可能出現過擬合的情況,訓練出的模型泛化能力不足,識別準確率不高。而基于遷移學習的方法,預訓練模型已經具備了提取圖像基本特征基的能力,這就能在一定程度上減緩過擬合發生的可能性,將預模型遷移到垃圾圖像數據集上進行微調訓練,提高識別準確率。
該數據集包含了 2507 個生活垃圾圖片。垃圾識別分類數據集中包括玻璃 (glass) 、硬紙板 (cardboard) 、金屬 (metal) 、紙 (paper) 、塑料 (plastic) 、一般垃圾 (trash) ,共6個類別。
采用遷移學習的方式導入預訓練模型,凍結特征提取層,進行微調訓練,選取了SeNet154、Se_ResNet50、Se_ResNext101、ResNext101_32x16d_ WSL四種模型進行對比實驗,選取結果較好的模型進行調優。
采用ResNext101_32x16d_WSL網絡作為基本的網絡結構進行遷移學習,將CBAM注意力機制模塊添加在首層卷積層,來增強圖像特征表征能力,關注圖像的重要特征抑制不必要的特征,固定除全連接層之外的其他層的權重。為降低過擬合,在模型全連接層添加了Dropout層,損失函數采用交叉熵損失函數(CrossEntropyLoss),優化函數對比了SGD和Adam,Adam在起始收斂速度快,但最終SGD精度高,所以采用了SGD。最終模型結構如下圖所示:
通過運行已經構建好的模型,得出訓練的模型的準確率是93.03%。選取一組圖片進行測試,我們得出如下圖所示的結果,模型很好的將各種垃圾的圖片進行了準確的分類,且準確度與之前訓練模型得出的準確率較為一致。
結論
本文訓練了一個用于垃圾圖片分類識別的模型,采用遷移學習的方法選取性能較好的模型進行調優改進,最終的模型識別準確率在93%以上。對垃圾的分類首先是在圖像識別的基礎上的,因此本文通過使用近幾年來發展迅速的遷移學習方法設計一個垃圾分類系統,從而實現對日常生活中常見垃圾進行智能識別分類,提高人們垃圾分類投放意識,同時避免人們錯誤投放而產生的環境污染。
(1.華北理工大學 藝術學院? ? 河北省唐山市? ? ?063210;2.華北理工大學 材料科學與工程學院? ? 河北省唐山市? ? ? 063210;3.華北理工大學 管理學院? ?河北省唐山市? 063210)