葉 沖,楊晶東
(上海理工大學 光電信息與計算機工程學院,上海200093)
如今,由人工進行垃圾分揀不僅對人體健康有傷害,而且垃圾分揀效率低。在日常生活中,每天會產生大量不同種類的垃圾,人工分揀只能解決其中的小部分,大多數都會進行填埋,從而對環境有很大的污染。隨著計算機視覺的發展和圖像數據的日益增多,深度學習方法在垃圾分類領域被廣泛的應用。通過對不同種類的垃圾圖像進行檢測,讓機器自動進行識別和分揀,從而提高資源利用率,減少環境污染。
傳統的圖像分類方法主要分為兩部分,一是通過人為設置特征提取器提取圖像特征,例如HOG特征[1]、SIFT特征[2]、LBP特征[3]等;二是通過設計更好的分類器算法來提高分類結果的準確率。然而隨著移動互聯網的普及以及各類互聯網產品的推出,每時每刻都有海量的圖像數據產生,這些圖像數據復雜而且多樣化,傳統的圖像分類算法并不足以支撐這些數據的分類。近年來,由于計算機技術的快速迭代和計算能力的日異豐富,給基于神經網絡學習的圖像分類算法提供了可能性。因此,越來越多的學者將目光投向基于神經網絡的圖像分類算法研究,以便找到更加快速高效的圖像分類技術。深度學習通過多層非線性層的疊加[4-5],使得模型可以擬合更加復雜的非線性映射。2014年,來自牛津大學的Simonyan K[6]等人提出了VGG網絡,該網絡常用的有VGG16和VGG19兩種結構,除了在網絡深度上的不同,二者在本質上并無區別。……