劉夢雅,毛劍琳
(昆明理工大學 信息工程與自動化學院,云南 昆明 650500)
近年來,深度學習的發展使得機器學習取得了重要突破。其中,卷積神經網絡 (CNN)在圖像處理等方面的研究成果十分矚目。它不但可以像人類視覺系統一樣逐層提取得到圖像的深層特征,提高網絡的識別率;而且它提取到的特征具有較強的平移不變性,解決了由于圖像變換引起的特征提取不準確的問題[1]。由于存在很多優點,目前卷積神經網絡在虹膜識別、人臉識別、圖像識別、語音識別等許多方面有著廣泛的應用。
Lee等人[2]使用分層生成模型改進卷積神經網絡來處理高維圖像,大幅提高了準確率;Alex等[3]在處理圖像識別問題時,構建了一種大型深層卷積神經網絡,經測試發現,識別率得到了明顯提高。目前提出的很多改進算法都取得了良好的識別效果,但對訓練數據量的要求仍然較大,如果數據量較小就會導致卷積神經網絡前幾層得不到充分訓練。為解決這一問題,權值的初始化操作是一個改進方向,文獻[4]提出利用稀疏自動編碼器學習輸入圖像的特征以初始化卷積神經網絡的卷積核,之后文獻[5]提出采用 PCA 改進初始權值的方法,但效果不佳,所以濾波器初值的優化仍然比較困難。
此外,卷積核的大小、池化模型以及特征圖的個數都會影響CNN的運行速度和識別率。文獻[6]比較了卷積核大小為19、15、11、7、3共5種情況下的實驗結果,并得出結論:卷積核較小的情況更能擬合原始變化趨勢,但是時間消耗巨大。……