張 萌,趙忠蓋
江南大學自動化研究所輕工過程先進控制教育部重點實驗室,江蘇 無錫 214122
近紅外光的本質是一種電磁波,一般定義780~2 526 nm區間內的波段為近紅外光譜區,近紅外光譜主要是由有機物質吸收光后分子振動從基態向高能級躍遷時產生的,反映了含氫集團X—H(X主要為C,N和O等)基頻振動的倍頻和合頻信息[1]。而應用近紅外光譜分析技術的關鍵就在于如何建立準確有效的模型[2]。
在近紅外光譜分析中,目前常用的模型建立方法有多元線性回歸法[3](multiple linear regression,MLR)、 主成分回歸[4](principle component regression,PCA)、 偏最小二乘法(partial least squares,PLS)[5]、 人工神經網絡[6](artificial neural networks, ANN)和支持向量機法(support vector machine,SVM)[7]。PLS是目前近紅外光譜分析中應用最廣泛的建模方法之一,它從自變量矩陣和因變量矩陣中提取主成分,有效降維,并消除自變量間可能存在的復共線性關系[5]。但PLS無法準確擬合非線性關系。人工神經網絡是目前應用廣泛的非線性建模方法,其中反向傳播(BP)算法是目前使用最多的神經網絡算法之一[6],但BP網絡算法易陷入局部最優,收斂速度慢。支持向量機是一種基于統計學理論的機器學習方法,它有較好的泛化能力并且能避免模型陷入局部最優[7],現在也越來越多的應用在近紅外光譜分析建模。但SVM沒有準確的選用標準,而且無法從給定的輸入空間中選擇有效特征用于建模。
深度信念網絡是一種具有多個隱藏層的多層感知器,它可以學習深層結構實現復雜函數的逼近,從大量輸入數據中學習有效的特征表示[8]。應用深度信念網絡(deep belief network,DBN)建模的優點是:(1)深度網絡具有復雜的多層結構,具有很好的表示能量,對于大數據的處理尤其有效;……