丁躍武,陳方方,楊 友,李四海
(甘肅中醫藥大學信息工程學院,蘭州 730000)
近紅外光譜分析技術(near infrared spectros?copy,NIRs)具有儀器成本低、測試便捷、效率高等特點,一般與機器學習方法結合建立NIRs檢測的定性分析模型。但是近紅外光譜數據與采集環境、所用儀器等密切相關,不同批次樣本的采集具有明顯差異且較難取得大量的定標樣本,導致傳統的淺層網絡方法往往存在特征學習能力不足、訓練難等問題,其預測結果不佳。化學計量學方法是近紅外光譜分析中常用的關鍵方法,其主要應用在以下六個方面:①異常樣品的剔除。②樣品集的劃分。③光譜預處理方法。④光譜譜區選擇方法。⑤分析模型的建立方法。⑥模型的傳遞與共享。這六個方面對于近紅外光譜分析技術的成功最重要的一步是建立魯棒性好的定性分析模型。目前常見的定性分析模型有主成分分析(PCA)、偏最小二乘?線性判別分析(PLS?LDA)、支持向量機(SVM)等淺層學習模型。然而,隨著大數據時代的來臨,光譜數據愈發復雜,淺層學習也許能夠有效地處理簡單的問題,但在解決復雜問題時,往往會因函數表達能力不足等問題而效果不佳。如今,如何將深度學習與光譜分析結合起來,越來越受到近紅外光譜技術研究人員的關注。
深度學習(deep learning)的概念來自于2006年Hinton 教授和他的學生Ruslan 一起發表在Science 雜志上的一篇文章,是在淺層學習結構基礎上發展而來的機器學習模型,開拓了機器學習的研究新領域,極大地推動了人工智能行業的發展。近些年,深度學習作為人工智能領域一個新的研究方向,在語音識別、文本鑒別、計算機視覺等多方面有了廣泛應用。深度學習是一種對數據進行抽象表達的算法,它能夠使用眾多基本單元構成復雜的多層網絡,在網絡中,低層單元的輸出作為高層單元的輸入,即為自下而上的學習過程,并且在輸入與輸出之間存在一定的映射關系,依據這一關系來對多層特征進行表達,最終實現樣品的預測或分類識別[1]。
目前有大量實驗和研究表明,深度學習的方法在定性分析中的準確性優于傳統的化學計量學方法和傳統的淺層神經網絡。如Ni 等[2]發現傳統的算法常能夠很好地分析近似線性的近紅外光譜數據,但深度卷積神經網絡在處理非線性模式的數據時效果則相比傳統算法更好。一些研究還表明,相比傳統的特征選擇算法如連續投影算法(SPA),卷積神經網絡和深度自編碼網絡(DAE)能夠從光譜數據中提取出更有代表性的特征[3]。大量文獻和實驗已足以說明深度學習在近紅外光譜技術領域發揮了不可比擬的作用,其中最值得一提的有深度卷積神經網絡(convolutional neural networks, CNN)、深度信念網絡(deep belief network, DBN)和深度自編碼器(deep autoencoder,DAE),這三種算法將會成為定性分析領域構建模型的重要基石,其中研究最多的是CNN,而后是AE。本文也將圍繞這三個算法介紹近些年深度學習在近紅外光譜定性分析領域的研究進展。
與傳統的機器學習方法有所不同,卷積神經網絡屬于一種深層次的前饋神經網絡模型。對于輸入數據的特征信息,由于CNN的局部連接方式以及權重共享特性,其可以較好地提取關鍵信息。因此,在文本分類、圖像分割領域都發揮著重要的作用。基于卷積神經網絡的優化變體有很多,如殘差網絡、膠囊網絡以及Inception[4]。局部連接這種方式可以對數據中的局部信息做出較強的響應,通過稀疏連接的方式從數據中抽取關鍵特征信息,最大程度減少了卷積神經網絡中訓練的參數。權重共享的核心在于模型所有的輸入數據均使用相同的卷積核進行計算,卷積層也因此具有了平移不變性,模型的計算復雜度也相應得到了降低。圖1為卷積神經網絡的經典算法LeNet?5的網絡結構。

圖1 卷積神經網絡LeNet?5網絡結構
近年來,由于CNN 在高維數據中具有優異的特征提取能力,在圖像分類[5]、目標檢測[6]等圖像任務中取得了巨大成功。在近紅外光譜領域,CNN 也參與其中。例如,針對馬兜鈴酸及其類似物的近紅外光譜鑒別,Chen 等[7]提出了1D?CNN,并取得了較高的性能。魯夢瑤等[8]提出了一種基于CNN 和近紅外光譜技術的煙葉產地分類方法。實驗結果表明,在不使用特征提取算法的情況下,該CNN 模型具有較好的準確率。然而,這些網絡使用了過多的卷積核來提高性能,增加了網絡的參數和計算量。為了提高CNN 的訓練效率和實用性,Szegedy 等[9]提出了一種名為Inception 的CNN 結構來近似局部最優稀疏度。由于近紅外光譜數據是一維序列,傳統的初始結構是為高維數據設計的,不能直接用于一維序列的輸入數據。因此,需要對Inception 結構進行改進。Chai 等[10]對刺梨及其仿制品的近紅外光譜數據進行了測定。然后,設計了一種改進的基于初始結構的一維卷積神經網絡(modified 1D?Inception?CNN),用于處理近紅外光譜數據,識別刺梨及其仿制品。改進的1D?Inception?CNN 具有參數少、計算效率高的特點,使識別模型更加實用。Zhang等[11]在將一維近紅外光譜數據轉換為二維數據的基礎上結合二維卷積神經網絡(2?DCNN)提出一種鑒別煙草產地的方法。實驗結果表明,提出的新方法分類準確率為93.05%,可以快速鑒別煙草的產地。Yan 等[12]提出并實現了通過卷積神經網絡結合NIRs 數據對植物藥產品商業化生產過程的在線實時監控。孟詩語等[13]提出了一種CNN 模型結合NIRs 數據判別木材等級的方法,經過多種數據處理方法的對比,利用已構建的卷積神經網絡模型,選取樣本識別準確率和模型構建過程中的損失值為判定指標,得到最佳的預處理和數據壓縮方法。實驗結果證明構建的分析模型可以有效地處理光譜數據和識別區分不同等級木材的關鍵特征,從而為廣闊的木材市場提供一定的技術支持。劉曉瑜[14]創新性地將卷積神經網絡算法結合近紅外光譜分析應用在對冷鮮豬肉的判別上,其實驗表明基于CNN 的判別模型相比傳統模型可以獲得更好的預測結果,證明基于CNN的冷鮮豬肉判別模型可行且有效;其次,通過對比不同預處理方法、不同訓練集數量,探究其對模型預測結果的影響,從多個角度分析了卷積神經網絡算法的優勢。Liu 等[15]利用卷積神經網絡構建分類模型,在幾種常見紡織品的NIRs 數據上進行驗證,實驗結果表明能夠實現對幾種常見紡織品的分類。Zheng等[16]提出了一種基于CNN 的近紅外光譜數據分析方法,現場對9 個品牌的4 種藥物進行分類實驗,準確率達97.3%,結果表明該方法具有較佳的識別能力。
深度自編碼器由多倫多大學教授Geoffrey Hinton 和他的學生Ruslan 在2006 年首次在Sci?ence 上提出[17],自那之后便作為深度學習領域的研究熱點,引起了學術界廣泛的關注。DAE是一種典型的深度學習網絡模型,不僅廣泛應用于海量數據建模,相比傳統的淺層學習模型,它具有更優秀的模型表達能力,同時從少量樣本集中也能夠學習到數據的本質特征。通過使用貪婪算法,將各層網絡的重構誤差降至最小,同時對每一層網絡進行訓練,以完成對整個網絡的訓練。對數據采取白化處理和預處理的同時利用無監督算法對輸入的數據在各層進行重構,使網絡對數據內部結構特征的學習更加高效。最后再通過對帶標簽數據使用監督學習算法實現對整個網絡的調優。圖2為深度自編碼器的經典網絡結構。

圖2 經典深度自編碼器網絡結構
楊輝華等[18]先為了消除光譜數據內部特征間的相關性,對琥乙紅霉素真假藥樣本的NIRs光譜數據集進行預處理及白化處理,之后結合稀疏降噪自編碼網絡(SDAE)建立定性分析模型。實驗結果表明,相較于BP 神經網絡以及SVM 算法,稀疏降噪自編碼網絡在準確性和魯棒性方面均更優。路皓翔[19]提出能夠有效鑒別柑橘黃龍病的堆棧降噪自編碼結合隨機森林(SDAE?RF)方法和壓縮自編碼結合極限學習機(CAE?ELM)方法。為了提高SDAE 網絡分析模型準確率和縮短運行時間,將隨機森林與SDAE結合代替其頂層的Softmax 分類和反向微調階段;利用引入雅克比矩陣的CAE 網絡對樣品光譜進行特征提取,通過采用極限學習機代替CAE 網絡的Softmax 分類和反向微調階段,降低CAE 網絡時間復雜度的同時提高了預測準確率。甘博瑞等[20]提出一種以堆棧壓縮自編碼網絡(SCAE)為基礎建立的光譜定性分析方法,可以取代傳統的特征提取方法更好地學習內部結構特征。將此方法應用于多類別藥品的光譜分析,可以有效地鑒別不同廠家生產的同種藥品。Zhou 等[21]提出了一種在稀疏降噪自編碼器(SDAE)基礎上構建定性分析模型的方法,結合近紅外光譜數據能夠有效識別藥物。Le[22]通過基于堆疊稀疏自編碼器和ELM 相結合的方法構建分析模型,實驗結果表明該模型在公開的玉米和水稻的近紅外光譜數據集上能夠得到優于其他經典NIRS 數據分析方法的準確率。Liang等[23]提出了一種基于稀疏自編碼器(SAE)與遺傳算法(GA)的MSC?SAE?GA 模型。并在小麥籽粒和面粉的NIRs 數據集上進行了研究,實驗結果表明提出的NIRs 定性分析模型的分類準確率可達100%。
深度信念網絡是Geoffrey Hinton 教授在2006年于Science 雜志上提出,屬于人工智能深度學習領域,具有非線性激活功能[24],與傳統的淺層學習方法相比,DBN 擁有更復雜的非線性和高層次特征提取能力,對非線性函數的表達能力更強,可以抽取更加有效的特征信息,提高分類和預測的準確率。圖3為深度信念網絡的經典結構。

圖3 經典深度信念網絡結構
為快速判別蓮子粉的真偽,胡仁偉等[25]提出一種基于近紅外光譜技術和深度信念網絡(deep belief network,DBN)方法的蓮子粉摻雜數據鑒別模型。通過支持向量機(SVM)方法獲得蓮子粉數據分類的帶標簽結果,之后使用構建的分析模型對未知樣品類別的數據進行判別。實驗表明采用DBN 算法可以使模型有效避免局部最優問題和應對無大量標簽樣本的情況。對于近紅外光譜樣本數據量大、維度高等問題,以及近紅外光譜內部波長間的相關性和與目標值之間的非線性關系,張萌等[26]提出利用深度信念網絡算法對近紅外光譜數據建模,該算法無需關于光譜數據的先驗知識就可以對光譜自身的特征進行提取,只要設置的頂層隱層節點數低于輸入光譜的維度,就可以在對光譜數據特征提取的同時也能夠對數據降維,實驗通過決策系數、均方根誤差等模型指標表明了所構建模型的可行性。
王靜等[27]提出一種基于DBN 和SVM 相結合的方法構建NIRs 數據的多分類模型。實驗證明通過DBN?SVM 算法構建的模型可以有效地學習NIRs 的特征內部結構并得到很好的分類結果,同時在魯棒性等各項模型指標上也更優。針對近紅外光譜數據特征往往復雜的現象,伏為峰[28]通過深度學習在特征提取階段展現出的優勢與傳統分類器良好的分類能力構建分析模型,結合深度信念網絡(DBN)與隨機森林(RFS)提出了一種新的藥品鑒別方法。實驗表明,DBN?RFS具有良好的藥品鑒別能力,同時隨著數據特征維數的增加,DBN?RFS 越發體現DBN 在復雜特征下進行特征提取的優越性。Yang 等[29]將Dropout機制與DBN 結合對近紅外光譜進行建模,實驗表明Dropout?DBN 方法可以有效避免小樣本數據的過擬合問題,鑒別小樣本藥物的效果相比SVM 等經典商業算法的性能更佳。Wu等[30]結合深度信念網絡和NIRs 分析技術提出了一種古陶瓷年代分類方法,實驗結果表明相比一些傳統的分類方法,提出的方法準確率更高,可達93.5%,證明了DBN方法的優越性。
本文分別對深度學習相關的理論思想作出了介紹,并說明了深度學習相較傳統學習方法的優勢,著重介紹了卷積神經網絡、深度自編碼器、深度信念網絡三個模型在NIRs 定性分析領域的應用,為后續深度學習在NIRs 定性分析領域的應用提供了參考。但深度學習可解釋性和可重復性不強限制了其在光譜分析領域的推廣,因此如何克服這些困難將深度學習與光譜分析更好地結合起來,急需廣大近紅外光譜分析領域的研究人員解決。