郭娟,駱德漢,何啟莉,詹燦堅
(廣東工業大學信息工程學院,廣州510006)
電子鼻是一種模仿生物嗅覺的氣味分析裝置,電子鼻系統基本上由傳感器陣列和數據采集系統、計算機和數據存儲系統以及模式識別算法[1]組成。電子鼻傳感器陣列克服了人工感官評定會受周圍環境和個人因素的干擾,這意味著機器嗅覺技術適用于許多領域。首先,它是一種無損檢測從物體[2]表面釋放的揮發物的技術。其次,電子鼻通常攜帶方便,可以隨時隨地檢測氣味。第三,電子鼻具有擴展嗅覺范圍的能力,因為氣體傳感器能夠探測并感知到那些人類聞不到的化學物質[3]。電子鼻在世界上得到了越來越廣泛的應用。電子鼻的發展對人類有很多好處,電子鼻可以在氣味、周圍空氣和呼吸氣體的檢測或分類中發揮重要作用,如食品安全檢測[4]、醫學診斷[5]和環境監測等[6]。對于電子鼻來說,數據預處理算法和分類器體系結構都是影響分類精度的重要因素。
隨著信息技術的飛速發展,智能識別方法已引起人們的廣泛關注。大量的算法被引入嗅覺領域作為氣味識別的方法,如模糊邏輯[7]、遺傳算法、機器學習、人工神經網絡[8]。然而,這些方法大多是在大量訓練數據的基礎上成功運行的。在實際采樣的過程中,由于樣本數量有限,往往只能收集到有限的電子鼻采樣數據。此外,當識別的物質產地不同或者保存方式不同都會有氣味有較大的影響,這會降低訓練后網絡模型的泛化能力,在某些情況下,網絡模型甚至不再適用。因此,針對樣本量有限的小樣本氣味數據,設計的一種有效的識別方法是極為重要的。
本文基于電子鼻采集的不同傳感器響應,通過生成對抗網絡(Generative Adversarial Network,GAN)對小樣本數據進行拓展,結合卷積神經網絡(Convolu?tional Neural Network,CNN)學習擴展樣本數據的特征,最終對物質氣味分類。
生成式對抗網絡(Generative Adversarial Net?work,GAN)主要由兩個子模塊組成:生成器模型(Generative Model,G)和 判 別 模 型(Discriminative Model,D)。發生器G接收從正態分布或均勻分布采樣的潛在隨機矢量,并輸出合成樣本。鑒別器D以訓練樣本或合成樣本作為輸入,輸出一個標量,表示訓練樣本或合成樣本遵循原始數據分布的概率。GAN的理念基于競爭,G的目的是混淆D,D的目的是區分G生成的數據和原始數據集的數據,其流程如圖1所示。

圖1 GAN框架
對于生成器G:Z→X,其中Z為任意維數的噪聲空間;它對應于超參數空間。X為數據空間;目的是得到數據分布。發生器通過在數據空間中擬合數據特征并隨機添加噪聲來生成新的數據。優化的目標函數如下:

其中D(x)表示判別器D對一個原始樣本的評分,D(G(z))表示判別器D一個生成樣本的評分;Pdata表示生成樣本的概率分布,Pdata表示原始數據的概率分布。
卷積神經網絡(Convolutional Neural Networks,CNN)是一種典型的深度學習架構。經過大量圖像數據訓練后,由于CNN具有多層卷積濾波器,因此可以學習捕獲不同級別的特征。每個過濾器都可以充當特定的特征模式提取器,并將它們組合在一起就可以形成功能強大的特征模型。
CNN是一種多層的監督學習神經網絡,隱含層的卷積層和池化層是實現卷積神經網絡特征提取功能的核心模塊。經典CNN神經網絡的基本結構由輸入層(Input Layer)、卷積層(Convolutional Layer)、池化層(Pooling Layer)、全連接層(Full-Connected Layer)以及輸出層(Output Layer)構成,其網絡結構如圖2所示。每一層有多個特征圖,每個特征圖通過一種卷積濾波器提取輸入的一種特征,每個特征圖有多個神經元。

圖2 CNN網絡結構
其中卷積層由多個卷積神經元組成,每個神經元的權值和參數可以通過反向傳播算法得到。卷積層中的卷積濾波器提供輸入數據的壓縮表示,卷積濾波器可以從輸入數據中提取特征,每個過濾器由在網絡訓練階段調整的權值組成。通過卷積層,網絡可以提取輸入數據向量的低層邊緣特征。卷積層的計算公式如下:

其中n為輸入矩陣個數,Xk表示第k個輸入矩陣,Wk表示卷積核的第k個子卷積核矩陣,s(i,j)即卷積核W對應的輸出矩陣的對應位置元素的值。
為了解決訓練數據有限的問題,本文提出了一種結GAN和CNN的分類器方法。首先,將原始樣本分為訓練集樣本和測試集樣本,利用生成的訓練網絡對樣本的數據進行增強,生成大量的模擬樣本。之后,使用生成的樣本和原始樣本混合的樣本訓練基于CNN的深度學習分類器。最后,利用測試樣本對訓練好的分類器進行測試,驗證了該方法對有限數據問題的有效性。
數據集從AirSense公司的PEN3電子鼻收集,PEN3電子鼻是一種通用氣體響應信號采樣儀表,它有10個金屬氧化物氣體傳感器,每個傳感器對不同氣體的靈敏度不同,如表1所示。電子鼻通過把十個傳感器之間的距離控制得非常小,使得因樣本氣味組成成分不均勻的問題得以解決,從而采集而來的氣味數據準確反映出氣味的真實信息。

表1 PEN3電子鼻傳感器陣列詳細信息
使用PEN3收集了7種中藥材的氣敏響應作為數據集,包括:檳榔、高良姜、砂仁、枳殼、莪術、姜黃、牡丹皮等。電子鼻實驗環境溫度為25±0.5℃,233濕度為75±2%。為了保證氣體傳感器響應的一致性,實驗材料的準備和實驗過程嚴格按照下列程序設置:
(1)初始條件下,將需要采集的中藥材放置于一個干凈的燒杯中,并保持不動超過20分鐘,以保證氣味充分揮發;
(2)數據采集之前,對傳感器室進行清洗和校準;
(3)在采集的過程中,每個樣本采集時間為120秒;
(4)重復步驟(1)-(3),每種中藥各取100個樣品。最終的數據集由7類700個數據樣本組成,每類100個樣本,可視化其響應曲線如圖3所示。

圖3 電子鼻數據響應曲線
為了解決小樣本數據下的氣味識別問題,本文建立了基于GAN的數據增強模型。首先,我們采集到的電子鼻信號轉換為灰度圖,將氣味識別問題轉換為圖片分類問題。在數據預處理階段,主要目的是樣本數據生成拓展,建立了數據生成網絡模型GAN模型,具體流程如圖4所示。當原始樣本輸入GAN模型時,GAN生成器會對樣本數據進行擴展,得到大量與原始樣本相似的偽樣本。原始樣本與生成的偽樣本相結合,形成新的混合樣本。

圖4 數據預處理過程
在模型訓練過程中,首先對生成器和判別器的模型參數進行初始化。其次,在生成樣本后,固定生成模型,并訓練判別器模型,使生成的樣本與真實樣本盡可能準確地進行區分。然后,經過多次更新后,對鑒別器模型進行固定,對生成模型進行訓練,使生成的數據與真實數據的差異最小化。最后,重復上述步驟,直到模型參數穩定。
本文中根據數據預處理部分生成的增強數據集,將訓練集數據輸入CNN中進行訓練,卷積層通過計算輸入變量的乘積和來提取特征,ReLU用于引入卷積網絡的非線性,引入最大池化層來減小卷積數據的空間大小。然后,引入一個全連通層來學習高級特征的非線性組合,通過輸出層實現Softmax作為分類器識別氣味標簽。其中卷積神經網絡的參數設置如下表2所示。

表2 CNN參數設置
本文將GAN-CNN模型應用于氣味識別,首先,將電子鼻采集到的氣味信息轉化為灰度圖,將灰度圖輸入GAN進行預處理,得到一個拓展數據集,對于數據集按照7:3比例劃分訓練集和測試集。之后將劃分好的數據集數據輸入CNN模型進行訓練識別。為了更好地展現該方法的識別效果,我們使用同樣的數據集,將該方法與PCA-SVM、PCA-RF、CNN、CNNSVM等多種方法進行對比實驗,實驗結果如表3所示。

表3
從表2中,可以清晰看到,PCA-SVM和PCA-RF在氣味識別上有一定的效果,CNN和CNN-SVM的預測效果更好,均可以達到90%以上。同時,考慮其中本文中提到的GAN-CNN模型準確度可以可達到94.43%,可以認為GAN-CNN適合用作為基于電子鼻的氣味識別算法。
本文提出了一種用于小樣本氣味識別的神經網絡方法,該方法基于生成對抗網絡(GAN)和卷積神經網絡(CNN)相結合的GAN-CNN模型。該方法可用于有限樣本的深度學習,能有效提高分類性能。為此,我們分別與PCA-SVM、PCA-RF、CNN、CNN-SVM等多種方法進行對比實驗,其中GAN-CNN識別準確率最高可達94.43%,效果優于其他算法。