劉弘禹,孟鋼,鄧贊紅,李蒙,常鋆青,代甜甜,方曉東
1中國科學院合肥物質科學研究院,安徽光學精密機械研究所,光子器件與材料安徽省重點實驗室,合肥 230031
2中國科學技術大學,研究生院科學島分院,合肥 230026
空氣和人類呼出氣體中的揮發性有機化合物(VOCs)分子對環境安全和人體健康有著非常重要的影響1,2。VOCs通常是指會對環境和人類健康產生危害的活潑揮發性有機物,是除碳酸、碳酸銨、金屬碳酸鹽、金屬碳化物、一氧化碳和二氧化碳外,能夠參加大氣光化學反應的其它碳化合物,主要具有易揮發和參加大氣光化學反應這兩個特點。VOCs在光照的條件下會與氫氧自由基(OH·)反應形成過氧化烷基(RO2·)與過氧化羥基(HO2·),再與氮氧化合物(NOX)作用即會反應成臭氧(既危害人體呼吸系統也是霧霾的主要成分之一)。VOCs分子的檢測對于室內/室外空氣質量的評估及人體健康狀況的評價至關重要3-5。目前,針對VOCs氣體的檢測方法主要有電化學傳感器法、光離子化檢測(PID)器法、金屬氧化物半導體(MOS)傳感器法、氣相色譜分析法、紅外吸收法及聲表面波法等6。雖然,基于VOCs分子紫外燈激發離子化原理,探測離子化“碎片”形成電流的PID傳感器目前性價比最好。但相比于PID傳感器,MOS氣體傳感器以其所具有的靈敏度高、響應快速、制作簡單和成本低廉等優點7,8,在VOCs氣體檢測的領域占據更為重要的地位,現已成為世界上應用最廣且產量最大的氣體傳感器9。MOS傳感器以表面敏感型為主,其根據傳感材料電阻隨氣體分壓的變化而逐漸減小或增大,利用被測VOCs氣體的吸附作用改變MOS的電阻/電導率,通過電流變化的比較來測試VOCs氣體濃度。目前,在諸多MOS材料中,n型氧化物(SnO2、In2O3、WO3、ZnO和γ-Fe2O3)和p型氧化物(CuO、NiO和Co3O4)表現出顯著的氣體傳感特性10,11。其中基于穩定性較高的SnO2、ZnO和WO3等氧化物半導體敏感材料的氣體傳感器受到廣泛關注,研究者們通過這些傳感器實現了對不同檢測環境中VOCs氣體濃度的測定12。
伴隨著工業4.0時代的到來,人類社會將進入萬物互聯的新時代,傳感器及傳感技術的發展將成為第四次工業革命的關鍵。然而,在實際復雜的氣體環境中,單一MOS氣體傳感器往往存在著交叉敏感這一嚴重缺陷,其對多種氣體均有一定的響應。因此,實現對目標氣體分子種類有選擇性的識別檢測很難,這成為制約MOS氣體傳感器繼續發展的瓶頸,也成為阻礙物聯網(IoT)時代機器嗅覺技術發展的最大障礙。研究人員為提高MOS傳感器的選擇性做了大量的努力。其中最直接的策略是促進傳感器對特定VOCs氣體分子的響應,通過改進傳感器的材料、結構和測試方法,提高其對特定氣體的靈敏度與選擇性,最終設計特定的氣體傳感器,實現所謂的“一對一”的傳感測試功能13。大量研究通過改進MOS傳感材料的表面性能(包括缺陷控制、貴金屬納米顆粒修飾、設計異質/復合傳感通道等)4,14-19、改變工作溫度20和施加柵壓等手段13,21,在探究傳感器對特定VOCs氣體分子/MOS界面電荷交換方面取得了重大進展。但是,由于MOS傳感材料對VOCs氣體均具有廣譜效應,因此,對傳感材料的修飾、開發和摻雜無法從根本上優化傳感器的選擇性能。除非待檢測氣體分子濃度受到限定,不然僅憑單一傳感器的氣敏響應信號來區分氣體分子仍然十分具有挑戰性。
為了從根本上提高MOS傳感器的選擇性,20世紀80年代,英國華威大學的Dodd和Persaud提出了一種模仿動物嗅覺系統的方法(電子鼻),采用具有不同表面化學性質的傳感器組成的傳感器陣列來提升其對VOCs分子選擇性22。同步測量恒溫傳感器陣列可大幅提高氣敏信號采集數量和采集效率。通過增加傳感器陣列的數量,可以提取更多的氣體分子“特征”,并通過信號處理和模式識別算法來實現特征分析,從而提供了一種“多對一”或“多對多”的氣體識別方法23,24。
采用結合氣體傳感器陣列信號和模式識別算法的電子鼻技術(圖1a)雖然可以改善MOS傳感器選擇性差的難題,但是由于陣列技術所需采用的傳感器數量較多,而現有可靠、穩定的MOS傳感器種類較少。同時,陣列傳感技術不僅增加了元件的數量還使系統的功耗和體積增大,大幅度增加了識別系統的成本25。因此,研究者們進一步提出了通過改變傳感器測試方式以及對現有的特征提取和模式識別方法進行改進,以提高單個MOS氣體傳感器的選擇性。不同于電子鼻擴大傳感器陣列的策略,基于單個MOS傳感器熱調制測試的方法被用于探索和增強MOS傳感器的氣體識別性能26-28。與傳統的恒溫測量(圖1b)不同,在一個測量周期內,MOS傳感器的測試溫度被設定調節(圖1c)。由于氣體測試過程中,傳感材料表面的氣體吸附、界面氧化還原反應和解吸等分子傳感的關鍵過程都與溫度有關7,29。通過調節傳感器的工作溫度,可以有效地控制分子吸附和分子/MOS界面的電荷交換。此外,在測試的MOS傳感器表面,不同氣體分子的吸附構型是存在差異的,同一傳感器上不同分子的熱力學和動力學響應不同。因此,熱調制響應信號可能包含了被吸附氣體分子的充分特征,可以用來對不同氣體分子進行分類識別30。現有研究報道了基于各種熱調制波形(三角形、方形、正弦、階梯形等)和時頻變換的信號特征提取方法下(快速傅里葉變換、離散小波變換等) MOS傳感器的氣體識別性能31-34,實現了單個MOS傳感器對還原性氣體(CH4、NH3、CO和H2)35、醇類27,36和農藥32的成功分類識別。所有這些研究結果都證明,單個MOS傳感器可以實現對VOCs氣體分子的“一對多”識別。本綜述主要介紹了提升MOS傳感器選擇性的研究進展,闡述了現有傳感材料性能提升、電子鼻和熱調制技術方法所存在的問題和未來的發展趨勢,詳細介紹了目前機器嗅覺領域主流的主成分分析(PCA)、線性判別分析(LDA)和神經網絡(NN)機器學習算法,并對未來機器嗅覺領域AI算法的發展趨勢做出展望。
圖1 (a)人類嗅覺和電子鼻系統原理圖39;(b)恒溫穩態測試響應信號40;(c)溫度調制測試響應信號41Fig. 1 (a) Schematic diagram of the human olfaction and e-nose system 39; (b) Response signal of isothermal test 40; (c) Response signal of thermal modulation test 41.
自1962年日本的Seiyama等37制備了首個基于ZnO的氣敏元件,研究人員不斷開發出新型MOS敏感材料。根據敏感材料與目標氣體間作用方式與敏感機理的不同,MOS氣體傳感器可分為表面電阻控制型和體電阻控制型兩種,其中表面電阻控制型傳感器利用MOS敏感材料表面化學吸附氧與目標氣體發生電子交換后引起的MOS材料電阻變化來檢測氣體,而體電阻控制型傳感器通過目標氣體與敏感材料內部部分晶格氧反應,晶體中結構缺陷發生變化從而改變MOS材料電阻實現氣體檢測。表面電阻控制型MOS傳感器應用更加廣泛,其基本氣敏原理主要可以通過吸附氧模型和晶界勢壘模型來解釋。吸附氧模型涵蓋了材料的氧吸附脫附、氣體擴散和氧化還原反應等諸多理化過程,當敏感材料暴露于空氣中時,吸附在MOS表面的氧分子從半導體導帶奪取電子形成活性氧離子、O-和O2-38,n型MOS顆粒殼層處產生空間電荷耗盡層,而在p型MOS顆粒表面形成空穴積累層(圖2a)。
當敏感材料與還原性氣體接觸時,敏感材料表面的活性氧離子(、O-和O2-)與還原性氣體反應,釋放電子到材料導帶中,而當敏感材料暴露在氧化性氣體中時,目標氣體將進一步奪取材料中的電子導致耗盡層/空穴積累層的厚度變化,進而影響MOS材料電阻。對于多晶MOS氣敏材料還需考慮晶界勢壘模型,敏感材料晶粒表面形成空間電荷層使得晶粒間接觸的界面(晶界)存在晶界勢壘,流過敏感材料的電流需克服晶界勢壘。
其中kB為玻爾茲曼常數,qV為勢壘高度,I0為溫度T和氧分壓P0下的相關常數。以n型MOS為例,還原性氣體與晶粒表面吸附氧離子反應,釋放自由電子導致晶界勢壘高度降低并降低材料電阻,而氧化性氣體能進一步俘獲材料表面導帶中的自由電子,從而使晶界勢壘增大增加材料電阻。
基于對MOS氣體傳感器選擇性提升的需求,研究人員在敏感材料形貌尺寸調控42-45、碳納米/MOS材料復合46-50、金屬粒子修飾4,51-55和金屬離子摻雜56等方面做了大量的研究工作,在提升敏感材料性能促進傳感器對特定目標氣體分子的靈敏度方面取得了重大進展(表1)。近年來,碳納米材料(碳納米管和石墨烯等)與MOS材料的復合材料對VOCs表現出相對較高的靈敏度和較快的響應速度,逐漸成為目前提升傳感器靈敏度和選擇性等性能的一個研究熱點。如表1所示,相比于其它碳納米材料,石墨烯或還原氧化石墨烯(rGO)與MOS材料的復合材料應用研究最多。石墨烯材料具有優異的電學和熱學特性,單層理想石墨烯室溫下的電子遷移率可高達1.5 × 104cm2·V-1·s-1,受溫度影響小且是目前已知的室溫下電阻率最低的材料57。石墨烯敏感材料在不同的氣體環境中具有較小且相似的電阻變化,較低的靈敏度和選擇性阻礙了其在氣體傳感中的應用。將石墨烯材料和MOS材料復合,可以充分利用兩者理化性質的優勢,降低敏感材料的電阻和工作溫度,改善氣敏靈敏度和選擇性。2017年Kim等49采用微波法制備了石墨烯-SnO2納米復合材料(圖2b),該氣敏材料在150 °C工作溫度下對1 ppm (1 ppm = 1 × 10-6,體積分數)的二氧化氮氣體達到24.7的高靈敏度響應。相比于二氧化硫、氨氣和乙醇氣體,石墨烯-SnO2納米復合材料對二氧化氮氣體有優異的選擇性。除了界面電子遷移的改善外,復合材料表面Sn間隙缺陷的產生和石墨烯-SnO2異質結的形成也是傳感器對二氧化氮氣體具有優良氣敏性能的重是傳感器對二氧化氮氣體具有優良氣敏性能的重要原因。
圖2 (a) n型和p型氧化物半導體的電子核殼結構圖38;(b)微波輻射產生的石墨烯-SnO2納米復合材料的形態圖49;(c)石墨烯與SnO2量子點修飾的ZnO納米結構在不同氣氛下界面的能帶結構示意圖46;(d) SnO2和Ag修飾SnO2的氣敏機理原理圖58Fig. 2 (a) Electron core-shell structure of n-type and p-type oxide semiconductors 38; (b) Morphologies of the graphene-SnO2 nanocomposites generated by the microwave irradiation 49; (c) Schematic diagram of band configuration at the interface of the GQD-SnO2/ZnO nanostructure in different atmospheres 46;(d) Schematic diagrams on the gas sensing mechanism of pure SnO2 and Ag-decorated SnO2 58.
表1 MOS材料氣敏性能提升的主要方法Table 1 Main methods of performance improvement for MOS materials.
晶粒尺寸是影響MOS傳感器靈敏度和選擇性能的重要因素,Yamazoe研究團隊系統研究了SnO2敏感材料的晶粒尺寸(5-32 nm)對氣體靈敏度的影響,發現當SnO2納米顆粒粒徑小于10 nm時,氣敏性能大幅提升59。粒徑在1-10 nm的顆粒稱為量子點,是具有高表面活性的低維納米材料。MOS量子點材料的晶粒半徑小于電子耗盡層或空穴積累層的厚度,空氣中晶粒呈現體耗盡或體積累狀態,在與目標氣體接觸時能呈現較大的電阻變化。發展高性能量子點氣體傳感器的難點在于量子點功能結構的理性設計與有效調控,2017年Zhang等43通過簡單的溶液法合成了具有晶體和溶液雙重性質的膠體ZnO量子點,利用旋涂技術制作了基于膠體ZnO量子點的氣體傳感器。氣敏測試結果表明,相比于二氧化氮、二氧化硫和氨氣,該傳感器對硫化氫氣體具有較高的靈敏度、良好的選擇性和較快的響應恢復時間,其在室溫下對50 ppm的硫化氫氣敏響應達到113.5,響應和恢復時間分別為16和820 s。2020年Shao等46研究了石墨烯和SnO2量子點修飾的ZnO納米片材料,提出p型石墨烯和n型SnO2/ZnO之間的強協同效應和p-n異質結的形成有效地增大了因氧吸附變化引起的電阻變化(圖2c)。與原始ZnO傳感器相比,石墨烯和SnO2量子點修飾的ZnO納米片敏感材料在室溫下對硫化氫氣體具有非常高的靈敏度和良好的選擇性,其在室溫下對100 ppb (1 ppb = 1 × 10-9,體積分數)的硫化氫氣體的靈敏度為15.9,響應和恢復時間分別為14和13 s。
通過摻雜和表面修飾將單個或混合金屬粒子與MOS材料復合,也是提高氣體傳感器氣敏性能的常用方法。早在1967年,美國的Shaver60就提出可以將金屬鉑等作為催化劑摻雜在WO3薄膜中來提高WO3薄膜對空氣中的氫和其他還原性氣體的靈敏度。修飾在MOS材料表面的金屬粒子會與MOS形成金屬-MOS接觸的肖特基勢壘,金屬粒子本身有很強的氧吸附特性,其表面吸附氧從半導體中汲取電子,進一步加深了材料近表層電子耗盡層/空穴積累層的厚度(圖2d),進而增大了敏感材料與目標氣體接觸時的電阻變化和氣敏反應速率。現有研究發現,MOS表面修飾的金屬粒子尺寸、濃度和連接構型對提升MOS材料的氣敏特性至關重要,當金屬粒子尺寸小于10 nm時,其催化性能顯著提升58。因此,通過不同合成方法合成不同形貌結構的小尺寸金屬納米粒子來提升MOS的靈敏度和選擇性也是目前研究人員熱衷的研究熱點。2020年,Chen等51采用電紡絲法制備了多孔In2O3納米纖維,并采用熱蒸發法制備了修飾In2O3納米纖維的納米鋅。與純In2O3納米纖維相比,Zn-In2O3復合納米纖維對二氧化氮有更高的氣敏響應和更好的選擇性,在50 °C工作溫度下對5 ppm二氧化氮的響應可達130。
由于MOS敏感材料對VOCs氣體的廣譜效應,對MOS材料的開發、復合、修飾和摻雜目前還無法從根本上解決MOS傳感器選擇性的問題。但基于MOS敏感材料性能提升的研究在增加MOS傳感器多樣性、提升傳感器對目標氣體靈敏度、降低傳感器最優工作溫度和響應回復時間等方面均取得了重大進展。這為后續結合機器嗅覺技術實現(痕量)氣體分子的快速、準確識別提供了重要保障。
氣體傳感器陣列技術,也被稱為電子鼻技術(E-nose)61,是一種有效改善MOS傳感器選性的方法。受人類嗅覺系統的啟發,電子鼻是由多個具有部分特異性的電子化學氣體傳感器構成的陣列和適當的模式識別算法組成的儀器裝置,能識別簡單和復雜的氣體。
圖1a給出了電子鼻系統的原理框圖,其主要由氣體傳感器陣列、信號采集與預處理單元以及模式識別算法三部分組成39。該技術由英國華威大學的Dodd和Persaud在1982年提出22,并在過去的幾十年里得到了許多研究人員的進一步發展和評估40,41,62-65。1993年,Gardner和Bartlett首次將電子鼻定義為“一種儀器”62,1998年,Corcoran等66采用8種商用SnO2傳感器組成的傳感器陣列結合一種遺傳神經網絡(GNN)模式識別算法,實現了對三種散裝茶葉的香氣分類任務。2003年,Srivastava67介紹了一種基于不同摻雜的4個SnO2氣體傳感器陣列(圖3a)和反向傳播神經網絡(BPNN)算法的電子鼻系統設計與開發方法,該系統成功用于識別與環境監測有關的丙二醇、甲醇、丙酮、己烷、苯和二甲苯等VOCs氣體。同年,Penza等68應用主成分分析(PCA)結合BPNN的信號處理算法,實現了4個傳感器識別甲醇(20-140 ppm)和異丙醇(5-70 ppm)氣體二元混合物中的單個氣體。2016年,Sudarmaji等69使用6個商品MOS氣體傳感器組成的傳感器陣列(圖3b),采用PCA和BPNN作為模式識別工具,測定了不同劑量養分添加后的土壤上部靜態氣體,驗證了傳感器陣列能夠清晰地區分土壤類型和土壤中養分的添加水平(圖3c-e)。2017年Acuna-Avila等65采用不同熱處理條件下所得的ZnO薄膜傳感器陣列(圖3f)鑒別了真假龍舌蘭酒,線性判別分析(LDA)和BPNN的識別結果分別達到了100%和86.3%的成功率(圖2g)。由此可見,大多數電子鼻均使用交互式傳感器陣列,對敏感材料表面的目標分析物進行反應(例如吸附、解吸和/或可逆反應等)。同時,將被測分析物與傳感器陣列之間的具體響應記錄下來,并將其轉換為可讀的數字值,根據統計模型進行計算,實現對不同VOCs氣體/氣味的識別70。
圖3 電子鼻陣列與模式識別算法:(a) SnO2的厚膜氣體傳感器陣列示意圖67;(b)捕獲土壤氣體信號的電子鼻系統框圖69;PCA對不同施肥量不同土壤類型上部氣體的預測 (c)沙壤土,(d)沙土,以及(e)不考慮土壤類型69;(f) ZnO薄膜傳感器陣列平臺65;(g) LDA分析真假龍舌蘭酒65Fig. 3 E-nose arrays and pattern recognition algorithms: (a) Schematic diagram of SnO2-based thick film gas sensor array 67; (b) Block diagram of e-nose system for capturing soil gaseous profile 69; PCA mapping for soil gaseous pattern projection for each soil sample (c) on sandy loam soil, (d) on sand soil, and (e) irrespective of soil type 69; (f) Sensor array platform of ZnO thin film 65; (g) LDA mapping of the Tequila and false Tequila 65.
隨著物聯網(IoT)的蓬勃發展和廣泛應用,對電子鼻這一基于物聯網基石(傳感器網絡)的氣體檢測儀器裝置有著巨大的需求,其在對氣體定性或定量測量分析方面具有諸多優勢,主要包括傳感結果的高一致性和高再現性;獲得測試結果的時間短,分析的吞吐量高;儀器的永久可用性和可靠性;對一種氣體/香味的非破壞性和全局性分析;對測試氣氛溫度的容忍能力強;分析物的毒性不受限制,且能連續監測等。但是,由于陣列技術所采用的傳感器數量較多,不僅增加了元件的數量還使系統的功耗和體積增大,這就大幅度增加了識別系統的成本。因此,通過日益成熟的微機電系統(MEMS)技術來減小傳感器尺寸,同時結合各種調制手段對現有的測試分析方法進行改進,以最大化提高每個傳感器所能收集到的氣體響應特征,成為電子鼻技術的未來發展方向。
MOS氣體傳感器的氣敏特性受器件加熱溫度的控制和影響,其在不同工作溫度范圍對不同VOCs氣體的氣敏響應有所不同。因此,可將MOS氣體傳感器的工作溫度調制在不同的變溫模式下,測試傳感器在給定溫度模式下對不同VOCs氣體的動態響應信號,再結合信號處理技術和模式識別算法,達到對氣體分類、識別和量化的目的。圖4列舉了熱調制(Thermal modulation,TM)系統的測試平臺圖71,這種MOS氣體傳感器的熱調制技術將陣列技術的空間拓展方式轉換為時間拓展方式,有效利用了氣體傳感器的溫度依賴特性,大幅度降低了VOCs氣體識別檢測設備的體積和功耗。
圖4 熱調制測試平臺圖71Fig. 4 Thermal modulation platform diagram 71.
溫度對MOS傳感器的許多性能有很強的影響,其中包括氧化還原反應的速率常數(kR)和氣體的克努森擴散系數(DK)。同時,MOS表面氧化還原過程的發生,前提還需要克服活化能(Eb)。
其中Ns為半導體表面負電荷密度,Nd為半導體中電荷的密度,εr為半導體的介電常數,ε0為真空介電常數,q為基本電荷。因此,在對目標測試氣體加以區分時,可以考慮氧化還原反應的速率常數、目標氣體的擴散系數和反應活化能等參數特征。
現有研究普遍使用一些隨意的方法來選定熱調制的波形和溫度范圍,且缺乏統一一致的響應信號優化處理與特征提取過程,因此使得通用識別模型的推導非常具有挑戰性。然而,在過去幾年中,基于模型優化的優勢變得非常明顯。為了能夠客觀地比較各種熱調制方式,將傳感器響應的定義擴展到準靜態傳感器響應Sqs(t)的概念,即在每個溫度周期內定義好時間t的準靜態傳感器響應。
據報道,準靜態傳感器響應在某些情況下可以用類似于平衡條件的冪次法則來估計72,73,且在某些情況下,熱調制下傳感器響應與恒溫運行相比有很大的改善。在其他情況下,由于熱調制中的材料表面氣體覆蓋可能遠離平衡,準靜態傳感器響應將小于恒溫氣敏響應74,75。考慮到溫度對傳感層電導的影響,從電導G被熱激活開始,受導帶電子的統計分布影響,熱激活幾乎是隨溫度變化而立即發生的。但是由于活化能達到平衡需要相當長的時間,材料表面的氧化還原過程更加復雜。
其中G0表示(假設的)平帶情況下MOS顆粒膜的電導。
最早報道MOS氣體傳感器熱調制技術的資料來源于一項美國專利,1975年作者Le Vine76提出了溫度調制技術來用于CO氣體的檢測,通過控制傳感器加熱溫度來對CO氣體進行高溫清洗和低溫檢測,該技術現已被Figaro公司的CO傳感器所采用。之后,Eicker77于1977年申請了一個將傳感器控制在高低不同的溫度而識別甲烷干擾下沼氣中CO的發明專利。Lee等34于1999年報道了采用鋸齒波、方波和三角波等熱調制波形控制傳感器的加熱模式,以此來實現對不同類型的VOCs氣體識別的研究進展。此后,Nakata等78-80通過對SnO2傳感器大量熱調制測試研究,發現對目標氣體的熱調制響應應該用幾個與溫度相關的速率常數來表示,在評估氣體傳感器時應該考慮這些常數。為此,他們提出了一種基于快速傅里葉變換(FFT)的頻域特征提取方法,希望通過該方法隱式地反映相關的速率常數。
在接下來的十幾年里,研究者們開展了多項采用熱調制響應信號(圖5)結合信號處理技術和模式識別算法(圖6)實現氣體識別的研究。2006年,中國科學院合肥智能機械研究所劉錦淮課題組利用單個SnO2傳感器在周期50 s的方波熱調制(250-300 °C)下,結合離散小波變換(DWT)和反向傳播神經網絡(BPNN),實現了對10-250 ppm濃度范圍內CO的定性分析81。同年,葛海峰等82研究了周期50 s的正弦熱調制加熱電壓下(0-5 V),商用半導體氣體傳感器對50-1000 ppm范圍內氫氣、一氧化碳和乙烷的響應特性,并結合DWT,對比了BPNN和兩種支持向量機(SVM)算法對氣體混合物識別準確性的差異。實驗結果表明,在小樣本氣體混合物識別中,分布式SVM的氣體識別性能優于單一SVM,各種SVM的氣體識別準確率(89.7%-90.8%)均高于BPNN (86.7%)。相對于BPNN算法,SVM無局部極小值問題,更適合解決小樣本下的非線性問題,可以很好的處理高維數據集,泛化能力比較強。2012年,美國Dattoli83研究了周期76.8 s的階梯波溫度(范圍194-373 °C)和電壓(范圍-5 - 5 V)雙調制下(圖5a),SnO2納米線氣體傳感器的調制響應,結合線性判別分析(LDA)模式識別方法實現了對三種VOCs氣體(丙酮,乙醇和甲基乙基酮)的識別。2012至2014年,伊朗Amir等27,71,84研究了各式矩形加熱電壓脈沖下(圖5b-d),SnO2類傳感器對100-2000 ppm甲醇、乙醇、正丁醇等VOCs氣體或其它不同濃度復雜氣味(草藥/香料)的響應特性,并采用DWT的特征提取方法,對比了PCA、LDA和分類器集合下的氣體識別準確性差異(圖6a-c)。2015年,Hosseini-Golgoo等85分別采用BPNN(圖6d)、徑向基函數神經網絡(圖6e)和模糊神經網絡(圖6f),對5階階梯電壓波(每階周期20 s)熱調制下(圖5e)SnO2氣體傳感器的VOCs氣體響應模式進行建模和特征提取,將隱藏層神經元權值作為目標氣體的判別特征向量,通過結合LDA算法比較了三種神經網絡的特征提取與識別性能(圖6g-i)。結果表明,采用BPNN隱藏層神經元權值結合LDA算法的識別模型未能實現對VOCs氣體的分類識別,但模糊神經網絡和徑向基函數神經網絡隱藏層神經元權值結合LDA算法的識別模型對氣體的分類效果較好,識別準確率分別達到96.27%和90.74%。基于上述識別模型,三種神經網絡中局部線性模型樹算法訓練的模糊神經網絡具有最優的氣體識別魯棒性能。
圖5 熱調制波形:(a)溫度和電壓雙調制的階梯波83;(b,c)兩種矩形加熱波形及其各自的傳感響應71;(d)一種帶有電壓尖峰的微加熱器沖擊偏壓波形84;(e)加熱波形、托盤溫度和電導的響應變化85Fig. 5 Thermal modulation waveform: (a) Step waveform of temperature and voltage modulation 83; (b, c) Two rectangular heating waveforms and the corresponding sensor responses 71; (d) A microheater shock biasing waveform with a voltage spike 84; (e) Temporal variations of heating waveform, pallet temperature and electrical conductance 85.
圖6 (a,b)六類草藥/香料氣味信號的LDA映射84;(c)多種VOCs氣體響應信號的PCA映射27;(d)反向傳播神經網絡85;(e)徑向基函數神經網絡85;(f)局部線性模糊神經網絡85;(g-i)基于神經網絡權值的特征向量LDA映射85Fig. 6 (a, b) LDA mapping for odor signals of six herbs/spices 84; (c) PCA mapping for response signals of various VOCs gas 27; (d) Back propagation neural network 85; (e) Radial basis function network 85; (f) Local linear neuro-fuzzy network 85; (g-i) LDA mapping of feature vectors from neural network weights 85.
從現有研究來看,基于信號特征提取和模式識別的熱調制技術仍處在發展階段。其主要問題在于,傳統的模式識別方法下通過分析傳感器原始電阻/電導信號無法有效的實現低濃度、低靈敏度和復雜氣體的識別分類。當采用時頻域轉化的特征提取方法(如FFT和DWT)時,特定“頻域特征”的選取往往又太過主觀,特征選取以結果為導向且缺乏原理解釋,無法根本上實現智能識別,阻礙了熱調制系統的產業化發展。因此,如何從原理出發,統一信號處理過程,客觀挖掘傳感器響應信號中目標氣體的參數特征,在較少的運算代價下,多角度挖掘氣體分子特征,排除冗余信息并結合高性能魯棒性AI算法實現智能分類是熱調制技術未來研究的主要方向。
主成分分析(PCA),也稱主分量分析或矩陣數據分析,是一種常用的線性降維方法。其目標主要是通過某種線性投影方式,將高維的數據樣本映射到低維的空間中進行表示,進而可以使用較少的數據維度,同時期望在所投影的維度上數據的方差最大化,通過衡量投影方向上數據方差的大小來判斷該方向的信息重要性程度,以此保留原數據點所具有的主要特性。由表2可知,PCA算法廣泛運用于醫療保健86,87、食品行業88-90、環境監測27,71,91,92、公共安全93,94和農業生產95-100過程中氣體的分類識別研究。由于PCA方法追求的是最大化保留數據包含的信息,往往投影后產生的數據區分作用并不大,甚至有時可能使得數據點揉雜在一起無法區分。這導致PCA算法在很多情況下的氣體分類識別效果并不好。因此,在MOS傳感器的電子鼻和熱調制技術領域,該類無監督模式識別方法逐步被基于監督學習的模式識別方法所替代或作為數據降維的步驟與其他模式識別方法結合使用。
表2 主成分分析在氣體識別中的主要應用Table 2 Main applications of PCA in gas recognition.
線性判別分析(LDA)屬于監督學習的降維方法,其數據集的每一個樣本都是有類別輸出。由于PCA方法是不考慮樣本類別輸出的無監督降維技術,LDA和PCA方法有明顯區別。用一句話來概括LDA方法的思想,就是“投影后類間方差最大,類內方差最小”。即樣本數據在低維度空間內投影后,希望不同類別數據的類別中心之間的距離盡可能的大,而同種類別數據的投影點則盡可能的接近。表3列舉了LDA算法在氣體分類識別中的應用,其在醫療保健101、食品行業84,102-106、環境監測61,107,108、公共安全109,110和農業生產60,111-114等領域對氣體分子的分類識別效果優于PCA算法。
表3 線性判別分析在氣體識別中的主要應用Table 3 Main applications of LDA in gas recognition.
LDA算法既可以用來降維,又可以用來分類。通常LDA分類方法假設每個類別的樣本數據符合正態分布,經過LDA方法投影后,可利用極大似然估計來計算每種類別投影數據的方差和均值,從而得出各類別正態分布的概率密度函數。當測試一個新的樣本時,可以將投影后的該樣本特征分別代入各個類別的正態分布概率密度函數中,并通過計算出該樣本屬于各類別的概率,選取最大概率對應類別作為該測試樣本的預測類別。目前,LDA作為信號數據降維或模式識別算法廣泛應用于MOS傳感器的電子鼻和熱調制技術領域,其主要適用于小樣本數據集下的識別分類研究。
人工神經網絡(ANN)也可簡稱為神經網絡(NN),是一種通過模仿動物神經網絡行為特征,進行分布式并行信息處理的數學算法模型。該網絡依靠模型的復雜程度,通過調整內部大量隱藏節點之間相互連接的關系,從而實現處理信息的目的。其最基礎結構感知機如圖7a所示,它由若干輸入和一個輸出構成。感知機的輸入和輸出之間采用一個線性關系,得到中間輸出結果,之后通過神經元的激活函數計算從而得到輸出結果1或-1。該基礎模型僅限于二元分類使用,并且無法學習較復雜的非線性模型。
圖7 (a)感知機模型圖;(b)多層神經網絡結構圖;(c) LeNet-5結構圖128;(d) AlexNet結構圖129Fig. 7 (a) Perceptron model; (b) Structure of multilayer neural network; (c) Architecture of LeNet-5 network 128;(d) Architecture of AlexNet network 129.
將單個感知機作為一個神經網絡節點,然后用此類節點組成一個層次網絡結構,當網絡的層次等于1 (無隱藏層)層時,稱為單層神經網絡。當網絡的層次大于等于2層(隱藏層+輸出層)時,稱之為多層神經網絡或多層感知機(MLP)。通過對感知機模型的擴展,多層神經網絡加入了隱藏層,隱藏層可以有多層,增強了模型的表達能力。同時,輸出層的神經元也可以有多個輸出,代表不同類別,以便模型可以靈活的應用于回歸和分類。并且,其對激活函數做了擴展,通過使用不同的激活函數(Sigmoid、Tanx、Softmax和ReLU等),神經網絡的表達能力進一步增強。
多層神經網絡結構如圖7b所示,神經網絡層可以分為三類,輸入層,隱藏層和輸出層。其中第一層是輸入層,中間的層數都是隱藏層,而最后一層是輸出層。網絡的層與層之間全連接,即第i層的任意一個神經元一定與第i + 1層的任意一個神經元相互連接。網絡的前向傳播算法利用若干權重系數矩陣W、偏倚向量b和輸入值向量x進行一系列線性運算z= ∑wixi+b和激活運算σ(z),從輸入層開始,層層向后計算,一直運算到輸出層,得到輸出結果的值。
反向傳播神經網絡(BPNN)是指基于反向傳播算法調整權重等參數的多層神經網絡。其通過對網絡的損失函數用梯度下降法進行迭代優化求極小值。通過運用反向傳播算法,BPNN可以解決各種監督學習的分類回歸問題。目前,基于反向傳播算法的BPNN及其它ANN作為一種高魯棒性的機器學習分類模型,具有處理大數據集并實現多種類復雜氣體分類識別的潛力,已廣泛應用于MOS氣體傳感器的電子鼻和熱調制技術中(表4)。不同于PCA和LDA提取的特征不具有可解釋性,且算法模型均需要人為設置和調整保留的特征數量,BPNN可以通過訓練學習過程,逐漸優化每一層隱神經層的參數值,自動提取出最能代表原始氣敏響應數據的特征65,85,101,102,113,115-126。相比于同屬監督學習的LDA算法,BPNN及其它ANN算法具有學習能力強、氣體分類準確度高、對響應信號噪聲數據魯棒性和容錯性較強等優點。其能夠逼近任意非線性關系,適用于大數據集下對任意氣體的精確快速分類識別。
表4 人工神經網絡在氣體識別中的主要應用Table 4 Main applications of ANN in gas recognition.
卷積神經網絡(CNN)是在BPNN基礎上發展而來的一種深度學習模型或類似于人工神經網絡的多層感知器,在各種深度神經網絡中應用最為廣泛。目前,CNN在機器視覺的很多問題上都取得了當前最好的效果,另外它在自然語言處理,計算機圖形學等領域也有成功的應用。作為深度CNN的鼻祖,第一個真正意義上的CNN由LeCun在1989年提出127,之后該網絡經過一系列的優化調整并被運用于識別手寫字符(圖7c)128。深度卷積網絡的大發展起步于2012年的AlexNet網絡(圖7d)129,在這之后各種改進的網絡被不斷提出(VGGNet、GoogleNet和ResNet等)130-132。
如圖7c-d所示,CNN架構由卷積層和池化層組合的特征提取層和全連接層(FC)兩部分組成,后部全連接層與常規BPNN架構非常相似,只是輸出層一般使用了Softmax激活函數來做識別與分類。CNN中特有的卷積層主要起到提取特征的作用,對輸入數據卷積其實就是對輸入數據不同局部的矩陣和卷積核矩陣各個位置的元素相乘,然后相加得到。二維卷積過程用公式表達為:
卷積后的輸出一般通過ReLU激活函數,使輸出張量中小于0的位置所對應的元素值調整為0。CNN中的池化層又叫下采樣層,目的是壓縮數據,降低數據維度。通過最大池化或均值池化對輸入張量的各個子矩陣進行壓縮。
CNN的本質也是一種輸入到輸出的映射,其能夠學習大量的輸入與輸出之間的映射關系,而不需要任何輸入和輸出之間的精確的數學表達式,只要采用已知的模式對網絡加以訓練,網絡就可以具有輸入輸出對之間的映射能力。使用CNN時,由于CNN的特征檢測層通過訓練數據進行學習,避免了人為主觀的特征抽取,而是通過隱式地從訓練數據中進行學習。因此,結合CNN的數據降維、特征提取和魯棒性識別分類性能,該深度學習模型有望突破MOS傳感器信號挖掘技術瓶頸,實現多種調制手段與傳感器陣列技術在氣體識別領域的結合運用,為超微型智能氣體分子檢測與識別芯片的研發應用奠定基礎。
MOS傳感器對VOCs氣體的低選擇性阻滯了其在人體健康和空氣質量監測等新興領域的應用。
通過從氣體傳感器的電響應信號中提取特征來提高氣體傳感器的選擇性已經得到了廣泛的研究。除了傳統的增加傳感器陣列數量的策略外,分析溫度調制氣體傳感器的瞬態信號也為提取分子特征提供了一種有效的方法。目前,電子鼻與熱調制技術亟待統一的信號特征提取與模式識別過程,使其能夠客觀高效地挖掘傳感器響應信號中目標氣體的參數特征,在較少的運算代價下,排除冗余信息并結合高性能魯棒性AI算法實現氣體智能分類。
敏感材料性能提升的研究進展為傳感器陣列在低功耗下實現低濃度VOCs氣體的快速識別檢測奠定了基礎。通過采用熱調制與光調制等其它調制手段相結合的技術方法,可以最大化挖掘每個MOS傳感器所能提取的氣體或氣氛特征信息量。基于敏感材料性能的提升、多種調制手段與陣列技術的結合以及深度學習理論的進一步發展,未來終將突破目前智能氣體識別技術在陣列空間、氣體種類、氣體濃度和復雜度上的限制,實現人工嗅覺領域信息物理融合系統的智能化產業變革。