李名偉,夏曉蒙,朱慶輝,劉 鶴,黃東巖,王 剛
基于熱裂解和電子鼻的土壤全氮檢測方法及特征優化
李名偉,夏曉蒙,朱慶輝,劉 鶴,黃東巖※,王 剛
(1. 吉林大學生物與農業工程學院,長春 130022;2. 吉林大學工程仿生教育部重點實驗室,長春 130022)
土壤氮是作物生長發育所必需的營養元素,也是衡量土壤肥力特征的重要指標。為快捷準確測定土壤全氮含量,該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測方法。采用10種不同類型的氣體傳感器構建傳感器陣列,并對其進行了不同濃度甲烷、氯乙烯和氨氣等標準氣體的響應測試試驗。使用馬弗爐裂解土壤樣本得到裂解氣體,采用氣體傳感器陣列檢測裂解氣體的響應曲線。提取響應曲線的平均值(mean)、方差值(vav)、最大梯度值(mgv)、最大值(max)、響應面積值(rav)、第8秒的瞬態值(8)和平均微分系數(mdc)7個特征構建121×10×7(121為土壤樣本,10為傳感器數量,7為特征)的特征空間,采用GA-BP特征優化方法將特征降至33維,形成121×33的特征空間。GA-BP算法優化結果表明,構建的傳感器陣列對該文檢測方法無冗余影響,其中傳感器TGS826、TGS2603、TGS2611和TGS2600對新特征空間的構建貢獻最大,特征mean、mgv、rav、8和mdc是反映該文檢測方法與土壤全氮含量內在關系的重要特征。采用反向傳播神經網絡算法(BPNN)、偏最小二乘回歸算法(PLSR)和反向傳播神經網絡與偏最小二乘回歸結合算法(PLSR-BPNN)建立特征空間與土壤全氮含量的預測模型,使用決定系數(2)、均方根誤差(RMSE)和相對分析誤差(RPD)作為模型性能指標。建模結果表明,PLSR、BPNN和PLSR-BPNN模型的2分別為0.91、0.81和0.93,RMSE分別為0.25、0.37和0.22,RPD分別為3.24、2.19和3.79,PLSR-BPNN模型擁有最高的2和RPD,最小的RMSE。結果表明,土壤熱解氣體與土壤全氮含量之間存在較高的相關性,采用該文檢測方法建立的PLSR-BPNN模型可以實現土壤全氮含量的準確預測。
土壤;全氮;傳感器;熱裂解;電子鼻;特征優化;模式識別
土壤是植物養分的主要來源,是作物生長發育的重要影響因素[1]。土壤養分的含量決定了作物的生長狀況,而土壤氮元素是土壤養分的重要組成部分,是決定作物營養水平的關鍵因素,影響著作物的生長情況、作物品質以及產量[2-3]。根據土壤氮的豐缺程度進行科學施肥,是作物優質高產的基礎[4]。然而,為了獲得高產,盲目高劑量施肥,導致肥料分配不均、利用率低,不僅造成經濟損失,還會嚴重污染環境[5]。因此,準確、快速、低成本地獲取土壤氮素含量及其變化,對促進精準農業發展,保護自然生態環境均具有重要意義。
測定土壤全氮含量的化學方法,如凱氏定氮法和杜馬斯燃燒定氮法,雖然可以精確測量土壤中的全氮含量,但存在費工費時、所用試劑有腐蝕性等不足[6-7]。近紅外光譜技術因為快速、無污染和無損等優勢,被廣泛應用于土壤全氮含量測定[8-11]。然而,土壤全氮的近紅外光譜測定方法受土壤質地、土壤水分和氧化鐵等因素的影響[12-13]。熱裂解氣相色譜質譜聯用技術(Pyrolysis gas chromatography-mass spectrometry,Py-GC/MS)具有快速、靈敏、需樣量少等優點,被廣泛應用于聚合物科學、微生物學、生物工程及地球化學等領域[14-17]。Becker等[18]利用Py-GC/MS技術對乞力馬扎羅山沿3 400 m海拔樣帶的火山土中有機質的構成進行了詳細分析。陳秋宇等[19]采用Py-GC/MS研究高寒草原土壤有機質的指紋差異,將熱解產物進行定性定量分析,并分為:芳烴、烷基類化合物、含氮化合物等。Py-GC/MS技術可以準確且定性定量的分析出土壤所含的各種養分,但存在設備購置成本高、需要專業人員操作、不能專用于檢測土壤全氮和耗時費工等缺點,難以實現大批土壤樣本全氮含量的快速測量。
電子鼻是由選擇性的氣體傳感器陣列和適當的模式識別算法組成的電子儀器,可以實現對簡單和復雜氣味的識別,已被廣泛應用于環境質量檢測、醫療分析和食品安全檢測等領域[20-24]。電子鼻在土壤中的應用主要集中于土壤特性和土壤有機質檢測等方面。Lavanya等[25]利用電子鼻對土壤中黃腐酸和腐殖酸的芳香度進行測定,實現了對兩種成分的檢測。Bieganowski等[26]研究了土壤的含水率對電子鼻信號的影響,利用電子鼻實現了土壤水分的評估。Zhu等[27-28]利用人工嗅覺系統實現了土壤有機質含量檢測,構建了偏最小二乘回歸算法(Partial Least Squares Regression,PLSR)、反向傳播神經網絡算法(Back Propagation Neural Network,BPNN)和支持向量回歸(Support Vector Regression,SVR)3種模型,預測性能最高的SVR模型2為0.91。
綜上所述,該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測方法。利用熱裂解技術實現少量土壤樣本的快速裂解,使其產生大量裂解氣體,將裂解氣體通入氣體傳感器陣列中得到傳感器響應曲線。提取響應曲線的平均值、方差值、最大梯度值、最大值、響應面積值、第8秒的瞬態值和平均微分系數7個特征構建電子鼻特征空間,采用GA-BP神經網絡算法(Genetic Algorithm - Back Propagation neural network)將特征空間進行優化降維,得到最優特征組成電子鼻特征空間。最后,采用BPNN、PLSR和PLSR-BPNN算法(Partial Least Squares Regression - Back Propagation Neural Network)建立新特征空間與土壤全氮含量的預測模型,從而利用熱裂解和電子鼻技術實現對土壤全氮含量的快捷、準確和低成本檢測。
研究區域位于吉林省,屬于東北地區中部,與俄羅斯、朝鮮接壤,地處東北亞地理中心位置。為使采集的土壤樣本盡可能反映出吉林省不同地區土壤全氮的變化,分別在研究區域的121個采樣點各采集土壤樣本1份,如圖1所示。采樣點選擇耕地、林地等土壤類型特征明顯,地形相對平坦、植被覆蓋良好的地點,遠離坡腳、洼地、田邊、城鎮和公路等。
由于土壤的不均一性,導致相同地塊土壤全氮含量也不盡相同,為盡可能得到土壤樣本在原位的實際狀態,每個采樣點按照S形路線采集16份土壤樣本,采集0~20 cm的淺層土壤。將采集的16份土樣攪拌混合,除去動植物殘體、石塊等,每個采樣點按照四分法保留1 kg土樣。依據試驗實際的需要,將土樣置于室內通風陰干后,用木棍研細并使之通過1 mm(18目)的篩網。將處理完的土樣分為兩份,分別用于凱氏定氮法和該文檢測法測定土壤樣本全氮含量[29-30]。
該研究所采用裝置為基于熱裂解和電子鼻的土壤全氮含量檢測系統,如圖2所示。該系統由熱裂解爐、裂解室(由真空法蘭和石英管組成)、氣體傳感器陣列(安裝在封閉的反應室)、信號處理電路、NI數據采集卡、筆記本電腦、PWM調速模塊和真空泵組成。
熱裂解爐采用Thermo Fisher Scientific公司生產的Lindberg/Blue M Mini-Mite管式爐,用于裂解土壤樣本。石英舟用于盛放土壤樣本被放置在石英管中央,真空法蘭和石英管組成裂解室,使土壤樣本在密封狀態下完成裂解。氣體傳感器陣列是電子鼻系統的核心組成部分,可以對土壤的裂解氣體產生特異性響應。根據土壤裂解后的產物[18-19],選擇了費加羅公司生產的10種氧化物半導體式氣體傳感器組成傳感器陣列,其具體名稱和參數如表1所示。信號轉換電路可以為氣體傳感器陣列供電,并將傳感器產生的電阻信號轉換成電壓信號。數據采集卡為國家儀器(National Instruments,NI)公司生產的多功能I/O設備USB-6210,通過杜邦線與信號轉換電路連接,實現對傳感器數據的采集,并將采集的數據通過USB數據線傳輸至電腦的LabVIEW檢測程序中顯示、存儲。采用真空泵實現整個系統的氣路循環,并通過PWM調速模塊調節真空泵的流速。

表1 氣體傳感器型號及參數
系統工作時,稱取2 g土壤樣本放入石英舟中,并將其置入裂解室的中央位置,關閉真空法蘭,使裂解室處于密封狀態,設置裂解溫度為400 ℃,裂解時間為3 min,開始土壤樣本的裂解。裂解室、反應室和真空泵通過橡膠管連接,形成密閉的氣路。裂解完成后,啟動LabVIEW檢測程序,打開真空法蘭,開啟并設置真空泵的流量為1 L/min,使裂解室內的裂解氣體進入裝有傳感器陣列的反應室,傳感器陣列采集裂解氣體的響應數據,時間為60 s,采集頻率為10 Hz。數據采集完成后,取下真空法蘭兩端的橡膠管,打開熱裂解爐,取出石英管和石英舟并將其清洗和干燥;開啟并設置真空泵的流量為3 L/min,用潔凈的空氣清洗反應室和聯通管道,清洗時間為2 min,完成一次土壤樣本數據的采集,其余樣本數據的采集重復上述過程。
基于熱裂解和電子鼻的土壤全氮含量檢測系統搭建完成后,為測試氣體傳感器陣列對不同氣體的響應狀況,該研究進行了傳感器陣列響應測試試驗。試驗裝置由多種標準氣體、氣體傳感器陣列、信號處理電路、NI數據采集卡和筆記本電腦組成,如圖3所示,標準氣體的類型和參數如表2所示。

表2 標準氣體類型及參數
測試時,啟動筆記本電腦中編寫的LabVIEW程序,通過NI數據采集卡獲得氣體傳感器陣列在潔凈空氣中的響應曲線,采集時間為10 s;然后,打開標準氣體的閥門,使標準氣體以1 L/min的流速通入安裝傳感器陣列的反應室,通氣時間為20 s;接著,將反應室用止氣夾密封,采集3 min;最后,以2.50 L/min的流速用真空泵抽取干凈的空氣清洗反應室中標準氣體殘留,時間為1 min,完成一次氣體傳感器陣列響應測試,每種標準氣體進行3次測試試驗,取平均值。
從傳感器陣列的響應曲線中提取合適的特征,有利于建立泛化能力強、決定系數高的預測關系模型。該研究提取平均值(Mean value,mean)、方差值(Variance value,vav)、最大梯度值(Maximun gradient value,mgv)、最大值(Maximum value,max)、響應面積值(Response area value,rav)、第8秒的瞬態值(8)和平均微分系數(Mean differential coefficient value,mdc),這7個特征構建特征空間,特征空間包含了傳感器陣列響應數據的瞬態值、穩定值、離散度、總體強度和變化速率等信息,能夠表征氣體傳感器的響應曲線。
1)平均值(mean)。平均值是氣體傳感器所有響應數據的平均,反映了該氣體傳感器對裂解氣體的平均響應特征。

式中X為傳感器數據的第個數據,為傳感器數據中最大值所對應的時間,為傳感器數據的總數量。
2)方差值(vav)。方差用來計算每一個變量與總體均數之間的差異,用方差值來表示不同傳感器響應的離散程度。
3)最大梯度值(mgv)。最大梯度值為氣體傳感器響應的最大值與初始值的斜率,可以表示響應信號變化的快慢。
式中imax為傳感器數據中的最大值,0為傳感器數據的初始值。
4)最大值(max)。最大值是傳感器響應強度大小最直觀的體現。
5)響應面積值(rav)。響應面積值是氣體傳感器響應曲線與采集時間的面積,反映了該氣體傳感器對裂解氣體的總體響應結果。

6)第8秒的瞬態值(8)。瞬態值表達了傳感器對不同裂解氣體的不同瞬態行為,包含了比穩態更多的可用信息。土壤裂解氣體在傳感器陣列的響應是先快速上升,然后慢慢趨近于穩定。快速上升時間主要為前15 s,傳感器響應強度區別最大的是第8秒的瞬態響應值,所以選擇8作為特征。
7)平均微分系數(mdc)。平均微分系數可以全面反映傳感器動態響應過程的整體信息,體現了氣體傳感器對裂解氣體響應的重要信息。
式中X1為傳感器數據的第1個數據。
該研究共采集了121份土壤樣本,傳感器陣列由10個氣體傳感器組成,提取每個傳感器響應曲線的7個特征,因此,組合成一個121×10×7的電子鼻特征空間。各特征與特征編號的對應關系如表3所示。

表3 各特征與特征編號的對應關系
由于提取的特征量綱不同,會造成數量級大的特征在建模中所占比重較大,不利于構建精準的預測模型。為消除數量級、量綱對建模的影響,該研究采用-score標準化方法對提取的特征進行歸一化處理。
遺傳算法是模擬達爾文生物進化論中自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。首先,根據實際需求產生初始種群,利用適用度表明個體的優劣性,然后從群體中選擇優良個體,通過交叉、突變實現“適者生存”的自然選擇,產生比以前更適應環境的新種群,直到滿足一定的終止條件,得出最優選擇。為了除去冗余信息、分析出各個傳感器對電子鼻系統的貢獻度,該研究采用GA-BP神經網絡算法進行特征優化、降維。具體的過程如圖4所示
圖4中,灰色矩形框中為神經網絡算法部分。首先,創建一個種群大小為50,個體長度為70(傳感器提取的特征10×7)的隨機種群。然后,對個體的染色體進行二進制編碼,使每條染色體上的每個位點基因對應一個特征載體。在每個基因中,“1”表示特征參與BPNN建模,“0”表示不參與建模。
選取遺傳個體對應的特征,用于BPNN模型。利用訓練集對模型進行訓練,以誤差平方和的倒數作為適應度函數進行驗證。適應度較高的個體遺傳到下一代的概率相對較大。適應度函數為
為建立一個可以精準預測土壤全氮含量的模型,需要將歸一化處理的電子鼻特征空間劃分為訓練集和測試集兩部分,訓練集用來擬合數據樣本,訓練模型的參數,減少模型的泛化誤差,使模型能夠具有較高的可靠性,進而實現預測未知土壤樣本的能力;而測試集用以預測未知土樣的全氮含量,并借助不同的評價指標評估模型的預測性能。該研究為劃分出合理的訓練集和測試集,采用Kennard-Stone方法將訓練集和測試集設置為7∶3。
為提高該研究檢測方法的檢測性能,采用PLSR、BPNN和PLSR-BPNN三種算法建立電子鼻特征空間與土壤全氮含量之間的預測關系模型,以找出最優的土壤全氮含量預測模型。
偏最小二乘回歸分析方法是一種將主成分分析、多元線性分析和典型相關分析結合在一起的多變量回歸分析方法。PLSR與最小二乘法相比,具有可實現數據降維、信息整合和提取對模型有最佳解釋信息的主成分等優點,可有效精簡裂解氣體響應曲線的自變量和去除冗余噪聲,篩選出對土壤全氮含量解釋性最佳的綜合變量;與主成分分析法相比,克服了其對自變量解釋較強,因變量解釋不足的問題[31-32]。PLSR模型預測精度主要受主成分因子(Principal Component Factor,PCF)數量的影響,合適的PCF數量可有效利用氣體傳感器陣列的信息和濾除噪聲,也可有效提高模型的泛化能力。該研究采用留一交叉驗證法確定模型中PCF的數量,并通過交叉驗證均方根誤差(Root Mean Square Error of Cross-Validation,RMSECV)來評估PCF的數量對PLSR模型預測性能的影響。
反向傳播神經網絡算法是一種典型的多層前向型神經網絡,由輸入層、隱含層和輸出層組成,主要應用于有導師學習的回歸預測和分類。輸入層由數據中提取的特征組成,隱含層中的神經元多采用S型傳遞函數,輸出層的神經元多采用線性傳遞函數。BPNN的精髓是將網絡輸出與期望輸出之間的誤差歸為權值和閾值的“過錯”,通過反向傳播把誤差“分攤”給各個神經元的權值和閾值,其指導思想是權值和閾值的調整要沿著誤差函數下降最快的方向(負梯度方向)。隱含層神經元個數對BPNN模型的預測性能影響較大,過少或過多的隱含層神經元個數直接導致BPNN模型出現欠擬合和過擬合現象,因此需要選擇合適的隱含層神經元個數。目前沒有精確的公式計算隱含層的神經元數目,但可以根據經驗公式來確定其范圍


土壤裂解氣體與土壤全氮含量的相互關系復雜,電子鼻特征空間與土壤全氮含量之間存在線性和非線性的內在聯系。若將PLSR模型的線性回歸能力和BPNN模型的非線性映射能力結合起來組成PLSR-BPNN模型,可充分利用2種算法的優點,以提高該研究檢測方法的預測性能。該文采用并聯方式將PLSR和BPNN模型組合在一起,分別對2種模型進行建模,將得到的預測結果加權組合,并通過模型有效度得到合適的加權系數,最終實現PLSR-BPNN模型的建立和檢測數據的輸出,如圖 5所示。
為了評估土壤全氮含量預測模型的性能和可靠性,該研究采用均方根誤差(Root Mean Square Error,RMSE)、決定系數(2)和相對分析誤差(Residual Prediction Deviation,RPD)作為模型預測性能的評價指標。RMSE是模型預測值和實際值之間誤差,RMSE越小,表明模型的預測性能越好。2用以表示模型的預測準確性,其范圍為0~1,2越接近1表明模型的準確性和擬合效果越好。RPD是樣本標準差與均方根誤差的比,用以進一步衡量建立模型的預測性能。當RPD≥2.50時,表明模型具有極好的定量預測能力;當2≤RPD<2.50時,表明模型具有較好的定量預測能力;當1.40≤RPD<2時,表明模型可粗略估算樣品含量;當RPD<1.40時,表明模型無法對樣品含量進行預測。
采用凱氏定氮法測量121個土壤樣本的全氮含量,結果如表4所示,采用Kennard-Stone方法設置訓練集和測試集之比為7∶3,即訓練集和測試集各有85和36個樣本。在訓練集中,土壤全氮含量為0.20~3.95 g/kg,平均值為1.54 g/kg,標準差為0.68 g/kg,變異系數為44.05%,偏度為1.01 g/kg,峰度為2.00 g/kg;而測試集中,土壤全氮含量為0.35~4.10 g/kg,平均值為1.70 g/kg,標準差為0.82 g/kg,變異系數為48.12%,偏度為1.36 g/kg,峰度為2.43 g/kg。研究區域中采集的土壤全氮含量和樣本變異系數變化趨勢較大,有利于提高模型的預測能力[34]。測試集中土壤全氮含量的范圍完全覆蓋了訓練集中土壤全氮含量的范圍,有利于提高模型的泛化能力。
3.2.1 甲烷響應測試結果
該研究按照1.3節試驗方法進行了氣體傳感器陣列的響應測試試驗,得到圖6不同濃度甲烷對傳感器陣列影響的曲線。圖6中,甲烷幾乎不能使傳感器S1、S2和S5產生任何響應,傳感器S6響應曲線呈下降趨勢,且不同濃度甲烷對其響應的影響不明顯;其余傳感器皆對不同濃度的甲烷氣體有明顯響應,且隨著甲烷濃度的增加,傳感器的響應曲線呈明顯上升趨勢。

表4 土壤樣本的全氮含量及分析
3.2.2 氯乙烯響應測試結果
不同濃度氯乙烯對傳感器陣列影響,如圖7所示。圖7中,傳感器S5對氯乙烯氣體沒有響應,其余傳感器對氯乙烯響應明顯,且隨著氯乙烯濃度依次增大,傳感器相應強度也依次增大,傳感器的響應時間明顯縮短,可以更快達到穩定狀態。
3.2.3 氨氣響應測試結果
圖8為傳感器陣列對兩種濃度氨氣的響應曲線。從圖8中可以看出,傳感器S10對氨氣幾乎沒有響應,低濃度氨氣幾乎不能使傳感器S5產生響應,但隨著氨氣濃度的增加,傳感器響產生較明顯的響應;其余傳感器對氨氣均有響應,且隨著氨氣濃度的增大,傳感器的響應強度明顯增強。
從氣體傳感器陣列對不同濃度、種類標準氣體的測試試驗中可以看出,甲烷不能使傳感器TGS826、TGS2602產生響應,傳感器TGS821只對高濃度氨氣響應,傳感器TGS2612對氨氣幾乎沒有響應。其余傳感器對不同濃度的氯乙烯、氨氣皆有響應且響應結果不同,且隨著標準氣體濃度的增大傳感器陣列的響應強度也隨之增大,響應時間縮短,可以更快達到穩定狀態;不同濃度的甲烷對傳感器陣列的影響不同于上述情況,高濃度甲烷提高了傳感器的響應強度,但同時提高了其響應時間,反而低濃度甲烷可以更快達到穩定狀態。響應測試試驗結果表明氣體傳感器陣列具有較高的特異性和一定的交叉敏感性,為基于熱裂解和電子鼻的土壤全氮含量檢測系統的組建奠定了基礎。
采用GA-BP算法對訓練集降維優化,設置種群大小為50,個體長度為70,輸出條件設為100次迭代。適應度函數演化曲線如圖9a所示。從圖9a中可以看出,迭代36次后,最佳適應度值保持不變,此時電子鼻特征空間達到了最佳的降維效果。在這種情況下,篩選出的最優特征編號為1、6、7、8、10、14、16、18、25、26、27、29、30、31、33、36、39、41、44、45、47、49、50、51、52、53、54、56、61、66、67、68、69,即特征由70維降到了33維。優化后所形成的電子鼻特征空間為121×33(樣本數121×特征數33),因總樣本數固定,僅減少了特征,因此劃分的訓練集和測試集不變。電子鼻特征空間的數據箱型可視化圖,如圖9b所示。
從圖9b中可以看出,7個特征參數對特征空間的貢獻依次為:rav>mdc=8=mean=mgv>max>vav,分別提供了6、5、5、5、5、4和3特征,特征max和vav維數貢獻相對較小,特征rav、mdc、8、mean和mgv是體現電子鼻系統與土壤全氮含量內在聯系的重要特征。
此外,圖9b還可以看出,對于電子鼻特征空間的構成,傳感器貢獻的特征維數也不同。傳感器S6提供了6維特征,傳感器S1提供了5特征,傳感器S7、S9提供了4維特征,其余傳感器提供特征相對較少,尤其是傳感器S2僅提供了1維特征。該研究所用氣體傳感器對新特征空間的構成均有貢獻,表明組建的傳感器陣列對基于熱裂解和電子鼻的土壤全氮含量檢測方法均有作用,沒有冗余,且傳感器TGS826、TGS2603、TGS2611和TGS2600對構建電子鼻特征空間的貢獻最大。
3.4.1 PLSR模型的建立
PLSR模型的預測性能受主成分因子(Principal component factor,PCF)數目的影響,適合的PCF數目可有效提高模型的預測和泛化能力。該研究采用40個主成分因子和留一交叉驗證法尋找合適的PCF數量,通過RMSECV驗證模型的可靠性,得到圖10所示PCF和RMSECV的關系圖。從圖10中可以看出,在PCF數量在19~25的時候,均方根誤差較小,而較少的PCF數量可以降低模型的復雜性、避免出現過擬合現象,因此該研究采用19個PCF建立了PLSR預測模型。
采用19個PCF和電子鼻特征空間的訓練集建立PLSR預測模型,并采用測試集的未知樣本對模型的預測性能進行驗證,如圖11所示。建立PLSR模型訓練集的2=0.91,RMSE=0.21,RPD=3.28(圖11a),測試集的2=0.91,RMSE=0.25,RPD=3.2(圖11b)。模型預測結果表明,采用PLSR算法建立的土壤全氮預測模型,其訓練集和測試集的2大于0.91,RMSE小于0.25,RPD大于3.23,模型具有極好的定量預測能力和較好的泛化能力。
3.4.2 BPNN模型的建立
該研究采用MATLAB 9.7.0.1190202(R2019b)軟件中的神經網絡工具箱建立BPNN預測模型。在BPNN模型的建立中,采用tansig函數作為隱含層的傳遞函數,采用線性函數purelin作為輸出層的傳遞函數,采用newff函數創建神經網絡。設置學習率為0.01,設置目標誤差為0.001,將訓練迭代次數設置為1 000,將訓練集用train函數帶入神經網絡進行訓練,最后利用sim函數將已經訓練好的BP神經網絡進行仿真預測。
BPNN建模中,隱含層神經元個數直接影響著模型的預測性能。為了選擇合適的神經元數量,根據公式(7)將其取值設置為7~16,選取程序運行20次對應訓練集和測試集決定系數的最小值、最大值和平均值作為評價指標,得到表5所示結果。從表5中可以看出,神經元數量為14時,BPNN模型訓練集2的最小值、最大值和平均值均為最高,但測試集2的3個指標均不如神經元數量為12時建立的BPNN模型,說明神經元數量的增多出現了過擬合現象,影響模型的泛化能力。因此,BPNN模型參數確定為33-12-1(33個輸入量,12個隱含層神經元,1個輸出量),其訓練集和測試集的預測結果如圖 12所示。

表5 神經元數量對BPNN模型預測性能影響
模型預測結果表明,建立BPNN模型的訓練集2=0.93,RMSE=0.18,RPD=3.69(圖12a),測試集的2=0.81,RMSE=0.37,RPD=2.19(圖12b),模型在訓練集中具有較高的準確性和擬合效果,但在測試集中2和RPD均有大幅下降。表明BPNN算法建立的土壤全氮預測模型出現了過擬合現象,模型在泛化能力上有所不足。
3.4.3 PLSR-BPNN模型的建立
由上文建立的PLSR和BPNN模型預測結果可以看出,PLSR模型具有不錯的定量預測和泛化能力,但其預測準確性有待提高。BPNN模型在訓練集擁有不錯的準確性,但在測試集中預測性能有明顯下降,說明模型的泛化能力不足。為提高建立模型的準確性和泛化能力,該研究將PLSR和BPNN模型結合,建立了PLSR-BPNN算法的土壤全氮預測模型,PLSR算法的主成分因子為19,BPNN算法隱含層神經元數目為12,得到如圖13所示PLSR-BPNN模型訓練集和測試集的預測結果。
從圖13看出,PLSR-BPNN算法建立的預測模型,其訓練集的2=0.94,RMSE=0.17,RPD=3.90(圖13a),測試集的2=0.93,RMSE=0.22,RPD=3.79(圖13b)。PLSR-BPNN模型訓練集和測試集的2>0.93,RPD>3.79,表明模型具有精確定量分析能力和較強的泛化能力。
為提高該研究檢測方法的檢測精度,采用PLSR、BPNN和PLSR-BPNN三種算法分別對電子鼻特征空間的訓練集和測試集進行測試,以找出最優的關系模型。從圖11a、12a、13a可以看出,在PLSR、BPNN、PLSR-BPNN三個訓練集的預測模型中,PLSR-BPNN模型的預測效果最好(2和RPD最大,RMSE最小),BPNN次之,PLSR最差。但3個模型的2均大于0.91,RPD均大于3.28,表明3個模型在訓練集中具有極好的定量分析能力。
將測試集分別帶入已經訓練完成的BPNN、PLSR和PLSR-BPNN模型中,得到圖11b、12b、13b中的預測結果。為了進行更直接的比較,在表6中列出了模型測試集的預測性能。從測試集的預測性能對比中可以看出(表 6),3個模型的2均大于0.81,RMSE<0.37,表明所有模型均有較好的土壤全氮含量預測能力。但從RPD的指標來看,BPNN算法建立的預測模型具有較好的定量預測能力,而PLSR和PLSR-BPNN模型均具有極好的定量預測能力,且PLSR-BPNN模型比PLSR模型的2提升2.20%,RPD提升16.98%,RMSE減少12.00%。建模結果表明,PLSR-BPNN算法建立的土壤全氮預測模型,可有效提高PLSR模型的預測準確性,解決BPNN模型泛化能力不足等問題,為土壤全氮的測量提供一種可靠的關系模型。其原因是土壤全氮含量與電子鼻特征空間存在一定程度的線性和非線性關聯,PLSR-BPNN模型可以分別彌補PLSR和BPNN模型在非線性和線性關系的不足,從而建立更為準確的土壤全氮預測模型。

表6 模型測試集預測性能對比
測定土壤全氮的傳統方法存在費工費時、所用試劑有腐蝕性等不足;土壤全氮的近紅外光譜測定方法受土壤質地、土壤水分和氧化鐵等因素的影響;Py-GC/MS方法存在設備購置成本高、不能專用于測定土壤全氮和耗時費工等缺點,難以實現大批土壤樣本全氮含量的快速測量。該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測方法,該方法具有成本低、方便快捷和準確性高等優勢,但土壤裂解、傳感器檢測和洗氣共需要6 min的時間,因此不能實現車載田間土壤全氮含量的實時測量。
該文采用模式識別算法建立裂解氣體響應曲線所選取特征與土壤全氮的關系模型,并用2、RMSE和RPD三個指標對模型的準確性進行評估。模式識別的基本原理是用計算統計的方法根據樣本的特征將樣本劃分到一定的類別中。文中采用熱裂解和電子鼻技術實現原始數據的獲取;提取傳感器陣列響應數據的特征組成特征空間,并利用GA-BP算法對其優化降維,完成特征的提取與選擇。該文選取的特征與土壤全氮含量存在緊密的聯系,目前對相關機理的研究比較初步,土壤裂解氣體的成分不能完全確定,且不同樣本間存在異質性,因此不能完全揭示特征與土壤全氮含量的內在規律。采用訓練集的新特征空間與對應土壤全氮含量對學習機器進行訓練,依據統計規律性和模式識別算法建立特征與土壤全氮的數學模型;用建立的模型對測試集的未知樣本進行土壤全氮含量預測。結果表明,PLSR、BPNN和PLSR-BPNN三種模式識別算法的預測結果較為準確,說明土壤裂解氣體與土壤全氮含量存在內在規律,且該文選取的特征可有效表達兩者間的統計規律性。
該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測方法。利用熱裂解技術實現土壤樣本快速裂解,采用電子鼻完成裂解氣體響應數據采集,最后利用模式識別實現土壤全氮含量準確預測。
1)采用GA-BP算法對模式識別中構建的特征空間進行優化,減少了冗余信息。結果表明,構建的傳感器陣列對該研究無冗余影響,其中傳感器TGS826、TGS2603、TGS2611和TGS2600對特征空間的構建貢獻最大,特征響應面積值、平均微分系數、第8秒的瞬態值、平均值和最大梯度值是反映該研究方法與土壤全氮含量內在關系的重要特征。
2)對構建的氣體傳感器陣列進行了標準氣體的響應測試。結果表明,傳感器陣列對不同濃度的甲烷、氯乙烯和氨氣皆有響應且響應結果不同,且隨著標準氣體濃度的增大氣體傳感器陣列的響應強度也隨之增強。
3)對比分析了PLSR、BPNN和PLSR-BPNN算法在此研究中的檢測性能。結果表明,三種模型均有準確預測土壤全氮含量的能力,PLSR-BPNN模型擁有最高的2和RPD,最小的RMSE。PLSR-BPNN模型在測試集中2=0.93,RMSE=0.22,RPD=3.79。
[1] 郭澎濤,李茂芬,羅微,等. 基于多源環境變量和隨機森林的橡膠園土壤全氮含量預測[J]. 農業工程學報,2015,31(5):194-202.
Guo Pengtao, Li Maofen, Luo Wei, et al. Prediction of soil total nitrogen for rubber plantation at regional scale based on environmental variables and random forest approach[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 194-202. (in Chinese with English abstract)
[2] 周鵬,楊瑋,李民贊,等. 基于灰度關聯-極限學習機的土壤全氮預測[J]. 農業機械學報,2017,48(S1):271-276.
Zhou Peng, Yang Wei, Li Minzan, et al. Soil total nitrogen content prediction based on gray correlation-extreme learning machine[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017,48(S1): 271-276. (in Chinese with English abstract)
[3] Chen C, Dong D M, Li Z W, et al. A novel soil nutrient detection method based on combined ATR and DRIFT mid-infrared spectra[J]. Analytical Methods, 2016, 9(3): 528-533.
[4] Ren G X, Wei Z Q, Fan P P, et al. Visible/near infrared spectroscopy method applied research in wetland soil nutrients rapid test[J]. IOP Conference Series Earth and Environmental Science, 2019, 344: 012123.
[5] Li H Y, Jia S Y, Le Z C. Quantitative analysis of soil total nitrogen using hyperspectral imaging technology with extreme learning machine[J]. Sensors, 2019, 19(20): 4355.
[6] 宋琦. 我國幾種土壤的有機氮組成和性質的研究[J]. 土壤學報,1988,25(1):95-100.
Song Qi. Study on composition and property of organic nitrogen in several soils of China[J]. Acta Pedologica Sinica, 1988, 25(1): 95-100. (in Chinese with English abstract)
[7] 秦琳,黃世群,仲伶俐,等. 杜馬斯燃燒法和凱氏定氮法在土壤全氮檢測中的比較研究[J]. 中國土壤與肥料,2020(4):258-265.
Qin Lin, Huang Shiqun, Zhong Lingli, et al. Comparison of Dumas combustion and Kjeldahl methods for determining total nitrogen content in soil[J]. Soil and Fertilizer Sciences in China, 2020(4): 258-265. (in Chinese with English abstract)
[8] 侯云鵬,韓立國,孔麗麗,等. 不同施氮水平下水稻的養分吸收,轉運及土壤氮素平衡[J]. 植物營養與肥料學報,2015,21(4):836-845.
Hou Yunpeng, Han Liguo, Kong Lili, et al. Nutrient absorption, translocation in rice and soil nitrogen equilibrium under different nitrogen application doses[J]. Journal of Plant Nutrition and Fertilizer, 2015, 21(4): 836-845. (in Chinese with English abstract)
[9] 張娟娟,田永超,姚霞,等. 基于近紅外光譜的土壤全氮含量估算模型[J]. 農業工程學報,2012,28(12):183-188.
Zhang Juanjuan, Tian Yongchao, Yao Xia, et al. Estimating model of soil total nitrogen content based on near-infrared spectroscopy analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(12): 183-188. (in Chinese with English abstract)
[10] 王海江,劉凡,YUNGER John A,等. 不同粒徑處理的土壤全氮含量高光譜特征擬合模型[J]. 農業機械學報,2019,50(2):195-204.
Wang Haijiang, Liu Fan, YUNGER John A, et al. Fitting model of soil total nitrogen content in different soil particle sizes using hyperspectral analysis[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(2): 195-204. (in Chinese with English abstract)
[11] Nie P C, Dong T, He Y, et al. The effects of drying temperature on nitrogen concentration detection in calcium soil studied by NIR spectroscopy[J]. Applied Sciences-Basel, 2018, 8(2): 269.
[12] He Y, Xiao S P, Nie P C, et al. Research on the Optimum Water Content of Detecting Soil Nitrogen Using Near Infrared Sensor[J]. Sensors, 2017, 17(9): 2045.
[13] Stoner E R, Baumgardner M F. Characteristic variations in reflectance of surface soils[J]. Soil Science Society of America Journal, 1981, 45(6): 1161-1165.
[14] al Sandouk-Lincke N A, Schwarzbauer J, Hartkopf-Froeder C, et al. The effect of different pyrolysis temperatures on organic microfossils, vitrain and amber-A comparative study between laser assisted- and Curie Point-pyrolysis-gas chromatography/mass spectrometry[J]. Journal of Analytical & Applied Pyrolysis, 2014, 107: 211-223.
[15] De La Rosa J M, Faria S R, Varela M E, et al. Characterization of wildfire effects on soil organic matter using analytical pyrolysis[J]. Geoderma, 2012, 191: 24-30.
[16] Kim Y, Oh J I, Lee S S, et al. Decontamination of petroleum-contaminated soil via pyrolysis under carbon dioxide atmosphere[J]. Journal of Cleaner Production, 2019, 236: 117724.
[17] Girona-Garcia A, Badia-Villas D, Jimenez-Morillo N T, et al. Changes in soil organic matter composition after Scots pine afforestation in a native European beech forest revealed by analytical pyrolysis (Py-GC/MS)[J]. Science of the Total Environment, 2019, 691: 1155-1161.
[18] Becker J N, Dippold M A, Hemp A, et al. Ashes to ashes: Characterization of organic matter in Andosols along a 3400?m elevation transect at Mount Kilimanjaro using analytical pyrolysis[J]. Catena, 2019, 180: 271-281.
[19] 陳秋宇,吳應琴,雷天柱,等. 基于Py-GC-MS/MS技術的高寒草原土壤有機質不同組分指紋特征研究[J]. 生態學報,2018,38(8):2864-2873.
Chen Qiuyu, Wu Yingqin, Lei Tianzhu, et al. Study on the fingerprints of soil organic components in alpine grassland based on Py-GC-MS/MS Technology[J]. Acta Ecologica Sinica, 2018, 38(8): 2864-2873. (in Chinese with English abstract)
[20] 路鵬,吳世新,戴志鋒,等. 基于電子鼻和GIS 的大型生活垃圾堆肥廠惡臭污染源測定[J]. 農業工程學報,2014,30(17):235-242.
Lu Peng, Wu Shixin, Dai Zhifeng, et al. Determination of odour emission at compost plant based on electronic nose and GIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(17): 235-242. (in Chinese with English abstract)
[21] Wilson A D. Review of electronic-nose technologies and algorithms to detect hazardous chemicals in the environment[J]. Procedia Technology, 2012(1): 453-463.
[22] Schnabel R M, Bounmans M L L, Smolinska A, et al. Electronic nose analysis of exhaled breath to diagnose ventilator-associated pneumonia[J]. Respiratory Medicine, 2015, 109(11): 1454-1459.
[23] 徐賽,陸華忠,周志艷,等. 基于電子鼻的果園荔枝成熟階段監測[J]. 農業工程學報,2015,31(18):240-246.
Xu Sai, Lu Huazhong, Zhou Zhiyan, et al. Electronic nose monitoring mature stage of litchi in orchard[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(18): 240-246. (in Chinese with English abstract)
[24] Tozlu B H, Okumus H I. A new approach to automation of black tea fermentation process with electronic nose[J]. Automatika, 2018, 59(3/4): 373-381.
[25] Lavanya S, Narayanan B D S, Murthy V K, et al. Indicative extent of humic and fulvic acids in soils determined by electronic nose[J]. Computers and Electronics in Agriculture, 2017, 139: 198-203.
[26] Bieganowski A, Jaromin-Glen K, Guz L, et al. Evaluating soil moisture status using an e-nose[J]. Sensors, 2016, 16(6): 886.
[27] Zhu L T, Jia H L, Chen Y B, et al. A novel method for soil organic matter determination by using an artificial olfactory system[J]. Sensors, 2019, 19(15): 3417.
[28] 朱龍圖,李名偉,夏曉蒙,等. 基于人工嗅覺系統的土壤有機質檢測方法研究[J]. 農業機械學報,2020,51(3):171-179.
Zhu Longtu, Li Mingwei, Xia Xiaomeng, et al. Soil organic matter detection method based on artificial olfactory system[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(3): 171-179. (in Chinese with English abstract)
[29] Stafilov T, Spiric Z, Glad M, et al. Study of nitrogen pollution in the Republic of North Macedonia by moss biomonitoring and Kjeldahl method[J]. Journal of Environmental Science and Health Part A-Toxic, 2020, 55(6): 759-764.
[30] Silva T E, Detmann E, Franco M O, et al. Evaluation of digestion procedures in Kjeldahl method to quantify total nitrogen in analyses applied to animal nutrition[J]. Acta Scientiarum: Animal Sciences, 2016, 38(1): 45-51.
[31] 楊越超,趙英俊,秦凱,等. 黑土養分含量的航空高光譜遙感預測[J]. 農業工程學報,2019,35(20):94-101.
Yang Yuechao, Zhao Yingjun, Qin Kai, et al. Prediction of black soil nutrient content based on airborne hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(20): 94-101. (in Chinese with English abstract)
[32] 于雷,洪永勝,周勇,等. 高光譜估算土壤有機質含量的波長變量篩選方法[J]. 農業工程學報,2016,32(13):95-102.
Yu Lei, Hong Yongsheng, Zhou Yong, et al. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(13): 95-102. (in Chinese with English abstract)
Method for detecting soil total nitrogen content and characteristic optimization based on pyrolysis and electronic nose
Li Mingwei, Xia Xiaomeng, Zhu Qinghui, Liu He, Huang Dongyan※, Wang Gang
(1.,,130022,; 2.,,,130022,)
Soil nitrogen as an essential nutrient element is one of the most important indexes to measure soil fertility for crop growth and development. In this research, a new detection was proposed to quickly accurately determine the soil total nitrogen (STN) content using pyrolysis and electronic nose. Ten types of gas sensors were used to construct the sensor arrays. A response test was carried out under the different concentrations of methane, vinyl chloride, and ammonia standard gas. The test results showed that there were significant differences in responses of the sensor array to the types and the concentration, where the response intensity increased with the increase of the standard gas concentration. The sensor array also presented a high specificity and cross-sensitivity during data detection. Furthermore, the pyrolysis gas was obtained from the soil samples using the muffle furnace, further to detect the response curve using the gas sensor array. After that, a 121×10×7 feature space (121 soil samples, 10 number of sensors, and 7 eigenvalues) was constructed to extract the mean (mean), variance (vav), the maximum gradient (mgv), the maximum (max), response area (rav), the eighth of the second transient (8), and mean differential coefficient (mdc) of the response curve. A genetic algorithm and neural network model (GA-BP) feature optimization was used to reduce the eigenvalue to 33 dimensions, forming a new feature space of 121×33. More importantly, there was no redundant effect of the constructed sensor array on the new detection. Specifically, the sensors of TGS826, TGS2603, TGS2611, and TGS2600 contributed the most to the construction of the new feature space. Themean,mgv,rav,8andmdcwere the important features to represent the internal relationship between the detection and STN content. The prediction model of feature space and STN content was then established using a back propagation neural network (BPNN), partial least squares regression (PLSR), and a combination of a back propagation neural network and partial least squares regression (PLSR-BPNN). The coefficient of determination (2), root mean square error (RMSE), and residual prediction deviation (RPD) were used as the indicators of the model. As such, the2of PLSR, BPNN and PLSR-BPNN models were 0.91, 0.81, and 0.93, respectively, where the RMSE were 0.25, 0.37, and 0.22, while the RPD were 3.24, 2.19, and 3.79, respectively. The predicted performance of the test sets demonstrated that the2values of the three models were all greater than 0.81, and the RMSE<0.37, indicating that all the models presented the better prediction ability of STN content. However, both PLSR and PLSR-BPNN models presented a much better ability of quantitative prediction than that of the BPNN, from the perspective of RPD indicators. The2of the PLSR-BPNN model increased by 2.90%, the RPD increased by 16.94%, and the RMSE was reduced by 14.48%, compared with the PLSR model. Therefore, the PLSR-BPNN prediction model can be expected to effectively improve the prediction accuracy of the PLSR model for the better generalization ability of the BPNN model, indicating a reliable relationship model for the STN measurement. The reason was that there was a certain degree of linear and nonlinear correlation between the STN content and characteristic space of the electronic nose. The PLSR-BPNN model greatly contributed to the strength of the nonlinear and linear relationship between the PLSR and BPNN model. Consequently, a more accurate PLSR-BPNN model was established to accurately predict the STN content. There was also a high correlation between the soil pyrolysis gas and STN content.
soil; total nitrogen; sensor; pyrolysis; electronic nose; feature optimization; pattern recognition
2021-10-29
2021-12-08
吉林省科技發展計劃項目(20200502007NC)
李名偉,博士生,研究方向為農業機械自動化。Email:lmw271314@163.com
黃東巖,教授,博士生導師,研究方向為保護性耕作技術及其智能農機裝備。Email:cchdy760829@sina.com
10.11975/j.issn.1002-6819.2021.24.009
S158.2;TP212.9
A
1002-6819(2021)-24-0073-12
李名偉,夏曉蒙,朱慶輝,等. 基于熱裂解和電子鼻的土壤全氮檢測方法及特征優化[J]. 農業工程學報,2021,37(24):73-84. doi:10.11975/j.issn.1002-6819.2021.24.009 http://www.tcsae.org
Li Mingwei, Xia Xiaomeng, Zhu Qinghui, et al. Method for detecting soil total nitrogen content and characteristic optimization based on pyrolysis and electronic nose[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(24): 73-84. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.24.009 http://www.tcsae.org