馬海姣 崔晨風
摘要:提出一種利用近紅外光譜快速、無損鑒別土壤種類的方法。首先利用近紅外光譜儀測定不同種類土壤的光譜特征曲線,利用主成分分析法提取主成分,再結合人工神經網絡建立模型進行類型鑒別。主成分分析表明,主成分1、2、3的累積方差貢獻率達到99.839%,可以很好地代表原始數據特征。以主成分分析得到的前3個主成分作為神經網絡輸入,以土壤類型為輸出,通過對30個樣本的訓練學習,分別建立了反向傳播人工神經網絡(BP)和徑向基函數人工神經網絡(RBF)。對10個樣本進行預測,結果表明2種模型預測的準確性均達到100%。RBF神經網絡運行時間明顯小于BP網絡,具有一定優勢。
關鍵詞:可見-近紅外光譜;土壤類型;主成分分析;BP神經網絡;RBF神經網絡;分類鑒別
中圖分類號: S155;O657.33 文獻標志碼: A 文章編號:1002-1302(2014)04-0284-03
收稿日期:2013-08-25
基金項目:國家自然科學基金-新疆聯合基金(編號:U1203182);國家自然科學基金(編號:51279166);高等學校學科創新引智計劃(編號:B12007);水資源與水電工程科學國家重點實驗室項目(編號:2011B083);西北農林科技大學大學生創新創業訓練計劃(編號:1210712077)。
作者簡介:馬海姣(1990—),女,甘肅武威人,研究方向為“3S”技術在農業水土工程中的應用。E-mail:18700807193@163.com。
通信作者:崔晨風,博士,講師,研究方向為“3S”技術在農業水土工程和水文水資源中的應用、大壩安全監測、精密工程測量。E-mail:cuichenfeng@163.com。光譜技術作為一種簡單、快捷、非接觸、非破壞的分析方法,已經被廣泛地應用到土壤和植物研究、食品行業等領域[1-4]。由于土壤的光譜反射率能綜合反映土壤理化特征和內在結構,所以土壤光譜測量為土壤光譜特征分析、土壤分類提供了新途徑[5-6]。目前已有基于土壤光譜特征對土壤各項生理指標參數的研究[7],但是基于土壤近紅外光譜和神經網絡的土壤分類研究較少[8]。劉家雄[9]、付強等[10]分別利用土壤理化指標,結合主成分分析、聚類分析、神經網絡等方法對土壤分類進行研究。由于土壤理化性質測量方法復雜,工程量大,無法快速、無損地對土壤進行分類。曾慶猛等利用土壤近紅外光譜和聚類分析對土壤分類進行了研究[11],宋海燕等利用近紅外光譜和正交信號-偏最小二乘法對土壤進行分類,但分類精度最高僅達到85%[12]。
神經網絡模型作為一種強有力的學習系統,模擬了人腦思維過程,能夠實現輸入層、輸出層的非線性映射,已經在很多領域得到廣泛應用,并取得良好效果[13-14],但目前還沒有基于土壤近紅外光譜和神經網絡[反向傳播人工(BP)神經網絡和徑向基函數人工(RBF)神經網絡]的土壤分類研究。本研究采用新疆土、土、沙土、阜陽土等4種類型土壤的室內可見-近紅外光譜反射數據為研究對象,利用主成分分析方法,結合BP神經網絡和RBF神經網絡技術進行土壤分類研究,探討基于土壤反射光譜特性的土壤分類技術,以期提高土壤分類精度和運行時間,為實現基于遙感方法進行土壤快速分類奠定基礎。
1材料與方法
1.1儀器設備
使用美國ASD(analytical spectral device)公司的Handheld Field Spec 型光譜儀,其光譜測定范圍為325~1 075 nm,采樣間隔為10 nm,光譜分辨率為3.5 nm,探頭視場角為15°。光源采用與光譜儀配套的14.5 V鹵素燈。采用ASD View Spec Pro和Matlab R2009b軟件分析數據。
1.2樣本采集與制備
供試土壤分別為新疆土、土、沙土、阜陽土。每種土壤各取10個樣本,每個樣本掃描20次,取平均值作為最終光譜反射率數據。
1.3主成分分析(PCA)原理
PCA是一種降維映射方法,可以有效地壓縮數據特征,把原有多維空間信息通過一系列線性變換在低維空間表現出來,從而消除眾多信息中的重疊部分。提取的每個特征都是原來特征的函數,使新得到的特征數少于原有特征數,同時保存了原有特征的主要信息。
1.4神經網絡原理
1.4.1BP神經網絡BP神經網絡是目前應用最廣泛的神經網絡方法之一,具有較強的信息處理能力,能夠實現輸入和輸出之間的非線性映射。典型的神經網絡具有1個輸入層、數個隱含層、1個輸出層,層與層之間采用全連接的方法,同層神經元之間不存在相互連接。理論上已證明,1個具有隱含層的3層網絡可以逼近任何連續的非線性函數。隱含層中神經元多采用“S”型函數(tansig),輸出層的神經元多采用線性傳遞函數(purelin)。
傳統的BP算法存在很多未解決問題,如收斂速度較慢,易于陷入局部極小等。在實際應用中,該算法存在網絡結構參數和學習訓練參數難以確定的問題,這在一定程度上影響了神經網絡的推廣應用。
本研究采用3層BP神經網絡,該網絡由1個輸入層、1個隱含層、1個輸出層組成,隱含層采用“S”型函數,輸出層采用線性傳遞函數,目標誤差0.01,設定訓練迭代次數 1 000 次。
1.4.2RBF神經網絡多變量插值的RBF神經網絡具有優秀的離散數據內插特性,可以提供最優逼近功能,其網絡結構域與多層前向型網絡類似,是一種3層前向型網絡,由輸入層、隱含層、輸出層組成,隱含層神經元傳遞函數是對中心點徑向對稱且衰減的非負非線性函數(radbas),從輸入層空間到隱含層的空間變換是線性的,從隱含層空間到輸出層空間變換也是線性的。RBF具有結構簡單,訓練速度快,函數逼近能力和分類能力強,不存在局部最優問題等特點。endprint
本研究采用3層RBF神經網絡,徑向基函數擴展速度(spread)為5.5。
2結果與分析
2.1可見-近紅外光譜分析
2.2主成分分析
3結論
通過試驗獲得4種類型土壤的可見-近紅外光譜特征曲線,結合主成分分析和有導師學習型的2種神經網絡,分別建立了鑒別土壤類型的模型,2種模型預測效果很好,識別率均達到100%。其中RBF神經網絡克服了BP神經網絡運行時間長的缺點,在應用時更加快捷方便。利用可見-近紅外光譜技術可以快速、準確、無損地對土壤類型進行鑒別,為土壤類型鑒別提供了一種可靠的新途徑。
參考文獻:
[1]何勇,李曉麗,邵詠妮.基于主成分分析和神經網絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[2]何勇,李曉麗. 用近紅外光譜鑒別楊梅品種的研究[J]. 紅外與毫米波學報,2006,25(3):192-194+212.
[3]李曉麗,何勇,裘正軍.一種基于可見-近紅外光譜快速鑒別茶葉品種的新方法[J]. 光譜學與光譜分析,2007,27(2):279-282.
[4]邵詠妮,何勇,潘家志,等. 基于光譜技術的桔子汁品種鑒別方法的研究[J]. 光譜學與光譜分析,2007,27(9):1739-1742.
[5]黃應豐,劉騰輝. 華南主要土壤類型的光譜特性與土壤分類[J]. 土壤學報,1995,32(1):58-68.
[6]劉煥軍,張柏,張淵智,等. 基于反射光譜特性的土壤分類研究[J]. 光譜學與光譜分析,2008,28(3):624-628.
[7]張娟娟,田永超,姚霞,等. 基于高光譜的土壤全氮含量估測[J]. 自然資源學報,2011,26(5):881-890.
[8]王遵義,金春華,劉飛,等. 基于光譜技術的土壤快速分類方法研究[J]. 浙江大學學報:農業與生命科學版,2010,36(3):282-286.
[9]劉家雄. 主成分分析與聚類分析在土壤分類中的應用[J]. 上海農業學報,2011,27(3):110-113.
[10]付強,王志良,梁川. 自組織競爭人工神經網絡在土壤分類中的應用[J]. 水土保持通報,2002,22(1):39-43.
[11]曾慶猛,孫宇瑞,嚴紅兵. 土壤質地分類的近紅外光譜分析方法研究[J]. 光譜學與光譜分析,2009,29(7):1759-1763.
[12]宋海燕,秦剛,韓小平,等. 基于近紅外光譜和正交信號-偏最小二乘法對土壤的分類[J]. 農業工程學報,2012,28(7):168-171.
[13]吳桂芳,蔣益虹,王艷艷,等. 基于獨立主成分和BP神經網絡的干紅葡萄酒品種的鑒別[J]. 光譜學與光譜分析,2009,29(5):1268-1271.
[14]楊芳,李紅睿,田學東. 基于RBF神經網絡的漢字粗分類方法[J]. 計算機工程與應用,2009,45(6):170-172.endprint
本研究采用3層RBF神經網絡,徑向基函數擴展速度(spread)為5.5。
2結果與分析
2.1可見-近紅外光譜分析
2.2主成分分析
3結論
通過試驗獲得4種類型土壤的可見-近紅外光譜特征曲線,結合主成分分析和有導師學習型的2種神經網絡,分別建立了鑒別土壤類型的模型,2種模型預測效果很好,識別率均達到100%。其中RBF神經網絡克服了BP神經網絡運行時間長的缺點,在應用時更加快捷方便。利用可見-近紅外光譜技術可以快速、準確、無損地對土壤類型進行鑒別,為土壤類型鑒別提供了一種可靠的新途徑。
參考文獻:
[1]何勇,李曉麗,邵詠妮.基于主成分分析和神經網絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[2]何勇,李曉麗. 用近紅外光譜鑒別楊梅品種的研究[J]. 紅外與毫米波學報,2006,25(3):192-194+212.
[3]李曉麗,何勇,裘正軍.一種基于可見-近紅外光譜快速鑒別茶葉品種的新方法[J]. 光譜學與光譜分析,2007,27(2):279-282.
[4]邵詠妮,何勇,潘家志,等. 基于光譜技術的桔子汁品種鑒別方法的研究[J]. 光譜學與光譜分析,2007,27(9):1739-1742.
[5]黃應豐,劉騰輝. 華南主要土壤類型的光譜特性與土壤分類[J]. 土壤學報,1995,32(1):58-68.
[6]劉煥軍,張柏,張淵智,等. 基于反射光譜特性的土壤分類研究[J]. 光譜學與光譜分析,2008,28(3):624-628.
[7]張娟娟,田永超,姚霞,等. 基于高光譜的土壤全氮含量估測[J]. 自然資源學報,2011,26(5):881-890.
[8]王遵義,金春華,劉飛,等. 基于光譜技術的土壤快速分類方法研究[J]. 浙江大學學報:農業與生命科學版,2010,36(3):282-286.
[9]劉家雄. 主成分分析與聚類分析在土壤分類中的應用[J]. 上海農業學報,2011,27(3):110-113.
[10]付強,王志良,梁川. 自組織競爭人工神經網絡在土壤分類中的應用[J]. 水土保持通報,2002,22(1):39-43.
[11]曾慶猛,孫宇瑞,嚴紅兵. 土壤質地分類的近紅外光譜分析方法研究[J]. 光譜學與光譜分析,2009,29(7):1759-1763.
[12]宋海燕,秦剛,韓小平,等. 基于近紅外光譜和正交信號-偏最小二乘法對土壤的分類[J]. 農業工程學報,2012,28(7):168-171.
[13]吳桂芳,蔣益虹,王艷艷,等. 基于獨立主成分和BP神經網絡的干紅葡萄酒品種的鑒別[J]. 光譜學與光譜分析,2009,29(5):1268-1271.
[14]楊芳,李紅睿,田學東. 基于RBF神經網絡的漢字粗分類方法[J]. 計算機工程與應用,2009,45(6):170-172.endprint
本研究采用3層RBF神經網絡,徑向基函數擴展速度(spread)為5.5。
2結果與分析
2.1可見-近紅外光譜分析
2.2主成分分析
3結論
通過試驗獲得4種類型土壤的可見-近紅外光譜特征曲線,結合主成分分析和有導師學習型的2種神經網絡,分別建立了鑒別土壤類型的模型,2種模型預測效果很好,識別率均達到100%。其中RBF神經網絡克服了BP神經網絡運行時間長的缺點,在應用時更加快捷方便。利用可見-近紅外光譜技術可以快速、準確、無損地對土壤類型進行鑒別,為土壤類型鑒別提供了一種可靠的新途徑。
參考文獻:
[1]何勇,李曉麗,邵詠妮.基于主成分分析和神經網絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[2]何勇,李曉麗. 用近紅外光譜鑒別楊梅品種的研究[J]. 紅外與毫米波學報,2006,25(3):192-194+212.
[3]李曉麗,何勇,裘正軍.一種基于可見-近紅外光譜快速鑒別茶葉品種的新方法[J]. 光譜學與光譜分析,2007,27(2):279-282.
[4]邵詠妮,何勇,潘家志,等. 基于光譜技術的桔子汁品種鑒別方法的研究[J]. 光譜學與光譜分析,2007,27(9):1739-1742.
[5]黃應豐,劉騰輝. 華南主要土壤類型的光譜特性與土壤分類[J]. 土壤學報,1995,32(1):58-68.
[6]劉煥軍,張柏,張淵智,等. 基于反射光譜特性的土壤分類研究[J]. 光譜學與光譜分析,2008,28(3):624-628.
[7]張娟娟,田永超,姚霞,等. 基于高光譜的土壤全氮含量估測[J]. 自然資源學報,2011,26(5):881-890.
[8]王遵義,金春華,劉飛,等. 基于光譜技術的土壤快速分類方法研究[J]. 浙江大學學報:農業與生命科學版,2010,36(3):282-286.
[9]劉家雄. 主成分分析與聚類分析在土壤分類中的應用[J]. 上海農業學報,2011,27(3):110-113.
[10]付強,王志良,梁川. 自組織競爭人工神經網絡在土壤分類中的應用[J]. 水土保持通報,2002,22(1):39-43.
[11]曾慶猛,孫宇瑞,嚴紅兵. 土壤質地分類的近紅外光譜分析方法研究[J]. 光譜學與光譜分析,2009,29(7):1759-1763.
[12]宋海燕,秦剛,韓小平,等. 基于近紅外光譜和正交信號-偏最小二乘法對土壤的分類[J]. 農業工程學報,2012,28(7):168-171.
[13]吳桂芳,蔣益虹,王艷艷,等. 基于獨立主成分和BP神經網絡的干紅葡萄酒品種的鑒別[J]. 光譜學與光譜分析,2009,29(5):1268-1271.
[14]楊芳,李紅睿,田學東. 基于RBF神經網絡的漢字粗分類方法[J]. 計算機工程與應用,2009,45(6):170-172.endprint