999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

玉米秸稈磷含量近紅外漫反射光譜的建模研究

2021-07-29 07:57:36李冬冬王浩瑛李國梁何思洋陳紹江劉文欣
中國農業大學學報 2021年8期
關鍵詞:模型

李冬冬 王浩瑛 王 蒙 王 銘 李國梁 何思洋 陳紹江 劉文欣*

(1.中國農業大學 農學院/作物雜種優勢研究與利用教育部重點實驗室/作物遺傳改良北京市重點實驗室/國家玉米改良中心,北京 100193;2.中國農業大學 國家能源非糧生物質原料研發中心,北京 100193)

玉米是我國重要的主糧作物,產量高且具有飼料和能源等多重價值。玉米產量的穩產和高產在保障我國糧食安全方面發揮了重要作用。磷是植物生長必須的大量元素,參與植物體內許多重要的代謝途徑[1]。然而我國大量土地處于缺磷狀態[2],土壤中絕大部分磷素以難溶性磷酸鹽和有機磷形式存在,有效磷的含量較低[3],磷短缺將成為玉米生產的一大挑戰[4]。我國每年磷肥施用量超過700萬t[5],一定程度上提高了農業生產成本,但施磷肥并不能從根本上解決問題,且過量使用會給環境帶來一定的負面影響[6]。從長遠來看,培育耐低磷和磷高效利用的玉米品種是更為有效的手段,要實現這一育種目標,首先需要能快速準確測量植物磷含量的方法。

目前測定植物磷含量的方法有很多,如比色法[7]、原子吸收光譜法[8]、電感耦合等離子質譜法[9]和原子發射光譜法[10]等。但這些方法均需對樣品進行前處理,存在程序繁瑣、成本高以及易受干擾等問題,因此急需創制一種簡單便捷且易用有效的植物磷含量測定技術。

上個世紀六十年代,使用近紅外光譜(NIRS)來進行物質測定的研究就已經開始[11]。近年來,隨著光譜學技術的發展,近紅外光譜測量已成熟應用于定性與定量分析。定性分析如李偉等[12]使用機器學習方法對玉米單倍體種子進行鑒別,使用樸素貝葉斯、決策樹、K近鄰及支持向量機(SVM)等常用方法構建出了近紅外玉米單倍體鑒別模型,其中前饋神經網絡和偏最小二乘(PLS)的模型效果最好。定量分析如對土壤全磷含量[13]和煙草中磷含量[14]的測定等,其中土壤磷含量的預測相關系數為 0.83,在0.05顯著水平下,利用近紅外光譜技術所得的煙草根、莖和葉中磷含量的預測值與測定值之間不存在顯著差異。目前近紅外定量分析技術已應用于植物秸稈組分的分析,Payne等[15]利用PLS建立的近紅外物質測定模型,對玉米秸稈、水稻秸稈和高粱秸稈等多種原料組成的物質中的葡聚糖、木聚糖、木質素和灰分都起到了很好的預測效果,決定系數(R2)在0.90左右;Hu等[16]將可見光和近紅外反射光譜和改進的PLS相結合,建立了預測不同水稻群體木質素單體含量的校正模型,建立了預測對羥基苯基、愈創木酚和丁香基木質素單元含量及其總量的4個最佳方程;Fan等[17]采用NIR監測了高粱秸稈固態發酵過程,PLS在糖、乙醇、水和pH的含量預測中表現良好,其多元回歸模型的R2分別為 0.93、0.94、0.87和0.95,而均方根誤差(RMSE)僅分別為0.013、0.006、0.008和0.150。這些研究表明,近紅外光譜是一種快速準確的可用于秸稈組分分析的方法。

近紅外光譜分析法具有速度快、無損和操作簡便的優點,但目前針對玉米秸稈磷含量的快速檢測模型未見報道。本研究比較了PLS、最小絕對值收斂和選擇算子(LASSO)、SVM和回歸樹(RT)這幾種建模方法,旨在建立玉米秸稈磷含量快速精確的預測模型,為NIRS技術應用于植物磷含量測定提供依據,為磷高效玉米材料的篩選和遺傳學研究奠定基礎。

1 材料與方法

1.1 試驗材料

試驗材料來源于本課題組2018年種植于中國農業大學上莊試驗站磷長期定位試驗地的玉米自交系群體。該群體來源廣泛,包含106個溫帶、48個熱帶和亞熱帶的種質資源。玉米成熟后,混合收獲其地上部分的莖和葉組織,于65 ℃烘箱烘干至恒重,再用植物粉碎機粉碎,封存于紙袋中并儲存在干燥避光的環境中。

1.2 近紅外光譜數據的采集

將等量粉末狀樣品小心放入樣品盤中,用壓樣器壓樣并刮去多余樣品。采用Thermo Scientific公司Antaris系列傅立葉近紅外儀和附帶軟件采集樣品光譜,光譜范圍4 000~10 000 cm-1,掃描10次,分辨率為4 cm-1。

1.3 磷含量的化學測定

利用鉬銻抗比色法測定樣品的磷含量,具體方法參照國家標準NY/T 2421—2013[18],該試驗由中國農業大學國家能源非糧生物質原料研發中心分析測試中心完成。

1.4 模型建立與評價

使用pls[19]、lars[20]、kernlab[21]和rpart[22]R語言程序包中的PLS、LASSO、SVM和RT 4種方法建模,并使用caret[23]R語言程序包計算PLS模型的最優主成分數。

采用5折交叉驗證策略評價模型預測準確性和精度[24],將200份樣品按4∶1進行隨機抽樣,分別作為訓練集(training set)和測試集(test set),用以建立模型和評價模型。該步驟重復1 000次。對于PLS而言,由于每次抽樣所得訓練集包含的個體不一樣,所以在評價模型時,所選用主成分數量也不相等。而PLS的主成分數量選擇十分關鍵,對預測結果的影響較大,本研究首先使用訓練集來選取最優的主成分數,具體方法為將訓練集再分為5份,其中1份作為驗證集,選擇不同的主成分數量來進行交叉驗證,最終選取RMSE最小的主成分數量來對測試集進行預測。LASSO使用訓練集進行5折交叉驗證來確定最優解的步數,SVM選取最佳的核函數,RT也選擇最適合的參數。將測試集真實值與預測值的相關系數(rtest)和訓練集真實值與預測值的相關系數(rtraining)作為模型的評價指標。相關系數越大,所建立模型的預測準確性越高。

1.5 光譜數據預處理

用11種方法對光譜數據進行預處理,包括一階導數(First Derivative, d1)、二階導數(Second Derivative, d2)、多元散射校正(Multiplicative Scatter Correction, MSC)、歸一化(Scale)、平滑化(Smooth)、標準正態變換(Standard Normal Variate, SNV)、一階導數+多元散射校正(d1_msc)、一階導數+歸一化(d1_scale)、平滑化+一階導數(sm_d1)、平滑化+一階導數+歸一化(sm_d1_scale)和平滑化+二階導數(sm_d2)預處理。所有預處理均使用matlab軟件完成。

2 結果與分析

2.1 近紅外光譜數據

200份玉米秸稈樣品的原始光譜如圖1所示,每條光譜由1 557個變量組成。由圖1可知,光譜曲線趨勢一致,且不同樣品的光譜吸收有差異,這說明光譜數據可用于近紅外定量分析。

圖1 200份玉米秸稈樣品的原始近紅外光譜圖Fig.1 Original NIRS of 200 maize straw samples

2.2 玉米秸稈磷含量的化學測定

利用鉬銻抗比色法測定的200份玉米秸稈磷含量分布如圖2。磷含量變化范圍為0.62~2.79 mg/g,平均值為1.41 mg/g,中位數為1.33 mg/g,變異系數為32.58%。這表明本研究選取的200份玉米秸稈樣品的磷含量變異較大,具有代表性。

圖中虛線表示均值。The dotted line in the figure represents the mean value.圖2 200份玉米秸稈樣品的磷含量分布Fig.2 Distribution of phosphorus concentration of 200 straw samples

2.3 磷含量預測模型最佳參數的選擇

對于PLS 模型,在訓練集中進行5折交叉驗證,來選擇最佳的主成分數目。其中,主成分數目最多可以選擇到訓練集數目減去1,在此過程中,模型的RMSE先逐步下降再緩步上升(圖3(a)),但在選取的主成分數目過大時,模型很不穩定,出現了RMSE的陡升,但主成分數目選擇并不受影響。對于SVM,核函數對于結果的影響很大,于是我們對SVM的6種不同的核函數進行了比較,最終選取的是表現最佳的線性函數“vanilladot”(圖3(b))。LASSO也是在訓練集中進行了5折交叉驗證,用RMSE來選取最優解的步數。在RT中, rpart函數中的參數“method”,選取最適合本研究的“anova”。

(a)中虛線表示選取的RMSE最小時的主成分數;(b)中不同小寫字母代表差異性顯著(LSD法,α=0.05)。下同。The dotted line in Figure (a) represents the number of principal components when the selected RMSE is the smallest. Different letters represent a significant difference in Figure (b) (LSD method, α=0.05). The same below.圖3 PLS最佳主成分數和SVM最佳核函數的選擇Fig.3 The best selection of number of principal components for PLS and kernels for SVM

2.4 不同模型預測磷含量的準確性

利用PLS、LASSO、SVM和RT等4種算法構建光譜數據與化學測定結果的數學關系模型,各模型預測準確性表現如圖4。結果顯示,4種算法對于訓練集和測試集的預測準確性均具有顯著性差異。其中,PLS表現最優,對訓練集的擬合準確性為0.97±0.03,對測試集的預測準確性達到了0.80±0.05。LASSO通過限制回歸方程各系數絕對值之和,達到降維的效果,它會壓縮部分系數為0,從而會導致部分信息喪失,因而模型效果并不理想,測試集的預測準確性為0.67±0.08;SVM的最終性能是由核函數直接決定的,本模型中選取的是線性核函數,但其擬合和預測效果都不及PLS,測試集的預測相關系數為0.69±0.08;RT所得模型的測試集預測相關系數僅為0.03±0.15,訓練集擬合的相關系數為0.68±0.03,擬合與預測效果在4種方法中表現最差,這說明該方法不適用于本類型的數據建模。

圖4 4種模型預測的相關系數Fig.4 The prediction correlation coefficients of the four models

2.5 多種光譜預處理方法對磷含量建模精度的影響

基于以上結果,PLS為篩選出的最優建模方法。將PLS結合不同預處理方式來探究不同光譜預處理方法對磷含量預測相關性的影響,結果如圖5(a)和5(b)所示,主成分數量的選取如圖5(c)所示。結果表明,對于訓練集的預測,原始數據、歸一化和平滑化表現最好,二階導數和平滑化+二階導數表現最差;對于測試集的預測,也呈現出相似的趨勢。這說明對于磷含量的預測,原始數據的表現已經很好,所采取的這些預處理方法意義不大,是否有更好的預處理方法,值得我們進一步的探究。

圖5 不同預處理方法結合PLS所得模型的預測相關系數和選取的主成分數量Fig.5 The prediction accuracy of different pre-processing methods combined with PLS model and the number of principal components selected

2.6 訓練集和測試集的樣品比例與模型精度的關系

通常情況下樣本量的大小影響建模的精度和實用性。為了探究建模所需的最少樣本數,本研究將200份樣品分成了不同比例,探索訓練集與測試集不同比例(分別為2∶8、3∶7、4∶6、5∶5、6∶4、7∶3、8∶2 及9∶1)時,對測試集的預測效果。結果顯示,隨著訓練集數目的增多,訓練集的擬合相關系數和測試集的預測相關系數均不斷上升。但是訓練集數目達到160,即訓練集∶測試集為8∶2時,測試集的相關系數達到了0.80,再增大訓練集比例也并沒有顯著提高預測準確性。留一法是只將一個樣本作為測試集,剩下的樣本都作為訓練集,最大限度地選取了訓練集,能夠計算模型的最大預測相關性[25]。留一法的擬合結果如圖6(c)所示,呈現出較好的擬合效果,但是其得到的rtest與5折交叉驗證無顯著差異(圖6(b))。這說明,對于本研究來說,5折交叉驗證已經足夠,無需采取計算難度更大的留一法。

(b)中虛線為留一法測試集的預測相關系數;(c)中紅色點代表真實值最大的15個樣品,藍色點代表真實值最小的15個樣品。In Figure (b), the dotted line is the rtest of Leave-One-Out method. In Figure (c), the red dots represent the 15 samples with the largest true values, and the blue dots represent the 15 samples with the smallest true values.圖6 不同訓練集比例和留一法結合PLS模型的預測相關系數Fig.6 The prediction correlation of different training set ratios and Leave-One-Out method combined with PLS model

3 討論與結論

近紅外光譜是研究分子運動的吸收光譜[26],主要基于C-H、N-H、O-H和C-O這些基團的振動倍頻和合頻的吸收,其中振動效應的特殊性為物理化學提供了大量的獨立的高價值光譜信息[27],因為不同樣品對近紅外光譜的選擇性吸收,可以對物質進行定性和定量分析,應用于物質磷含量的測定。Murguzur 等[28]使用NIR對植物葉片磷含量進行測定,決定系數為0.76;Lin等[29]使用NIR對混合土壤全磷含量進行測定,決定系數約為0.60。前人的研究也充分證明了使用近紅外光譜建立磷含量測定的模型有較高的研究價值。

本研究是將近紅外光譜技術應用于玉米秸稈磷含量的定量分析,比較了不同建模方法和不同預處理方式對模型預測準確性和穩定性的影響,并研究了建模時所需的最小樣本數目。在玉米秸稈磷含量的定量分析中,對4 000~10 000 cm-1波段的光譜數據采用PLS進行建模,所得模型最優。所得模型的訓練集的擬合相關系數為0.97±0.03,測試集的預測相關系數為0.80±0.05。Baye等[30]的研究證明了PLS在NIR預測玉米籽粒營養物質方面也具有卓越的性能,尤其是對玉米籽粒中蛋白質含量的預測準確性達到了0.90,對淀粉含量的預測相關性達到了0.87。Kahrman等[31]的研究也獲得了類似的結果。這說明,PLS非常適合用于建立玉米干物質含量NIR定量分析的模型。Carra等[32]開發了PLS模型用NIR預測土壤中磷含量,其測試集的決定系數達到了0.95,這進一步說明了NIR和PLS在快速檢測磷含量上的應用價值,也說明本研究模型還有待改進。前人的研究及我們得到的結論均表明,近紅外光譜技術可應用于玉米秸稈磷含量的快速測定,這為植物磷含量的測定提供了一種快速、簡便和實用的方法,使得大量樣本的測定變得更加方便。

在生產上,采用化學方法測定物質含量是十分繁雜的,而近紅外光譜的測定則十分容易,只需要采用化學方法測定小部分樣品的物質含量,作為訓練集,建立PLS模型,便可以快速預測大量的樣本,大大加快科學研究的進程。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 99国产在线视频| 欧美成人手机在线观看网址| 久久a毛片| 成人免费一级片| 热这里只有精品国产热门精品| a级毛片免费网站| 国产成人综合亚洲欧美在| 91在线激情在线观看| 狂欢视频在线观看不卡| 青青青视频91在线 | 亚洲成人在线网| 中文字幕调教一区二区视频| 亚洲国产精品美女| 亚洲无码熟妇人妻AV在线| 精品国产一二三区| 欧美中文字幕在线二区| 久久www视频| 999精品在线视频| 色综合中文| 91精品国产福利| 国产美女一级毛片| 精品人妻无码区在线视频| 欧美中文字幕无线码视频| 亚洲91精品视频| av一区二区三区高清久久| 日本在线视频免费| 国内精品视频在线| 欧美劲爆第一页| 99久久精品免费观看国产| 青青操国产| 亚洲性日韩精品一区二区| 免费A级毛片无码无遮挡| 亚洲有无码中文网| 2020国产精品视频| 欧美区一区二区三| 天堂久久久久久中文字幕| 亚洲视频a| Aⅴ无码专区在线观看| 国产超碰在线观看| 国产精品三级av及在线观看| 亚洲免费福利视频| 欧美亚洲另类在线观看| 亚洲第一成年人网站| 国产高清无码麻豆精品| 57pao国产成视频免费播放| 免费无码又爽又黄又刺激网站 | 亚洲中文精品人人永久免费| 特黄日韩免费一区二区三区| 亚洲精品福利网站| 无码免费的亚洲视频| 日韩一区二区三免费高清| 九九这里只有精品视频| 在线观看免费黄色网址| 精品无码日韩国产不卡av| 色妞www精品视频一级下载| 亚洲成人网在线播放| 欧美日韩午夜| 亚洲AV永久无码精品古装片| 午夜视频在线观看区二区| 久久亚洲国产一区二区| 免费在线a视频| 男女性午夜福利网站| 找国产毛片看| 免费毛片在线| 亚洲三级影院| 精品国产自| 亚洲欧洲日韩国产综合在线二区| 国产精品一区在线观看你懂的| 四虎永久在线精品国产免费| 成人一级免费视频| 国产视频欧美| 亚洲成人精品在线| 欧美一级大片在线观看| 婷婷色中文网| 欧美一级99在线观看国产| 国产激爽大片在线播放| 国产在线专区| 亚洲天堂区| 色老头综合网| 日本中文字幕久久网站| 女同国产精品一区二区| 青青青国产精品国产精品美女|