劉秀英,余俊茹,王世華
(1.河南科技大學(xué)農(nóng)學(xué)院,洛陽 471023;2.洛陽市共微生物與綠色發(fā)展重點實驗室,洛陽 471023;3.洛陽市植物營養(yǎng)與環(huán)境生態(tài)重點實驗室,洛陽 471023)
種子水分是評定種子質(zhì)量的重要指標(biāo)之一,通過種子水分測定,能夠及時采取措施,防止種子發(fā)熱、霉變、生蟲,避免造成種子變質(zhì),是保證種子質(zhì)量的重要手段[1]。傳統(tǒng)測定種子含水率的方法是室內(nèi)烘干稱重法,該方法測定結(jié)果準(zhǔn)確,但比較繁瑣,測定時間較長。其他的直接或間接含水率測定方法雖然也較多,但都存在某些方面的缺點,具有不同的適用范圍[2-3]。已有研究表明水分速測儀具有使用簡單、測定迅速的特點,但其測試結(jié)果的準(zhǔn)確性與適宜的溫度條件、種子的品種及質(zhì)量范圍有密切的關(guān)系[4]。目前,市場上種子水分快速檢測設(shè)備較多,但多數(shù)儀器適合測定特定的品種,需要適宜的工作環(huán)境,測定水分的范圍因品種而異。且油脂類種子含有不飽和脂肪酸,在研磨、剪切、加熱過程中容易氧化,因而較多方法和儀器并不適合進(jìn)行油脂類種子含水率測定[2]。
近紅外光譜分析技術(shù)(Near Infrared Reflectance Spectroscopy,NIRS)是20世紀(jì)80年代發(fā)展起來的一項物理檢測技術(shù)。與傳統(tǒng)分析方法相比,該技術(shù)具有檢測速度快、非破壞性、無損樣品等優(yōu)點,尤其適用于農(nóng)產(chǎn)品品質(zhì)分析[5-7]和食品品質(zhì)檢測[8-9]領(lǐng)域。由于在近紅外光譜區(qū),水的O-H基團(tuán)泛音和組合帶非常明顯,因此該技術(shù)的發(fā)展為種子含水率的測定提供了新的方法[10]。國內(nèi)外學(xué)者采用近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法特別是偏最小二乘方法對種子含水率的快速檢測進(jìn)行了研究,其估算精度差異較大[10-15]。
人工神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)性、容錯性、實時性等優(yōu)點,能夠?qū)W習(xí)和模擬任意復(fù)雜的非線性函數(shù),因而被越來越多的應(yīng)用于可見/近紅外光譜分析[13,15-16]。牡丹籽油富含人體需要的氨基酸、維生素、不飽和脂肪酸(含量高達(dá)92%以上)等多種成分,其中“植物腦黃金”α-亞麻酸占42%左右[17],并且油用牡丹種子出油率較高,因此油用牡丹成為了一種新興的高端木本油料作物。含水率是衡量油用牡丹種子質(zhì)量、影響牡丹籽油品質(zhì)的重要指標(biāo),因而在銷售、儲存及加工過程中需要進(jìn)行快速、準(zhǔn)確測量。然而以油用牡丹種子為研究對象,使用BP神經(jīng)網(wǎng)絡(luò)模型反演種子含水率的研究目前尚不多見。為此,本研究以油用牡丹種子為研究對象,通過相關(guān)分析選擇特征變量作為自變量,建立一元線性回歸模型,然后將從中優(yōu)選的參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,油用牡丹種子含水率作為輸出,建立含水率BP神經(jīng)網(wǎng)絡(luò)估算模型,并對比分析一元線性回歸(SLR,Simple Linear Regression)模型、逐步多元線性回歸(SMLR,Stepwise Multiple Linear Regression)模型、偏最小二乘回歸(PLSR,Partial Least-squares Regression)模型和BP神經(jīng)網(wǎng)絡(luò)(BPNN,BP Neural Network)模型的估算精度,旨在探索油用牡丹種子含水率高光譜估算的最優(yōu)模型,提高油用牡丹種子含水率反演精度,為促進(jìn)中國牡丹產(chǎn)業(yè)發(fā)展及糧油生產(chǎn)、保障國家糧油安全提供理論依據(jù)和技術(shù)支持。
本研究收集了2個年份(即:2016年和2017年)、不同產(chǎn)地(即:安徽安慶、毫州、銅陵;河南洛陽;山東曹縣、吏口、平陰;四川德陽、眉山、資陽)、不同品種(“鳳丹”和“紫斑”)的油用牡丹種子 156份。分年份收集種子樣品后,首先進(jìn)行人工目視篩選,選擇顆粒比較飽滿、大小均勻一致的種子充分進(jìn)行自然干燥,盡可能的去除種子中的含水率。然后分裝在密封袋內(nèi),其中,山東曹縣、平陰、吏口的種子根據(jù)年份、品種不同分成6個平行樣,共獲得72個樣本,設(shè)置3個梯度;而其他省份不同地區(qū)的樣本根據(jù)年份、品種不同分成 3個平行樣,共獲得84個樣本,同樣設(shè)置3個梯度,每份種子樣本約30 g,( 135±10)顆,正好裝滿75 mm培養(yǎng)皿(見圖1),并根據(jù)年份、產(chǎn)地、品種不同進(jìn)行編號。然后將不同梯度樣本放入烘箱干燥,通過調(diào)節(jié)烘干的時間,形成不同的水分梯度,樣本含水率范圍為 0.22%~5.77%,詳細(xì)參數(shù)見表1。

圖1 單個油用牡丹種子樣本Fig.1 Single sample of oil tree peony seeds

表1 油用牡丹種子樣本含水率的統(tǒng)計特征Table 1 Statistical characteristic of moisture content measured oil tree peony seed samples
含水率測定:種子含水率測定采用常壓烘箱干燥法,依照GB/T 5009.3—2003進(jìn)行。
光譜數(shù)據(jù)采集:采用美國Spectra Vista公司的SVC HR-1024i便攜式光譜儀測定置于黑色背景上裝滿75 mm培養(yǎng)皿的油用牡丹種子光譜,該儀器的光譜范圍 350~2 500 nm。在波長350~1 000 nm,光譜分辨率≤3.5 nm;1 000~1 850 nm,光譜分辨率≤9.5 nm;1 850~2 500 nm,光譜分辨率≤6.5 nm。光源為功率50 W鹵素?zé)簦庠慈肷浣菫?45°;探頭視場角為 8°,垂直放置于目標(biāo)物正上方。儀器開機預(yù)熱30 min,然后將油用牡丹種子樣本裝盤,從4個方向?qū)悠愤M(jìn)行掃描,每個方向掃描3次,一個樣品總共掃描12次,去掉異常線后求平均值作為該樣品的光譜值。
通過對種子近紅外吸收光譜、一階微分值與含水率的相關(guān)分析,選擇相關(guān)系數(shù)絕對值大于0.85的波段即特征波長吸收光譜及其特征波長一階微分光譜作為自變量構(gòu)建含水率的一元線性回歸估算模型;將水分吸收特征參數(shù)與含水率進(jìn)行相關(guān)分析,選擇相關(guān)系數(shù)絕對值大于0.85的參數(shù)作為自變量構(gòu)建含水率的一元線性回歸估算模型。為了進(jìn)一步簡化及優(yōu)化模型,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型和偏最小二乘回歸模型時,選用的輸入變量為構(gòu)建一元線性回歸模型時,建模及驗?zāi)?shù)R2大于0.8,驗?zāi)MSE小于0.5%,而RPD大于2.5的變量。
為了驗證模型的預(yù)測精度,采用獨立驗證樣本將模型預(yù)測值和實測值進(jìn)行回歸擬合,以預(yù)測決定系數(shù)(R2)、均方根誤差(RMSE)及相對預(yù)測偏差(RPD)作為指標(biāo)評價模型的學(xué)習(xí)能力和預(yù)測能力。RPD值可以解釋模型的預(yù)測能力,其評價采用 Chang等[18]提出的閾值劃分標(biāo)準(zhǔn)。R2及RPD值越大,RMSE越小,表明模型的精度越高。綜合建模和驗?zāi)>葯z驗結(jié)果,選擇出最優(yōu)估算模型。
圖2和圖3為不同含水率油用牡丹種子樣本的近紅外吸收光譜及吸收特征曲線。由圖2可以看出,油用牡丹種子的近紅外吸收光譜隨含水率增加而增大,在整個波段范圍內(nèi),光譜曲線總體變化比較明顯,具有多個波峰、波谷;此外,光譜曲線具有相似的變化規(guī)律,在1 200、1 440、1 930、2 140 nm波長附近有強烈的吸收峰,隨含水率增加吸收峰強度具有增大的趨勢,而吸收峰位置具有朝長波方向偏移的趨勢。依據(jù)前人研究可知,1 400、1 900和2 100 nm波長附近的吸收峰是由于水分的強吸收引起的[10,19-20],因而采用包絡(luò)線法制作了吸收深度曲線圖(圖3)。從圖3中可以看出,吸收深度最大的波長位于3個水分吸收帶,具體位置為1 440、1 930、2 140 nm波長附近。當(dāng)油用牡丹種子含水率發(fā)生變化時,1 930 nm波長處的波段寬度最窄;2 140 nm波長處的吸收深度及吸收面積變化最明顯,1 440 nm波長處的吸收深度參數(shù)變化最小。因而可以提取1 440、1 930、2 140 nm波長附近的水分吸收特征參數(shù)進(jìn)行油用牡丹種子含水率反演。

圖2 油用牡丹種子的近紅外吸收光譜Fig.2 Near infrared spectrogram of oil tree peony seeds

圖3 油用牡丹種子的光譜吸收深度曲線Fig.3 Spectral absorption depth curves of oil tree peony seeds
對油用牡丹種子近紅外吸收光譜及一階微分光譜與含水率進(jìn)行相關(guān)分析,其相關(guān)系數(shù)見圖4。依據(jù)相關(guān)系數(shù)較大且位于 3個水分吸收帶附近的原則,分別選取了 3個特征波長光譜及 3個特征波長一階微分光譜變量(見圖4)用于后續(xù)分析建模,其相關(guān)系數(shù)大小見表2。分析表2可知,特征波長光譜及特征波長一階微分光譜與含水率的相關(guān)性較好,相關(guān)系數(shù)較高,均通過了0.01極顯著性檢驗。特征波長光譜變量與含水率的相關(guān)系數(shù)介于0.83~0.90之間,而特征波長一階微分光譜變量與含水率的相關(guān)系數(shù)均大于 0.91,介于 0.91~0.96之間,后者的相關(guān)性明顯高于前者。選擇這3個特征波長光譜及3個特征波長一階微分光譜變量參與一元線性含水率估算模型的構(gòu)建。
對光譜進(jìn)行包絡(luò)線去除后,提取水分吸收特征波段1 440、1 930、2 140 nm處的水分吸收特征參數(shù),包括:最大吸收深度(D)、吸收總面積(A)、吸收峰右面積(RA)、吸收峰左面積(LA)、面積歸一化最大吸收深度(AD),及吸收波段波長位置(P)。將提取的吸收特征參數(shù)與含水率進(jìn)行相關(guān)分析,其相關(guān)系數(shù)的大小見表3。從表3可知,除P1930無法計算,LA1440、D2140、RA2140與含水率的相關(guān)系數(shù)在0.05水平上相關(guān)外,其余各參數(shù)與含水率的相關(guān)性均達(dá)到了 0.01水平極顯著相關(guān)。其中,面積歸一化最大吸收深度(AD)與含水率的相關(guān)性最好,兩者間的相關(guān)系數(shù)均大于0.9。比較3個波段位置的吸收特征參數(shù)與含水率的相關(guān)系數(shù)可知,2 140 nm波長處的吸收特征參數(shù)與含水率的相關(guān)性明顯優(yōu)于另外兩個波長位置的參數(shù)。總體來看,吸收特征參數(shù)與含水率的相關(guān)系數(shù)高于0.85的有7個,說明這些吸收特征參數(shù)對含水率變化更敏感,因而選擇這 7個吸收特征參數(shù)作為變量參與一元線性含水率估算模型的構(gòu)建。

圖4 近紅外吸收光譜、一階微分光譜與含水率的相關(guān)性Fig.4 Correlation between near infrared absorption spectra and first derivative of spectra and moisture content

表2 油用牡丹種子特征波長光譜與含水率的相關(guān)系數(shù)Table 2 Correlation coefficients between characteristic wavelength spectrum of oil tree peony seed and moisture content
2.3.1 含水率的一元線性回歸估算模型
建立 13個光譜特征變量與含水率的一元線性估算模型,然后采用獨立樣本進(jìn)行驗證,其建模及驗?zāi)?shù)見表4。分析表4可知,除R1410和S1930這2個變量建立的線性估算模型的驗證RPD值小于2.0外,其余變量建立的一元線性估算模型的驗證RPD值均大于2.0,校正及驗證R2均大于0.75,說明這些變量建立的模型均能用于油用牡丹種子含水率快速、無損檢測。3個特征波長一階微分光譜建立的估算模型效果均較好,建模及驗?zāi)2和RPD值均較大,而RMSE值均較小,尤其以DF1950、DF2080這2個參數(shù)建立的模型估算效果更佳,其建模及驗?zāi)2均高于0.92,RPD值高于4.0,而RMSE值小于0.4%。

表3 油用牡丹種子水分吸收特征參數(shù)與含水率的相關(guān)系數(shù)Table 3 Correlation coefficients between absorptioncharacteristics parameters of oil tree peony seed and moisture content
吸收特征參數(shù)中以面積歸一化吸收深度參數(shù)建立的估算模型效果最好,尤其以AD2140建立的估算模型效果最佳,其建模及驗?zāi)2高于0.94,RPD值高于4.0,而RMSE值小于0.4%。綜合分析比較一元線性模型的建模及驗?zāi)5母黜梾?shù)值可知,以DF2080和AD2140為自變量建立的模型優(yōu)于其他光譜特征變量建立的模型,都能對含水率進(jìn)行很好的估算;而且這2個模型建模及驗?zāi)8黜梾?shù)幾乎相同,相比較而言,以DF2080為自變量建立的模型均方根誤差RMSEv較小,而RPDv值較大所以該模型為一元線性模型中的最優(yōu)估算模型。由于一元線性模型只是應(yīng)用了一個光譜特征變量建模,為了進(jìn)一步提高含水率預(yù)測精度,依據(jù)建模及驗?zāi)?shù)R2大于0.8,RMSEv小于0.5%,而RPDv大于2.5的原則,從13個光譜特征變量中進(jìn)一步優(yōu)選出 5個光譜特征變量(即 DF1150、DF1950、DF2080、AD1930、AD2140)用于逐步多元線性回歸、偏最小二乘回歸及人工神經(jīng)網(wǎng)絡(luò)建模。

表4 基于光譜特征變量的油用牡丹種子含水率估算模型參數(shù)Table 4 The model parameters of moisture content in oil peony seed based on spectral characteristic variable
2.3.2 含水率的BP神經(jīng)網(wǎng)絡(luò)模型
以優(yōu)選出來的5個光譜特征變量(DF1150、DF1950、DF2080、AD1930、AD2140)作為輸入層,油用牡丹種子實測含水率作為輸出層,隱含層節(jié)點數(shù)q根據(jù)經(jīng)驗公式(1)[21]給定的范圍,通過試錯法多次訓(xùn)練后選出最佳節(jié)點數(shù)為5,建立一個網(wǎng)絡(luò)結(jié)構(gòu)為5-5-1的BP神經(jīng)網(wǎng)絡(luò)模型。

式中k為輸入層單元數(shù);m為輸出層單元數(shù);α為[1,10]之間的常數(shù)。
利用Matlab編程進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,為了使網(wǎng)絡(luò)在訓(xùn)練階段容易收斂,首先對輸入輸出變量進(jìn)行歸一化處理[22];網(wǎng)絡(luò)中間層神經(jīng)元傳遞函數(shù)采用 S型正切函數(shù)Tansig,輸出層神經(jīng)元傳遞函數(shù)采用線性函數(shù) Purelin,訓(xùn)練函數(shù)為 trainlm[23]。通過 BP神經(jīng)網(wǎng)絡(luò)分析得到含水率的預(yù)測值,然后對獨立驗證樣本的實測值與預(yù)測值進(jìn)行擬合及精度檢驗,結(jié)果見表5。模型的訓(xùn)練值和目標(biāo)值均方根誤差RMSE為0.220%,相關(guān)系數(shù)為0.989,相對分析誤差RPD值為6.478,模擬結(jié)果很好。預(yù)測值和實測值的均方根誤差RMSE為0.242%,預(yù)測值和實測值相關(guān)系數(shù)達(dá)到 0.986,相對分析誤差RPD值為5.889,模型預(yù)測效果也非常好。綜上所述,BP神經(jīng)網(wǎng)絡(luò)模型的建模及驗證精度都非常高,可進(jìn)行油用牡丹種子含水率精確估算,幾乎可以與實驗室測量結(jié)果相媲美。
2.3.3 BP神經(jīng)網(wǎng)絡(luò)模型與回歸模型的比較
將BP神經(jīng)網(wǎng)絡(luò)模型與一元線性回歸模型、逐步多元線性回歸模型以及目前在含水率預(yù)測中應(yīng)用非常廣泛的偏最小二乘回歸模型進(jìn)行比較,其結(jié)果見表5。為了保證模型具有可比性,建立SMLR模型和PLSR模型時,選取與構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型相同的自變量(即優(yōu)選的 5個光譜特征變量 DF1150、DF1950、DF2080、AD1930、AD2140)作為輸入變量,并采用相同的獨立樣本進(jìn)行驗證。表5列出了不同估算模型的建模及驗證結(jié)果。結(jié)果表明,BPNN模型的建模效果最好,建模決定系數(shù)R2為0.978,RMSE為0.220%;其次為多元線性模型,建模決定系數(shù)R2為0.961,RMSE為0.289%。就模型檢驗效果而言,BP神經(jīng)網(wǎng)絡(luò)模型驗證效果仍然最佳,其次為多元線性模型,均優(yōu)于PLSR模型和一元線性模型。PLSR模型驗證決定系數(shù)Rv2為0.955,RMSEv和 RPDv分別為 0.242%和 5.889,預(yù)測精度略低于 BP神經(jīng)網(wǎng)絡(luò)模型和逐步多元線性模型;而一元線性模型無論是建模還是驗?zāi)PЧ畈睢5牵辉€性模型僅用了一個光譜特征變量建模,從建模及驗?zāi)8黜梾?shù)來看估算效果也比較好,精度比較高。由于該方法最簡單且容易操作,在能夠滿足油用牡丹種子含水率估算的精度情況下,不失為優(yōu)先選擇的估算方法。綜合比較4類模型的建模及驗?zāi)8黜梾?shù)可知,4類模型的預(yù)測精度都比較高,而BPNN模型的預(yù)測效果最好,其次是多元線性估算模型。

表5 不同估算模型的建模及驗證結(jié)果Table 5 Modeling and testing results under different estimation
種子的近紅外光譜是其各種組成成分及其內(nèi)、外結(jié)構(gòu)的綜合表現(xiàn),兩者之間存在著密切關(guān)系。油用牡丹種子樣品中含有大量的C-H、O-H、N-H等含氫基團(tuán),因而在近紅外光譜圖中出現(xiàn)很強烈的吸收,形成吸收峰。但是高光譜數(shù)據(jù)具有波段多、數(shù)據(jù)量大、冗余性強等特點,若直接用全波段數(shù)據(jù)進(jìn)行數(shù)據(jù)建模就會導(dǎo)致建模效率低、模型的性能差[24],因此本研究通過相關(guān)分析篩選出了不同油用牡丹種子含水率的敏感波長,有利于構(gòu)建較高精度的、比較簡單的估測模型。將近紅外吸收光譜、一階微分光譜與含水率進(jìn)行相關(guān)分析,結(jié)果表明一階微分光譜與含水率的相關(guān)性明顯高于近紅外吸收光譜。通過相關(guān)分析選擇了相關(guān)系數(shù)較大且位于水分吸收波長附近的3個特征波長1 410、1 900、1 990 nm處的吸收光譜,和3個特征波長1 150、1 950、2 080 nm處的一階微分光譜作為變量,參與一元線性回歸建模,結(jié)果表明特征波長一階微分光譜建立的模型預(yù)測效果更好,究其原因可能是一階微處分光譜可以部分消除線性或接近線性噪聲的影響[23]。已有研究表明,含水率不同時吸收光譜的吸收峰的位置會產(chǎn)生偏移,通過微分變換可以進(jìn)一步增強高頻信息,因而微分變換可以調(diào)整波長光譜,使吸收峰的位置更加明顯[10],同樣,通過相關(guān)分析可以使不同含水率的吸收光譜的吸收峰的位置更加明顯。本研究分析吸收光譜曲線探究水分的吸收峰位置與通過相關(guān)分析和微分變換選擇的特征吸收峰的具體波段位置雖然稍有差異,但大多都位于1 400、1 900、2 100 nm附近,可見不同方法的分析結(jié)果具有一致性。
通過包絡(luò)線消除法可以去除那些不感興趣的吸收特征,孤立單個感興趣的吸收特征,并將其歸一到一個一致的光譜背景上,從而具有可以擴大弱吸收特征信息的優(yōu)勢[25]。故本研究采用包絡(luò)線消除法提取了 1 440、1 930和2 140 nm 3個水分吸收波段附近的18個吸收特征參數(shù),通過相關(guān)分析選擇了7個相關(guān)系數(shù)大于0.85的水分吸收特征參數(shù)參與一元線性回歸分析建模。通過比較分析建模及預(yù)測結(jié)果可知,3個吸收深度參數(shù)為變量構(gòu)建的模型優(yōu)于其他吸收特征參數(shù)為變量構(gòu)建的模型;并且2 100 nm波長位置附近的參數(shù)(比如:AD2140)建立的模型優(yōu)于1 400和1 900 nm波長位置附近參數(shù)建立的模型。分析原因可能是:從吸收深度圖可以發(fā)現(xiàn),不同含水率的種子樣本在 2 100 nm波長位置附近吸收峰的吸收深度和吸收面積的變化最明顯,說明含水率的變化對這個波長位置的光譜峰值變化影響更大,從而這個位置的參數(shù)建立的模型效果更優(yōu),這一結(jié)論有待進(jìn)一步研究。
建模方法是影響可見/近紅外光譜分析法預(yù)測精度的一個主要因素,因此采用多變量校正算法來構(gòu)建光譜數(shù)據(jù)與分析目標(biāo)之間的關(guān)系并進(jìn)行預(yù)測精度比較是非常重要的[24]。本研究比較了SLR、SMLR、PLSR和BPNN方法建立的含水率估算模型的預(yù)測精度,結(jié)果表明 BPNN模型的預(yù)測精度最高,其次為SMLR模型,這與其他研究者的結(jié)論一致[23,26]。多元回歸模型可以實現(xiàn)降維和剔除冗余信息[27],顯著提升光譜分析的精度和可靠性[28],因而模型的預(yù)測精度相對較高。而BPNN模型預(yù)測結(jié)果優(yōu)于PLSR模型,原因可能是BPNN模型能夠解釋光譜變量與含水率間存在的非線性關(guān)系,而偏最小二乘回歸模型是一種線性算法,沒有考慮光譜變量中某些潛在的非線性信息。BP神經(jīng)網(wǎng)絡(luò)是一種采用誤差反向傳播算法對網(wǎng)絡(luò)權(quán)值進(jìn)行訓(xùn)練的多層前向網(wǎng)絡(luò),通過反向傳播途徑能夠不斷的調(diào)整網(wǎng)絡(luò)的閾值與權(quán)值,直至滿足誤差最小精度條件,輸出最優(yōu)結(jié)果[29]。在數(shù)據(jù)分析時,理論上BP神經(jīng)網(wǎng)絡(luò)模型能夠無限逼近任意復(fù)雜的非線性函數(shù),因而對非線性問題有很好的解釋性。但是,BP神經(jīng)網(wǎng)絡(luò)算法的網(wǎng)絡(luò)權(quán)值初始化是隨機的,神經(jīng)網(wǎng)絡(luò)程序在每次運行后得到的訓(xùn)練結(jié)果是不同的[23,30],因此BP 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程很難取得全局最佳效果。而且BP神經(jīng)網(wǎng)絡(luò)的隱含層的層數(shù)及節(jié)點數(shù)對網(wǎng)絡(luò)的模擬及預(yù)測精度影響較大[24],所以與其他回歸模型相比,其在實用性方面還有待于進(jìn)一步的研究。此外,為了驗證所建模型的實用性,下一步將進(jìn)行另外批次自然含水率的種子驗證試驗;其次,本研究油用牡丹種子含水率比較低,范圍比較窄,為了拓寬模型的適用范圍,進(jìn)一步研究將擴大種子含水率的范圍。
本研究針對油用牡丹種子的含水率,采用包絡(luò)線消除法提取水分吸收特征參數(shù),分析了含水率與近紅外吸收光譜、一階微分光譜及水分吸收特征參數(shù)的相關(guān)關(guān)系,建立了油用牡丹種子含水率估算的一元線性回歸模型、逐步多元線性回歸模型、偏最小二乘回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型,并比較了不同模型的預(yù)測精度,得出如下結(jié)論:
1)通過相關(guān)分析確定了含水率的吸收光譜特征波長為 14 10、1 900、1 990 nm,一階微分光譜特征波長為1 150、1 950、2 080 nm;
2)水分吸收特征參數(shù)與含水率的相關(guān)性較好,相關(guān)系數(shù)大于 0.9的水分吸收特征參數(shù)為吸收深度參數(shù),即AD1930、AD2140、AD1440;
3)以DF2080和AD2140為自變量建立的一元線性回歸模型預(yù)測效果明顯優(yōu)于其他模型;
4)將構(gòu)建一元線性回歸模型時篩選出的光譜特征變量作為輸入,實測含水率值作為輸出,構(gòu)建含水率估算的逐步多元線性回歸模型、偏最小二乘回歸模型及BP神經(jīng)網(wǎng)絡(luò)模型。其中BP神經(jīng)網(wǎng)絡(luò)模型的建模與驗?zāi)2分別為0.978和0.973,RMSE分別為0.220%和0.242%,而RPD值分別為6.478和5.889,與其他回歸模型相比,BP神經(jīng)網(wǎng)絡(luò)模型的建模及驗?zāi)>染罡撸冶容^穩(wěn)定,是估算油用牡丹種子含水率的最優(yōu)模型,其次為逐步多元線性回歸模型。在能夠滿足油用牡丹種子含水率估算的精度情況下,一元線性回歸模型估算方法可以作為優(yōu)先選擇。