999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MC-UVE-VIP兩步波長篩選實現近紅外光譜模型的無標樣傳遞

2023-02-20 11:34:06張站鴿倪力軍張立國欒紹嶸
分析測試學報 2023年2期
關鍵詞:方法模型

張站鴿,倪力軍,張立國,欒紹嶸

(華東理工大學 化學與分子工程學院,上海 200237)

近紅外光譜(NIRs)技術是一種綠色、無損、快速的檢測方法。隨著化學計量學理論方法和計算機技術的快速發展,NIRs技術已被應用于農產品[1]、中藥[2]和煙草[3-4]等領域。該技術以樣品的近紅外光譜數據為自變量,樣品的待測性質為因變量,利用多元分析方法建立定量或定性的NIRs分析模型,并對驗證集樣品進行預測。研究表明[5-9],建立一個預測效果良好的模型未必需要所有的波長信息,因此需對波長進行篩選。常見的波長篩選方法有遺傳算法(GA)[10]、連續投影算法(SPA)[11]、無信息變量消除算法(UVE)[12]以及變量穩定性競爭自適應重加權抽樣算法(SCARS)[13]等,但這些方法大都以單臺儀器上模型的預測誤差最小為目標進行優化,建立的模型未必能在多臺儀器間共享。

本課題組基于不同儀器間光譜的差異提出的方差分析[5,14]和光譜比值分析[6]方法,通過篩選出主、從機間光譜信號一致且穩定的波長變量,在主機上建立的NIRs定量模型對從機玉米中主要成分和黃芩中黃芩苷的預測誤差比分段直接校正(PDS)[15]算法更小或接近。同時基于儀器間光譜響應信號一致且穩定的波長,結合相關系數法、無變量信息消除[16]以及變量重要性投影[17]算法等波長篩選方法,建立了煙葉中總植物堿的定量模型,該模型對從機樣品總植物堿含量的預測誤差滿足企業內控要求[7]。文獻[18]也報道了基于主、從機間光譜信息的波長篩選方法,該方法通過對主、從機光譜在不同波長下進行相關分析,篩選出主、從機間光譜信號響應一致性好的波長,基于這些波長建立的定量模型對從機玉米樣品中主要成分的預測誤差與主機樣品預測誤差相當。上述研究結果表明,基于主、從機間光譜信號并和不同波長篩選方法結合可以建立穩健的近紅外光譜模型,實現模型在多臺儀器間的直接共享。但這些方法在波長篩選時仍需要用到若干從機樣品的光譜信息,不是嚴格意義上的無標樣模型傳遞。

研究表明[19-21],將不同波長篩選算法結合的多步波長篩選方法可充分利用各波長篩選算法的優點,基于其建立的NIRs模型的預測性能優于單一算法所建模型。由于蒙特卡洛-無信息變量消除(MCUVE)算法可剔除無信息或信息量較少的波長,變量重要性投影(VIP)算法可挑選對因變量解釋能力最強的波長,因此本文將MC-UVE法與VIP算法結合篩選有信息的重要波長來建立玉米中蛋白質含量的近紅外光譜模型,并考察了其對從機樣品預測的準確度,以期實現無標樣模型傳遞。

1 算法與原理

1.1 MC-UVE算法原理

MC-UVE算法是基于蒙特卡洛(MC)和無變量信息消除(UVE)算法提出的一種變量選擇方法。該方法通過隨機選擇的校正集樣本建立大量的模型,然后根據相應的回歸系數對每個變量的穩定性進行評估。穩定性較差的變量被當作無信息的變量,并予以剔除。變量的穩定性公式如下:

式中,mean(bi)和std(bi)分別表示第i個波長變量的平均值和標準方差;Si表示第i個變量的穩定性。由公式可知bi的平均值越大、方差越小時,第i個變量就越穩定。

1.2 VIP算法與原理

VIP算法是基于偏最小二乘回歸的一種變量篩選方法,它描述了自變量對因變量的解釋能力,并根據解釋能力的大小進行波長篩選。第j個變量的解釋能力(VIPj)大小根據公式(2)計算:

公式(2)中,k表示自變量數,ch表示相關自變量間提取出的第h個新變量(主成分),m表示主成分數,r(y,ch)表示因變量與主成分間的相關系數,反映了主成分對因變量的解釋能力,Wij表示自變量在主成分上的權重。

1.3 技術路線

圖1為本文MC-UVE-VIP兩步波長篩選的技術路線。首先用MC-UVE算法對全波長集合U進行波長篩選,挑選出Si大于Mthreshold,u的波長,得到有信息的波長集合UUVE;然后采用VIP算法對波長集合UUVE做進一步波長篩選,挑選出VIPj大于閾值Vthreshold,u(該閾值為UUVE中所有波長下VIP值的均值)的波長,得到波長集合UUVE?VIP;采用VIP算法從全波長中篩選VIPj大于閾值Vthreshold,w(該閾值為全部波長下VIP值的均值)的重要波長,得到波長集合UVIP。分別以波長集合UUVE?VIP、UUVE、UVIP建立預測玉米中蛋白質含量的偏最小二乘回歸(PLSR)模型,簡稱MC-UVE-VIP模型、MC-UVE模型與VIP模型,比較各模型對主、從機樣品的預測均方根誤差(RMSEP)、平均相對誤差(MARE)及相關系數R,并與全波長模型、文獻報道的其他模型的預測結果進行比較。

圖1 建立NIRs模型的兩步波長篩選方法技術路線圖Fig.1 Technical route to establish NIRS models by two-step wavelength selection method

2 實驗部分

2.1 樣品數據集

本文采用的玉米近紅外數據來自http://software.eigenvector.com/Data/Corn/index.html。該數據集由80個玉米樣品在3臺近紅外光譜儀M5、MP5、MP6上測試的近紅外光譜以及樣品的水分、油脂、蛋白質和淀粉含量組成,近紅外光譜數據集的波長范圍為1 100 ~ 2 498 nm,波長間隔為2 nm,波長總數為700個。玉米樣品在主機和兩臺從機上的原始近紅外平均光譜如圖2所示。

圖 2 玉米樣品在主機和兩臺從機上原始光譜的平均光譜Fig.2 Original average spectra of corn samples in master and two slaves

2.2 近紅外光譜定量模型的建立與評價

對玉米近紅外光譜數據進行標準正態變換(SNV)結合一階導數(光滑點數為11)的處理,以消除背景漂移、減小光散射以及噪聲的影響。采用PLSR方法建立近紅外定量分析模型。本課題組前期的研究表明,PLS模型中的潛變量(LV)個數會對模型的預測性能產生很大的影響[22],本文的LV數由累積貢獻率達到99.9%確定(表1)。以SPXY法[23]劃分樣品數據集,對于玉米數據,選擇前3/4(60個樣本)作為校正集,剩下1/4(20個樣本)作為驗證集。由圖2可知,儀器M5上玉米樣品的平均光譜與MP5和MP6上的差異較大,而MP5和MP6兩臺儀器上的平均光譜差異較小。因此,本文選取M5作為主機M;MP5、MP6分別作為從機S1、S2。

以MARE對模型的預測性能進行評價,評價指標的計算公式:

式中,m表示樣品數,yi,actual和yi,predicted分別表示第i個樣品的實際含量和預測含量。對于含量在1% ~ 100%范圍的物質濃度檢測,一般認為MARE小于5%是可以接受的。

偏最小二乘(PLS)在進行回歸分析時,將前n個潛變量所代表的方差之和與所有潛變量方差之和的比值η稱為累計貢獻率,計算公式如下:

式中,λi表示第i個潛變量的方差,p表示所有不為零的方差的潛變量數,p≤ min{樣品數,波長點數}。被前n個潛變量接受的方差可根據累積貢獻率進行判斷,潛變量的重要性可根據其能解釋的方差大小來判斷。隨著潛變量個數的增大,后面潛變量所能解釋的方差變小,意味著這些潛變量在不同樣本中變化不大,在模型中可以略去。

本文所有算法和畫圖操作均在Matlab R2020a上完成。

3 結果與討論

3.1 基于MC-UVE及VIP算法的兩步波長篩選

首先利用MC-UVE算法進行初篩。MCUVE算法的閾值太小,則弱信息變量無法剔除;閾值太大則會剔除掉有信息變量。因此,本文將MC-UVE算法的閾值設定為1 ~ 7,間隔為1,采用MC-UVE法在不同閾值下篩選出7個UUVE集合,并基于這7個波長集合分別建立PLS模型,得到各閾值下的校正均方根誤差(RMSEC)(圖3)。由圖3可知,閾值為4時,對應的RMSEC最小,故選定4作為MC-UVE算法的閾值Mthreshold。在此閾值下挑選出有信息的波長變量集合UUVE,然后再在UUVE基礎上利用VIP算法作進一步的波長篩選,得到有信息的重要波長集合UUVE?VIP;同時利用VIP算法對全波長進行篩選,得到重要波長變量集合UVIP。波長集合UUVE、UVIP、UUVE?VIP在全波長的分布如圖4所示。由該圖可知,UUVE?VIP中的波長點只有143個,約為UUVE的三分之一、UVIP的二分之一。UUVE?VIP中1 980、2 048、2 054、2 056、2 060、2 160、2 470 nm處為蛋白質的近紅外光譜特征吸收峰位置[24]。

圖3 不同Mthreshold閾值下的RMSECFig.3 RMSEC under different thresholds of Mthreshold

圖4 主儀器樣本光譜的平均SNV+一階導數光譜Fig.4 Average spectra of primary samples after SNV plus first derivation pretreatment

3.2 不同波長篩選方法所建模型對玉米中蛋白質含量的預測結果

潛變量個數對PLSR定量模型的預測性能有很大影響[9]。因此,本文比較了分別基于累計貢獻率達到99.9%準則(ACR)和留一交叉驗證(LOOCV)確定的潛變量數(LV)所建立的全波長模型的預測結果,如表1所示。由表可知,雖然基于LOOCV建立的模型預測主機樣品的MARE比基于ACR所建模型小,但該模型傳遞到從機后的MARE比ACR模型的對應指標高,尤其是對S2儀器樣品的預測誤差是ACR模型的2倍。而LOOCV的潛變量數是ACR的幾倍,易導致基于LOOCV建立的模型過擬合。因此,本文根據累積貢獻率達到99.9%確定潛變量數。

表1 基于不同的潛變量確定方法所建全波長模型的蛋白質預測結果Table 1 Protein prediction results of whole wavelength calibration model based on latent variables selected by different methods

表2給出了分別基于波長集合UUVE、UVIP、UUVE?VIP和全波長建立的PLS模型預測主、從機樣品蛋白質含量的結果,表中還列出了PDS方法對從機樣品的預測結果以及文獻[5]報道的蛋白質含量預測結果。在本文所建模型中,全波長模型預測主機樣品蛋白質含量的MARE小于其它模型。但全波長模型轉移到從機后,預測從機樣品蛋白質含量的MARE均大于5%,且約是主機樣品預測誤差的6倍,即全波長模型對從機樣品的預測誤差偏大。MC-UVE-VIP模型預測從機樣品蛋白質含量的MARE為1.64% ~ 1.88%,小于全波長模型的6.05%、也小于MC-UVE模型與VIP模型的5.19% ~ 7.16%,但略大于PDS的1.41% ~ 1.47%和SWCSS[5]模 型 的1.41% ~ 1.79%。由 于MCUVE-VIP完全基于主機樣本篩選波長,無需從機樣本的光譜信息[5],模型傳遞到從機時不需像PDS方法那樣根據轉移集樣本的光譜及蛋白質含量信息校正從機樣本的預測結果,也不需像SWCSS方法那樣采用若干主、從機光譜信息,其預測從機樣本的誤差雖然略高于PDS和SWCSS方法,但其建模及模型傳遞過程比這兩種方法簡單、易行。

由表2可知,MC-UVE-VIP模型的變量(波長)個數顯著小于全波長模型,也比單一MCUVE和VIP方法的變量少,這使得該模型的運算效率及解釋能力得到顯著提升。基于MC-UVE和VIP結合算法的兩步篩選方法,能夠篩選出有信息的重要波長,使得基于這些波長建立的玉米蛋白質模型具有更好的穩健性,故模型對于主、從機樣本蛋白質含量的預測誤差均處于可接受水平。

表2 不同近紅外模型對蛋白質含量的預測結果比較Table 2 Protein prediction results of different NIRs calibration models

4 結 論

兩步波長篩選方法MC-UVE-VIP能夠根據主機樣本光譜篩選有信息的重要波長變量,無需從機光譜信息。基于該方法篩選出的波長所建立的玉米蛋白質近紅外光譜定量預測模型可以直接傳遞到從機,模型對主、從機樣品蛋白質含量預測的MARE均小于5%,實現了玉米樣品中蛋白質含量近紅外光譜模型的無標樣轉移。該模型的穩健性、傳遞效果及精簡程度均優于全波長模型以及一步波長篩選法MC-UVE和VIP建立的模型。MC-UVE-VIP兩步波長篩選方法對于其他數據的適應性有待進一步研究。

(續表2)

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 一边摸一边做爽的视频17国产| 亚洲人网站| 看av免费毛片手机播放| a色毛片免费视频| 99在线观看精品视频| 午夜国产精品视频黄| 人人爽人人爽人人片| 91久久偷偷做嫩草影院电| 亚洲精品图区| 2021国产精品自产拍在线| 国产成人精品一区二区| 无码国产偷倩在线播放老年人| 免费一级毛片不卡在线播放| 日本在线国产| 日韩高清一区 | 中文字幕亚洲综久久2021| 精品乱码久久久久久久| 777国产精品永久免费观看| 成人一区在线| 国产一区二区三区在线无码| 欧美一级特黄aaaaaa在线看片| 国产精品白浆在线播放| 日韩中文精品亚洲第三区| 成人av手机在线观看| 在线观看欧美国产| 午夜福利视频一区| 中国成人在线视频| 日韩精品亚洲人旧成在线| 手机成人午夜在线视频| 中国一级特黄大片在线观看| 露脸国产精品自产在线播| 超清无码熟妇人妻AV在线绿巨人| 国产门事件在线| 国产97色在线| 热这里只有精品国产热门精品| 亚洲视频a| 午夜精品一区二区蜜桃| 免费一极毛片| 精品国产香蕉在线播出| 免费一极毛片| 色网站免费在线观看| 免费国产黄线在线观看| 91精品国产一区| 中文字幕不卡免费高清视频| 波多野结衣一区二区三区88| 国产主播福利在线观看| 国产成人久久777777| 午夜不卡视频| 亚洲国产精品成人久久综合影院 | 人人妻人人澡人人爽欧美一区| 波多野结衣的av一区二区三区| 亚洲福利网址| 99久久人妻精品免费二区| 国产无码网站在线观看| 成人欧美在线观看| 老司机精品久久| 2022精品国偷自产免费观看| 亚洲中文字幕无码mv| a级毛片毛片免费观看久潮| 亚洲无限乱码| 亚洲国产精品日韩欧美一区| www.99在线观看| 啦啦啦网站在线观看a毛片| 成人亚洲国产| 国产人人干| 欧美日韩中文国产| 欧美亚洲国产日韩电影在线| 国产一区在线观看无码| 欧美国产三级| 国产探花在线视频| 高清免费毛片| 成人精品免费视频| 久久精品亚洲热综合一区二区| 在线无码九区| 一区二区三区国产| 不卡的在线视频免费观看| 综合社区亚洲熟妇p| 2021国产精品自产拍在线| 亚洲欧美日韩中文字幕在线| 国产精品美女免费视频大全| 欧美精品在线免费| 99热在线只有精品|