999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于蒙特卡洛法紅棗光譜水分模型研究

2018-08-08 08:08:28石魯珍張樹艷張景川
江蘇農業科學 2018年14期
關鍵詞:模型

石魯珍,陳 杰,張樹艷,張景川,3

(1.塔里木大學信息工程學院,新疆阿拉爾 843300; 2.南疆農業信息化研究中心,新疆阿拉爾 843300;3.塔里木大學機械電氣化工程學院,新疆阿拉爾 843300)

紅棗是新疆南疆地區主要的經濟作物,含有多種微量元素和營養物質,近些年紅棗產業有了較快的發展。含水量是紅棗重要的測量指標,在收購的過程中紅棗含水量達不到加工企業的標準,企業將不予以收購,或者低于市場價格進行收購,因為紅棗在加工過程中需要含水量相接近。收購到加工企業的紅棗在加工貯藏時,含水量更是重要的測量指標。清洗、烘干、包裝每個環節對水分的控制非常嚴格,包裝是紅棗成品上市的最后一關,紅棗含水量決定其口感,通常認為含水量為20%左右的紅棗口感最佳,因此,只有快速、準確地測量紅棗含水量,才能合理評價紅棗品質,提高農戶的收入,提升加工企業的產品質量和經濟效益[1]。

近紅外光譜(NIR)技術作為一種有效的分析測試手段,目前已經廣泛運用于食品[2]、飼料[3]、煙草[4]、石油[5]等領域化學性質的測定。偏最小二乘(PLS)法是近紅外光譜定量分析中運用最多的多元統計方法。PLS模型可以很方便地對化學值預測,模型的質量對預測結果影響很大。所以建立一個高質量的模型非常關鍵,不同的預處理方法和波長變量選擇對模型的質量影響很大,如預處理方法正交信號校正(OSC)、凈分析信號(NAS)和小波變換(WT)[6]等,波長變量選擇方法無信息變量消除(UVE)[7]、連續投影(SPA)[8]、遺傳算法和間隔偏最小二乘法[9]等,這些方法已經廣泛應用于近紅外定量分析中,并發揮了重要作用。除了光譜數據預處理、波長變量選擇方法,奇異樣本識別更重要,奇異樣本對模型質量有很大的影響。常用的奇異樣本識別方法有馬氏距離、濃度殘差、光譜殘差[10]等,這些奇異樣本識別方法對于單個奇異樣本識別方法效果很好,但是對于樣本集中奇異樣本較多時,其識別效果往往不是很理想。本研究利用蒙特卡洛交叉驗證(MCCV)[11-14]中奇異樣本的統計規律來識別奇異樣本,并比較幾種常見的預處理方法和波數選擇方法,來建立預測性較好的紅棗水分近紅外定量分析模型。

1 材料與方法

1.1 材料與儀器

試驗所用灰棗樣本:產自新疆阿拉爾市農一師10團,采摘時間為2016年10月份,采摘后放置冷庫中保存,冷庫溫度為1~5 ℃。傅里葉變換型近紅外光譜儀Antaris Ⅱ(賽默飛世爾,美國),波數范圍:10 000~4 000 cm-1,信噪比:15 000 ∶1,分辨率設置為8 cm-1,光譜點數為1557點,光譜掃描次數為32次。ME104E分析天平(梅特勒,瑞士),最大稱量值:120 g,精度:0.1 mg。

1.2 光譜采集

先將灰棗從冷庫中取出,在實驗室放置4 h,目的是讓灰棗溫度與室內溫度相同。近紅外光譜儀Antaris Ⅱ開機預熱 1 h,開始采集灰棗近紅外光譜,采集方式是:采集灰棗赤道部位每間隔120°位置,每個灰棗采集3次光譜,將3條光譜進行平均作為該灰棗的近紅外光譜,圖1為151個灰棗的近紅外光譜。為了保持光譜檢測的無損特性,所有紅棗樣本均是整果(連皮帶肉)采集其近紅外光譜[15-16]。

1.3 紅棗水分測定方法

將紅棗去皮,取果肉約3 g,放入ME104E分析天平稱質量,精確到0.000 1 g,記為m1,然后放入電熱鼓風干燥箱內烘干,溫度設置溫度為70 ℃。每隔4 h稱質量1次,至質量變化小于0.001 g時從烘箱中取出,并放入干燥器內冷卻至室溫,稱質量直至恒質量記為m2。紅棗含水率W按下式計算:

式中:m1為稱取紅棗果肉樣品烘干前質量,g;m2為稱取紅棗果肉樣品烘干后質量,g。

MATLAB R2012a(Mathworks,USA)用于算法的實現,光譜采集軟件為Result(Thermo Fisher Scientific,USA)。

2 結果與分析

2.1 蒙特卡洛交叉驗證(MCCV)剔除異常樣本

在近紅外定量分析[17-18]中,哪個樣本是奇異樣本是未知的,但是可以根據正常樣本與異常樣本的差異性,建立大量的定量模型,然后通過統計參數把奇異樣本選擇出來,這就是基于蒙特卡羅交叉驗證(MCCV)的一類奇異樣本識別方法。利用MCCV隨機劃分校正集與預測集,如果奇異樣本在校正集中,整個模型的質量將受到影響;相反,如果奇異樣本在預測集中,僅此樣本的預測結果受到影響。盡管這種情況對預測結果都有影響,但效果明顯不同。本研究就利用奇異樣本出現在校正集或預測集時模型預測誤差的差異,通過MCCV及統計分析來進行奇異樣本的識別。根據預測集中奇異樣本的預測殘差會明顯大于正常樣本的預測殘差也提出了一種基于MCCV的奇異樣本識別方法。基于MCCV的奇異樣本識別方法充分利用統計學的性質,能夠在一定程度上降低由掩蔽效應帶來的風險,檢出光譜陣和性質陣方向的奇異點,有望在奇異樣本檢測中得到更廣泛的應用[11]。

算法具體步驟:(1)用PLS確定最佳主成分數;(2)用蒙特卡洛隨機取樣法取80%的樣本做校正集建立PLS回歸模型,剩余部分做預測集;(3)循環2 000次,得到各樣本的1組預測殘差;(4)求各樣本預測殘差的均值與方差,并作圖;(5)如樣本偏離主體,則從校正集中剔除。圖1是151個紅棗樣本利用MCCV的奇異樣本識別方法計算出的殘差均值和殘差方差,將均值小于-5、大于5的樣本,方差大于1的樣品進行剔除。剔除異常樣本共12個,編號分別是第5、16、63、93、95、98、105、116、136、140、143、147。

2.2 校正樣本選擇

校正樣本集的選擇比較關鍵,通常校正集的樣本光譜性質和濃度范圍應包括驗證集的光譜性質和濃度范圍,且分布均勻,這里用SPXY(sample set partitioning based on joint x-y distances)[12]法對樣品進行選擇。將剩余的139個紅棗樣本分成2組,一組是校正集用來建立校正模型,另一組是驗證集用來測試模型的準確性和穩健性。如表1中所示,校正集y值范圍大于驗證集的范圍。因此,樣品分布在校正集和驗證集是適當的。

表1 校正集和驗證集樣品水分含量參考測量值

2.3 光譜數據預處理

在近紅外進行建模的過程中,光譜的預處理是必不可少的,在近紅外定量分析與定性分析中是非常關鍵的一步,經過適當的近紅外預處理方法可有效提高模型的適用性能力。合理的預處理方法可有效過濾近紅外光譜中的噪聲信息,保留有效信息,從而降低近紅外定量模型的復雜度,提高近紅外模型的可用性。表2是選用不同的光譜預處理方法,波數用全譜建立的模型結果。從表2中可以看出一階導數得到的模型有最小驗證標準偏差(SEP),所以預處理方法選擇一階導數。

表2 不同預處理方法得到的模型結果

導數(微分)可以消除樣品光譜的基線漂移、增強譜帶的特征信息并克服譜帶重疊,是最為常用的光譜數據預處理方法。一階導數可以去除同波數無關的基線漂移。圖2-a是紅棗原始光譜圖,圖2-b是經過一階導數處理后的光譜圖。

2.4 波數變量選擇

2.4.1 相關系數法 相關系數法是計算校正集光譜矩陣中每個波數點對應的吸光度向量與樣品組分濃度向量的相關系數,然后得出每個波數點變量對應的相關系數。將相關系數排序,選擇合適的閾值,保留相關系數大于該閾值的波數點,進而建立多元校正模型[6]。相關系數r由下式計算:

圖3是校正集紅棗含水量與波數的相關系數圖,藍線為相關系數,紅線是所選擇的閾值,綠色五角星為所選擇的波數點,從圖3中可以看出紅棗含水量與波數有較好的相關性,閾值選擇0.6(取絕對值,大于0.6和小于-0.6的波數被選擇),共選擇波數變量311個。

2.4.2 競爭性自適應加權取樣(CARS)法 競爭性自適應權重取樣(competitive adaptive reweighted sampling,CARS)選擇波數的方法是基于回歸系數的權重,衡量波數被選中的重要評價指標是回歸系數絕對值的大小,采用交互驗證選擇偏最小二乘模型交互驗證均方根誤差最小的子集,選擇出與目標值對應的最優波數組合,逐個將絕對值大的回歸系數對應的波數點保留,保留方式采用指數衰減函數來計算。

CARS算法實現步驟是:首先,運用蒙特卡洛方法循環N次,每次從數據樣本中隨機抽取一定數量(通常取總樣本數的80%)的樣本作為建模集建立偏最小二乘模型;然后,利用指數衰減函數去掉回歸系數絕對值相對較小的波數點,第i次循環時,保留波數點的概率為:

ri=ae-ki。

這里a與k為常數,a與k的計算公式如下:

可以看出,第1次采樣時,所有的m個變量都被用于建模,故r1=1;運行第N次采樣時,僅2個波數被使用,故rN=2/m。

圖4是用CARS方法選擇波數變量圖,其采樣次數為 1 000 次,PLS主成分數選擇10,共選擇78個波數變量。

2.4.3 模型比較 將相關系數法、CARS法得到的PLS模型與全譜建的PLS模型進行比較,結果如表3所示。對于全譜PLS模型,共選用1 557個變量來建立校正模型,這 1 557 個變量有很多和紅棗含水量不相關,這些變量稱為“無信息變量”。如果模型中含有“無信息變量”,會增加PLS主因子數,從表3中可以看出該模型的PLS主因子數是9個,較另外2個模型主因子數要多。過多的PLS主因子數會導致模型過擬合,通過獨立的樣品來測試時,過擬合模型會給出不好的預測結果,從表3可以看出,雖然全譜得到的校正標準偏差(SEC)和校正相關系數(RC)要好于其他2個模型,但是預測標準偏差(SEP)大于另外2個模型,預測相關系數(RP)低于另外2個模型。

對于相關系數法得到的PLS模型,和全譜PLS模型相比主成分數降到了8個,預測標準偏差(SEP)和預測相關系數(RP)也都好于全譜模型,這時因為相關系數法選擇的波數變量數要小于全譜1 557個,大大減少了“無信息變量”。

對于CARS法得到的PLS模型,模型的主因子數為7個,“無信息變量”得到進一步降低,模型變得更加簡潔和穩定。從模型的預測結果上看預測標準偏差(SEP)和預測相關系數(RP)在所以模型中是最好的。

表3 選擇不同波數得到偏最小二乘模型結果

3 結論

蒙特卡洛交叉驗證(MCCV)能夠有效地識別奇異樣本。利用一階導數對紅棗原始近紅外光譜進行處理,可以很好地提取有用的信息,去除同波數無關的基線漂移。CARS方法選擇的波數變量建立PLS模型,與全譜模型相比,不僅提高了模型的預測準確性,而且還大大減少了建模波數變量數,使模型簡化,減少建模所用時間,所選取的波數變量能夠有效地反映紅棗含水量的信息,建立的模型穩定性強。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲精品国产成人7777| 美女国内精品自产拍在线播放| 高清色本在线www| 99re在线观看视频| 国产精品30p| 精品视频在线观看你懂的一区| 亚洲另类色| 国产又黄又硬又粗| 在线亚洲精品福利网址导航| 呦女精品网站| 这里只有精品在线| 国产高清免费午夜在线视频| 很黄的网站在线观看| 国产精品久久久久久影院| 欧美成人国产| 亚洲娇小与黑人巨大交| 色综合五月婷婷| 白丝美女办公室高潮喷水视频 | 国产AV毛片| 亚洲专区一区二区在线观看| 伊人大杳蕉中文无码| 美女毛片在线| 欧美色视频日本| 久久精品国产亚洲麻豆| 国产一级妓女av网站| 无码AV日韩一二三区| 国内精品免费| AV网站中文| 国产精品亚洲αv天堂无码| 色老二精品视频在线观看| 欧美日本在线一区二区三区| 白浆视频在线观看| 亚洲乱强伦| 国产成人精品高清不卡在线| 成人在线亚洲| AV在线天堂进入| 天天综合网在线| 草逼视频国产| 国产无码精品在线| 亚洲丝袜中文字幕| www.亚洲一区| 99在线观看国产| 性网站在线观看| 国产精品视频白浆免费视频| 欧美成人午夜在线全部免费| 99热在线只有精品| 在线观看网站国产| 午夜成人在线视频| 亚洲精品视频网| 国产麻豆另类AV| 国产一区二区三区在线观看视频 | 欧美中文字幕一区| 91精品综合| 亚洲欧美成人网| 香蕉国产精品视频| 老司机精品久久| 精品国产一区二区三区在线观看 | 亚洲精品无码抽插日韩| 日韩中文字幕亚洲无线码| AV在线麻免费观看网站| 国产在线专区| 色婷婷亚洲十月十月色天| 国产精品亚欧美一区二区| 国产女人18水真多毛片18精品 | 亚洲第七页| 无码综合天天久久综合网| 亚洲欧洲日韩久久狠狠爱| 无码中文AⅤ在线观看| 在线人成精品免费视频| 色成人亚洲| 国产swag在线观看| 亚洲人在线| 国产精品视频公开费视频| 午夜日b视频| 亚洲午夜国产片在线观看| 欧美成人a∨视频免费观看| 亚洲开心婷婷中文字幕| 成人免费视频一区| 久久中文电影| 亚洲精品视频网| 国产福利在线观看精品| 国产精品页|