999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于近紅外光譜的大米蛋白質含量快速檢測

2021-06-04 09:19:06劉金明張東杰34張愛武3
食品與機械 2021年5期
關鍵詞:檢測模型

殷 坤 劉金明 張東杰34 張愛武3

(1.黑龍江八一農墾大學食品學院,黑龍江 大慶 163319;2.黑龍江八一農墾大學信息與電氣工程學院,黑龍江 大慶 163319;3.黑龍江八一農墾大學國家雜糧工程技術研究中心,黑龍江 大慶 163319;4.黑龍江省農產品加工與質量安全重點實驗室,黑龍江 大慶 163319)

大米蛋白質是公認的優質植物蛋白質之一[1],其氨基酸組成均衡合理,不會產生過敏反應[2]。研究[3]表明,大米中蛋白質含量與大米的食味品質呈負相關,蛋白質含量增加,會導致米飯的硬度增大、彈性降低、色澤變差,大米的食味品質變差。大米蛋白質含量的檢測是評價大米質量的重要手段之一。目前,蛋白質含量的測定方法主要依據GB 5009.5—2016《食品安全國家標準 食品中蛋白質的測定》中的凱氏定氮法、分光光度法和燃燒法。該國標檢測方法具有準確性好、靈敏度高的特點,但操作繁瑣、檢測時間長且破壞樣品。

近紅外光譜(near infrared spectroscopy,NIRS)分析技術因其簡便、快速、低成本、無損以及多組分同步檢測的優點被廣泛應用于大米蛋白質、脂肪等成分含量的快速檢測。苗雪雪等[4]使用偏最小二乘(partial least squares,PLS)、組合區間PLS和移動窗口PLS 3種方法對327份大米樣本的NIRS和水分含量進行建模,結果表明移動窗口PLS法建立的模型的預測集相關系數達到了0.961 7,可以用于大米水分含量的快速檢測。劉文麗等[3]使用OPUS定量分析軟件分別對大米蛋白質和蛋白質(干基)進行PLS建模,得到的最佳近紅外模型決定系數R2分別為0.956 5和0.974 1,剩余預測偏差(residual predictive deviation,RPD)分別為4.79和6.21,說明兩種模型都有較好的精確性,可以用于預測大米中蛋白質含量。俞法明等[5]對同一批樣品的稻谷、糙米、精米、精米粉分別建立了蛋白質含量NIRS檢測模型,發現精米和精米粉回歸模型的校正決定系數大于0.90,可用于進行大米蛋白質含量的快速檢測。

上述大米組分NIRS快速檢測模型主要采用PLS線性建模方法建立相應的校正模型,但PLS難以體現光譜數據與待測目標組分之間的非線性關系。因此,相關學者開始研究使用支持向量機(support vector machine,SVM)和神經網絡等非線性多元統計方法建立NIRS定量回歸模型[6]。其中,SVM是基于統計學習理論和結構風險最小化原則的機器學習方法[7],與傳統的神經網絡相比結構簡單、泛化能力強,對求解小樣本、非線性、高維數問題有更好的適應性。但是在應用SVM進行光譜數據非線性建模時,因NIRS原始數據維數過高,若直接以全部的波長數據作為SVM的輸入變量,將導致模型過于復雜、運行時間長,而且冗余光譜數據還會影響模型的建模精度[8]。李子文等[9]分別使用PLS和最小二乘SVM建立了372個核桃露樣品脂肪含量NIRS定量檢測模型,結果表明兩種模型均有較高的精度,且最小二乘SVM建立的模型性能更高。孫麗萍等[10]使用SVM建立了東北黑木耳多糖含量的NIRS分類模型,模型精確率為85.7%,召回率為87.3%,說明SVM可以用來建立黑木耳多糖含量分類模型。

相關學者將主成分分析(principal component analysis,PCA)與SVM相結合構建PCA-SVM用于建立NIRS快速檢測模型。張曉冬等[11]使用PCA-SVM建立了4種含鐵礦物藥的NIRS快速鑒別模型,結果表明所建的模型預測能力強,可以用于4種含鐵礦物藥的快速鑒別。魏從師等[12]利用NIRS法結合PCA和SVM建立了6味中藥的識別模型,所建的模型對訓練集和驗證集樣品預測的正確率均達到100%。上述研究均使用網格搜索(grid search,GS)對SVM建模參數進行優化,但GS法搜索步長過大時結果不準確,搜索步長小則運行時間較長[13]。而且前人的研究大多基于全譜進行建模,在特征波長優選與PCA-SVM結合方面少有涉獵。研究擬基于遺傳模擬退火算法(genetic simulated annealing algorithm,GSA)對PCA-SVM的參數進行優化,探討將PCA-SVM與反向區間偏最小二乘(backward interval partial least squares,BiPLS)相結合建立大米蛋白質含量NIRS快速檢測模型的可行性,以BiPLS優選后的譜區作為PCA-SVM的輸入參數,建立大米蛋白質含量快速檢測模型。

1 材料與方法

1.1 材料與儀器

1.1.1 材料與試劑

大米:采集自黑龍江省查哈陽、五常、方正、響水和建三江5個地區150個樣品,壟谷3次、碾米2次后粉碎,裝入密封袋于陰涼干燥處保存;

硫酸、硫酸鉀、硼酸、乙醇:分析純,遼寧泉瑞試劑有限公司;

硫酸銅:分析純,哈爾濱市新達化工廠;

氫氧化鈉:分析純,天津市博華通化產品銷售中心;

甲基紅、溴甲酚綠:分析純,天津市恒興試劑制造有限公司。

1.1.2 主要儀器設備

壟谷機:THU35C型,佐竹機械(蘇州)有限公司;

碾米機:TM05C型,佐竹機械(蘇州)有限公司;

粉碎機:CT193型,福斯分析儀器(蘇州)有限公司;

電子分析天平:AR323CN型,奧豪斯儀器(上海)有限公司;

全自動凱氏定氮儀:K9860型,濟南海能儀器股份有限公司;

石墨消解儀:SH220N型,濟南海能儀器股份有限公司;

傅里葉變換近紅外光譜儀:TANGO型,德國BRUKER公司。

1.2 方法

1.2.1 蛋白質含量測定 按GB 5009.5—2016的凱氏定氮法執行。

1.2.2 光譜數據采集 粉碎后的大米樣品填滿樣品杯,振蕩均勻后使用近紅外光譜儀進行積分球漫反射光譜掃描,光譜范圍3 946~11 542 cm-1(866~2 534 nm),分辨率為8.0 cm-1,每個樣品掃描32次,背景每小時掃描一次。保持室內溫濕度基本不變,每個樣品裝樣3次,取3次掃描平均值作為樣品原始光譜。

1.2.3 BiPLS BiPLS是在間隔偏最小二乘法(interval partial least square,iPLS)[14]的基礎上發展而來的一種特征譜區優選算法。BiPLS在iPLS的基礎上依次去除交叉驗證均方根誤差(root mean squared error of cross-validation,RMSECV)值最大的區間,當RMSECV最小時所對應的子區間組合為優化后的特征譜區域[15]。

1.2.4 PCA-SVM PCA作為一種多元統計方法,能夠消除各指標間的相互關聯影響,在數據降維方面應用廣泛[16]。SVM非線性回歸的核心思想是通過選取的核函數將非線性問題映射為高維特征空間的線性問題,并在這個空間中進行線性回歸[17]。

PCA-SVM融合了PCA光譜數據降維方法和SVM非線性回歸思想,既解決了PLS在處理光譜數據多重共線性時效果不佳的問題,又彌補了以全譜波長變量直接建模效率低的不足。在采用徑向基(radial basis function,RBF)核函數進行PCA-SVM建模過程中,主成分(principal components,PCs)個數、懲罰參數C、RBF核函數參數γ和不敏感損失函數參數ε對建模性能具有重要影響。采用MCCV結合PLS回歸模型進行最佳PCs個數的選取。通過比較PLS回歸模型的預測殘差平方和(prediction residual error sum of squares,PRESS),選取PRESS值最小的PCs個數作為最佳PCs個數[18]。為了有效提高PCA-SVM的學習和泛化能力,采用GSA算法[19]對回歸模型的參數C、γ和ε進行優化。GSA以PCA-SVM回歸模型的k折RMSECV為目標函數,結合溫度參數進行適應度優化設計如下:

(1)

式中:

fit(x)——適應度函數;

f(x)——當前染色體目標函數值;

fmin——當前代種群中的最小目標函數值;

t——當前代溫度值。

(2)

(3)

(4)

式中:

R2——決定系數;

RMSE——均方根誤差;

RPD——剩余預測偏差;

yi——第i個樣本的測量值;

n——樣本個數。

研究所有算法,包括光譜預處理、樣本集劃分、特征譜區優選、主成分分析、模型參數優化和回歸模型構建等全部在Matlab R2016b軟件平臺中實現,其中BiPLS和SVM分別基于iToolBox[21]和LibSVM[22]工具箱實現。

2 結果與分析

2.1 采集數據分析

大米樣品光譜數據如圖1所示。由圖1(a)可知,原始光譜數據存在基線漂移現象。由圖1(b)可知,通過SG平滑和MSC多元散射校正相結合對原始光譜進行預處理,修正了因掃描時間、周邊環境、設備狀態不同而導致的基線漂移、噪聲干擾和光譜散射等問題,有效提高了光譜數據的分辨率和信噪比。其中,SG主要用于消除隨機噪聲的干擾,MSC主要用于修正基線漂移和光譜散射。對NIRS數據進行預處理后,使用KS法按4∶1的比例進行樣本集劃分,得到校正集樣本120個、驗證集樣本30個。樣品中蛋白質含量測量結果如表1所示。

圖1 樣品光譜數據Figure 1 Spectral data of samples

對預處理后的NIRS數據進行PCA計算,第一、第二和第三PCs的貢獻率分別為82.72%,7.31%,6.07%,前3個PCs的累積貢獻率達96.10%。校正集和驗證集的三維PCs空間分布情況如圖2所示。

由表1和圖2可知,校正集基本涵蓋了驗證集,且校正集和驗證集樣本在PCs空間上分布均勻,可以用該樣本劃分方法進行NIRS建模。

圖2 樣本在主成分空間中的分布Figure 2 Distribution of the samples in principal components space

表1 樣品中蛋白質含量Table 1 Protein content in samples

2.2 特征譜區優選

在使用BiPLS算法進行NIRS特征譜區優選時,區間劃分個數的選擇很重要。為尋找最佳區間劃分個數,首先將預處理后的樣品光譜數據劃分為k個子區間(k=10,20,30,40,50,60,70,80,90),并采用BiPLS計算每個k值下的最佳特征譜區,完成劃分區間個數的初選(如表2 所示)。由表2可知,k=70時,蛋白質BiPLS回歸模型的RMSECV最小;k=80時,其RMSECV比k=70時略大,因此可以推測蛋白質最佳譜區劃分個數為70~80。

表2 BiPLS優化蛋白質光譜特征區間初選結果Table 2 Primary results of BiPLS optimization of protein spectral feature interval

為獲得蛋白質最佳譜區劃分個數,采用BiPLS計算區間個數從71到79對應的最佳特征譜區(如表3所示)。由表3可知,區間劃分個數為79時,BiPLS優選出42個蛋白質特征譜區對應的RMSECV最小(0.211 0),對應區間列表為[1 3 4 7 8 9 10 12 15 17 19 20 22 23 25 26 27 30 31 32 33 34 36 37 39 40 44 46 47 48 50 57 58 63 64 68 69 70 72 74 76 77],選中的特征波長變量共983個。

表3 BiPLS最佳特征譜區篩選結果Table 3 Results of BiPLS optimal feature spectrum screening

繪制BiPLS優選的蛋白質特征譜區與光譜數據對比圖(如圖3所示)。圖3中,特征譜區波數9 075~9 450 cm-1區域對應著蛋白質—RNH2基團的三級倍頻;波數6 900~7 300 cm-1區域對應著蛋白質—CONH2基團的二級倍頻;波數5 640~5 880 cm-1對應著蛋白質—CH和—CH2基團的一級倍頻,波數4 220~4 370 cm-1區域對應著蛋白質—CH、—CH2和—CH3基團的組合頻。

2.3 回歸模型建立及評價

最佳PCs個數的選擇是建立PCA-SVM模型的第一步,合理的PCs個數既可以提高模型的預測精度,又可以提高模型的穩定性。采用MCCV結合PLS回歸模型進行最佳PCs個數的選取。設PCs個數的搜索范圍為1~20,步長為1,分別建立不同PCs個數下的PLS回歸模型,并計算每個PLS回歸模型的PRESS,選取PRESS值最小時對應的PCs個數作為最佳PCs個數。以BiPLS優選的983個蛋白質特征波長變量為輸入,采用MCCV結合PLS回歸模型分析PRESS隨PCs個數變化情況如圖4 所示。由圖4可知,隨著PCs個數的增加,PRESS呈先迅速減少,后緩慢增加的趨勢。圖4中箭頭所示紅色圓點的PRESS值最小(2.182 6),PCs的個數為11,說明這11個PCs的解釋能力最強。選取此點的PCs個數作為大米蛋白質BiPLS特征波長優選后的最佳PCs個數建立PCA-SVM模型。

灰色陰影區域為蛋白質特征譜區圖3 蛋白質光譜特征譜區Figure 3 Spectral characteristic intervals of protein

圖4 PRESS與PCs關系圖Figure 4 Relationship between PRESS and the number of PCs

遺傳算法(genetic algorithm,GA)因其具有強大的搜索能力,在SVM參數優化方面得到了廣泛應用[23]。但GA存在早熟問題,且進化后期搜索效率較低。因此,采用GSA算法對PCA-SVM回歸模型的參數C、γ和ε進行優化。參數C、γ和ε的尋優范圍分別是[0,100]、[0,100]和[0.001,1.000],染色體碼長為60(每個參數對應20位基因),種群規模為50,遺傳代數為200,初始溫度參數K為200,退溫系數α為0.95,交叉概率為0.7,變異概率為0.7/L(L為染色體碼長),采用10折RMSECV為目標函數。以BiPLS優選的983個大米蛋白質特征波長變量按最佳PCs個數為11,使用校正集數據進行PCA-SVM回歸模型參數優化。參數優化的過程如圖5所示。由圖5 可知,在高溫時(進化前期)GSA求得的平均目標函數值與最佳目標函數值差異很大,而低溫時(進化后期)平均目標函數值更接近于最佳目標函數值。原因在于GSA算法融合了GA和模擬退火算法的優點,結合溫度參數設計適應度函數和Metropolis選擇復制策略,既提高了算法高溫時(進化前期)種群的多樣性,又擴大了低溫時(進化后期)優良染色體的適應度函數值,能夠有效克服GA早熟收斂和進化后期搜索效率低的不足。

圖5 基于特征波長的蛋白質PCA-SVM的參數優化過程Figure 5 Optimization process of parameters for PCA-SVM based on characteristic wavelengths for protein

為了分析BiPLS與PCA-SVM相結合建立大米蛋白質含量NIRS快速檢測模型的性能,分別建立全譜PLS和BiPLS優選譜區的PLS、SVM和PCA-SVM回歸模型,依次記為Full-PLS、BiPLS、BiPLS-SVM和BiPLS-PCA-SVM。不同回歸模型的評價指標如表4所示。

表4 不同回歸模型的評價指標Table 4 Evaluation indicators of different regressive models

由圖6可知,蛋白質的測量值與預測值點基本呈對角線分布,樣本點位于對角線兩側,說明蛋白質回歸模型的預測效果較好。經t檢驗計算,得到樣本蛋白質含量實測值與預測值的t值為1.058 2,小于相應的臨界值t(0.05,149)=1.976,Matlab ttest函數返回檢驗結果均為0,顯著性水平概率為0.928 2,說明蛋白質測量值與預測值無顯著性差異,一致性較好。圖6中存在個別偏離對角線較嚴重的樣本點,原因在于部分樣品消化過程中因淀粉含量過高,導致在消化溫度300 ℃左右時產生大量黑色氣泡粘壁,消化溫度提高到420 ℃后部分附著在消化管壁的氣泡無法被消化,從而形成未消化完全的黑色顆粒物而產生的誤差。因此在建立NIRS快速檢測模型時,一定要保證前期測量的基礎目標屬性化學含量值的準確。BiPLS-PCA-SVM融合了BiPLS特征譜區優選、PCA光譜數據降維、MCCV的最佳主成分選取、SVM非線性建模、GSA參數優化,既減少了SVM模型的輸入數據量,又提高了SVM模型的回歸精度,還有效解決了線性方法建模的多重共線性問題。在建立基于BiPLS-PCA-SVM的大米蛋白質含量NIRS快速檢測模型過程中,并未對圖6中偏離對角線的異常樣本進行剔除,但建立的模型仍能滿足大米蛋白質含量的快速檢測需求。說明使用BiPLS-PCA-SVM建立NIRS檢測模型時,在保證足夠多樣本的前提下,少量樣本化學含量測定存在一定誤差對最終模型的影響不大,充分體現了文中提出的BiPLS-PCA-SVM建模方法具有較高的魯棒性。

圖6 測量值和預測值分布圖Figure 6 Distribution of measured and predicted values

3 結論

試驗探討了近紅外光譜結合化學計量學方法進行大米蛋白質含量快速檢測的可行性。為了提高近紅外光譜回歸模型的檢測精度和效率,將反向區間偏最小二乘(BiPLS)、主成分分析(PCA)和支持向量機(SVM)相結合構建BiPLS-PCA-SVM模型,所建立回歸模型的驗證決定系數為0.928 9,預測均方根誤差為0.196 7%,剩余預測偏差為4.024 6。結果表明,BiPLS-PCA-SVM模型通過融合了特征譜區優選、光譜數據降維和非線性建模策略,其建模性能優于全譜偏最小二乘模型和反向區間偏最小二乘優選譜區建立的偏最小二乘和支持向量機回歸模型,能夠滿足大米蛋白質含量的實際檢測需求。BiPLS-PCA-SVM與近紅外光譜相結合為建立簡單、高效、低成本的大米蛋白質含量快速檢測方法提供了新途徑。由于時間有限,試驗僅將BiPLS-PCA-SVM應用于大米蛋白質含量的測定,后期將進一步研究其在大米直鏈淀粉、脂肪等其他營養成分含量測定方面的應用。

猜你喜歡
檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 香蕉网久久| 日本高清免费不卡视频| 色亚洲激情综合精品无码视频| 在线观看免费黄色网址| 无码区日韩专区免费系列| 天天综合亚洲| 午夜福利视频一区| 毛片视频网| 成年人国产网站| 欧美日本不卡| 亚洲综合网在线观看| 亚洲一区二区三区中文字幕5566| 久久香蕉欧美精品| 国产成人AV综合久久| 久久天天躁夜夜躁狠狠| 成人另类稀缺在线观看| 国产精品19p| www.亚洲一区| 国产一在线观看| 黄色网页在线观看| 精品自窥自偷在线看| av色爱 天堂网| 一本色道久久88亚洲综合| 欧美在线视频不卡| 亚洲国产无码有码| a毛片基地免费大全| 国产成人精品一区二区三区| 国产日韩精品欧美一区喷| 色婷婷狠狠干| 美女一级免费毛片| 亚洲无码一区在线观看| 国产无码网站在线观看| 欧美69视频在线| 国产精品无码久久久久AV| 九九精品在线观看| 亚洲成年人网| 91精品国产自产在线老师啪l| 日韩人妻少妇一区二区| 99re这里只有国产中文精品国产精品 | 无码一区二区三区视频在线播放| 高清免费毛片| 国产女人综合久久精品视| 六月婷婷激情综合| 中文字幕 日韩 欧美| 国产在线精品99一区不卡| 亚洲免费三区| 精品国产香蕉在线播出| 午夜精品福利影院| 一本一道波多野结衣一区二区 | 国内老司机精品视频在线播出| 视频一本大道香蕉久在线播放| 91免费片| 97se综合| 欧美国产在线一区| 国产永久免费视频m3u8| 日韩国产综合精选| 国产福利大秀91| 91丝袜乱伦| 国产丝袜啪啪| 国产第二十一页| 天天综合亚洲| 福利在线免费视频| 大陆精大陆国产国语精品1024| 欧美激情视频一区二区三区免费| 99免费在线观看视频| 国产国拍精品视频免费看| 国产亚洲精| 久久99国产综合精品女同| 国产成人精品在线1区| 中文字幕有乳无码| 91精品国产麻豆国产自产在线| 免费观看男人免费桶女人视频| 国产18在线播放| 国产精品人人做人人爽人人添| 天天婬欲婬香婬色婬视频播放| 亚洲视频a| 九九久久精品免费观看| 精品一区国产精品| 成人精品区| 欧美日韩一区二区三区在线视频| 国产在线视频自拍| 精品一区二区三区无码视频无码|