999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于便攜式近紅外光譜儀的櫻桃番茄糖分快速分析模型

2021-12-27 01:26:06孫陽劉翠玲孫曉榮聞世震
食品與發酵工業 2021年23期
關鍵詞:模型

孫陽,劉翠玲,孫曉榮,聞世震

(北京工商大學 人工智能學院,食品安全大數據技術北京市重點實驗室,北京,100048)

櫻桃番茄又名圣女果、千禧果、珍珠小番茄等,是茄科番茄屬中多汁漿果一年生草本植物,被聯合國糧農組織(Food and Agriculture Organization of the United Nations,FAO)列為優先推廣的四大水果之一[1-2]。櫻桃番茄表面光亮,色澤鮮艷,營養價值高,具有防癌、降壓、降膽固醇等保健作用[3-7],近年來深受消費者喜愛。相比于人們日常食用的普通番茄,櫻桃番茄的口感更佳,味道更甜。香甜可口也成為了櫻桃番茄在如今市場備受歡迎的一大原因。影響櫻桃番茄口感的因素有很多,如糖分、有機酸、纖維素等,但糖分是衡量櫻桃番茄口感及品質的一項重要指標。

光譜檢測技術作為一種快速的檢測手段,目前已廣泛應用于農業、工業、食品檢測等領域[8]。常用的光譜檢測技術有近紅外光譜檢測技術、拉曼光譜檢測技術、高光譜成像檢測技術、熒光光譜檢測技術等[9-13]。目前,番茄的光譜檢測大部分集中在使用實驗室大型儀器上,對使用便攜式近紅外光譜儀器研究櫻桃番茄光譜尤為少見,王凡等[14]建立了基于櫻桃番茄近紅外透射光譜的可溶性固形物含量分析模型,但對實驗環境的要求很高,儀器昂貴,無法做到便攜、快速地檢測。雷鷹等[15]使用便攜式近紅外光譜儀器掃描蘋果光譜數據,對蘋果糖分含量建立模型,使用偏最小二乘算法最終得到的模型預測集相關系數為0.918 9,均方根誤差為0.237;劉偉[16]使用便攜式近紅外光譜儀器,以贛南臍橙和蘋果為實驗對象,對這2種水果的光譜數據建立了糖度分析模型,贛南臍橙糖分分析模型預測集的相關系數為0.77,均方根誤差為0.83,蘋果糖分分析模型的預測集相關系數為0.75,均方根誤差為0.82,均取得了較為理想的實驗結果。在現實生活中,使用便攜式儀器實現現場快速檢測可以使果農們在種植櫻桃番茄時能夠無損地檢測作物中的含糖情況,可依此來安排其具體采摘時間和進行光照及養分調整;同時在面向市場時,商家可以用該方法來檢驗貨物以保證貨物質量,更大程度上滿足消費者們的需求。綜上,在這些實際生活需求和眾多研究基礎上,本文提出用便攜式近紅外光譜儀器對櫻桃番茄的糖分進行建模分析,實現現場的快速無損檢測。

本研究使用AMBER Ⅱ便攜式近紅外光譜儀器,以櫻桃番茄為實驗樣本,獲取其近紅外光譜數據。使用Kennard-Stone(K-S)算法對172個樣本進行樣本劃分,用標準歸一化(standard normal variate,SNV)和Savitzky-Golay卷積平滑相結合的方式對光譜數據進行預處理,將預處理過后的光譜數據進行無信息變量消除算法(uniformative variable elimination,UVE)和連續投影算法(successive projections algorithm,SPA)聯合使用提取特征波長,在此基礎上進行偏最小二乘(partial least squares,PLS)方法建模,建立櫻桃番茄糖分預測模型。

1 材料與方法

1.1 實驗儀器

AMBER Ⅱ便攜式近紅外光譜檢測儀,北京凱勝天成科技有限公司。為使測量結果更為準確,設置樣本掃描次數為10次,最終得到樣品掃描10次的平均光譜。波長測量范圍為900~1 700 nm,測量的波長點數為605個。通過USB接口與控制器進行連接。ANBER Ⅱ便攜式近紅外光譜檢測儀器如圖1所示。愛宕PAL-1數顯糖度計,日本Atago。儀器的測量范圍為:糖度(Brix)0.0%~53.0%;測量精度為:糖度(Brix)整幅0.2%。

圖1 AMBER Ⅱ便攜式近紅外光譜儀Fig.1 AMBER Ⅱ portable near infrared spectrometer

1.2 實驗方法

1.2.1 實驗樣本及糖度檢測

實驗樣本為來自3個不同大型果蔬超市所采購的櫻桃番茄,產地分別為海南省陵水市、廣西省田陽縣和福建省晉江市,樣本總數為172個,平均果徑為2.32 cm。

首先用水果刀將櫻桃番茄從赤道處切開,將使用濾布過濾后的番茄汁液滴于檢測儀器上用于檢測,顯示結果為23 ℃室溫條件下的可溶性物質含量值(%Brix),將3次測量結果的平均值作為實際測量值。圖2為櫻桃番茄樣本的糖分分布,從圖中可知,采集到的樣本糖分分布大致符合正態分布。

圖2 櫻桃番茄糖分與樣品數量的關系圖Fig.2 Relationship between cherry tomatoes sugar and sample quantity

1.2.2 實驗樣本光譜采集

AMBER Ⅱ便攜式近紅外光譜儀器所檢測的譜頻區域為900~1 700 nm,獲取的原始光譜如圖3所示。光譜在980、1 200和1 450 nm處出現了波峰。櫻桃番茄中的糖分主要為果糖、葡萄糖和蔗糖[17],1 080 nm處為C—H基團的2倍頻吸收峰,980 nm處為O—H基團的二級倍頻特征波峰,1 200 nm處為C—H鍵的二級倍頻特征波峰,1 450 nm為C—H鍵的一級倍頻特征波峰,具有較強特征性。

圖3 櫻桃番茄近紅外原始光譜圖Fig.3 Near infrared spectrum of cherry tomatoes

1.3 實驗算法原理

1.3.1 Kennard-Stone算法

為了使所建立的模型魯棒性更強,訓練集和預測集的樣品更具有代表性,使用K-S算法將樣本集以3∶1的比例劃分為訓練集和驗證集。K-S算法將所有的樣本全部看作訓練集的候選樣本,隨后依次從中挑選樣本進行劃分。該算法首先選擇歐式距離最遠的2個樣本進入訓練集,隨后對剩下的樣本計算到訓練集中每一個已知樣本的歐氏距離。分別找到擁有最大最小距離的樣本放入訓練集,以此類推,直到訓練集樣本個數達到數量要求。該算法的優點是可以確保訓練集中的樣本按照空間距離均勻的分布。歐式距離的計算如公式(1)所示。

(1)

式中:xp和xq,2個不同的樣本;N表示樣本的光譜點數。

1.3.2 UVE無信息變量消除法

UVE算法[18]是用于光譜波長變量篩選的一種算法。它可以有效減少最終PLS模型中包含的變量數,將有效的特征波段應用于模型中,從而降低PLS模型的復雜性,并且提高模型的預測能力。在實際采集的櫻桃番茄光譜數據中,會有大量不包含糖分信息的波長點存在,因此為了提高模型精度,使用UVE算法去除不包含信息的波長點是尤為必要的。

UVE算法是一種基于分析PLS回歸系數的算法,目的在于消除不提供有效信息的變量。在PLS模型中光譜數據矩陣(X)和濃度矩陣(Y)的回歸關系如公式(2)所示。

Y=Xb+e

(2)

式中:b,模型的回歸系數向量,e,誤差向量。

UVE算法首先要產生一個與自變量矩陣相同變量數目的隨機矩陣,將其等同于噪音,并將該隨機矩陣加入到原光譜矩陣中。隨后通過留一交叉驗證的方法逐一建立PLS模型,最終得到回歸系數的矩陣B。計算回歸系數矩陣中的回歸系數向量b的平均值和標準偏差的商,記為Ci,如公式(3)所示。

Ci=mean(bi)/S(bi)

(3)

式中:mean(bi),回歸系數向量b的平均值;S(bi),回顧系數向量b的標準偏差,下標i為B矩陣中的第i列,具體算法如下:

(1)產生一隨機噪聲矩陣R(n×m),將其與光譜矩陣X(n×m)合成矩陣XR(n×2m),其中前m列為X后m列為R;

(2)將矩陣XR與濃度矩陣Y(n×1)進行PLS回歸,使用留一交叉驗證方法,每次得到一個回歸系數向量b,共得到n個回歸系數向量,組成矩陣B(n×2m);

(3)按列計算回歸系數矩陣B平均值與標準偏差的商,計算Ci=mean(bi)/S(bi),i=1,2,…,2m;

(4)在[m+1,2m]區間取C的最大絕對值Cmax=max[abs(C)];

(5)在[1,m]區間內去除Ci

1.3.3 SPA連續投影算法

SPA算法[19-20]為一種波長選擇算法,該算法對波長進行選擇的主要原理是從某一個波長點出發,不斷地采用連續投影策略選擇與已有波長線性相關度最小的波長點構成一個波長子集,重復這一操作選出一系列的波長子集,隨后將這些選擇出來的波長子集建模后的模型預測能力進行比較,選出結果最優的波長子集。計算未選擇變量xj(j∈s)在已選擇的特征變量xk(t-1)構成的正交子空間上的投影,如公式(4)所示。其中,P為投影算子;I為單位矩陣。這一算法的優勢在于盡可能地降低了被選波長之間所存在的共線性問題。

(4)

1.4 模型評價標準

在本研究中使用的模型評價指標有決定系數、驗證均方根誤差 (root-mean-square error of collection,RMSEC)、預測均方根誤差 (root-mean-square error of prediction,RMSEP)和相對分析誤差(relative percent deviation,RPD)。其中,模型最終計算出的RMSEC和RMSEP的值越小、R2的值越接近于1則說明模型越穩定,預測能力越強。一般情況下,RMSEC和RMSEP的值相差不多,若RMSEC和RMSEP的值相差過大,則說明建模集樣本或預測集的樣本不具有代表性,出現了欠擬合或過擬合的狀況,需要重新對樣本集進行劃分。RPD的值可以說明模型的預測能力,當其值大于1.4時便說明該模型數據有預測能力,值越大則說明模型的預測能力越強。RMSEP和RMSEC的計算公式相同,如公式(5)所示,R2的計算公式如公式(6)所示。

(5)

(6)

2 結果與分析

2.1 樣本劃分

采集的實驗樣本一共為172個,利用K-S算法對實驗樣本數據進行分析。以3∶1的比例將樣本劃分為建模集和預測集,即建模集樣本為129個,預測集樣本為43個。樣本劃分過后的糖含量統計值如表1所示。

表1 樣本含糖量統計表Table 1 Statistical value of sample sugar content

2.2 光譜數據預處理

在原始光譜數據中可以觀察到,該光譜數據具有明顯的噪音及漂移,因此在建立模型前對光譜數據進行預處理。預處理方法選用了SNV、Savitzky-Golay卷積平滑處理和一階導數差分[21-23]。使用不同預處理方法后基于PLS方法建模的結果如表2所示。

表2 櫻桃番茄糖分模型不同預處理方法建模結果Table 2 Modeling results of different pretreatment methods for sugar model of cherry tomatoes

由表2可知,無論是用哪一種預處理方案,該模型驗證集和預測集的R2均>0.7,RPD均>1.4,說明每一種預處理方案下的模型均具有一定的預測能力。但采用SNV+S-G卷積平滑預處理方法后所建立模型的R2值最大,且RMSEC和RMSEV的值最小,說明在該預處理方法下的模型性能為最優。預處理過后的近紅外光譜圖如圖4所示。

圖4 櫻桃番茄近紅外預處理光譜圖Fig.4 Near infrared pretreatment spectrum of cherry tomatoes

2.3 櫻桃番茄糖分分析模型建立

2.3.1 基于全譜段的PLS櫻桃番茄糖分分析模型

選擇最佳預處理方法后,使用全波段的光譜數據進行PLS建模分析,最終得到的糖分分析模型建模集和預測集的決定系數R2分別為0.894 2和0.892 9,預測均方根誤差RMSEC和RMSEP分別0.159 6和0.223 4,RPD的值為2.22。預測結果如圖5所示。

圖5 全譜段的PLS模型櫻桃番茄糖分預測結果Fig.5 Prediction of sugar content in cherry tomatoes based on PLS model

2.3.2 基于UVE-PLS的櫻桃番茄糖分預測模型

為使模型更加簡化,降低模型計算量,提高預測精度,將SNV+S-G卷積平滑預處理過后的光譜數據用UVE特征波段篩選方法對605個波長點進行篩選,將與預測糖分無關的特征變量去除[24]。UVE算法共去除了231個無信息波長點,保留信息變量374個。用全部波段的61.8%建立櫻桃番茄糖分的定量分析模型,最終所選取的波段如圖6所示。

圖6 UVE算法對特征波段篩選的結果Fig.6 The result of selecting characteristic wavelength by UVE algorithm

基于UVE-PLS方法建立的櫻桃番茄糖分模型建模集和預測集的決定系數R2分別為0.929 5和0.899 9,預測均方根誤差RMSEC和RMSEP分別為0.135 9和0.215 9,RPD的值為2.29。預測結果如圖7所示。

圖7 UVE-PLS模型櫻桃番茄糖分預測結果Fig.7 Prediction results of sugar content of cherry tomato based on UVE-PLS model

2.3.3 基于SPA-PLS櫻桃番茄糖分預測模型

對櫻桃番茄的光譜數據進行SNV+S-G卷積平滑預處理,將預處理過后的光譜進行SPA特征波長提取。由于SPA算法要求在優化過程中生成的每個波長子集的波長點數的數目是不能超過校正集中的樣本個數的,因此在本實驗中,用SPA算法所提取出的特征波長數量一定會少于21個,這使變量輸入到PLS模型后的計算量在很大程度上得到了簡化。使用SPA算法最終提取到了16個特征波長點,分別是906.15、966.04、995.60、1 056.44、1 109.99、1 196.42、1 214.36、1 220.32、1 450.70、1 476.74、1 582.20、1 596.57、1 639.11、1 644.12、1 650.11、1 689.61 nm。結果如圖8所示。

圖8 SPA算法選擇的特征波段Fig.8 Characteristic wavelength selected by SPA algorithm

圖9顯示了基于SPA算法的PLS模型用不同波長數量進行交叉驗證的均方根誤差結果。隨著選擇的波段數的增加,PLS模型的均方根誤差值在逐漸減小,隨后減小趨勢逐漸平緩最后幾乎不變。當選擇的波長數量<16時的均方根誤差的值下降速率較快,當選擇波長數量>16后,均方根誤差的下降速率明顯減小。因此,SPA算法最終選擇的波長變量數為16個。

圖9 SPA算法選擇的變量個數Fig.9 Prediction results of sugar content of cherry tomato based on SPA-PLS model

將提取過后的特征波長進行PLS建模,建模集和預測集的決定系數R2分別為0.930 1和0.918 6,預測均方根誤差RMSEC和RMSEP分別為0.130 4和0.194 7,RPD的值為2.53。預測結果如圖10所示。

圖10 SPA-PLS模型櫻桃番茄糖分預測結果Fig.10 Prediction results of sugar content of cherry tomato based on SPA-PLS model

2.3.4 基于UVE-SPA-PLS櫻桃番茄糖分預測模型

在研究中,分別將櫻桃番茄的光譜數據進行了UVE和SPA算法的特征波長提取。單獨使用UVE算法時,盡管消除了部分不具有信息的特征波長點,但被選擇的特征波長點之間會存在共線性問題。同樣,當在單獨使用SPA算法進行特征波長提取時,雖然降低了特征波長點之間的共線性,但所選擇的波長子集中很可能會包含一些無信息的、甚至會產生干擾的波長[25]。因此,在本實驗中將UVE算法與SPA算法聯合,實現兩者之間的優勢互補,建立基于UVE-SPA特征波段選取的PLS櫻桃番茄糖分模型。經過2種算法的計算,最終被選取的特征波長點分別為1 056.44、1 109.99、1 196.42、1 214.36、1 220.32、1 476.74、1 582.20、1 596.57、1 639.11、1 644.12、1 650.11、1 689.61 nm,共12個特征波長點。基于UVE-SPA-PLS方法所建立的櫻桃番茄糖分模型建模集和預測集的決定系數R2分別為0.938 5和0.934 7,預測均方根誤差RMSEC和RMSEP分別為0.130 5和0.174 4,RPD的值為2.81。預測結果如圖11所示。

圖11 UVE-SPA-PLS模型櫻桃番茄糖分預測結果Fig.11 Prediction results of sugar content of cherry tomato based on UVE-SPA-PLS model

表3是基于不同波長提取算法下PLS模型的模型參數,從表中可以看出,經過特征波長提取后的模型決定系數R2和相對分析誤差RPD的值均有所提高,均方根誤差RMSEC和REMSP均有所降低。其中UVE和SPA特征波長選取方法聯合使用既去除了無消息特征波長點,又降低了波長之間的共線性,因此UVE-SPA-PLS建模方法達到的效果最佳。

表3 不同波長提取方法PLS建模結果表Table 3 PLS modeling results of different wavelength extraction methods

3 結論與討論

本實驗用AMBER Ⅱ便攜式近紅外光譜儀器采集櫻桃番茄的近紅外光譜圖,使用K-S算法將樣本以3∶1的比例進行劃分,建模集樣本個數為129個,預測集樣本個數為43個。用PLS方法建模,經過多種預處理方法比較,選用S-G卷積平滑和SNV預處理方法的建模結果最佳。建模集和預測集的決定系數R2分別為0.894 2和0.892 9,均方根誤差RMSEC和REMSP分別為0.159 6和0.223 4,RPD的值為2.22。

對預處理過后的光譜數據分別使用UVE、SPA和UVE-SPA聯合這3種方法進行特征波長提取,最終使用UVE-SPA特征波長提取方法提取到的12個特征波長進行PLS建模效果最佳,建模集和預測集的決定系數R2分別為0.938 5和0.934 7,均方根誤差RMSEC和REMSP分別為0.130 5和0.174 4,RPD的值為2.81。建模集和預測集的決定系數都達到了0.9以上,均方根誤差也都較低,說明了使用便攜式近紅外光譜儀掃描的數據可以建立精度較高的櫻桃番茄的糖分預測模型。

在進一步研究中,應擴大樣本獲取范圍,采集更多不同產地的櫻桃番茄,增大樣本數量,增大樣本的糖分范圍,盡量使不同產地櫻桃番茄的采摘時間大致相同,使模型的預測性更高,應用更加廣泛。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲欧美一级一级a| 国产精品第页| 黄色国产在线| 高清亚洲欧美在线看| 国产一区二区三区精品久久呦| 国产日韩精品一区在线不卡| 欧美有码在线观看| 亚洲中文久久精品无玛| 在线看国产精品| 亚洲精品黄| 2024av在线无码中文最新| AV在线天堂进入| 91精品小视频| 亚洲精品图区| 中文字幕首页系列人妻| 园内精品自拍视频在线播放| 国产一级做美女做受视频| 五月婷婷中文字幕| 男女男精品视频| 色老头综合网| 亚洲色偷偷偷鲁综合| 97se综合| 天天躁狠狠躁| 国产中文一区a级毛片视频 | 久久这里只有精品23| 国产成人综合亚洲欧洲色就色| 国产在线精品美女观看| 亚洲一道AV无码午夜福利| 亚洲国产成熟视频在线多多| 最新午夜男女福利片视频| 人妻21p大胆| 欧美一级色视频| 97久久精品人人做人人爽| 亚洲精品午夜天堂网页| 青青操国产视频| 午夜日韩久久影院| 国产精品对白刺激| 亚洲av日韩综合一区尤物| 国产午夜无码片在线观看网站| 国产精品浪潮Av| 亚洲首页国产精品丝袜| 国产真实乱了在线播放| 亚洲无码熟妇人妻AV在线| 国产精品入口麻豆| 国产成人高清精品免费5388| 性欧美在线| 国产成人a在线观看视频| 亚洲人成亚洲精品| 久久午夜影院| 动漫精品啪啪一区二区三区| 人妻一区二区三区无码精品一区| 欧美日本视频在线观看| 国产亚洲精| 日韩欧美中文在线| 亚洲国产成人精品一二区| 亚洲国产精品久久久久秋霞影院| h视频在线观看网站| 免费99精品国产自在现线| 亚洲无码在线午夜电影| 成人福利视频网| 欧美成人午夜视频| 极品国产一区二区三区| 香蕉久人久人青草青草| 天天色综合4| 国产成年女人特黄特色毛片免 | 波多野结衣久久高清免费| 第一区免费在线观看| 精品国产三级在线观看| 91九色国产porny| 国产精品免费电影| 精品久久综合1区2区3区激情| 老司国产精品视频| 亚洲精品手机在线| 日韩在线2020专区| 亚洲国产欧美目韩成人综合| 久久99国产综合精品女同| 少妇精品久久久一区二区三区| 色综合久久88| 无码人妻免费| 国产成人精品亚洲77美色| 国产福利免费视频| 在线观看国产精品第一区免费|