999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TrAdaBoost算法的近紅外光譜模型傳遞研究

2022-03-14 13:26:22劉翠玲徐金陽孫曉榮張善哲昝佳睿
農(nóng)業(yè)機械學報 2022年2期
關鍵詞:模型

劉翠玲 徐金陽 孫曉榮 張善哲 昝佳睿

(1.北京工商大學人工智能學院, 北京 100048; 2.北京工商大學食品安全大數(shù)據(jù)技術北京市重點實驗室, 北京 100048)

0 引言

隨著近紅外(Near infrared,NIR)光譜學的發(fā)展,近紅外光譜技術已成功地應用于食品、醫(yī)藥和農(nóng)業(yè)等許多領域[1-4]。然而,由于儀器的多樣性,所建立的校正模型已經(jīng)不適用于新樣本,但是重新建立校正模型需要大量的工作和時間。模型傳遞(Calibration transfer)為這類問題的解決提供了可行途徑,其本質(zhì)是克服樣本在不同儀器間測量信號的不一致性,使得主機建立的校正模型可以用于其他儀器[5-6]。

近年來,國內(nèi)外學者對模型傳遞在食品安全領域的應用進行了大量研究。劉銳等[7]使用直接標準化算法(Direct standardized,DS)和分段直接標準化(Piecewise direct standardization,PDS)對牛奶的成分進行模型傳遞研究。趙政[8]將斜率截距(Slope/bias,S/B)算法應用到新鮮度豬肉的揮發(fā)性和鹽基氮原子含量的模型傳遞。CHEN等[9]提出了一種基于極限學習機自編碼器的模型傳遞方法(Transfer via extreme learning machine auto-encoder method,TEAM),通過對玉米、煙草、藥品數(shù)據(jù)集的實驗證明其預測性能較好。這些傳統(tǒng)算法都成功將校正模型進行傳遞并取得不錯效果,但存在參數(shù)設置復雜、效率低等缺點。

隨著計算機技術的快速發(fā)展,遷移學習(Transfer learning)逐漸成為研究熱點,其核心思想是將某個領域上學習到的知識遷移到不同但相關的領域中[10-11]。這與模型傳遞將主機建立的校正模型遷移到從機上的思路十分相近,所以遷移學習為模型傳遞提供了一種新思路。但現(xiàn)階段遷移學習主要用于圖像[12-13]、文本[14]、語義[15]等方面,戴文淵[16]提出TrAdaBoost算法并成功將其應用到跨領域的文本分類。遷移學習具有數(shù)據(jù)小、效率高和魯棒性較好等優(yōu)點[17],但其在模型傳遞領域的應用卻鮮有報道。

本文采用TrAdaBoost算法,并結合極限學習機(Extreme learning machine,ELM)[18]建立傳遞模型,實現(xiàn)食用油酸值的校正模型在不同儀器之間傳遞。并與直接標準化算法(DS)、基于極限學習機自編碼器的模型傳遞算法(TEAM)和缺損數(shù)據(jù)重構算法(Missing data recovery,MDR)[19]進行對比研究,以期將遷移學習更好地應用于模型傳遞領域。

1 材料與方法

1.1 材料

實驗食用油樣本來源于北京古船食品有限公司,選擇了5種食用油(玉米油、芝麻香油、大豆油、橄欖油、小磨香油)共計129個樣本。并依據(jù)GB/T 5530—2005《動植物油脂 酸值和酸度測定》[20]測定所有食用油樣本的酸值。

1.2 實驗儀器

實驗在北京工商大學光譜技術與品質(zhì)檢測實驗室完成,光譜檢測儀器為Bruker公司的VERTEX-70型傅里葉紅外光譜儀和MATRIX-F型傅里葉紅外光譜儀。實驗設定MATRIX-F型光譜儀為主機,VERTEX-70型光譜儀為從機。儀器參數(shù)詳見表1。

表1 光譜儀器和參數(shù)Tab.1 Spectroscopic instruments and parameters

1.3 光譜采集

使用2臺近紅外光譜儀分別采集食用油樣本信息。采集時儀器參數(shù)設置為:分辨率16 cm-1;樣本掃描次數(shù)32;背景掃描次數(shù)為32;光譜的采集范圍9 000~5 000 cm-1;光闌6 mm;掃描頻率10 kHz。

1.4 數(shù)據(jù)分析與處理

1.4.1光譜數(shù)據(jù)預處理

由于客觀存在或人為因素,實驗采集到的光譜數(shù)據(jù)通常會摻入噪聲干擾,甚至使得數(shù)據(jù)不再完整。因此,光譜數(shù)據(jù)在建立校正模型之前必須進行預處理,壓縮建模光譜集數(shù)據(jù)的規(guī)模,從而平滑噪聲并剔除奇異數(shù)據(jù)[21]。在全光譜范圍內(nèi)比較了有限脈沖響應(Finite impulse response,F(xiàn)IR)[22]、多元散射校正(Multiplicative scatter correction,MSC)[23]、正交信號校正(Orthogonal signal correction,OSC)[24]和標準正態(tài)變量變換(Standard normalized variate,SNV)[25]共4種預處理方法對ELM模型性能的影響,發(fā)現(xiàn)經(jīng)SNV預處理后的光譜能有效提高ELM模型的性能,因此,本實驗以SNV預處理后的光譜作為后續(xù)分析的基礎。

1.4.2樣本劃分方法

建立校正模型前,需要將食用油樣品集劃分為訓練集和測試集。Kennard-Stone[26]算法是一種有效的樣品集劃分方法。其算法是通過計算樣品之間的歐氏距離(Euclidean distance),選擇代表性強的樣品作為訓練集樣品,其余的作為測試集,從而提高校正模型性能。

1.5 建立PCA-ELM-TrAdaBoost模型傳遞分析模型

1.5.1PCA降維

由于食用油數(shù)據(jù)集中的樣本數(shù)量遠小于波數(shù),因此需要降維處理減少數(shù)據(jù)的復雜度。PCA是常用的化學計量工具,它可以將數(shù)據(jù)從高維空間投影到低維空間,并盡可能保留原始數(shù)據(jù)的有效信息[27]。

1.5.2ELM校正模型

ELM的拓撲結構是一個經(jīng)典的前饋神經(jīng)網(wǎng)絡,具有輸入層、隱藏層和輸出層共3層。隱藏神經(jīng)元參數(shù)是隨機分配的,輸出權重可以通過使用Moore-Penrose廣義逆矩陣進行分析,ELM算法具有學習速度快、可調(diào)參數(shù)少等優(yōu)點[28]。本文采用加權ELM算法建立校正模型,將降維后的食用油數(shù)據(jù)作為神經(jīng)元輸入,油酸值預測值作為神經(jīng)元輸出,隱藏層節(jié)點設為20,并選用Sigmoid作為激活函數(shù)。

1.5.3TrAdaBoost模型傳遞方法原理

現(xiàn)階段遷移學習大致分為3類:基于實例的遷移、基于特征的遷移和基于共享參數(shù)的遷移[29-30]。其中TrAdaBoost算法就是基于實例的遷移學習,其核心思想是:對源域Ds的標記數(shù)據(jù)實例進行有效權重分配,使源域?qū)嵗植冀咏繕擞駾t的實例分布,從而在目標領域中建立一個可靠的校正模型實現(xiàn)模型傳遞[31-32]。其主要步驟為:

(1)

(2)

(3)

式中m、n——源域、目標域訓練集樣本數(shù)量

(2)計算誤差。建立加權ELM校正模型。將訓練集Xi經(jīng)PCA降維后輸入到校正模型中,輸出預測值Yi,其與真實值Ti的預測誤差為εi,計算式為

(4)

(5)

(6)

其中

式中βk——每次迭代的學習機權重

(4)達到最大迭代次數(shù)N后,輸出ELM校正模型目標域的最終預測值YN。

1.6 模型傳遞的評價

模型的評價參數(shù)選擇決定系數(shù)(Correlation coefficient of cross-validation,R2)和預測集均方根誤差(Root mean square error of prediction,RMSEP)。R2越大表明光譜信息與食用油理化值的相關性越好,RMSEP越小,表明預測性能越好,模型傳遞的效果越好。

2 結果與分析

2.1 食用油光譜特征分析

主機和從機所采集的食用油樣品光譜經(jīng)SNV預處理后波數(shù)在9 000~5 000 cm-1范圍內(nèi),共2 074個波數(shù)點(圖1)。觀察發(fā)現(xiàn),8 700 cm-1和8 200 cm-1附近有2處主要的吸收峰,且其分別可能是由C—H(CH3,CH2)基團的2ν二倍頻和2ν+2β組合頻作用所引起的[33]。

圖1 經(jīng)SNV預處理后的主機與從機的食用油吸光度Fig.1 Spectra of edible oil from master and slave after SNV pretreatment

2.2 樣本劃分

采用Kennard-Stone算法對129個食用油樣品進行數(shù)據(jù)劃分,訓練集與預測集的比例約為3∶1,所以有97個樣本作為訓練集,32個樣本作為預測集。食用油樣本的數(shù)據(jù)集劃分的具體情況如表2所示,訓練集的油酸質(zhì)量比為0.08~2.12 mg/g,涵蓋了較寬的范圍,有助于構建穩(wěn)定的數(shù)學模型。且預測集的油酸質(zhì)量比為0.09~1.82 mg/g,在訓練集的油酸質(zhì)量比范圍之內(nèi),表明該子集可以對模型的預測性能進行驗證。

表2 食用油樣品的數(shù)據(jù)集劃分Tab.2 Data set division of edible oil

2.3 主成分分析

由于原始光譜數(shù)據(jù)包含2 074個波數(shù)點,為了降低模型的復雜度和計算量,故對數(shù)據(jù)采用PCA主成分分析。前5個主成分的貢獻率分別為70.52%、16.79%、4.15%、3.29%和1.21%。通過計算可知,前5個主成分的累計貢獻率已經(jīng)達到了95.96%,故本文使用5個主成分進行建模分析。

2.4 模型預測結果

利用在主機上已建立好的ELM模型分別預測主機和從機上的32個預測集樣品的油酸質(zhì)量比,并循環(huán)20次取平均值。利用主機模型預測主機樣品集時,預測值與真實值的決定系數(shù)R2為0.922,預測集均方根誤差(RMSEP)為0.198 mg/g,預測效果較好。而當從機樣品集未進行模型傳遞直接代入主機模型進行預測時,決定系數(shù)R2下降到0.489,預測集均方根誤差(RMSEP)提高到4.824 mg/g,預測結果產(chǎn)生較大差異。

圖2為2臺光譜儀的預測集與真實值差值圖,其中Δ1為真實值與主機預測值的差值,Δ2為真實值與從機樣品集直接應用于主機模型預測值的差值。可以看出Δ1幾乎為0,主機預測值與真實值相差不大,說明預測較為準確。但當從機樣品集直接應用于主機模型時,Δ2較大,預測值與真實值產(chǎn)生較大偏差,所以主機建立的校正模型無法直接應用于從機樣品,需要進行模型傳遞改善預測效果。

圖2 2種模型的油酸質(zhì)量比預測值與真實值差值圖Fig.2 Difference of predicted and true values between two models

2.5 基于TrAdaBoost算法模型傳遞及預測結果

首先,按照算法要求將97個主機訓練集和97個從機訓練集進行合并,形成一個新的訓練集。其次,對新訓練集進行PCA處理并選取5個主成分,建立PCA-ELM-TrAdaBoost模型傳遞分析模型。最后,將從機的32個樣本代入上述傳遞后的主機模型中進行預測,并循環(huán)20次取平均值。

圖3為循環(huán)20次的模型傳遞與未傳遞的決定系數(shù)R2對比圖,經(jīng)過模型傳遞后的從機預測值與真實值的R2較高且比較穩(wěn)定,在0.9左右浮動,而未經(jīng)過模型傳遞的決定系數(shù)R2相對較低且不穩(wěn)定。

圖3 傳遞與未傳遞的決定系數(shù)R2對比Fig.3 R2 comparison between transfer and un-transfer

圖4為經(jīng)過模型傳遞后從機預測值與真實值差值圖,可以看出經(jīng)模型傳遞后預測值與真實值差值(Δ)幾乎為0,預測值接近真實值,說明模型預測能力有所改善。決定系數(shù)R2從0.489提高到0.892,RMSEP從原先的4.824 mg/g降低到0.267 mg/g。說明經(jīng)TrAdaBoost算法傳遞后的主機模型能更有效適用從機樣本,從而減少主機與從機間的數(shù)據(jù)差異。

圖4 模型傳遞后的預測值與真實值差值圖Fig.4 Difference of predicted and true values between transfer and un-transfer

2.6 標準樣品數(shù)量對模型傳遞的影響

為了取得較好的模型傳遞效果,采用Kennard-Stone算法依次從主機訓練集中選取0、10、…、90個樣品作為標準化樣品集,對TrAdaBoost算法進行測試。圖5為不同標準化樣品數(shù)量對TrAdaBoost模型的影響情況。當主機樣品數(shù)為0時,此時仍是從機樣品直接在主機模型預測的結果。隨著主機樣品數(shù)的增加,RMSEP下降到穩(wěn)定值后無明顯變化,說明標準樣品集的數(shù)量對TrAdaBoost算法的影響很小。

圖5 不同標準化樣品數(shù)對模型的影響Fig.5 Influence of number of samples on model

2.7 TrAdaBoost算法與其他算法的比較

為了評估TrAdaBoost算法的模型傳遞的性能,采用DS算法、TEAM算法和MDR算法進行對比測試。DS算法的基本思想是先建立主、從機光譜數(shù)據(jù)的數(shù)學函數(shù)關系,再用函數(shù)關系轉(zhuǎn)換從機光譜數(shù)據(jù),從而減少不同儀器間所測同一樣本光譜數(shù)據(jù)的差異,實現(xiàn)模型在不同儀器間傳遞。TEAM算法將主機光譜作為學習目標,選擇隱藏層中權重與偏差正交的節(jié)點,利用極限學習機的快速逼近能力與泛化性能建立主機和從機光譜之間的關系,以減少傳遞后的預測誤差。MDR算法通過構建光譜轉(zhuǎn)換矩陣,將待轉(zhuǎn)換光譜視作缺失數(shù)據(jù),通過多次迭代計算,可逐步實現(xiàn)從機光譜向主機光譜方向的轉(zhuǎn)換,再預測時能夠得到從機與主機光譜數(shù)據(jù)較小偏差的結果。

為了對比4種模型傳遞算法,樣本的數(shù)據(jù)集劃分、主成分個數(shù)以及ELM隱藏節(jié)點數(shù)均相同。經(jīng)4種算法傳遞后的主機模型分別預測從機樣品的油酸質(zhì)量比,并循環(huán)20次計算平均R2和RMSEP,以評估傳遞模型的性能,如圖6所示。

圖6 不同算法下的模型R2和RMSEPFig.6 R2 and RMSEP results by different calibration transfer methods

對比4種算法,將從機樣本代入經(jīng)TrAdaBoost算法轉(zhuǎn)換后的主機模型,其預測能力效果最好,R2為0.892,RMSEP為0.267 mg/g,十分接近主機本身的樣本代入主機模型的預測值,R2為0.922和RMSEP為0.198 mg/g。預測效果由優(yōu)到差依次為TEAM算法、MDR算法和DS算法,但這3種模型傳遞算法的預測能力均有所改善,均大于從機樣本直接應用到主機模型上的預測值。TrAdaBoost模型預測效果比其他3種算法好的原因可能是該算法將主機樣本和從機樣本進行合并,新產(chǎn)生的訓練集因為包含主機樣本,使得擬合效果更接近主機模型,以致在預測時可以更好地適應主機模型。

3 結論

(1)將遷移學習的方法應用到近紅外光譜中模型傳遞領域,采用TrAdaBoost算法結合ELM模型,實現(xiàn)了食用油酸質(zhì)量比校正模型在不同儀器之間的傳遞。并與DS算法、TEAM算法和MDR算法進行對比研究。

(2)經(jīng)模型傳遞后的主機模型的從機樣本油酸質(zhì)量比預測模型R2從0.489提高到0.892,RMSEP從4.824 mg/g降低到0.267 mg/g。對比其余3種算法,TrAdaBoost算法的預測結果最好,且預測值十分接近主機模型的預測結果,此外模型的建立幾乎不受標準樣品數(shù)量的影響。

(3)TrAdaBoost算法可以有效使不同儀器之間的光譜數(shù)據(jù)進行轉(zhuǎn)換,提高了從機樣本在主機模型的適應度,這對遷移學習應用于模型傳遞領域提供了研究思路,使近紅外光譜技術應用于食用油檢測具有實際意義。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久综合伊人 六十路| 国产精品永久久久久| 综合天天色| 91啪在线| 中文字幕在线永久在线视频2020| 成人日韩精品| 91精品专区| 免费无码一区二区| 国产波多野结衣中文在线播放| 97久久免费视频| 中文字幕有乳无码| 狠狠躁天天躁夜夜躁婷婷| 麻豆国产原创视频在线播放| 久久人体视频| 国禁国产you女视频网站| 在线观看欧美精品二区| 国产精品免费p区| 亚洲视频在线青青| 日韩视频精品在线| 色婷婷成人网| 青青草综合网| 丁香婷婷综合激情| 国产成人福利在线| 激情综合激情| 日本少妇又色又爽又高潮| 国产v欧美v日韩v综合精品| 不卡色老大久久综合网| 国产av一码二码三码无码| 亚洲第一黄色网址| 超碰91免费人妻| 午夜小视频在线| 成人在线视频一区| 狠狠干综合| 久久精品无码一区二区国产区| 72种姿势欧美久久久大黄蕉| 2020亚洲精品无码| 中国毛片网| 亚洲无限乱码| 91精品国产情侣高潮露脸| 国产精品一区二区不卡的视频| 免费福利视频网站| 制服丝袜一区二区三区在线| 精品国产成人高清在线| 高清免费毛片| 美美女高清毛片视频免费观看| 亚洲综合色婷婷中文字幕| 91国内视频在线观看| 亚洲品质国产精品无码| 亚洲AV无码一区二区三区牲色| 亚洲一区二区三区国产精华液| 欧美一级夜夜爽| 欧美亚洲欧美| 性做久久久久久久免费看| jizz亚洲高清在线观看| 国产区91| 成人夜夜嗨| 欧美一级在线| 91年精品国产福利线观看久久| 久久一日本道色综合久久| 91丝袜乱伦| 国产福利微拍精品一区二区| 色妞永久免费视频| 精品无码国产自产野外拍在线| 久久 午夜福利 张柏芝| 动漫精品啪啪一区二区三区| 99精品免费在线| 免费黄色国产视频| 专干老肥熟女视频网站| 免费在线a视频| 视频在线观看一区二区| 亚洲无限乱码| 国产无遮挡猛进猛出免费软件| 国内精品免费| 99久久精品免费视频| 手机精品福利在线观看| h视频在线观看网站| 婷婷色中文网| 国产日韩欧美视频| AV在线天堂进入| 国产欧美精品午夜在线播放| 国产不卡网| 蜜桃视频一区|