倪金 索麗敏 劉海龍



摘 要:大米是我國主要的糧食之一。近年來將陳大米冒充新大米售賣的現象在市場上層出不窮,嚴重擾亂了市場秩序。該文基于近紅外光譜與機器學習方法相結合,提供了一種陳化大米以及不同程度的混摻大米的定性定量檢測方法。研究中將原始近紅外光譜數據采用標準正態變量變換預處理后,建立核極限學習機分別用于陳化大米的定性判別和摻假大米的定量分析,其準確度和R2分別達到90%和0.889 2。引入北方蒼鷹優化算法用于模型的兩個重要參數尋優,結果表明北方蒼鷹優化算法能有效提高核極限學習機的性能,測試集預測準確度和R2分別提高約5%和0.054 1,為陳化大米的定性定量鑒別提供了新方法。
關鍵詞:陳化大米;摻假大米;近紅外光譜;群體智能優化算法;機器學習
Abstract: Rice is one of the main grains in China. In recent years, the phenomenon of passing off old rice as new rice for sale has been rampant in the upper echelons of the market, seriously disrupting market order. This article combines near-infrared spectroscopy with machine learning methods to provide a qualitative and quantitative detection method for aged rice and mixed rice to varying degrees. After preprocessing the raw near-infrared spectral data using standard normal variable transformation, a kernel limit learning machine was established for qualitative discrimination of aged rice and quantitative analysis of adulterated rice, with accuracy and R2 reaching 90% and 0.889 2, respectively. Introducing the northern goshawk optimization algorithm for optimizing two important parameters of the model, the results show that the northern goshawk optimization algorithm can effectively improve the performance of the kernel limit learning machine, with a prediction accuracy and R2 improvement of about 5% and 0.054 1, respectively, for the test set. This provides a new method for qualitative and quantitative identification of aged rice.
Keywords: aged rice; adulterated rice; near-infrared spectroscopy; population intelligence optimization algorithm; machine learning
大米是我國主要的糧食作物之一[1]。隨著社會經濟的發展,大米的質量問題逐漸引起了人們的關注。其中,大米的陳化和摻假是一個突出的問題。傳統的大米鑒別方法主要依賴于人工經驗和化學分析技術,普遍存在分析周期長、操作復雜、成本高等問題[2-3]。因此,需繼續探索更加準確、快速、穩定的大米鑒別方法[4]。
本文在基于近紅外光譜數據的基礎上采用北方蒼鷹優化算法(Northern Goshawk Optimization,NGO)對核極限學習機(Kernel Extreme Learning Machine,KELM)的兩個重要參數進行尋優并建立模型[5-6]。提出一種新的大米定性鑒別和摻假定量分析方法。通過驗證,該方法在陳化大米的鑒別和摻假定量分析中取得了很好的效果,對于解決陳化大米鑒別和摻假問題具有重要的實際意義。
1 材料與方法
1.1 材料
實驗樣品為2017年和2022年水稻成熟后,于黑龍江省建三江市七星農場采用五點式隨機采樣法獲取的五優稻4號,將其脫粒碾磨至精白米后作為研究樣品。其中新大米樣品為2022年收獲大米,摻假大米樣品為將2017年收獲的大米按照不同比例(25%、50%、75%)摻入2022年收獲的大米中,陳化大米樣品為2017年收獲大米。采用高精度電子秤(武義銀利電子有限公司)?。?±0.02)g作為一份樣品,共計新大米30份樣品、摻假大米90份樣品、陳化大米30份樣品。
1.2 儀器與設備
TANGO近紅外光譜儀,德國布魯克(北京)科技有限公司。
1.3 實驗方法
1.3.1 光譜預處理
對原始光譜數據進行標準正態變量變換(Standard Normal Variate,SNV)預處理,用于消除顆粒不均等原因產生的噪聲信息,原理為樣品光譜數據各波數點的吸光度符合一定分布,計算時將每個樣品的原始光譜減去理想光譜,再除以標準差[7-8]。SNV公式為
1.3.2 模型的建立
極限學習機(Extreme Learning Machine,ELM)是提出的一種機器學習模型[9],由于其可以自動生成輸入層和隱含層之間的權重和偏差值,省去了參數的設定和迭代試錯,具有操作簡單、建模速度快等優點。為進一步提高ELM的性能,在其基礎上將核函數加入建模過程,構成核極限學習機(KELM),其原理是利用核函數代替ELM中隱含層的特征映射,達到將數據升維的目的,大幅提高了模型的計算精度與泛化能力,并且該模型在面對分類任務和回歸任務時都能表現出較好的效果。但KELM對建模中的核函數γ與正則化參數C過分依賴,二者的取值對預測結果有決定性作用。目前γ與C值的設定多采用人工調參選取,嚴重降低了建模時的快速性和穩定性。為解決這一問題,該文引入北方蒼鷹優化算法(NGO)對以上兩個參數進行尋優。NGO是一種模擬的北方蒼鷹捕獵行為的群體智能優化算法,其思想是在輸入模式與目標模式之間顯式地建立一個映射關系,通過不斷迭代尋得最優的建模參數。該算法在彌補了原有不足的同時也提高了預測準確率和置信度。
1.3.3 基于NGO-KELM的陳化大米定性鑒別方法
分別建立KELM分類模型和NGO優化后的KELM分類模型。將新鮮大米30份、摻假大米90份以及陳化大米30份共計150份樣本數據隨機按照7∶3的比例分為訓練集(105份)和測試集(45份)。采用訓練集和測試集的預測準確度和F1值作為模型的性能評價指標,并繪制混淆矩陣。
1.3.4 基于NGO-KELM的陳化大米摻假定量分析方法
基于上文定性分析,分別建立KELM回歸模型與NGO優化后的KELM回歸模型,對摻假樣品進行摻假量的定性分析,探討KELM模型和NGO-KELM模型對新鮮大米中摻雜陳化大米量的預測能力。將新鮮大米30份(摻假量0%)、摻假大米90份(摻假量25%、50%、75%)、陳化大米30份(摻假量100%)共計150份樣本按照7∶3的比例隨機分為訓練集(105份)和測試集(45份)。對于定量預測模型采用決定系數R2和RMSE作為性能評價指標,并繪制柱狀圖來反映預測結果。
2 結果與分析
2.1 定性實驗結果分析
分別建立KELM模型和NGO-KELM模型,對比二者準確度和F1值并繪制混淆矩陣從而確定模型的性能,實驗結果見表1。NGO-KELM模型的訓練集和測試集準確度與F1值均高于未優化的KELM模型(NGO-KELM測試集的混淆矩陣見圖1),其測試集準確度提高約5%,說明NGO能有效提高KELM模型的分類準確度。
2.2 定量實驗結果分析
分別建立KELM模型和NGO-KELM模型進行實驗發現,利用NGO優化的KELM模型的定量預測表現也有顯著的提升,結果見圖2。
NGO-KELM模型測試集決定系數R2和RMSE分別提升了0.054 1和0.023 3,得到了較理想的摻假率檢測精度,見表2,該方法顯著優于傳統方法。
3 結論
基于NGO-KELM實現了陳化大米的定性鑒別和摻假定量分析。通過近紅外光譜設備采集標準樣品的信息,并采用NGO優化算法對KELM模型進行了優化。建立的模型具有較高的準確度和穩定性,可以有效鑒別陳化大米,同時能對其摻假進行定量分析,為陳化大米的定性鑒別和摻假定量分析提供了一種新的分析方法。
參考文獻
[1]高楊,范必威.大米品質的評價及其主要影響因素[J].廣東微量元素科學,2005(12):12-16.
[2]JIAMYANGYUEN S,WICHAPHON J, BOONMEEJOY J.Classification of rice cultivars by using chemical, physicochemical, thermal, hydration properties, and cooking quality[J].Food and Applied Bioscience Journal,2019,2:42-62.
[3]趙卿宇,王占占,陳博睿,等.大米儲藏期間風味品質的變化研究[J].中國食品學報,2021(6):203-215.
[4]唐瑋娜,劉靜炎,陳志華,等.糧食收購中主要采用的新陳度檢測方法[J].糧食與飼料工業,2016(10):61-62.
[5]DEHGHANI M,HUB?LOVSK? ?,TROJOVSK? P.Northern goshawk optimization: a new swarm-based algorithm for solving optimization problems[J].IEEE Access,2021,9:162059-162080.
[6]LIU X W,WANG L,HUANG G B,et al.Multiple kernel extreme learning machine[J].Neurocomputing,2015,149:253-264.
[7]RINNAN ?,VAN DEN BERG F,ENGELSEN S B.Review of the most common pre-processing techniques for near-infrared spectra[J].TrAC Trends in Analytical Chemistry,2009,28(10):1201-1222.
[8]BARNES R J,DHANOA M S,LISTER S J.Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra[J].Applied spectroscopy,1989,43(5):772-777.
[9]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine: theory and applications[J].Neurocomputing,2006,70(1/3):489-501.