劉海龍 倪金 索麗敏



摘 要:枸杞子具有較高的營養和醫學價值,不同產地品種的枸杞品質不同,價格也存在一定的差異,但由于缺乏有效的檢測分級手段,枸杞市場魚龍混雜,影響枸杞市場質量監管。為實現枸杞快速、無損的品種檢測,本文提出基于傅里葉變換近紅外光譜的枸杞子品種快速區分方法。利用傅里葉變換近紅外光譜儀采集了青海、寧夏兩個產地6個品種的枸杞子共計648個樣本的光譜數據之后,通過多元散射校正(MSC)、標準正態變換(SNV)、移動平均平滑(MA)、標準化(SS)、Savitzky-Golay平滑濾波(SG)、最大最小歸一化(MMS)、均值中心化(Zero-centered)分別對6個品種枸杞光譜數據進行預處理,并使用Python語言和Keras框架分別建立了2種神經網絡模型。試驗結果表明,標準化(SS)處理過后的枸杞光譜數據可快速、高效地實現中寧枸杞子品種判別,為食品安全應用提供了技術支撐。
關鍵詞:人工神經網絡(ANN);品種鑒別;近紅外光譜;枸杞子
Identification of Goqizi Species Using Near-Infrared Spectroscopy Combined with Keras Neural Network
LIU Hailong, NI Jin, SUO Limin*
(Heilongjiang Bayi Agricultural University, Daqing 163319, China)
Abstract: Goqizi have high nutritional and medical value. The quality of Goqizi from different regions varies, and there are also certain price differences. However, due to the lack of effective detection and grading methods, the Goqizi market is mixed, which affects the quality supervision of the Goqizi market. To achieve rapid and non-destructive variety detection of Goqizi, this paper proposes a fast identification method for Goqizi varieties based on Fourier transform near-infrared spectroscopy. After using a Fourier transform near-infrared spectrometer to collect spectral data of 648 samples from 6 varieties of Goqizi from two regions of Qinghai and Ningxia, multiple scattering correction (MSC), standard normal transformation (SNV), moving average smoothing (MA), standardization (SS), Savitzky Golay smoothing filtering (SG), maximum minimum normalization (MMS) Zero centered preprocessing was performed on the spectral data of 6 varieties of Goqizi, and two neural network models were established using Python language and Keras framework. The experimental results indicate that the standardized (SS) processed spectral data of Goqizi can quickly and efficiently distinguish the varieties of Zhongning Goqizi, providing technical support for food safety applications.
Keywords: Artificial Neural Network(ANN); variety identification; near infrared spectroscopy; Goqizi
枸杞是目前最具發展潛力的藥食兩用類經濟植物,因其含有豐富的營養價值和藥用價值而得到消費者的普遍接受和信賴,在全國乃至全世界都享有極高的聲譽[1]。目前,我國枸杞主產區的絕大多數栽培品種均引自寧夏枸杞系列品種[2]。研究表明,不同品種或不同產地的枸杞子在多酚、糖類、維生素、氨基酸等化學成分含量等方面具有較大差異[3-6]。例如,祿璐等[7]研究發現,46個枸杞原漿產品的主要成分與口感、風味具有相關性;蔣蘭等[8]研究得出多種活性成分能明顯提升枸杞子品質,如枸杞多糖含量可作為枸杞果酒釀造工藝的衡量指標[9],枸杞的營養成分是其藥用價值的評價指標之一[10]。因此,對不同品種枸杞子進行快速、準確判別,有利于根據不同枸杞子品種的差異有針對性地開展枸杞資源的利用,提高資源利用率。目前有關枸杞子分類方面的研究較少。
近紅外光譜是一種介于可見光和中紅外間的電磁波,波長為780~2 526 nm,該區域的波長能夠記錄C-O、O-H和N-H等化學鍵振動的倍頻和合頻吸收信息,可以作為獲取信息有效載體對含氫基團有機物的理化性質進行測量,且可實現對樣品快速、無損的檢測,現已廣泛運用于各農產品研究中[11-12]。但光譜數據中還包含噪聲、基線漂移采樣環境干擾等不穩定因素,會導致建立模型的精度下降,因此還需要提前對光譜數據進行預處理,提高光譜數據信噪比和分辨率,從而提高模型預測的準確度。
Keras是一種主流的神經網絡框架,其采用Python編寫,高度封裝,能夠在TensorFlow、CNTK或Theano之上運行,用戶可以用最小的時間獲得最優的實驗結果,大大降低了神經網絡的使用門檻,減少了構建網絡所耗費的時間與精力。目前,該神經網絡框架在醫學、自動駕駛、人臉識別等眾多領域都有使用[13-15]。
1 材料與方法
1.1 樣本數據來源
用于實驗的枸杞子為產地市購買,分別為中寧
1號、中寧7號、小尖椒(中寧)、青海板型、青海條形,青海1號6個品種。將枸杞子樣品進行除雜、干燥后,每個品種選取20粒作為一份樣品,得到青海1號104份、青海板型104份、青海條形106份、小尖椒(中寧)106份、中寧1號106份、中寧7號122,共計648份樣品。將樣本置于近紅外光譜實驗室靜置24 h后進行掃描。
采樣儀器為Bruker公司生產的TANGO近紅外光譜儀,測量波數為11 550~3 950 cm-1,測量樣本的吸光度。每個樣品單獨掃背景,后掃描32次選取平均光譜作為研究樣本。將樣品數據按照7∶3的比例隨機分為訓練集和驗證集,劃分后訓練集和測試集樣本數據量分別為454個和194個,結合Keras框架進行枸杞子品種鑒別研究。
1.2 數據預處理
由于樣本在掃描過程中極易受到檢測環境、儀器、顆粒大小不均勻和自身因素的影響,使光譜數據質量下降,產生基線漂移、噪聲、尺度差異等一系列問題,造成模型精度下降。因此對數據分別進行多元散射校正(MSC)、標準正態變換(SNV)、移動平均平滑(MA)、標準化(SS)、Savitzky-Golay平滑濾波(SG)、最大最小歸一化(MMS)以及均值中心化(Zero-centered)預處理,提高信噪比和分辨率,讓模型更具有穩健性。通過不同方法預處理后的光譜圖如圖1所示。
1.3 建立模型
人工神經網絡(Artificial Neural Network,ANN)的學習能力很強,且對于許多非線性問題有極強的映射能力和容錯性[16]?;诜聪騻鞑ニ惴ǎ˙P)的神經網絡作為ANN重要組成部分,在涉及多種非線性因素建模時,相對于傳統的反應機理建模顯示出巨大的優勢[17]。基于Keras框架搭建模型1:輸入層—3個隱藏層(8)—輸出層(6)以及模型2:輸入層—3個隱藏層(16)—輸出層(6)的全連接反向傳播神經網絡模型見圖2,使用Sgd隨機梯度下降法學習率為0.05,隱藏層均采用rule激活函數。面對多分類問題將輸出層激活函數設置為softmax,每批次輸入數據尺寸為100,損失函數為交叉熵(CrossEntropy Loss),設置訓練迭代次數為10 000次。
2 結果與分析
使用Python語言和Keras框架分別建立了模型1:3個隱藏層(8)—輸出層(6),以及模型2:3個隱藏層(16)—輸出層(6)的神經網絡模型,將通過不同方法預處理后的數據輸入模型訓練得到結果如圖3所示。
分析可知,通過標準化(SS)預處理后的數據在模型1中準確率達到了100%,而在模型2中經最大最小歸一化(MMS)和標準化(SS)方法預處理后的數據測試結果準確度均能達到100%,證實了該方法的有效性。
3 結論
通過對自采的6種不同枸杞子品種的光譜數據進行7種不同方法預處理后分別輸入復雜度不同的兩個Keras搭建的神經網絡模型,最終模型對枸杞品種的鑒別準確度達到100%,能夠滿足枸杞品種鑒別的實際需求。通過SS和MMS兩種預處理方法均能增大不同品種之間光譜圖的差異,有效提高了近紅外光譜預測模型的準確性和魯棒性,為快速無損檢測枸杞品種提供了一種新方法。
參考文獻
[1]逄春梅,李艷萍.枸杞中功能性成分的研究進展[J].食品界,2023(4):116-118.
[2]開建榮,李彩虹,趙丹青,等.寧夏不同地區不同品種枸杞中元素含量差異分析[J].食品與發酵工業,2020,46(7):257-264.
[3]王秀芬,李靜,方光明,等.枸杞子質量評價研究進展[J].中國醫藥導報,2020,17(22):46-49.
[4]王益民,張珂,許飛華,等.不同品種枸杞子營養成分分析及評價[J].食品科學,2014,35(1):34-38.
[5]LIU E J,XIA M Q,BAI J,et al.Chemical characterization and 5α-reductase inhibitory activity of phenolic compounds in goji berries[J].Journal of Pharmaceutical and Biomedical Analysis,2021,201:114119.
[6]孫紅亮.11種枸杞子總黃酮和總硒含量分析[J].分子植物育種,2022,20(18):6177-6186.
[7]祿璐,閆亞美,米佳,等.枸杞原漿品質分析與評價標準構建[J].食品工業科技,2022,43(21):271-281.
[8]蔣蘭,楊毅,江榮高.枸杞的藥理作用及其加工現狀[J].食品工業科技,2018,39(14):330-334.
[9]許引虎,謝再斌,楊萌,等.枸杞果酒釀造工藝的研究進展[J].釀酒科技,2023(1):117-122.
[10]吉德娟,張得芳,王占林,等.有機栽培下枸杞果實中營養成分的含量特征[J].青海大學學報,2022,40(5):41-46.
[11]RAHMAWATI L,PAHLAWAN M F R,HARIADI H,et al.Detection of encapsulant addition in butterfly-pea (Clitoria ternatea L.) extract powder using visible–near-infrared spectroscopy and chemometrics analysis[J].Open Agriculture,2022,7(1):711-723.
[12]ZHU X F,ZHANG C Y,HAO Y J,et al.Effects of corn stover mulch quantity on mid-infrared spectroscopy of soil organic carbon in a no-tillage agricultural ecosystem[J].The Journal of Applied Ecology,2021,32(8):2685-2692.
[13]劉志雄,潘媛媛.基于Keras的LSTM模型的心肌梗死患者發病預測[J].電腦知識與技術,2022,18(23):68-70.
[14]蔡默晗,劉晨煜,張辛沅.基于Keras神經網絡模型的車道線識別技術研究[J].現代計算機,2022,28(13):76-78.
[15]儲匯,宋陳,汪晨燦.基于Keras卷積神經網絡的多人臉識別抗干擾研究[J].洛陽理工學院學報(自然科學版),2022,32(1):62-67.
[16]REN R,LI X M,LI Z,et al.Projected change in precipitation forms in the chinese tianshan mountains based on the back propagation neural network model[J].Journal of Mountain Science,2022,19(3):689-703.
[17]蔡月芹,趙文杰,王雪.基于近紅外光譜技術的玉米品種鑒別方法研究[J].江蘇科技信息,2019,36(21):36-38.