





摘要:為建立油莎豆塊莖含油率的近紅外光譜快速無損檢測模型,提高育種材料的早代選擇效率,本研究以109份油莎豆塊莖樣本為實驗材料,采集波長范圍為950-1 650 nm、分辨率為1 nm的近紅外光譜,并通過索氏提取法測定塊莖粗脂肪含量,剔除異常樣本后共得到103份樣本,使用SPXY法將其按3:1的比例劃分為校正集與驗證集。分別采用標準正態變換、多元散射校正、一階導、二階導、sc平滑以及混合方法對原始光譜進行預處理,并基于此建立偏最小二乘回歸(PLSR)模型,通過對模型性能的對比分析,篩選出在校正集和驗證集上預處理效果均較好的MSC+SC法,用于油莎豆含油率檢測模型的構建;然后用競爭性自適應重加權采樣(CARS)、無信息變量消除(UVE)算法以及MIP神經網絡進行特征波長提取,并構建PLSR模型,結果顯示,用CARS和UVE算法分別提取出115個和251個特征波段,建模效果均比全波段建模效果好,其中CARS-PLSR模型預測性能最優,校正集交叉驗證均方根誤差(RMSEcv),決定系數分別為1.328、0.903,驗證集RMSEp.RP分別為1.206、0.888,驗證集相對分析誤差(RPDp)為3.040;而MIP-PLSR模型的預測精度與CARS-PLSR模型接近,RMSEcv.R分別為1.387、0.903,RMSEp、R2分別為1.207、0.887,RPDp為3.040,但提取的特征波長僅77個,是3種方法中最少的,說明MLP法能夠更有效地降低光譜信息重疊,濾除無關信息,MLP-PLSR更適合用于油莎豆含油率檢測。綜上,本研究初步建立了基于近紅外光譜的油莎豆含油率快速無損檢測模型,可為提高育種工作中的檢測效率提供有效方法,并為油莎豆含油率無損檢測提供技術支持。
關鍵詞:油莎豆;含油率;近紅外光譜;偏最小二乘回歸(PLSR);MLP神經網絡;特征波長提取
中圖分類號:S126:S565.9 文獻標識號:A 文章編號:1001-4942(2025)01-0166-08
油莎豆是一種原產于非洲和地中海沿岸的高能作物,耐鹽堿、干旱,適宜在沙壤土中種植;其塊莖橢圓形或類球形,成熟時含油量在20%-36%之間,單位面積產油量非常可觀,并且油脂中富含維生素E和維生素C,營養價值較高。因此,油莎豆作為新型油料作物,有著極高的發展潛力,是《全國種植業結構調整規劃(2016-2020年)》重點推薦種植的油料作物之一,可作為進口大豆重要的替代性原料,在不與主糧爭地的政策背景下對提高我國食用油自給自足率起著重要作用。
含油率是油料作物的重要品質性狀,也是育種改良的主要目標性狀,建立一套能規模化應用且快速準確的含油率測定方法對于加快育種進程具有重要意義。通常實驗室中使用索氏提取法測定樣品中的粗脂肪含量,這也是我國糧油分析首選的標準方法。但該方法實際操作過程中耗時較長且需要消耗大量試劑,不適用早代育種材料的大規模篩選分析。近紅外光譜分析技術是一種融合了光譜技術、信息學、化學計量學和計算機技術的高效快速分析技術,利用有機分子中含氫基團(如0-H、C-H、N-H等)的震動吸收頻率與780-2 526 nm近紅外光譜的對應關系,通過獲取和分析不同分子的光譜信息,實現對農產品中蛋白質、氨基酸、脂肪等的檢測分析,已廣泛用于花生、玉米、谷物等的品質分析以及肉類摻假鑒定和乳飲料品質分析等領域,但在油莎豆含油率檢測方面的應用研究還較少。
本研究選用103份油莎豆樣本構建數據集,采用SPXY算法按照3:1的比例將數據集劃分為校正集和驗證集,對比分析一階導、二階導、標準狀態變換、多元散射校正、SG平滑以及混合處理等多種光譜預處理方法的降噪效果,采用CARS和UVE算法以及MIP人工神經網絡進行特征波長選擇,初步建立了基于PLSR和MIP人工神經網絡的油莎豆含油率近紅外無損分析模型,以提高油莎豆育種工作中的檢測分析效率,為油莎豆品質無損檢測分析提供一定的理論參考。