郝 欣 邱 燁 陳 晏 孔維恒 劉 鑫* 忻 欣 徐記各
(1.中國海關科學技術研究中心,北京 100026;2.北京工業設計促進中心,北京100088;3.西派特(北京)科技有限公司,北京100029)
鱈魚屬脊椎動物門、脊椎動物亞門、真骨魚綱、鱈形目。純正鱈魚主要指大西洋鱈魚。近年來,為了滿足我國國內消費需求,鱈魚產品進口量增長迅速,貿易規模不斷擴大。目前,隨著水產品進口數量逐漸增加,水產分類易混淆不清而出現利用廉價的油魚冒充鱈魚等現象。如何在口岸快速無損鑒定進口魚類物種分類成為了海關各口岸亟待解決的問題。
近紅外檢測技術在農產品領域通常用于食品成分分析等方面[1]。其中,拉曼光譜技術是近年來應用較廣泛的一種分子光譜分析技術。其利用拉曼散射效應反映分子轉動和振動性質。現階段,拉曼光譜因其信息豐富,可從分子水平上反映物質組成和結構信息,同時又便攜、高效等特點已應用于考古、毒品檢測、化工生產、化學品檢測平臺、材料學、醫藥學和環境等領域[2-9]。相關研究表明,拉曼光譜技術可應用于魚類物種鑒別。其中,Alamprese等[10]通過NIR法分別兩對魚類品種:鯔魚和紅鰹、鰈和偏口魚進行了分類鑒別。Sivertsen等[11]通過NIR-VIS聯用法區別冷凍鱈魚片的新鮮度。本實驗利用采集魚肉蛋白與脂肪組織的拉曼光譜數據,通過波長標定法進行采集數據降噪處理,結合多元散射校正和均值中心化方法對光譜數據進行前處理,采用簇類獨立軟模式法建立大西洋鱈魚、銀鱈魚、黑線鱈魚、龍利魚、巴沙魚和狹鱈魚6種魚類的動物種屬鑒別分析模型。
本實驗選用的6種不同進口魚類樣品來源于中國海關科學技術研究中心。6種魚類樣品的種屬鑒定確證實驗已完成,此鑒定由廣西中醫藥大學完成。
ExR810廣域拉曼光譜儀。
實驗選取的6種魚類樣品光譜數據的采集數量、校正集及驗證集數據如表1所示。

表1 6種魚類樣品分類信息
每個魚肉樣品采取凈魚肉部分作為采集位置,每個樣品采集1個位置點,每個位置點采集1個數據。
依據實驗設計,將魚肉樣品置于樣品臺上,設定積分時間10 s,每個樣品的平均采集次數為6 次,設備功率等級設定為10 級,拉曼光譜的掃描范圍設定為167~3745 cm-1。
本實驗采用多元散射校正法(MSC)和均值中心化法對6種魚類樣品的光譜數據進行預處理,利用MSC法和求導是校正基線漂移現象的有效處理辦法[12]。中心化是從變量中減去它的均值,均值中心化法是從樣品光譜數據中去掉校正集的平均光譜數據,從而得到符合正態分布的有力數據[13]。本實驗的數據處理程序采用MATLAB(R2017b)軟件編寫。如圖1所示,6種魚肉樣品中銀鱈魚的拉曼信號最強,其次為黑線鱈魚,這兩種魚的強信號來自于魚肉中的脂肪成分,判斷此兩種魚可能為高脂肪魚;其他4種魚肉的拉曼信號較弱,這些弱信號來自于魚肉中的蛋白質成分,判斷此4種魚可能為高蛋白魚。

圖1 6種魚肉樣品的拉曼光譜圖
本實驗利用簇類獨立軟模式分類法(Soft Independent Modeling Class Analog,SIMCA)先驗分類知識,對每一種類別的魚類樣品建立一個主成分分析(principle component analysis,PCA)模型,再利用這些建立的模型判斷未選入建模集的魚類樣本進行歸屬[14]。本實驗光譜數據定性識別準確率按公式(1)計算。
(1)
本實驗先對樣品進行主成分分解,建立已知類別的SIMCA主成分分析模型,建模樣品類別與樣品的對應關系見表2。

表2 樣品名稱及類別號對應關系表
圖2~圖7為建立的6種魚類樣品的SIMCA主成分分析模型,模型以Q與T22個參數衡量樣本與PCA模型的擬合程度。Q為樣本與PCA模型中主成分投影之間的殘差,用于評價樣本與模型擬合程度的好壞。而T2用于描述樣本在PCA模型內部的遠離程度[15]。再將未知樣本與各類SIMCA主成分分析模型進行擬合,綜合Q與T2的值判斷未知樣本屬于哪一類。

圖2 巴沙魚(0號)與其他魚類之間的區分

圖3 大西洋鱈(1號)與其他魚類之間的區分

圖4 黑線鱈(2號)與其他魚類之間的區分

圖5 龍利魚(3號)與其他魚類之間的區分

圖6 狹鱈魚(4號)與其他魚類之間的區分

圖7 銀鱈魚(5號)與其他魚類之間的區分
本實驗利用SIMCA定性分析首先從6種魚類樣品430個樣本中選擇297個建立訓練集。將光譜數據進行前處理后,選出適當的主因子數以便防止光譜中的有效信息過度擬合,從而利用SIMCA法分別建立6種不同魚類樣品的主成分定性分析模型數據庫。其中,巴沙魚、大西洋鱈魚、黑線鱈魚、龍利魚、狹鱈魚和銀鱈魚6種進口魚類樣品的主因子數分別選取6、6、5、5、3、6。
由圖2~圖7可見,6個魚類樣品之間可顯著區分。由此可見,利用拉曼光譜法和有效的數據處理方法能較高效的提取出不同種屬進口魚類樣品的脂肪、蛋白質組成以及其肉質結構等方面的光譜數據內容,完成鑒別進口魚類樣品的種屬分類。
6種魚類樣品數據通過SIMCA模型分析后,內部驗證數據見表3,外部驗證數據見表4,其中外部樣品選擇經鑒定的非建模用魚類樣本,可視為盲樣。
對巴沙魚、大西洋鱈魚.等6類魚進行63個樣品的內部驗證(如表3所示),正確率均為100%。

表3 內部樣品驗證正確率
如表4所示,對巴沙魚、大西洋鱈魚.等6類魚進行70個樣品的樣品外部驗證正確率亦為100%,表明本實驗建立起來的SIMCA主成分定性識別模型對6種不同進口魚類樣品的種屬具備良好的鑒別能力。

表4 外部樣品驗證正確率
本實驗利用拉曼光譜技術結合簇類獨立軟模式方法建立快速鑒別進口鱈魚真偽檢測方法。采集數據處理結合多元散射校正和波長標定降噪技術,建立起6種魚的SIMCA主成分定性分類模型,并對70個不同種類的魚類樣品種屬進行盲樣定性鑒別,識別正確率達100%。單個樣品檢測可實現在瞬時內完成實驗檢測,操作簡便,無破壞性。因此,采用拉曼光譜技術和可行的光譜數據處理法并利用SIMCA方法建立主成分分析模型,可快速鑒別進口鱈魚樣品真偽情況,從而解決在口岸快速無損鑒定進口魚類物種分類的問題。