朱向榮 李高陽 蘇東林 劉 偉 單 楊(1.中南大學研究生院隆平分院,湖南 長沙 410125;2.湖南省食品測試分析中心,湖南 長沙 410125)
鎘(cadmium,Cd)是一種毒性大,遷移性強的重金屬元素,Cd在土壤中有較高活性[1],Cd污染是土壤和食品中重金屬污染關注的首要問題之一。水稻被認為是鎘吸收最強的大宗谷類作物[2],很容易吸收土壤中的鎘。水稻鎘污染不僅導致水稻產量下降,更為嚴重的是鎘元素在水稻植株內大量累積,并通過食物鏈進入人體,對人類健康帶來嚴重危害[3]。中國GB 2762—2012《食品中污染物限量》規定稻米中鎘的最高限量為0.2mg/kg,因此,對稻米中鎘含量進行質量控制,保障稻米食用安全,采用靈敏、準確的分析方法檢測稻米鎘含量尤為重要。目前,國內外研究者[4]常采用電感耦合等離子體原子發射光譜與石墨爐原子吸收光譜法等儀器分析方法測定農產品中Cd含量。上述方法雖然準確性好,專屬性強、靈敏度高,但也存在著樣品消化時間長、強酸試劑消耗量大、環境危害較大、儀器操作復雜等缺點。
近紅外光譜法(near-infrared spectroscopy,NIRS)是目前發展較為迅速的分子光譜快速檢測技術,具有快速、無損、綠色、環境友好等優點。NIRS在稻米中淀粉、蛋白質、氨基酸、脂肪、礦質元素、水分、脂肪酸值等營養指標的含量檢測等領域均有應用。從原理上講,無機元素在近紅外光譜區并沒有吸收,但是有機物質通過螯合或絡合的方式與無機元素形成螯合物或絡合物,而這些物質在近紅外光譜區有相應的響應與吸收[5]。稻米的主要有機成分為淀粉和蛋白質,其含量分別約為80%和8%。鎘元素與淀粉及蛋白質中的C—H、N—H與O—H等基團結合,而使得采用近紅外光譜檢測鎘成為可能。近年來,國外學者采用NIRS結合化學計量學方法對動物樣 品[6,7]、植物樣品[8-11]以及 水樣[12,13]中重金屬元素定性、定量分析,Kumagai等[14]采用NIRS對鎘污染稻米進行定性研究,但尚未見到采用NIRS對稻米鎘進行定量研究的報道。本研究擬通過NIRS與組合間隔偏最小二乘法(synergy interval partial least squares,siPLS)組合,建立稻米鎘含量是否超標的NIRS定量模型,并對光譜預處理方法與光譜變量篩選進行系統的考察,以達到預期的效果。
石墨爐原子吸收光譜儀:AA-6800型,日本島津公司;
傅里葉變換近紅外光譜儀:Nicolet AntarisⅡ型,美國Thermo公司;
硝酸、高氯酸:優級純,國藥集團化學試劑有限公司。
1.2.1 樣品收集 在湖南省長沙市周邊收集了72個稻米樣品(40個樣品采自湘陰縣浩河口鎮,10個樣品采自長沙縣大同橋鎮,12個樣品采自長沙縣江背鎮,10個樣品采自長沙縣干杉鎮)。樣品經烘干(85℃,2h)、去殼、粉碎、過60目篩4個步驟。
1.2.2 鎘含量的測定 按 GB/T 5009.15—2003《食品中鎘的測定》執行。
1.2.3 NIRS方法 利用積分球漫反射檢測系統完成樣品近紅外光譜的采集,NIRS掃描波數范圍4 000~10 000cm-1。NIRS方法經優化后,樣品光譜采集的工作流(workflow)確定為:分辨率8cm-1,掃描次數32次,增益為2,以內置背景為參考。每個樣品重復3次掃描,取其平均光譜,以消除樣品不均勻性帶來的干擾。
1.2.4 組合間隔偏最小二乘法 偏最小二乘回歸法(partial least squares regression,PLSR)是多元校正中經典的定量建模方法之一。在建模的過程中,為了不丟失光譜信息,PLSR常采用全光譜(full spectrum)數據進行建模,但是全光譜中無信息變量(uninformative variables)過多,將會導致模型過擬合,預測結果變差。因此,需采用變量篩選方法提取特征變量,提高NIRS模型的精度。間隔偏最小二乘法[15](interval partial least square,iPLS)是將全光譜分為n個等寬子區間,然后對每個子區間進行局部建模,得到誤差最小,相關系數最大的子區間。組合間隔偏最小二乘法(siPLS)是iPLS的一個擴展,該方法的主要原理是以交叉驗證均方根誤差為指標,對全光譜不同子區間(比如2、3以及4個區間)進行任意組合,采用多元回歸方法建立定量模型,最終得到最優的光譜變量區間組合以及相應的模型[16]。
1.2.5 模型評價 采用模型相關系數(R)、交叉驗證均方根(RMSECV)與預測集驗證均方根(RMSEP)進行評價,分別按式(1)~(3)計算:

式中:
ci——試驗值,mg/kg;
n——校正集樣本數;
m——預測集樣本數。
1.2.6 統計分析 利用MATLAB軟件進行。
采用NIRS數據進行建模,選擇有代表性的校正集樣品進入到校正模型的數據庫,不但可以降低過擬合風險、提高模型的預測精度,還可以減少建模的工作量。本研究共收集72個稻米樣本,采用基于馬氏距離的Kennard-Stone(KS)法[17]依次從整個樣本集(samples set)挑選54個樣品作為校正集(calibration set),18個樣品作為預測集(prediction set)。
圖1為代表性樣品在4 000~10 000cm-1的NIRS圖,主要吸收峰光譜解析為[18]:8 423.5cm-1附近的吸收峰為C—H鍵振動的二級倍頻,6 907cm-1附近的吸收峰為O—H鍵伸縮振動的一級倍頻,6 480cm-1附近的吸收峰為N—H鍵伸縮振動的一級倍頻,5 720cm-1與5 900cm-1兩處吸收峰對應的是C—H鍵的一級倍頻,5 200cm-1附近的吸收峰為O—H鍵振動組合頻,4 830cm-1附近的吸收峰為N—H鍵伸縮振動與彎曲振動的組合頻,4 390cm-1附近的吸收峰為C—H振動的組合頻。

圖1 稻米樣品代表性的近紅外光譜圖Figure 1 NIR spectrum of rice sample
采集的NIRS中,光譜的背景噪聲、物理因素導致的光散射與量綱不一致等將對建模的準確性產生重要影響[19]。因此,需要對光譜進行預處理,以減少上述影響。在全光譜范圍內,以RMSECV值及Rc(訓練集相關系數)進行評價指標,考察了Savitzky-Golay(SG)平滑、中心化(meaning)、自歸一化(autoscaling)及多元散射校正(multiple scattering correction,MSC)等5種數據預處理方法對稻米樣品的NIR光譜模型的影響。最終確定了平滑、中心化以及多元散射校正作為光譜預處理最優方法。
本研究采集的近紅外原始光譜包含1 557個變量,在多元變量校正時包含著不相關或冗余信息,利用全光譜建立校正模型存在著過擬合風險。因此,采用特征變量選擇方法對全光譜變量進行篩選,能減少模型的變量數,降低模型的復雜性,提高模型的預測性能。本試驗分析了siPLS特征變量提取方法,并與全光譜建模結果進行比較。SiPLS法具體步驟:將全光譜劃分為60個區間,每個區間26個變量,然后對不同區間進行組合,得到RMSECV值最小的子區間組合。本試驗考察了siPLS法不同子區間個數的組合對模型的影響,確定3個區間組合次數時,RMSECV值最低,Rc值最大。
圖2為訓練集建模時前10個主因子數與所對應的RMSECV值的相關圖。由圖2可知,當主因子數為9時,RMSECV值最小。

圖2 主因子數與RMSECV的相關圖Figure 2 The correlation diagram of PLS components and RMSECV
表1列出了前10個區間組合所對應的波數位置、主因子數以及RMSECV值,由表1可知,組合區間為[21 30 38]時,對應的主因子數為9,此時RMSECV值最小,為0.247。
采用siPLS法得到的最優區間組合為[21 30 38],21,30與38三區間在全光譜對應的波數位置見圖3,分別為6 005.2~6 101.6,6 907.8~7 004.2與7 710.0~7 806.4cm-1。具體NIRS解析為[18]:6 005.2~6 101.6cm-1為C—H伸縮振動的一級倍頻,6 907.8~7 004.2cm-1為蛋白質N—H反對稱伸縮振動一級倍頻以及淀粉O—H伸縮振動的一級倍頻。7 710.0~7 806.4cm-1為C—H伸縮振動的一級倍頻伸縮振動的第二組合頻。

表1 RMSECV最低的前10個組合區間及其對應的主因子數Table 1 The top 10intervals corresponding to PLS component and RMSECV using siPLS

圖3 采用siPLS算法選擇波段在全譜中的位置Figure 3 Spectral subintervals were selected by siPLS algorithm
采用siPLS法選擇NIRS特征吸收波數,建立稻米鎘PLS定量模型并進行預測,訓練集中54個樣品ICP—MS測定的試驗值與NIRS預測值的相關圖見圖4。由圖4可知,樣本號為8#、30#與31#的樣品預測相對較差。此時,模型校正集 RMSECV為0.247,訓練集相關系數(Rc)為0.919。
圖5為預測集中18個樣品ICP—MS測定的試驗值與NIRS預測值的相關圖。預測集RMSECV為0.261,預測集相關系數(Rp)為0.895。

圖4 訓練集中試驗值與預測值的相關圖Figure 4 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=54)

圖5 預測集中試驗值與預測值的相關圖Figure 5 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=18)
為了評價siPLS法在稻米鎘定量建模變量選擇中的重要性,本研究采用2.3節相同的光譜預處理手段,建立了全光譜的PLS模型。由表2可知,采用全光譜建立的PLS模型的預測結果比siPLS法都要差,這說明采用siPLS法對原始光譜進行特征波長選擇,主要成分信息得到最大保留,冗余信息得到部分去除,預測能力得到提高。

表2 siPLS法與PLS建模結果比較Table 2 Comparison of the results of siPLS and PLS
本研究采用近紅外光譜與組合間隔偏最小二乘法相結合,初步實現了鎘污染稻米中鎘含量的定量檢測。結果表明,采用siPLS法選擇特征變量再進行建模,所得結果優于全譜建模結果。本研究將進一步擴大樣品量,提高模型的穩健性與準確性。本研究結果可為近紅外光譜技術在稻米鎘快速識別上提供初步依據。
1 Chaney R L,Reeves P G,Ryan J A,et al.Improved understanding of hyperaccumulation yields commercial phytoextraction and phytomining technologies[J].Biometals,2004,17(5):549~553.
2 Lindén A,Olsson I M,Bensryd I,et al.Monitoring of cadmium in the chain from soil via crops and feed to pig blood and kidney[J].Ecotoxicology and Environmental Safety,2003,55(2):213~222.
3 Chen Gui-ping,Mei Yuan,Tao Wei,et al.Micro near infrared spectroscopy(MicroNIRS)based on on-line enrichment:determination of trace copper in water using glycidyl methacrylatebased monolithic material[J].Analytica Chimica Acta,2011,670(1~2):39~43.
4 Akamatsu S,Yoshioka N,Mitsuhashi T.Sensitive determination of cadmium in brown rice and spinach by flame atomic absorption spectrometry with solid-phase extraction[J].Food Additives &Contaminants:Part A,2012,29(11):1 696~1 700.
5 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using aportable near-infrared spectrometer[J].Analytical Science,2003,19(11):1 553~1 555.
6 González-Martín I,González-Pérez C,Hernández-Méndez J,et al.Mineral analysis(Fe,Zn,Ca,Na,K)of fresh Iberian pork loin by near infrared reflectance spectrometry:Determination of Fe,Na and K with a remote fibre-optic reflectance probe[J].Analytica Chimica Acta,2002,468(2):293~301.
7 Font R,Del Río-Celestino M,Vélez D,et al.Visible and nearinfrared spectroscopy as a technique for screening the inorganic arsenic content in the red crayfish(procambarus clarkii Girard)[J].Analytical Chemstry,2004,76(14):3 893~3 898.
8 Font R,Del Río-Celestino M,Vélez D,et al.Use of near-infrared spectroscopy for determining the total arsenic content in prostrate amaranth[J].Science of the Total Environment,2004,327(1~3):93~104.
9 Font R,Vélez D,Del Río-Celestino M,et al.Screening inorganic arsenic in rice by visible and near-infrared spectroscopy[J].Microchimica Acta,2005,151(3~4):231~239.
10 張龍,潘家榮,朱誠.基于近紅外光譜的重金屬汞、鎘和鉛污染水稻葉片鑒別[J].浙江大學學報(農業與生命科學版),2013,39(1):50~55.
11 劉燕德,施宇.香根草葉片鉛含量近紅外光譜快速檢測[J].農業機械學報,2014,45(3):232~236.
12 Ning Yu,Li Ji-hui,Cai Wen-sheng,et al.Simultaneous determination of heavy metal ions in water using near-infrared spectroscopy with preconcentration by nano-hydroxyapatite[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2012(96):289~294.
13 Huang Zi-xia,Tao Wei,Fang Juan-juan,et al.Multivariate calibration of on-line enrichment near-infrared (NIR)spectra and determination of trace lead in water[J].Chemometrics and Intelligent Laboratory Systems,2009,98(2):195~200.
14 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using a portable near-infrared spectrometer[J].Analytical Sciences,2003,19(11):1 553~1 555.
15 Norgaard L,Saudland A,Wagner J,et al.Interval partial least squares regression (iPLS):a comparative chemometric study with an example from near-infrared spectroscopy[J].Applied Spectroscopy,2000,54(3):413~419.
16 丁姣,蔡建榮,張海東,等.近紅外結合Si-ELM檢測食醋品質指標[J].食品與機械,2012,28(1):93~96.
17 Kennard R W,Stone L A.Computer aided design of experiments[J].Technometrics,1969(11):137~148.
18 陸婉珍.現代近紅外光譜分析技術[M].第二版.北京:中國石化出版社,2006.
19 張菊華,朱向榮,蘇東林,等.茶油品質鑒別的透射和透反射模式分析比較[J].食品與機械,2012,28(1):101~104.