周頎偉,宋燕如,張展碩,袁雷明,孫一葉
(溫州大學電氣與電子工程學院,浙江溫州 325035)
伴隨著城鎮化、工業化進程的快速發展,大量有毒有害物質隨之產生。對一些缺乏排污管理、清潔技術保障的地區,造成嚴重的環境、生態污染,其中重金屬污染是各類污染中最為嚴重的一種。重金屬污染不僅毒害水產生物,還通過食物鏈濃縮最終進入人體,引起中毒反應。為應對日益嚴峻的重金屬污染問題,早在2011 年3 月,我國就出臺了第一個“十二五”專項規劃《重金屬污染綜合防治“十二五”規劃》。溫州地處東南沿海,具有豐富的海洋資源,其中貝類泥蚶富含多種營養物質,口味鮮美,深受當地群眾喜愛。灘涂養殖、非選擇性濾食習性的泥蚶,相比其他水產品具有更強的重金屬富集能力,且具有隱蔽性、長期性、累積性等特性,這凸顯了貝類泥蚶在食品安全上的風險地位。因此,開展對貝類重金屬污染信息的檢測,可以評估貝類的品質安全性。
目前,重金屬的常規檢測方法,主要包括物理化學檢測法(原子光譜法、質譜法、電化學法)和生物檢測法(生物傳感器法、酶聯免疫吸附法)。這些方法檢測靈敏度高,檢測結果精確,但存在檢測成本高、操作過程復雜、耗時費力、有破損等問題。因此,當前迫切需要研發一種能夠適用于多種重金屬污染信息的貝類快速定性、低成本的檢測技術,提高貝類重金屬污染的監測能力。近紅外光譜(780~2526 nm)技術的出現,為解決此類問題帶來了契機。它具有靈敏度高、成本低、操作簡單等特點,對含氫官能團有著特異性的信號響應,能實現大批量樣本的快速檢測。對生物制品而言,由于多種含氫基團能產生光譜共軛響應,特別是O-H、N-H 等官能團二級倍頻、三級倍頻等信號疊加響應,使得一些結構相近或濃度低的生物組分光譜信息難以解析。鑒于此,一種基于溫控紅外光譜的檢測技術被提出,它是調控樣品溫度引起物質組分微觀結構變化,使分子振動能級躍遷所需光子頻率發生變化,導致光譜吸收信息差異化。孫巖等以溫度作為擾動因子,探究了溫度梯度變化下液體組分的微觀結構及紅外光譜信息的相應變化,提出“水光譜組學”的概念,并對模擬血清中的葡萄糖含量進行精確檢測。另外,為降低溫度影響,在酒精濃度、煙草植物堿、水果品質等檢測中引入溫度校正模型來開展應用,降低檢測誤差,增強了紅外光譜技術的精準分析能力。目前,溫控光譜技術還未在水產品重金屬污染的檢測中進行探究。
本工作利用蛋白酶解技術對重金屬污染的泥蚶進行全蛋白提取,調節溫度梯度變化分別來獲取近紅外光譜信息,借助模式識別來區分各種重金屬污染的泥蚶,旨在提供一種能夠快速鑒別重金屬污染泥蚶的光譜判別方法。
樣品泥蚶()試驗人工養殖;PbCl、CdCl、CuSO分析純,上海化學試劑有限公司;全蛋白試劑 Sigma 公司;玻璃水族箱 尺寸:60 cm×50 cm×40 cm;比色皿 量程2 mm;塑料密封袋 50 mm×70 mm。
ML204T/02 電子天平 德國梅特勒托利多公司;TGL-12GB-C 高速臺式離心機 上海安亭科學儀器廠;VS-35S 手持式勻漿器 無錫沃信儀器制造有限公司;Bruker Vertex 70 臺式光譜儀 德國布魯克公司;卡薩帝BCD-500WL 冰箱、DW-86L959BPT超低溫保存箱 海爾集團;M-Cube-T 溫控儀器 上海熒颯光學儀器有限公司;VX200-T 旋渦振蕩器美國MET 公司。
1.2.1 泥蚶脅迫養殖 參照貝類養殖技術標準(DB37/T 2069-2012)方法,由技術人員在同時養殖健康對照組和重金屬脅迫組的泥蚶。分別配置不同濃度的Pb(0.611~1.833 mg/L)、Cd(0.545~1.634 mg/L)、Cu(20~100 mg/L)重金屬溶液于消毒后的水族箱,控制溫度(20.8±2.6 ℃)、酸度(8.05±0.1)、鹽度(2.1%)、溶氧量(>6 mg/L)、水流(3 L/h)等參數模擬海洋環境養殖泥蚶,培養7~14 d,使其體內富集不同含量的重金屬。將同一水族箱內的養殖泥蚶,每5~7 個泥蚶作為一組,去殼取肉、袋包裝密封,作類別標記,于-18 ℃冰箱冷凍保存。收集的4 類樣本包括:Pb、Cd、Cu 單一重金屬污染樣本和健康樣本;每一類樣本集收集15 個密封袋,共60 個密封袋泥蚶樣本。
1.2.2 蛋白提取方法 從冰箱冷凍室取出密封袋,泥蚶肉質解凍后,經剪刀剪碎、小型手持式勻漿器進一步磨細。參考文獻[23]配比各試劑濃度,制作全蛋白試劑提取盒。電子天平準確稱取100 mg 樣品置于1.5 mL 的離心管中,每個密封袋制作4 個平行樣(用于擴展樣本),將全蛋白試劑0.1 mL 分別注入各離心管中,于振蕩器上搖晃10 min 至大部分顆粒溶解;8000 r/min 高速離心2 min 后,取上層清液于離心管,置于-80 ℃冰箱保藏,防止提取的蛋白結構被破壞。在本試驗操作過程中,所有樣品的用具及試劑均需要預冷至0 ℃使用。經樣品平行擴展后,每個類別有60 個小樣(即15×4),其中每個類別的前40個小樣作為訓練集,后20 個小樣作為預測集。
1.2.3 光譜采集 臺式光譜儀(波數范圍是4000~12000 cm,分辨率是2 cm)開機預熱10 min,設置溫控儀器的溫度25 ℃升溫至60 ℃,間隔為5 ℃,共計8 個溫度梯度。移液槍從離心管吸取0.2 mL樣品液于比色皿內(量程2 mm),插入溫控儀器的樣品池中,1 min 受熱穩定后,掃描其透射光譜信息;取出該比色皿振蕩2 s 后,再次測量其光譜。重復測量3 次后,該比色皿加蓋保存至冰箱-18 ℃,待下一個溫度梯度點再取出采集光譜信息。取3 次透射光譜的平均值作為樣本當前溫度的透射光譜。在每個溫度梯度點,采集完所有樣本的光譜信息后,再升溫至下一個溫度梯度點進行采集。
形成樣本×波數×溫度對應的三維光譜數據塊,溫度維度對應8 個梯度點;波數維度即近紅外光譜的變量個數;樣本維度共240 個,存在4 個類別,每個類別為60 個樣本,其中前40 個劃分到訓練集,后20 個劃分到預測集;于是,訓練集有160 個樣本,預測集有80 個樣本。
在常規的數據處理中,線性判別為常用的分類方法,但光譜變量多,存在共線性問題。本文以偏最小二乘-判別法(Partial Least Squares-Discriminant Analysis,PLS-DA)來壓縮光譜空間投影,對泥蚶樣本的污染信息進行線性判別區分。模型的分類評價指標主要為精準率(Precision)、敏感性(Sensitivity)、特異性(Specificity)。由于光譜變量數較多,后續擬通過變量篩選方法來選出對溫度敏感的光譜特征變量,本文以競爭自適應重加權算法(Competitive Adaptive Reweighting Sampling,CARS)、無信息變量剔除法(Uninformative Variable Elimination,UVE)、遺傳算法(Genetic Algorithm,GA),作為PLS-DA 分類器的前端變量篩選方法。所有數據于MATLAB(2018b,Mathwork Inc.)處理。
圖1 為25 ℃時各類泥蚶樣本的近紅外平均吸收光譜圖,光譜曲線平緩,無明顯的吸收脈沖峰,且變化趨勢一致;在短波段的近紅外區域8500~12000 cm之間光譜波峰強度差異變大;在長波近紅外光譜區域4000~7200 cm之間表現平緩,僅在6000 cm存在一個微小波峰,可能是由于近紅外光譜區域受到C-H、O-H 官能團的二級倍頻、三級倍頻重疊吸收效應的影響,由于比色皿內樣本含水率較高,致使透射信號衰減。因此,在應用中應盡可能地降低水分干擾,或是通過光譜軟件設置去除水吸收峰區域。本文是為避免脫水方式影響酶解蛋白的生物結構,采取軟件設置方式去除水分干擾。

圖1 四類泥蚶樣本25 ℃時的近紅外平均透射光譜Fig.1 The averaged transmittance of NIR at termperature of 25 ℃for four classes of Tegillarca granosa samples
圖2 為不同溫度下所有樣本的平均透射光譜。隨著溫度的升高,樣品內水分子之間形成簇狀體的范德華力變小,光譜的透射強度在6000 cm波峰處依次增加,但是在光譜區域8000~12000 cm范圍內,各溫度下的平均光譜強度增減幅度不一,特別是在波谷8500 cm處譜線趨勢發生變化、在波段9000~11000 cm范圍內交叉,說明在升溫過程中蛋白質的結構受熱發生變化,從而導致其吸收光學特性的變化。

圖2 不同溫度下的泥蚶樣本平均透射光譜Fig.2 The averaged transmitted spectra of Tegillarca granosa samples at different temperatures
所有泥蚶樣本類別分別設為標簽號1(健康組),2(鎘污染),3(銅污染),4(鉛污染)。將訓練集中同一溫度下樣本透射光譜作為輸入項,標簽號作為輸出項,訓練偏最小二乘-判別分析(PLS-DA)分類器,再以預測集來驗證所建分類器的可行性,得到準確率指標;并以此方法構建其他溫度下的PLS-DA 分類器,結果如圖3 所示。相同的樣品采集及處理方法,不同溫度下泥蚶類別分類準確率各不相同,波動較大,準確率從室溫25 ℃的51%逐漸提高到40 ℃時的最高準確率92%,此后溫度區間劇減至50%左右。由于溫控光譜是處于一個溫度升高的過程,據此推測:溫度在逐步升溫至40 ℃時,重金屬離子、酶解蛋白、水分子之間可能形成的絡合物結構發生變化,再結合圖2 的光譜強度變化,可知它們的光譜吸光頻率及強度發生了變化,而這些變化則有益于區分不同重金屬離子的絡合物。但是在40 ℃后繼續升溫,光譜識別率卻劇減至一個低的數值區間,表明此階段的溫度變化對重金屬絡合結構影響減小,是由于溫度過高導致原先的酶解蛋白變性、絡合物結構破壞,且這些絡合物結構變化不利于光譜識別;再結合圖2光譜區域(9000~12000 cm)的變化分析,在升溫的后半程(≥ 45 ℃),透射光譜的變化趨勢差異減小,其幅度正小于升溫的前半程。因此認為,在現有的數據分析下,40 ℃時泥蚶酶解蛋白提取液中絡合物空間結構最有益于光譜表征,是測量重金屬污染的最佳溫度。

圖3 PLS-DA 各溫度下的分類準確性Fig.3 Classification accuracy of PLS-DA at different temperatures
表1 列出了40 ℃時泥蚶樣本的預測分類結果。健康組泥蚶樣本預測集的分類準確性達到73%,受重金屬Cd、Pb 污染的脅迫泥蚶樣本的預測集準確性能達到100%,對加入重金屬Cu 脅迫樣本的預測集準確性達到94%,總體識別準確率為92%。從表中可知,對于健康泥蚶,有27%的樣本被誤判為重金屬污染;而對于被污染的樣本,基本都判別正確。

表1 40 ℃ PLS-DA 分類結果Table 1 Classsification results of 40 ℃ PLS-DA
經光譜儀器獲取的一維光譜共有2074 個波數點,數據量偏大,從圖1、圖2 可見,在區間4000~7200 cm之間表現平緩且光譜強度差異極小,不隨溫度變化,說明此區域受溫度影響可以忽略,此區域的光譜信息對于識別重金屬污染分析并不重要;另外,由于相鄰光譜變量間存在共線性問題,會降低模型的計算精度。因此,有必要對特定溫度下的光譜數據進行變量篩選。本文選用CARS、UVE、GA 三種方法進行變量篩選,以各類別的標簽號作為定量擬合目標,依據預測標簽值就近歸屬標簽類別。
以樣本被加熱恒溫至40 ℃時獲取的光譜數據,經均值化光譜預處理后,再以變量篩選方法降低數據維度。運行變量篩選程序時,參數設置參考文獻[7-8];對于UVE、GA 算法,則連續運行10 次降低隨機波動,取其中最好的一次運行結果予以記錄,用于后續分析。各模型的分類結果如表2 所示。經篩選后的變量,PLS 建模后得到的分類結果得到了不同程度的提高,且篩選的變量數量接近,均低于100 個波數點,是原數量的5%以內;其中CARS 處理后建模效果最好,達到了98%的準確率;而GA 處理后模型識別效果卻有所降低,這可能是GA 在處理光譜共線性問題有待進一步提供,且擬合目標值取整有關,篩選變量過少,未能達到光譜數據的優化目的。因此,認為CARS 與UVE 可適用于非常規溫度下的光譜數據變量篩選。

表2 40 ℃溫度下光譜變量篩選后建模分類結果Table 2 Modeling classification results by variable selection at temperature of 40 ℃
對于光譜技術識別泥蚶重金屬污染的問題,在文獻[25]中進行冷凍烘干、磨粉、壓片等預處理,以紅外光譜捕捉潛在的重金屬-蛋白絡合物,優化模型92%的分類準確率低于本工作最優的98%分類準確率。由于重金屬離子在泥蚶體內含量較低,在中紅外指紋圖譜中的信息極少。鑒于重金屬離子包含于壓片樣本,文獻[26-27]借助金屬直接測量方法:激光誘導擊穿光譜技術,捕獲重金屬的激發譜線,但是泥蚶有機樣本的基體效應影響,識別精度與中紅外光譜的識別率接近。而本文則通過蛋白酶解與離心,盡可能地富集重金屬離子,并以液體狀態檢測,并探尋最適溫度充分展開重金屬離子-蛋白絡合的空間結構,使得近紅外光譜能捕獲不同重金屬蛋白絡合物之間的差異。若進一步減少離心液中的水分,可嘗試具有指紋圖譜特性的中紅外光譜檢測。
本文以控溫近紅外光譜技術定性識別重金屬污染的泥蚶樣本,其肉質經過細磨、酶解、離心等預處理操作提取上清蛋白液,在近紅外光譜(7200~12000 cm)呈現出微小差異,以PLS-DA 方法對污染類別進行區分,在接近室溫25 ℃時分類準確率僅為51%;通過調節蛋白測試液的溫度,可改變重金屬離子、水分子、酶解蛋白之間的絡合結構,導致光譜吸光度差異化;在上清蛋白液恒溫至40 ℃時具有很好的光譜表征特性,PLS-DA 模型的識別率達到92%,經變量篩選后進一步提高到98%。另外,不同溫度之間光譜信息的聯動變化,可結合二維相關光譜解析技術進一步研究,尋找溫度敏感的特征區域。