董 歡,吳龍國,賀曉光,王松磊
(寧夏大學農學院,寧夏銀川 750021)
超氧化物歧化酶(Superoxide dismutase,SOD)又稱肝蛋白,含有金屬銅離子,是存在于生命體中的一種活性球蛋白物質。SOD可以消除生物體在新陳代謝過程中產生的有害物質,免受氧自由基的毒害作用,是生物細胞保護體系的一員[1-3]。生物體內SOD酶活力的大小能說明其健康程度,因此可以將酶活力作為肉類品質檢測和質量評價的參考指標。一般實驗室進行樣本的理化檢測時,前處理及實驗方法繁瑣,檢測時間長,試劑消耗量大,不能滿足批量肉類生產過程中在線快速檢測的要求。
顯微高光譜成像技術是將顯微成像與近紅外光譜的官能團化學分析相結合的一種新型技術,通過顯微成像系統與高光譜系統有機組合,實現微觀組織空間分布的可視化及定量分析,從而分析物質內部結構組分的變化。該技術是一種快速無損檢測新技術,可以對樣本進行批量、快速、準確的測量;無需化學試劑和復雜的樣品前處理,可直接對鮮活組織細胞進行掃描,大幅降低分析成本和檢測時間,直接提取酶相關的特征波段,為肉類SOD酶活力在線快速無損檢測技術的創新提供新途徑。
近幾年,國內外學者對植物SOD酶活力及顯微成像技術分別進行了大量的研究,但用顯微高光譜技術對肉類樣本中SOD酶活力的研究鮮有報道。劉婷婷等[4-5]分別對冬小麥和油菜葉片中SOD酶活力進行高光譜檢測,相關性均能達到0.8以上,說明基于高光譜模型的SOD生理活性的檢測是可行的。馬天蘭等[6-7]提取顯微高光譜圖像信息,分別采用菌落總數、揮發性鹽基氮對羊肉和豬肉新鮮度進行表征,其判別率均達到90%以上。石冬冬等[8]應用近紅外顯微成像技術結合化學計量學方法,對蛋鴨飼料中的蘇丹紅進行檢測,判斷飼料中是否非法添加蘇丹紅,準確率達89.2%。Matthew等[9]使用顯微高光譜成像系統對雞肉沙門氏菌進行檢測研究,實驗用100倍物鏡收集并提取450~800 nm之間的細胞光譜特征,得出細胞分類準確度81.8%~98.5%。Luisa等[10]用拉曼顯微光譜研究玻璃化溫度對體外成熟綿羊卵細胞皮質肌動蛋白誘導的變化,結論證明拉曼顯微鏡可作為研究玻璃化卵細胞變化的替代分析工具。Santos等[11]采用紅外顯微成像技術對牛奶中摻假物質進行定量檢測分析,估計牛奶摻假水平并定位其位置和濃度;Philippe等[12]使用紅外顯微光譜對小麥胚乳發育過程中細胞壁多糖的沉積進行分析檢測,并通過評估二階導數來進行光譜數據分析。Baranska等[13]使用顯微拉曼成像技術檢測類胡蘿卜素含量,并定位其在細胞內的分布。
本研究以灘羊肉肌細胞中的SOD酶活力為研究對象,結合顯微高光譜成像技術采集樣品380~980 nm的顯微光譜圖像。首先使用蒙特卡洛方法進行異常樣本的剔除,并使用共生距離法、隨機法和Kennard-Stone法進行校正集和預測集的劃分;然后對原始光譜進行預處理,優選最佳預處理方法;使用間隔隨機蛙跳算法、遺傳偏最小二乘算法、反向區間偏最小二乘法等六種方法進行特征波長提取;最后對比分析不同特征波長下的偏最小二乘回歸、主成分回歸以及多元線性回歸模型,優選最佳預測模型,為今后顯微高光譜成像技術在肉品微量成分檢測方面提供理論和技術參考。
灘羊 寧夏鹽池縣鑫海食品有限公司;A045-2蛋白定量測試盒(考馬斯亮藍法) 南京建成生物工程研究所;A001-1-1總超氧化物歧化酶測試盒(羥胺法) 南京建成生物工程研究所;生理鹽水 湖南科倫制藥有限公司;冰乙酸 分析純,北京鵬彩化學試劑有限公司。
Micro-Hyper Spec VNIR顯微高光譜成像系統(380~980 nm,分辨率3.5 nm,176個波段) 北京卓立漢光儀器有限公司;KD-2508冷凍切片機 浙江金華市科迪儀器設備有限公司;FA25 FLUKO間歇式高剪切組織勻漿機 上海弗魯克科技發展有限公司;Neofuge15R臺式高速冷凍離心機 上海力申科學儀器有限公司;753N紫外可見分光光度計 上海儀電分析儀器有限公司;HH-4電熱恒溫水浴鍋 上海比朗儀器有限公司;SQP電子天平 賽多利斯科學儀器(北京)有限公司。
1.2.1 肌細胞顯微樣本制備 樣本選取新鮮屠宰1 h內的30只健康灘羊的背部(外脊)、前腿和后腿三個部位,裝入密封袋中,置于低溫采樣箱中運輸至實驗室進行4 ℃保存。實驗前,將樣本放至室溫,除去脂肪和肌膜,修整切塊(20 mm×10 mm×10 mm),獲得223個樣本。將樣本放置冷凍切片機的冷凍平臺上,冷臺溫度設置-40 ℃,刀片溫度設置-30 ℃,切片厚度15 μm,制備顯微光譜樣本,標號以備光譜采集使用。
1.2.2 顯微高光譜圖像采集 采用Gaia Field-Pro-V10顯微高光譜成像系統及SpecView2.9. 2.10數據采集軟件,采集光譜圖像前需要進行黑白校正[14-18]及掃描參數的設定。經過多次預實驗調整,最終確定最佳掃描參數:掃描前進速度0.1 cm/s,回退速度}起點位置0.6 cm,掃描距離0.5 cm,曝光時間1.9 ms,增益1,黑白校正如公式(1)所示。
式(1)
式中:R:黑白校正后光譜圖像強度;R0:原始光譜圖像強度;D:黑校正圖像強度;W:白校正圖像強度。
1.2.3 超氧化物歧化酶活力的測定 稱取1.0000 g樣本,按樣本:生理鹽水1∶9 (g/mL)進行冰水浴,使用機械10000~15000 r/min上下研磨勻漿,勻漿后2500 r/min冷凍離心12 min,取上清液用生理鹽水按體積比1∶9的比例稀釋成1%組織上清液,待測。
使用蛋白定量測試盒對1%濃度的組織上清液中蛋白濃度進行測定,使用紫外分光光度儀在595 nm處讀取吸光度值,根據公式(2)計算待測樣本蛋白濃度;使用總超氧化物歧化酶測試盒對1%濃度的肉組織上清液中的SOD酶活力進行測定,使用紫外分光光度儀在550 nm處讀取吸光度值,根據公式(3)計算待測樣本SOD酶活力。
式(2)
式中,標準品濃度為0.563 g/L。

式(3)
1.3.1 樣本異常值剔除 實驗過程中,由于樣本、儀器以及人為等因素的影響,導致少量樣本的光譜信息和理化值存在差異,這些樣本被看作是異常樣本。使用蒙特卡洛采樣法計算223個樣本的均值與標準差的大小,分別取樣本均值和標準差值各自平均值的2.5倍作為閾值,將均值或標準差閾值以外的樣本判定為異常值[19]。
1.3.2 樣本集劃分 采用Kennard-Stone(KS)法、Sample Set Partitioning Based on Joint x-y Distance(SPXY)法以及Random sampling(RS)法按3∶1比例對剔除異常值后樣本進行劃分,并建立偏最小二乘回歸模型比較分析。
1.3.3 預處理方法選擇 由于圖像采集時儀器噪音和暗電流等因素的影響,以及提取的光譜信息中其他無用信息的干擾,因此需要對原始光譜進行預處理,以此增強光譜信號,提取有用信息[20-22]。本文使用卷積平滑(Savitzky-Golay,SG)、歸一化法(Normalize)、基線校準(Baseline)、標準正態變量變換(SNV)、去趨勢化(Detrend)、多元散射校正(MSC)6種方法進行預處理,并建立偏最小二乘回歸模型進行分析比較。
1.3.4 特征波長提取 為了后期建模過程的快速、方便進行,減少波段個數,降低光譜維數,減小數據冗余,有利于實現快速檢測[23-25]。利用MATLAB軟件,使用間隔隨機蛙跳算法(Interval Random Frog,IRF)、遺傳偏最小二乘算法(Genetic Algorithms PLS,GA)、反向區間偏最小二乘法(Backw ard interval PLS,BiPLS)、競爭性自適應重加權法(Competitive Adaptive Reweighted Sampling,CARS)對剔除異常值后使用MSC預處理的樣本進行特征光譜的提取。數據選擇時,根據所選波段的交互驗證均方根誤差(RMSECV)最小決定特征波長,RMSECV越小說明模型穩定性越好,預測結果的能力越強。
1.3.5 預測模型的建立 使用The Unscrambler X 10.4分析軟件對提取特征波長后的光譜反射率進行建模。分別建立基于肌細胞中SOD酶活力定量分析的偏最小二乘回歸(Partial Least Squares Regression,PLSR)、主成分回歸(Principal component regression,PCR)、多元線性回歸(Multiple Linear Regression,MLR)預測模型。
采用ENVI4.8軟件進行顯微圖像感興趣區域(Region of Interest,ROI)的提取,每個樣本圖像選取10個ROI進行提取,計算其平均反射光譜,將其作為該樣本的反射光譜。實驗提取的肌細胞原始顯微高光譜圖如圖1所示。

圖1 顯微樣本原始光譜曲線Fig.1 The original spectral curves of the microscopic sample
結果如圖2所示。模型中的46、164、165、120、73、43、190、30、44、215、176號11個樣本明顯位于臨界線之外。剔除上述異常值前后建立的偏最小二乘回歸模型效果見表1。由表1可以看出,所得模型的交互驗證均方根誤差及校正模型的均方根誤差(RMSEC)均小于原始樣本模型,同時模型的校正集相關系數Rc為0.8115大于原始樣本模型,說明剔除這些樣本后,模型相關性變大,穩定性增強。因此剔除11個異常樣本,剩余212個后續處理。

表1 異常樣本剔除前后SOD酶活力的PLSR模型Table 1 PLSR model of SOD enzyme activity before and after abnormal sample rejection

圖2 肌細胞中SOD含量樣本分布圖Fig.2 Distribution of SOD content in muscle cells
由表2可以得出,在三種劃分方法中,僅RS法的預測集相關系數Rp大于0.8,高于其它兩種方法。除此之外,還可以利用Rc與Rp之和來說明模型總體精確度[26-27],數值之和越大說明精確度越高。RS法之和為1.6262,KS法為1.6035,SPXY法為1.6082,并且RS法建立的模型中,RMSE值均較小。綜合分析各個參數,最終選擇RS法劃分灘羊肉中SOD酶活力樣本集。

表2 不同樣本劃分方法對SOD酶活力的PLSR模型結果統計Table 2 Results of different sample partition methods on PLSR model of SOD activity
由表3數據可以得出,使用RS法對樣本中SOD酶活力值進行劃分也是可行的。不同部位樣本中SOD酶活力分布范圍廣,并且預測集的酶活力值包含在校正集的酶活力值范圍之內。校正集和預測集的標準偏差也比較理想,由此可以說明所選的樣本數據集的劃分具有代表性,是有實驗意義的。同時樣本數據量較大,也滿足了建模的要求,可以對此數據進行建模分析。

表3 樣本SOD酶活力統計表Table 3 Statistics on SOD activity
從表4得出,使用MSC預處理后建立的PLSR模型具有較好的模型參數,和剔除異常值后的原始數據相比,Rc和Rp值均有所提高,RMSEC和RMSEP均減小。綜合各項參數,最終選定MSC為處理樣本的預處理方法。圖3為經過MSC預處理后的樣本光譜圖像。

表4 不同預處理方法對SOD酶活力的PLSR模型結果統計Table 4 Results of the PLSR model of different pretreatment methods for SOD activity

圖3 MSC預處理后的樣本光譜圖Fig.3 Spectral image of sample after MSC pretreatment
由表5可知,6種特征波長提取方法中,CARS提取的特征波長共20個,占總波長的11.4%;GA提取21個,占11.9%;BiPLS提取94個,占53.4%;IRF提取出59個,占33.5%。由于BiPLS和IRF提取的特征波長較多,因此將二者與CARS聯合使用,方法的疊加使用,可以在保證相關性的基礎上減少光譜的維數。BiPLS-CARS提取的特征波長數最少,共有11個,占總波長的6.3%;IRF-CARS提取的特征波長有23個,占總波長的13.1%。6種方法所選波長分布均勻,各個波段均有挑選,降低了光譜的維數,方便后期建立模型。

表5 特征波長選取統計表Table 5 Characteristic wavelength selection statistics
2.5.1 偏最小二乘回歸模型 由表6得出,BiPLS-PLSR和BiPLS-CARS-PLSR模型的參數指標較為接近,但后者的波長數只有11個,遠遠低于BiPLS-PLSR模型,因此說明利用BIPLD-CARS提取特征波長的方法是可行的,IRF-PLSR和IRF-CARS-PLSR模型的情況同上。GA挑選出的波長建立的模型具有較高的Rc、Rcv值,較低的RMSEC和RMSECV值,校正模型優于其他三種模型;從預測能力上看,GA-PLSR擁有最高的Rp值和較低的RMSEP值,說明該模型預測能力較好較穩定。綜合各個參數,對于PLSR的6種模型,GA挑選出來的波長所建立的是最優模型。

表6 不同特征波長的肌細胞中SOD酶活力定量分析 PLSR模型Table 6 PLSR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.2 主成分回歸模型 從表7得出,同時,BiPLS-PCR與BiPLS-CARS-PCR模型相比,后者雖然只有11個波長,但參數性能較低,穩定性不高,預測能力不及BiPLS-PCR,不能作為替代模型,說明在BiPLS-CARS聯合使用時,貢獻率較大的波長被忽略,挑選出來的波長不足以代表所有信息。IRF-PCR和IRF-CARS-PCR模型的性能指標接近,后者只有23個波長,因此IRF-CARS-PCR模型可以作為替代模型。在6種模型中,GA-PCR的R值均較大,RMSE值最低,說明模型校正能力強,穩定性優于其他模型,預測也較為準確。因此GA-PCR是最優模型。

表7 不同特征波長的肌細胞中SOD酶活力定量分析 PCR模型Table 7 PCR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.3 多元線性回歸模型 由表8得出,BiPLS-CARS-MLR模型的相關性系數R均大于0.8,且均方根誤差較小。說明該模型與BiPLS-MLR相比,穩定性更好,預測能力也較強,波長數也只有11個,大大降低了模型的維數。IRF-CARS-MLR模型的波長數只有23個,是IRF-MLR模型波長數的一半,但是模型參數整體不如IRF-MLR,穩定性較低。CARS-MLR模型的R值均大于0.8,RMSE值較低,是6種模型中建模效果最佳的。因此綜合比較,選用CARS-MLR模型為最優模型。

表8 不同特征波長的肌細胞中SOD酶活力定量分析 MLR模型Table 8 MLR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.4 全波段與最優特征波長模型比較 由表9得出,GA法的PLSR模型和PCR模型相比,二者特征波長數相同,但前者模型性能參數較好,擁有較高的R值和較低的RMSE值;CARS模型的R值為四種模型中最高,RMSE值最小,說明模型的校正能力和預測能力均為最好;綜合各個參數,和全波段所建立的PLSR模型相比,CARS-MLR模型的各個參數均有所提高,說明其模型代表全波段建模是具有可行性的。CARS-MLR模型的結果見圖5。

表9 全波段與特征波長模型結果比較Table 9 Comparison of the results of full band and characteristic band models

圖4 CARS-MLR建模結果Fig.4 CARS-MLR modeling results注:a:CARS-MLR光譜校正模型; b:CARS-MLR光譜預測模型。
針對可見顯微高光譜檢測靈敏度高,放大倍數大,定位準確等優勢,結合化學計量學方法,對灘羊肉肌細胞中超氧化物歧化酶活力進行檢測并建立相關模型。選擇380~980 nm波段采集223個顯微樣本圖像,對原始數據進行異常值剔除及樣本的劃分,剔除11個異常值,采用RS(3∶1)法進行樣本劃分;預處理后選定MSC為最優方法;應用GA、IRF、BiPLS等6種方法提取特征波長;建立并分析全波段和基于特征波長的PLSR、PCR、MLR預測模型。對比多種預測模型,得出CARS-MLR最優,GA-PLSR、全波段的PLSR次之,GA-PCR最低。結果表明,利用CARS提取特征波長建立的MLR模型代表全波段建模具有可行性,這為顯微高光譜成像技術在灘羊肉肌細胞內超氧化物歧化酶活力的快速檢測提供借鑒。