朱毅寧 楊平 楊新艷 李嘉銘 郝中騏 李秋實 郭連波 李祥友 曾曉雁 陸永楓
摘要為提高激光誘導擊穿光譜技術(Laserinduced breakdown spectroscopy, LIBS)對鮮肉品種的識別率, 采用支持向量機結合主成分分析算法輔助LIBS技術對鮮肉品種進行識別。對鮮肉切片用載玻片壓平, 采用LIBS技術對鮮肉組織(豬肉、牛肉和雞肉)表面進行光譜數據的采集, 每種鮮肉采集150幅光譜并進行隨機排列, 取前75幅光譜作為訓練集建立模型, 后75幅作為測試集測試建模結果。研究選取K、Ca、Na、Mg、Al、H、O等元素的49條歸一化譜線數據進行主成分分析, 并用所得數據建立支持向量機分類模型。結果表明, 通過主成分分析降維, 輸入變量從49個優化減少到18個, 模型建模速度從88.91 s降至55.52 s, 提高了支持向量機的建模效率; 并使預測集的平均識別率提高到89.11%。本研究為激光誘導擊穿光譜技術在鮮肉品種快速分類領域提供了方法和數據參考。
關鍵詞激光誘導擊穿光譜; 支持向量機; 主成分分析; 組織分類
1引 言
肉類品種多樣、價格不一, 一些不良商家以次充好, 不斷出現“豬肉充當牛肉”、“鼠肉充當羊肉”、“摻假牛羊肉”、“僵尸肉”等嚴重危害消費者利益和食品安全的事件。因此, 肉類品種的快速分類分析有著重要的現實意義。傳統的肉類檢測技術有聚合酶鏈反應技術(Polymerase chain reaction)[1]、氣相層析質譜分析技術(Gas chromatography mass spectrometer)[2]、芯片毛細管凝膠電泳(Capillary gel electrophoresis)[3]等。雖然上述方法檢測準確度高, 但需要專業人員對樣品進行DNA或蛋白質的萃取, 操作過程復雜耗時[4], 不能滿足快速檢測的需求, 因此亟需開發一種快速肉類品種區分的檢測技術。
激光誘導擊穿光譜(Laserinduced breakdown spectroscopy, LIBS)是一種原子發射光譜分析技術[5], 已廣泛用于固、液、氣等物質的檢測[6~13], 并逐漸進入工業生產檢測領域[14], 尤其以微損、非接觸、快速分析的特點在生物組織檢測方面受到越來越多的關注[15~18]。近年來, 將LIBS技術與化學計量學方法相結合識別生物組織已成為研究熱點[19]。Kumar等[20]使用LIBS技術對狗肝正常組織和惡性腫瘤組織進行光譜區分, 實驗表明, 組織中不同元素譜線強度比值差異可以有效區分正常組織和腫瘤組織。Yueh等[21]使用層析聚類分析(Hierarchical cluster analysis, HCA)、主成分分析(Principal components analysis, PCA)、偏最小二乘判別分析(Partial least square discriminant analysis, PLSDA)和BP神經網絡(Back propagation artificial neural networks, BPANN)4種算法對冰凍雞肉組織的不同部位(大腦、肝、肺、脾臟、腎臟、肌肉)進行LIBS實驗分析, HCA對44個樣品驗證,僅有3個沒有正確識別, 其它算法(如PLSDA、BPANN)由于訓練集建模樣品數據太少及訓練集與驗證集采集時間不一致, 不能有效地建立訓練模型, 造成對驗證集的識別率差。Bilge等[22]采用LIBS技術結合PCA算法對烘干壓片處理的肉類組織(豬、牛、雞)進行種類區分, 識別率為83.37%。除此之外, 還對相互摻雜的肉制品進行了PLS定量分析的研究。上述研究表明, LIBS對肉類組織的識別率有待提高, 且樣品的制作方法如冰凍、壓片法, 制樣耗時、復雜, 需要改善。
相對于以上所使用的分類算法, 支持向量機[23](Support vector machines, SVM)具有在小樣本建模、訓練速度、預測穩定等方面的優勢, 被廣泛用于LIBS分類研究中。 Yu等[24]利用LIBS結合SVM對11種塑料的識別率達到了100%, 但SVM常會受輸入變量過多和噪聲的影響, 使得建模效率和穩定性降低。鑒于PCA具有降維、除噪[25]的優勢, 目前已有研究者將PCA引入SVM算法, 提高SVM的建模效率和穩定度, 并成功應用于土壤[26]、巖石[27]、柑橘葉[28]和蛋白質[29]等LIBS的分類研究中, 識別率分別達到100%, 91.33%, 97.5%和98%。然而, 將SVM與PCA結合用于LIBS鮮肉品種分類方面的研究鮮有報道。
本研究采用載玻片壓制鮮肉樣品的簡單處理方法, 使用SVM輔助LIBS技術對豬肉、牛肉、雞肉等6種不同品種的鮮肉進行快速、準確地分類識別, 并利用PCA算法優化SVM建模效率, 以期提高建模的速度和識別準確率, 從而證實了PCASVM方法對于識別鮮肉品種有較好的效果。
2實驗部分
2.1實驗裝置
實驗裝置如圖1所示, 采用調Q開關Nd∶YAG脈沖激光器(Quantel Brilliant B, 波長532 nm, 脈沖寬度8 ns, 最大重復頻率10 Hz)。激光經過反射鏡和平凸透鏡(焦距為100 mm)聚焦到樣品表面, 激發出等離子光譜。
2.2樣品處理
本實驗所采用的鮮肉樣品為: 恩施土豬里脊肉(簡稱為恩施土豬)、黑豬里脊肉(簡稱黑豬)、中糧豬特級里脊肉(中糧集團有限公司, COFCO, 簡稱中糧豬)、牛里脊、牛后腿和雞脯肉, 實驗材料均購自當地超市。鮮肉組織制樣的具體步驟為: (1)用醫用切片刀將鮮肉組織切成長寬約為50 mm×18 mm、厚2~3 mm的小片, 放在普通載玻片(25.4 mm×76.2 mm)上; (2)用另一塊載玻片壓在肉片上, 并用10 kg重物將其壓制1 min, 使得肉片平鋪在下面的載玻片上, 壓片效果如圖2所示。(3)利用LIBS系統對制作好的樣品進行光譜采集。
3結果與討論
3.1數據采集與提取
采用優化的實驗參數, 能量30 mJ/脈沖, 頻率5 Hz。光譜儀積累模式的采集參數: 曝光時間1 s, 積累次數為2, 采集延時時間為0.9 μs, 門寬為10 μs, 每幅光譜積累10個激光脈沖。每種鮮肉壓制5個樣品, 每樣品采集30幅光譜, 因此6種鮮肉組織樣品共獲得900幅光譜數據。
為降低光譜強度的波動性的影響, 以生物組織基體元素C 247.86 nm光譜強度對其它元素譜線強度進行歸一化處理。圖3所示為牛里脊LIBS光譜強度歸一化后的全譜圖, 部分分析譜線位置也在全譜中予以標出。實驗中所使用的49條譜線也在表1中列出。不同組織間部分主量元素歸一化譜線強度的差異如表2所示。
由表2可知, 價格較低的中糧豬, 其歸一化譜線Ca/C、Na/C、K/C、Al/C強度明顯低于價格高的恩施土豬和黑豬; 而兩種不同價格的牛肉其譜線Ca/C、Na/C、K/C、Al/C強度則高于恩施土豬和黑豬。這表明不同種鮮肉組織元素含量存在較大差異, 這為鮮肉樣品的分類奠定了基礎。
3.2主成分分析
主成分分析算法(PCA)是一種高效的信息壓縮方法, 采用特征分解方法獲得最大方差的主成分(PC)來代替原有變量, 可以消除原始數據的相關性和信息冗雜[31], 通過優化主成分個數代替原有變量個數進行數學建模, 提高建模速度和穩定度, 并使用得到的主要主成分對數據進行聚類分析。分析所用的PCA算法和SVM算法程序均在Matlab R2010b環境下實現。
獲得的900幅組織光譜經譜線強度提取、C線歸一化處理后, 對其進行PCA降維分析。圖4為前3個主成分下不同種組織光譜的散點圖, 所使用3個主成分的累計貢獻率達到了95.79%。由圖4可知, 除了部分牛里脊光譜數據在三維主成分圖中可聚集到同一區域, 其它種類的鮮肉組織光譜交互在一起, 難以區分, 因此需結合其它算法進一步區分。
3.3SVM與PCASVM對比分析
支持向量機(SVM)是一種通過尋求結構化風險最小來提高學習機泛化能力的方法, 實現經驗風險和置信范圍最小化, 從而達到在取樣少亦能達到良好統計規律的目的。其很重要的特點是可以將線性不可分的數據通過構造核函數的方式映射到高維空間中, 從而在高維空間得到線性區分[20]。本研究采用Chang等[32]開發的支持向量機軟件工具箱(Library for Support Vector Machines, LIBSVM)進行數據分類處理。數據集等分為訓練集和測試集。每個類別設置標簽進行區分, 相同類使用相同的標簽。因為內核選擇的是映射徑向基函數, 需要選擇合適的懲罰參數C和徑向基函數系數g才能獲得較佳的預測結果。設置的方式和優化選擇參數的方法詳見文獻[33], 不同的是本研究使用的是3折交互驗證。
為使SVM分類模型更加穩健, 將每種鮮肉樣品的150幅光譜數據隨機排列, 選擇前75幅光譜進行訓練, 剩余的75幅光譜進行預測。在訓練過程中使用交叉驗證法選擇最佳的懲罰參數C和內核參數g。結果表明, 單獨的SVM模型平均訓練、
在SVM算法中, 輸入變量越多, 訓練時間越長; 且難免存在變量共線性和光譜噪聲的影響。因此采用PCA算法對原始變量進行線性組合對數據進行壓縮, 去除多余的變量, 減弱光譜噪聲影響。通過使用PCA算法對49個光譜變量重新組合得到新的49個主成分, 不同主成分變量數對SVM訓練集識別結果的影響如圖5所示, 主成分數分別在18, 19, 21, 28, 29, 30, 33時均可達到最佳的平均訓練識別率88.22%。在同樣的訓練識別率下, 取最小數目的主成分個數可以加快SVM算法的建模效率, 因此本研究采用18個主成分進行建模和分類識別, 其平均預測識別率可達到89.11%, 高于未降維SVM的識別效果, 此時的(C, g)優化參數為(1024.00, 0.0030), 對比文獻[22]中對豬肉、牛肉和雞肉識別率, 提高了5.74%, 具體的識別結果如表3所示。SVM與PCASVM建模結果對比見表4, 在不降低SVM算法識別率的情況下, PCA算法的引入大大縮短了SVM建模的時間, 使得建模時間從89.11 s降至55.52 s。
4結 論
通過對6種鮮肉進行簡單的載破片壓制處理, 聯合PCA和SVM算法對LIBS采集的光譜數據進行分析和建模, 提高了SVM的建模效率, 獲得較好的識別效果, 其中建模時間縮短至55.52 s, 平均預測識別率達到89.11%。以上結果表明, LIBS結合PCA與SVM算法可以用于快速檢測新鮮肉類品種, 為市場鮮肉的快速識別提供一種新途徑。
References
1Rodríguez M A, García T, González I, Hernández P E, Martín R. Meat Sci., 2005, 70(1): 113-120
2Hites R A. Handbook of Instrumental Techniques For Analytical Chemistry, 1997: 609-626
3VallejoCordoba B, CotaRivas M. J. Capillary Electrophor., 1997, 5(56): 171-175
4Kumar A, Kumar R R, Sharma B D, Gokulakrishnan P, Mendiratta S K, Sharma D. Crit. Rev. Food Sci., 2015, 55(10): 1340-1351
5Radziemski L J. Spectrochim. Acta, 2002, 57(7): 1109-1113
6Radziemski L, Cremers D. Spectrochim. Part B, 2013, 87: 3-10
7CHEN QiMeng, DU Min, HAO ZhongQi, ZOU XiaoHeng, LI JiaMing, YI RongXing, LI XiangYou, LU YongFeng, ZENG XiaoYan. Spectroscopy and Spectral Analysis, 2016, 36(5): 1473-1477
陳啟蒙, 杜 敏, 郝中騏, 鄒孝恒, 李嘉銘, 易榮興, 李祥友, 陸永楓, 曾曉雁. 光譜學與光譜分析, 2016, 36(5): 1473-1477
8Li C M, Zou Z M, Yang X Y, Hao Z Q, Guo L B, Li X Y, Lu Y F, Zeng X Y. J. Anal. Atom. Spectrom., 2014, 29(8): 1432-1437
9LI JiaMing, CHU YingBo, ZHAO Nan, ZHOU Ran, YI RongXing, GUO LianBo, LI JinYan, LI XiangYou, ZENG XiaoYan, LU YongFeng. Chinese J. Anal. Chem., 2016, 44(7): 1042-1046
李嘉銘, 褚應波, 趙 楠, 周 冉, 易榮興, 郭連波, 李進延, 李祥友,曾曉雁, 陸永楓. 分析化學, 2016, 44(7): 1042-1046
10SHAO Yan, ZHANG YanBo, GAO Xun, DU Chuang,LIN JingQuan. Spectroscopy and Spectral Analysis, 2013, 33(10): 2593-2598
邵 妍, 張艷波, 高 勛, 杜 闖, 林景全. 光譜學與光譜分析, 2013, 33(10): 2593-2598
11LIU Li. Las. Optoelect. Prog., 2015, 52(7): 295-299
劉 莉. 激光與光電子學進展, 2015, 52(7): 295-299
12Zeng Q, Guo L, Li X, He C, Shen M, Li K, Duan J, Zeng X, Lu Y. J. Anal. Atom. Spectrom., 2015, 30(2): 403-409
13Hao Z, Guo L, Li C, Shen M, Zou X, Li X, Lu Y, Zeng X. J. Anal. Atom. Spectrom., 2014, 29(12): 2309-2314
14Sun L X, Yu H B, Cong Z B, Xin Y, Li Y, Qi L F. Spectrochim. Acta B, 2015, 112: 40-48
15Rehse S, Salimnia H, Miziolek A. J. Med. Eng. Technol., 2012, 36(2): 77-89
16CHEN TianBing, LIU MuHua, HUANG Lin, ZHOU HuaMao, WANG CaiHong, YANG Hui, HU HuiQin, YAO MingYin. Chinese J. Anal. Chem., 2016, 44(7): 1029-1034
陳添兵, 劉木華, 黃 林, 周華茂, 王彩虹, 楊 暉, 胡慧琴, 姚明印. 分析化學, 2016, 44(7): 1029-1034
17Liu X Y, Zhang W J. J. Med. Biol. Eng., 2008, 1(3): 147
18Yao M, Huang L, Zheng J, Fan S, Liu M. Opt. Laser. Technol., 2013, 52: 70-74
19Singh V K, Rai A K. Laser Med. Sci., 2011, 26(5): 673-687
20Kumar A, Yueh F Y, Singh J P, Burgess S. Appl. Optics, 2004, 43(28): 5399-5403
21Yueh F Y, Zheng H, Singh J P, Burgess S. Spectrochim. Acta B, 2009, 64(10): 1059-1067
22Bilge G, Velioglu H M, Sezer B, Eseller K E, Boyaci I H. Meat Sci., 2016, 119: 118-122
23Cortes C, Vapnik V. Mach. Learn., 1995, 20(3): 273-297
24Yu Y, Guo L, Hao Z, Li X, Shen M, Zeng Q, Li K, Zeng X, Lu Y, Ren Z. Opt. Express, 2014, 22(4): 3895-3901
25Shi Q, Niu G, Lin Q, Xu T, Li F, Duan Y. J. Anal. Atom. Spectrom., 2015, 30(12): 2384-2393
26Yu K Q, Zhao Y R, Liu F, He Y. Sci. Rep., 2015, 6: 27574-27574
27Yang H X, Fu H B, Wang D H, Jia J W, Dong F Z. Chinese Phys. B, 2016, 25(6): 290-295
28Sankaran S, Ehsani R, Morganc K T. Appl. Spectrosc., 2015, 69(8): 913-919
29Pokrajac D, Lazarevic A, Kecman V, Marcano A, Markushin Y, Vance T, Reljin N, McDaniel S, Melikechi N. Appl. Spectrosc., 2014, 68(9): 1067-1075
30Pearse R W B, Gaydon A G, Pearse R W B, Gaydon A G. The Identification Of Molecular Spectra (Chapman and Hall London), 1976, Vol. 297
31YIN Fei, FENG DaZheng. Comput. Technol. Dev., 2008, 18(10): 31-33
尹 飛, 馮大政. 計算機技術與發展, 2008, 18(10): 31-33
32Chang C C, Lin C J. Acm. T. Intel. Syst. Tec., 2011, 2(3): 27
33YU Yang, HAO ZhongQi, LI ChangMao, GUO LianBo, LI KuoHu, ZENG QinDong, LI XiangYou, REN Zhao, ZENG XiaoYan. Acta. Phys. Sin, 2013, 62(21): 215201-215201
于 洋, 郝中騏, 李常茂, 郭連波, 李闊湖, 曾慶棟, 李祥友, 任 昭, 曾曉雁. 物理學報, 2013, 62(21): 215201-215201
AbstractTo improve the classification accuracy of fresh meat species using laserinduced breakdown spectroscopy (LIBS), the support vector machine (SVM) and principal component analysis (PCA) were combined to classify fresh meat species (including pork, beef, and chicken). A simple sample preparation to flatten fresh meat by glass slides was proposed. For each meat sample, 150 spectra were recorded and randomly arranged. The first 75 spectra were used to train a model while the others were used for model validation. By analyzing the 49 normalized spectral lines (K, Ca, Na, Mg, Al, H, O, etc.) in the different tissues, the classification model was built. The results showed that the dimensionality of input variables was decreased from 49 to 10 and modeling time was reduced from 89.11 s to 55.52 s using PCA, thus improving the modeling efficiency. The mean classification accuracy of 89.11% was achieved. The method and reference data are provided for further study of fresh meat classification by laserinduced breakdown spectroscopy technique.
KeywordsLaserinduced breakdown spectroscopy; Support vector machine; Principal component analysis; Tissue classification