拱健婷 鄒慧琴 王佳宇 吳浩忠 王大仟 李佳慧 劉長利 李莉



[摘要] 目的 建立不同產地當歸的氣味指紋圖譜,挖掘其氣味的差異性并據此建立判別模型,并建立一種快速、準確、可靠的鑒別不同產地當歸藥材的方法。 方法 采用電子鼻對不同產地當歸樣品進行氣味分析,提取傳感器信號的最大值、平均值、最大斜率和積分值作為特征參數,分別利用主成分分析法和支持向量機對特征參數進行數據分析并建立判別模型,并考察組合特征對不同產地當歸的鑒別效果。 結果 主成分分析無法有效區別當歸產地。支持向量機能夠實現當歸產地的快速準確鑒別,當采用單一特征作為特征參數時鑒別效果一般,在測試集上的平均正判率為86.03%;當采用組合特征作為特征參數時效果較好,兩特征組合、三特征組合平均正判率分別為86.76%、89.71%,四特征組合正判率最高,為91.18%。 結論 電子鼻技術可以準確鑒別不同產地當歸樣品,為中藥材產地快速鑒別提供新技術和新方法,不同模式識別算法和特征參數的篩選與優化為電子鼻的數據挖掘在中醫藥研究中的應用提供更多思路。
[關鍵詞] 電子鼻;當歸;產地;主成分分析;支持向量機;特征組合
[中圖分類號] R282.5 ? ? ? ? ?[文獻標識碼] A ? ? ? ? ?[文章編號] 1673-7210(2019)10(a)-0039-05
Rapid identification research on Angelica sinensis from different producing areas based on electronic nose technology
GONG Jianting1,2 ? ZOU Huiqin3 ? WANG Jiayu4 ? WU Haozhong3 ? WANG Daqian1,2 ? LI Jiahui3 ? LIU Changli5 ? LI Li1,2
1.Beijing Institute of Chinese Medicine,Beijing ? 100035, China; 2.Beijing Chinese Medicine Hospital, Capital Medical University, Beijing ? 100010, China; 3.School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing ? 102488, China; 4.Changchun Medical College, Jilin Province, Changchun ? 130031, China; 5.School of Traditional Chinese Medicine, Capital Medical University, Beijing ? 100069, China
[Abstract] Objective To establish a fast, accurate and reliable method for identification of Angelica sinensis of different origin, based on the odor fingerprint of Angelica sinensis of different origin, and the discrimination model was established based on the difference odor. Methods Odor analysis of Angelica sinensis samples from different habitats was carried out by electronic nose. The maximum, average, maximum slope and integral values of sensor signals were extracted as characteristic parameters. Principal component analysis and support vector machine were used to analyze the characteristic parameters. The discriminant model was established. And examine the identification effect of combination characteristics on Angelica sinensis from different habitats. Results Principal component analysis could not distinguish the origin of Angelica sinensis. Support vector machine could quickly and accurately identify the habitat of Angelica sinensis. When a single feature was used as a feature parameter, the identification effect was general, and the average positive detection rate on the test set was 86.03%. When combined features were adopted as the feature parameters, the effect was better. The average positive detection rate of the combination of two features and three features was 86.76% and 89.71% respectively, and the positive detection rate of the combination of four features was the highest, which was 91.18%. Conclusion Electronic nose technology can accurately identify Angelica sinensis samples from different regions, providing new technologies and methods for rapid identification of the origin of traditional Chinese medicine. The selection and optimization of different pattern recognition algorithms and characteristic parameters provide more ideas for the application of electronic nose data mining in traditional Chinese medicine research.
[Key words] Electronic nose; Angelica sinensis; Habitats; Principal component analysis; Support vector machine;Feature combination
當歸來源于傘形科植物Angelica sinensis(Oliv.)Diels.的干燥根[1],始載于《神農本草經》[2],為中醫藥臨床常用大宗中藥材。當歸主產于甘肅,目前云南、四川、湖北、青海、陜西、湖南、貴州等地亦有栽培[2-3]。道地性是當歸質量評價的重要內容之一,可從源頭保證臨床療效,而產地作為中藥道地性的重要影響因素之一,隨著地理區域的改變,光照、環境溫度、降水量、土壤條件等生態因子會影響藥材質量[4]。目前藥材產地區分主要依靠傳統性狀鑒別[5]和指紋圖譜技術[6]、分子鑒定技術[7],前者主觀性和經驗性較強,不利于推廣應用,其余兩種技術存在操作復雜、成本較高等局限性。因此,探尋準確而快速鑒別不同產地當歸的新方法十分必要。
電子鼻是一種智能仿生儀器,基于特定的氣敏傳感器陣列能夠分析、識別和檢測復雜氣味并全面地反映整體氣味特征[8]。與傳統檢測方法相比,電子鼻具有檢測速度快、操作簡單、靈敏度高等優點,在食品、工業、農業、環境監測、醫藥等領域極具開發潛力[9]。近年來電子鼻也逐漸應用到中藥產地區分中,借助電子鼻技術成功鑒別出喜馬拉雅紫茉莉[10]、黃連[11]、砂仁[12]、枳殼[13]的產地。此外,嚴輝等[14]發現我國不同產地當歸藥材揮發油含量為0.28%~0.55%,王洮惠等[15]研究表明甘肅渭源、岷縣、四川3個產地當歸揮發油含量和組成存在顯著差異,運用電子鼻技術區分當歸產地具有可行性。本研究分別選取當歸氣味響應曲線中的最大值、平均值、最大斜率、積分值作為特征參數,應用主成分分析和支持向量機建立判別模型,優選不同特征參數和分類器的最優組合,并考察組合特征對當歸產地的鑒別效果,實現當歸產地的快速、準確鑒別,為電子鼻技術應用于中藥研究領域提供參考。
1 材料與方法
1.1 材料
2017年10~12月,收集產自甘肅岷縣的3批當歸樣品和青海西寧、四川北川、湖北神農架、云南曲靖當歸樣品各1批,經北京市衛生局臨床藥學研究所李莉研究員鑒定為傘形科植物Angelica sinensis(Oliv.)Diels.的干燥根。
1.2 實驗儀器
研究選用法國Alpha M.O.S. α-FOX3000電子鼻測定當歸氣味,儀器主要由HS-100自動進樣系統、氣體傳感器陣列以及模式識別系統組成,其12根金屬氧化物氣敏傳感器。見表1。
1.3 試驗方法
當歸粉碎過2號篩,精密稱取0.3 g置于10 mL頂空進樣瓶,放入電子鼻自動進樣器樣品盤中。電子鼻孵化溫度設定為35℃,攪拌速度250 r/min,孵化時間360 s,進樣體積1500 μL,注射溫度45℃,數據采集時間120 s,采集周期1 s,延滯時間600 s。各批次樣品平行采集氣味16次。
1.4 統計學方法
以12根傳感器的最大響應值、平均值、最大斜率、積分值建立當歸產地鑒別模型,數據采用SPSS 21.0和Python 2.7軟件進行分析。
2 結果與分析
2.1 不同產地當歸氣味雷達圖分析
采用電子鼻對5個產地當歸進行分析,不同產地當歸揮發性氣味的電子鼻傳感器響應雷達圖輪廓存在一定差別,最大斜率作為當歸特征參數時甘肅產當歸與其他樣品差距較大(圖1)。但從整體來看各產地樣品在氣味組成上比較一致,無法使用雷達圖直觀區分不同產地當歸,需用統計學方法對其進行處理。
2.2 主成分分析
主成分分析是電子鼻構建判別模型時常用的統計方法,能消除數據中相互重疊的信息,實現用少數關鍵變量表征原變量的數據特征[16-18]。分別利用12根傳感器的最大值、平均值、最大斜率、積分值作為特征參數進行主成分分析。以最大值作為當歸的特征參數時,主成分分析區分效果較好(圖2a);四川產當歸均可以區分開,但其余4個產地樣品有重疊;平均值作為當歸的特征參數主成分分析區分效果最差(圖2b);甘肅和四川產當歸可以區分開,但云南、湖北、青海樣品有部分重疊,最大斜率、積分值作為當歸特征參數主成分分析區分效果次之(圖2c~d)。在分類過程中主成分分析側重于提取樣本的描述特征,所以使用主成分分析直接處理當歸產地的判別問題效果不理想。圖2是當歸取不同特征參數的主成分分析圖,第1主成分和第2主成分累積方差百分比均大于90%,即前兩個主成分可以表征原始數據特征。
2.3 支持向量機
支持向量機是Vapnik和Corinna Cortes于1995年首先提出的[19],基于“結構風險最小化”原理,擁有堅實的理論基礎和良好的泛化能力,在解決小樣本、非線性和高維模式識別方面具有許多特有的優勢[11,20]。對每個產地分別隨機抽取70%樣本構成訓練集,30%構成測試集以評估所建支持向量機判別模型的性能,采用網格搜索方法尋找支持向量機最優參數,最終確定參數為:核函數為徑向基核函數,核函數系數為0.4,懲罰項系數C為100,最大迭代次數為500次,訓練停止誤差為1e-5。
支持向量機判別模型經訓練樣本訓練之后,對測試樣本進行預測,4種特征參數的訓練集正判率均高于90%,從大到小依次為:最大值>平均值、積分值>最大斜率;最大值作為特征參數時的測試集正判率最高(表2)。綜合來看,用平均值、最大斜率、積分值表征電子鼻測試信號時其鑒別能力基本相同,而用最大值表征時鑒別能力效果較好。
2.4 多特征融合的支持向量機判別模型
電子鼻中氣敏傳感器的響應是樣品多種成分的綜合反映,單一特征既不能全面有效地表征電子鼻對檢測樣品的響應信息,也不能準確體現樣品的差異性,降低了電子鼻檢測結果的準確率[21]。在用各自單一類型特征結合支持向量機判別分析鑒別不同產地當歸的基礎上,保持訓練集和測試集不變,嘗試將特征組合以構建電子鼻響應信息的表征模式提升鑒別效果。為了排除隨機性影響,分別求取單特征、組合特征的平均預測準確率。結果顯示:四特征組合>三特征組合>兩特征組合>單特征,提示特征組合的效果優于單特征,特征組合支持向量機鑒別正確率總體上也有較為明顯的提高。此外,三特征組合測試集正判率為89.71%,效果相對于單特征和兩特征組合正判率分別提升3.68%和2.95%。因此,在用電子鼻鑒別產地時可以考慮采用三特征組合或四特征組合建模。
3 討論
在不同產地的當歸區分研究中發現,傳統的線性模式識別方法主成分分析對云南曲靖、湖北神農架、青海西寧3個產地區分效果不佳,采用更先進的模式識別算法支持向量機進行建模分析提高電子鼻的識別能力,測試集識別準確率均大于86%優于主成分分析。由此來看,電子鼻技術聯合模式識別算法可以鑒別當歸產地,為中藥材產地快速、客觀、綠色的鑒別提供新技術和新方法。
信號的準確表征或提取有用信號是實現電子鼻準確檢測的重要一環,研究為探索有效表征不同產地當歸氣味信息的特征參數,提取了4種不同特征參數對不同產地當歸進行主成分分析及支持向量機判別,以最大響應值作為特征參數時的區分效果較好,平均值作為特征參數主成分分析區分效果最差,最大斜率作為特征參數支持向量機判別效果最差,可見不同的特征參數適合不同的模型。
此外,對比了單一特征、組合特征表征電子鼻響應信息時的鑒別效果,結果顯示,組合特征的鑒別效果優于單特征值,四特征組合的鑒別效果更佳,用多特征融合模式可更有效地表征電子鼻對當歸產地的響應信息,有利于提高當歸產地的鑒別正確率,為電子鼻信號表征提供了一種新思路。
[參考文獻]
[1] ?國家藥典委員會.中華人民共和國藥典[S].一部.北京:中國醫藥科技出版社,2015:133.
[2] ?張瑛,王亞麗,潘新波.當歸歷史資源分布本草考證[J].中藥材,2016,39(8):1908-1910.
[3] ?南海軍,滕希峰,王峰.不同產地當歸藥材中藁本內酯含量調查分析[J].食品與藥品,2015,17(6):393-395.
[4] ?廖保生,宋經元,謝彩香,等.道地藥材產地溯源研究[J].中國中藥雜志,2014,39(20):3881-3888.
[5] ?陳有智,羅文蓉.侯嘉.不同產地當歸的鑒定學研究[J].西部中醫藥,2012,25(5):25-30.
[6] ?胡傳芹,徐嘉良.不同產地當歸指紋圖譜及聚類分析[J].中國食品學報,2017,17(12):272-278.
[7] ?朱田田,晉玲,張裴斯,等.基于ISSR的甘肅不同產區栽培當歸遺傳多樣性研究[J].中草藥,2015,46(23):3549-3557.
[8] ?Gardner JW,PN Bartlett. Electronic Noses:Principles and Applications [D]. New York:Oxford University Press,1999.
[9] ?鄒慧琴,劉勇,閆永紅,等.電子鼻技術及應用研究進展[J].傳感器世界,2011,17(11):6-11.
[10] ?林輝,趙婷,鄒慧琴,等.基于電子鼻技術的不同產地栽培及野生喜馬拉雅紫茉莉的鑒別研究[J].中華中醫藥雜志,2014,29(6):1834-1837.
[11] ?陶夢琳,顧文濤,汪子青,等.基于支持向量機的黃連飲片產地識別研究[J].中草藥,2015,46(21):3173-3178.
[12] ?劉夢楚,鄒曉紅,藍倫禮,等.基于電子鼻及頂空-氣質聯用技術結合化學計量學區分不同產地的砂仁[J].中國實驗方劑學雜志,2017,23(6):35-42.
[13] ?周華英,李鐘,駱德漢.基于仿生嗅覺技術的不同產地枳殼鑒別研究[J].中草藥,2017,48(19):4068-4072.
[14] ?嚴輝,段金廒,錢大瑋,等.我國不同產地當歸藥材質量的分析與評價[J].中草藥,2009,40(12):1988-1992.
[15] ?王洮惠,程自銀.不同產地當歸揮發油的成分研究[J].藥物生物技術,2013,20(6):535-537.
[16] ?Eriksson L,Johansson E,Kettaneh-Wold N,et al. Multi- and megavariate data analysis part 1:Basic principles and applications [J]. Umea,Sweden:Umetrics AB,2006.
[17] ?Costache GN,Coloran P. Combining pca-based datasets without retraining of the basis vector set [J]. Pattern Recognition Letters,2009,30(16):1441-1447.
[18] ?徐銳,張雪絨,郭巧生,等.9個產地夏枯草主要化學成分的比較分析[J].成都醫學院學報,2017,12(5):551-554,566.
[19] ?Cortes C,Vapnik V. Support-vector networks,Proc. of the 25th Machine Leaning,1995,20:273-297.
[20] ?吳莎,劉啟安,李云,等.最小二乘支持向量機和偏最小二乘法在梔子中間體純化工藝近紅外定量分析中的應用[J].中草藥,2015,46(7):990-997.
[21] ?殷勇,郝銀鳳,于慧春.基于多特征融合的電子鼻鑒別玉米霉變程度[J].農業工程學報,2016,32(12):254-260.
(收稿日期:2019-03-27 ?本文編輯:劉永巧)