裴藝菲,左智天,趙艷麗,張慶芝,王元忠*
(1.云南中醫學院 中藥學院,云南 昆明 650500;2.云南省農業科學院 藥用植物研究所,云南 昆明 650200)
重樓為百合科植物云南重樓ParispolyphyllaSmith var.yunnanensis(Franch.) Hand-Mazz.或七葉一枝花ParispolyphyllaSmith var.chinensis(Franch.) Hara的干燥根莖,苦,微寒,有小毒,歸肝經,具有清熱解毒、消腫止痛、涼肝定驚等功效;外用于疔瘡癰腫、咽喉腫痛、蛇蟲咬傷、跌撲傷痛及驚風抽搐[1]。植物化學研究發現,重樓的主要化學成分為甾體皂苷類,此外,還含有多糖、黃酮、氨基酸等[2]。重樓具有抗腫瘤、抑菌、止血、免疫調節、抗氧化、肝臟保護、抑制血管生成等作用[3],被廣泛應用于中成藥,如云南白藥系列、宮血寧膠囊、清熱止咳顆粒、復方蛇膽川貝散、復方重樓酊等。
調查發現,云南省中藥材市場重樓藥材質量參差不齊,價格差異較大。前人研究發現不同生長環境會形成膠質和粉質重樓,兩種質地重樓活性成分與藥理作用存在較大差異,從而影響重樓藥材及其中成藥質量,進而影響臨床療效[4]。目前,對于重樓化學成分的定性定量分析,主要采用高效液相色譜(High performance liquid chromatography,HPLC)、超高效液相色譜(Ultra high performance liquid chromatography,UHPLC)、紅外光譜(Infrared spectra,IR)、紫外光譜(Ultraviolet,UV)、質譜(Mass spectrometry,MS)等單一或多種技術聯用的方法[5-9]。Yang等[10]利用UHPLC-UV-MS和UV結合多元統計分析對3個不同地區的云南重樓進行區分,定量分析結果表明云南南部地區重樓中的總皂苷含量(19.9 mg·g-1)高于中部地區(8.79 mg·g-1),進一步鑒別分析發現,UV比UHPLC更適于區別3個區域樣品,200~300 nm被認為是區分不同區域云南重樓的重要波長范圍。
UV可快速準確地測定化合物含量[11]。傅立葉變換紅外光譜(Fourier transform infrared spectroscopy,FTIR)因具有簡便無損的特點,已被應用于食品及中藥材摻假鑒定、優劣鑒定、產地溯源、化學成分分析等方面[12]。衰減全反射傅立葉變換紅外光譜(Attenuated total reflectance Fourier transform infrared spectroscopy,ATR-FTIR)通過配備石英、鍺、硒化鋅等晶體材料ATR附件,簡化了樣品處理過程,提高了FTIR采樣成功率,作為一種快速無損的分析技術廣泛用于中草藥和食品化學成分研究領域[12-13]。Cebi等[14]將ATR-FTIR技術與化學計量學相結合檢測中藥減肥茶中的西布曲明,方法穩定可靠。Nikzad-Langerodi等[15]利用ATR-FTIR技術結合生物活性數據建立了不同金銀花乙醇提取物抗炎特性的正交偏最小二乘判別模型,成功預測了提取物抑制炎癥反應的能力。FTIR及ATR-FTIR一般采用400~4 000 cm-1波數范圍,UV采用190~380 nm波長范圍。由于不同技術提供互補信息可得到比單一技術更好的結果,使得數據融合策略逐步應用于中藥基原鑒定等方面[16]。Yang等[17]將UV與FTIR(KBr壓片法測量)兩種光譜數據與化學計量學進行串聯融合,建立了偏最小二乘判別分析(Partial least squares discriminant analysis,PLS-DA)與支持向量機(Support vector machine,SVM)判別模型,對采自云南的重樓樣品進行產地鑒別,經篩選變量得到的中級融合分類效果較好;其正確率均達到80%以上,但并未獲得最佳鑒別效果。
為比較ATR-FTIR與FTIR的采集信息差異及模型分類效果,本研究擬使用ATR附件及KBr壓片技術分別測定重樓FTIR信息。采集云南省昆明市、怒江州、文山州、西雙版納傣族自治州及貴州省安順市、興義市6個產地重樓根莖的FTIR、ATR-FTIR、UV,建立單一光譜、低級數據融合(FTIR-UV及ATR-FTIR-UV)PLS-DA與SVM判別模型,旨在對FTIR與ATR-FTIR獲得的兩種重樓紅外光譜信息進行對比,分析使用FTIR與UV低級數據融合技術的分類效果,為準確建立重樓產地鑒別模型及選擇優質產地提供依據。
在云南省怒江州、西雙版納傣族自治州、昆明市、文山州及貴州省興義市、安順市共采集156株重樓根莖,經云南中醫學院張慶芝教授鑒定為云南重樓P.polyphyllaSmith var.yunnanensis。將重樓樣品新鮮根莖洗凈陰干,切片置于50 ℃烘箱內烘干,粉碎,過100目篩,自封袋密封保存。
傅立葉變換紅外光譜儀配備ATR附件(ZnSe晶體材料)及DTGS檢測器(美國Perkin Elmer公司);UV-2550紫外可見分光光度計(日本島津公司);YP-2壓片機(上海山岳科學儀器有限公司);電熱恒溫鼓風干燥箱(上海一恒科學儀器有限公司);CH936B除濕機(森井電氣公司);DFY-50型中藥材粉碎機(溫嶺市林大機械有限公司);電子天平(梅特勒·托利多儀器有限公司);超聲波清洗儀(上海聲源超聲波儀器設備有限公司)。
超純水系統;甲醇(分析純);溴化鉀(分析純)。
在保持室溫且干燥環境下,精確稱取1.0 mg重樓樣品與100 mg KBr粉末,于瑪瑙研缽內混勻并研磨后壓成透明薄片,掃描(背景掃描采用100 mg KBr粉末壓成的透明薄片)。光譜采集范圍400~4 000 cm-1,分辨率4 cm-1,掃描累積量16次,每個編號樣品重復3次,取FTIR平均光譜圖。
保持房間恒溫干燥,每次掃描前進行空氣的背景掃描,取重樓樣品粉末于干燥且潔凈的硒化鋅晶體材料上進行光譜掃描,累積掃描16次,壓力保持在130~140 Pa之間,光譜采集范圍650~4 000 cm-1,分辨率4 cm-1,單個樣品重復3次,取ATR-FTIR平均光譜圖。
精確稱取0.1 g重樓樣品于試管中,加入10 mL甲醇溶解,超聲40 min后過濾,收集濾液于干凈試管內,紫外儀器預熱1 h后進行光譜采集,采用石英比色皿掃描空白甲醇,以減少基線漂移,采集重樓樣品UV圖譜,掃描間隔1 nm,單個樣品重復3次,取平均UV光譜圖。
重樓樣品的原始FTIR及ATR-FTIR光譜利用OMNIC軟件轉化吸光度;以UVProbe軟件對原始UV進行平滑等處理;SIMCA-P+13.0軟件對UV、FTIR、ATR-FTIR及經ATR校正的ATR-FTIR(ATR-FTIR-A)光譜數據分別進行不同預處理,如一階導數(First derivatives,FD)、二階導數(Second derivatives,SD)、標準正態變量(Standard normal variables,SNV),以消除無關干擾(高頻隨機噪音、光散射、基線漂移、濃度不均等),使模型準確度增強,預測效果提升[18-20]。采用Kennard-Stone算法篩選2/3訓練集與1/3預測集,通過SIMCA-P+13.0、MATLAB R2014a軟件分別建立PLS-DA及SVM判別模型。參考模型所得訓練集分類正確率(AT)、預測集分類正確率(AP)、校正均方根誤差(Root mean square error of estimation,RMSEE)、交叉驗證均方差(Root mean square error of cross-validation,RMSECV)、預測均方根誤差(Root mean square error of prediction,RMSEP)等相關參數,選取最佳預處理方式(表1)。將不同單光譜信息直接串聯融合,建立低級數據融合的兩種判別模型,進而比較不同模型的穩定性及對不同產地重樓的分類效果。

表1 不同光譜不同預處理方式下的模型結果對比Table 1 Comparison of models results with multiple spectra of different pretreatment combinations

圖1B為二階導數光譜圖,如圖所示,ATR-FTIR及ATR-FTIR-A在4 000~3 600 cm-1及2 500~1 700 cm-1范圍內,C—H及C—O的伸縮振動等吸收較FTIR明顯。二階導數譜圖比原始譜圖顯示出更多細小信息,3 600~2 500 cm-1及1 700~650 cm-1范圍內的一些特征峰峰形更明顯。可以發現,ATR-FTIR與FTIR信息基本吻合;ATR-FTIR對樣品無預處理操作,簡化了操作過程,在樣品檢測后還可進行回收,為重樓FTIR分析提供了比KBr壓片檢測法更高效簡單的技術。

圖2為不同產地重樓的FTIR、ATR-FTIR及ATR-FTIR-A譜圖。6個產地重樓樣品峰形及峰位類似,吸光度略有差異。KBr壓片法與ATR測得的FTIR數據顯示,各個產地重樓的吸光度強度有所不同,其中文山州樣品吸光度在使用傳統FTIR方法時比其他產地低,使用ATR-FTIR則為最高,可能原因是FTIR需研磨樣品至極細粉,而ATR-FTIR直接測定樣品獲得信息,導致吸光度大小產生差異。由于各產地間其他細微差異從圖中難以直接分辨,故需進一步利用紅外光譜數據建立判別模型進行分析。
圖3A為所有重樓樣品的原始UV平均圖譜,其主要吸收峰在200~370 nm范圍內,其中207 nm處可能是薯蕷皂苷或溶劑甲醇的吸收峰,222 nm可能對應重樓皂苷Ⅶ的吸收,重樓皂苷C大致對應283 nm處的吸收峰。Tatar等[24]利用UV測定纈沙坦含量時發現,與原始UV吸收和其它階導數光譜相比,二階導數譜具有較好的信噪比以及更清晰明確的峰值。圖3B為經二階導數處理的重樓紫外光譜圖,有效提高了譜圖分辨率,除原始光譜存在的特征吸收峰,還明顯存在213、238、249、275、288、303 nm等處的吸收峰。



圖2 不同產地重樓的紅外原始平均光譜圖Fig.2 Original Fourier transform infrared average spectra of P.polyphylla in different areasA.FTIR;B.ATR-FTIR;C.ATR-FTIR-A
PLS-DA是目前使用較多的基于偏最小二乘回歸的多元統計分類方法之一,該法是將數據轉換為一組線性潛在變量并用于分類變量預測,即包括x、y兩個變量,每一組x觀測值都對應一個y變量,用于確定觀測數據所屬類別[25]。R2是認定模型與數據匹配程度的一種度量標準,效果越好的模型的R2越接近于1。但僅憑這一項標準衡量模型效果略顯不足,因此還需要觀察Q2。Q2是代表交叉驗證所得百分比的一項擬合參數,Q2>0.5時表示模型具有良好的預測能力。RMSEE、RMSECV及RMSEP參數用來評價模型效果,其數值越小表示模型越穩定,效果越好[26]。AT與AP分別表示訓練集與預測集的分類正確率,數值越大正確率越高。
4種最佳預處理UV、FTIR、ATR-FTIR、ATR-FTIR-A單光譜及不同紅外光譜與UV低級數據融合的PLS-DA模型參數如表2所示。就單一光譜而言,經過ATR校正處理的ATR-FTIR模型效果最佳,AT與AP也都達到100.00%。紅外光譜與UV低級數據融合模型鑒別精度較相應單一紅外光譜均有所提高。就ATR-FTIR-A-UV模型而言,其預測正確率與ATR-FTIR-A同為100%,但ATR-FTIR-A-UV的R2、Q2值更接近于1,RMSEE、RMSECV、RMSEP值也均有所減小,故ATR-FTIR-A與UV的低級數據融合模型更可靠。通過比較模型參數值發現,ATR-FTIR-A的PLS-DA模型各參數均好于FTIR-UV模型,即前者分類效果更好。

表2 不同光譜PLS-DA模型參數值Table 2 The model parameters of PLS-DA models with different spectra
支持向量機(SVM)是一種有監督的分類化學計量工具,通過最大化分類超平面和訓練集最接近樣本的距離,搜索不同數據類別之間最優分離超平面[27]。SVM包含兩個參數,c作為一個懲罰參數,可控制SVM泛化能力,減小過擬合現象;而核函數參數g與模型的穩定程度有關。SVM模型不受異常值的影響,對控制樣本數量要求不嚴格[25]。
表3為不同單一光譜與低級數據融合建立SVM模型所得特征參數值,Bestc、Bestg分別代表模型最佳懲罰參數與核函數參數。UV模型的AT與AP分別為62.50%和73.08%,相差10.00%以上,FTIR、ATR-FTIR及ATR-FTIR-A單光譜的AT與AP相差均在5.00%以內,表明利用UV數據建立的SVM模型可靠性較差,ATR-FTIR-A在單光譜SVM模型中鑒別精度最高,效果最佳。不同紅外光譜與UV相融合建立的SVM模型的正確率均高于相應單一紅外光譜SVM模型,c、g值也處于正常范圍內,模型穩定,說明數據融合效果優于單光譜。FTIR-UV模型AT與AP均為90.38%,ATR-FTIR-A分別為97.12%和100.00%,ATR-FTIR-A-UV融合模型正確率更高,達到99.04%及100.00%,故ATR-FTIR-A的SVM分類模型可用于有效區分不同來源重樓,ATR-FTIR-A-UV鑒別精度更高,體現了數據融合的準確性與有效性。

表3 不同光譜SVM模型參數值Table 3 The model parameters of SVM models with different spectra
圖4A、C分別為利用FTIR-UV、ATR-FTIR-A-UV低級融合數據建立SVM分類模型時篩選Bestc及Bestg所得的最優分離超平面圖,圖4B、D分別為FTIR-UV及ATR-FTIR-A-UV的SVM模型預測集實際與預測分類結果圖。圖4A所得超平面平滑程度較圖4C差,正確率也相應偏低。圖4B中有5個預測集樣本分類錯誤:第2類中有1個樣本錯分到第4類,第4類中有1個樣本錯分在第2類,以及有3個樣本錯分到第6類,而圖4D全部分類正確,表明ATR-FTIR-A-UV的SVM分類模型效果明顯好于FTIR-UV。
ATR-FTIR技術省略了樣品預處理過程,無損操作,樣品檢測后可回收,為重樓提供了簡便準確的紅外分析技術。該技術簡化了重樓分類模型的建立過程,極大提升了鑒別效果。直接利用ATR-FTIR-A單一光譜建立的PLS-DA或SVM產地鑒別模型分類正確率高,在實際生產中高效簡便;若進一步采用ATR-FTIR-A-UV低級數據融合建立模型可加強模型的穩定性。

圖4 最優分離超平面圖(左)和SVM分類結果圖(右)Fig.4 Optimal separation of hyperplane(left) and classification result of SVM(right)A,B:FTIR-UV,C,D:ATR-FTIR-A-UV