周雨楓, 董林毅, 楊哲萱, 張鳳蓮, 章順楠, 周立紅?, 葉正良,3?
(1.天津醫科大學藥學院,天津300070;2.天士力醫藥集團股份有限公司,中藥先進制造技術國家地方聯合工程實驗室,天津300410;3.天士力控股集團有限公司,天津300410)
三七 Panax notoginseng(Burk.) F.H.Chen為五加科人參屬植物的干燥根和根莖物[1],屬于珍貴的中藥材。具有止血、活血化瘀、降血壓、降血脂等多種作用。近年來,隨著三七產業的不斷發展,三七不同藥用部位的開發研究越來越受到廣泛關注。
三七按部位分類,分為主根、筋條 (側根)、絨根 (須根)、剪口、花、葉6個部位,文獻指出,三七不同部位內在成分含有量差異,可能影響臨床用藥的安全性與有效性[2]。數據顯示,生產合格的三七粉,在投料時需考慮不同藥用部位的質量特征[3]。但傳統分析方法鑒別三七粉來源時,存在耗時長、前處理復雜等缺點,且對于不同部位的三七粉,單獨采取傳統某種分析方法,無法對各部位判別分析,需多種分析方法綜合應用,且隨著摻雜成分的不同,鑒別結果變數也大[4-5]。 《中國藥典》規定三七飲片可以直接以粉入藥,主要有效成分三七皂苷R1、人參皂苷Rg1和 Rb1。但沒有規定三七粉的原料來源,藥材經過粉碎后,失去了原來的形狀特征[6],容易摻偽。而且市售的三七主根粉容易摻雜其余部位,卻仍以主根粉原價出售,并且難以通過感官辨別。
近年來,近紅外光譜技術在中藥行業得到大力推廣,作為一種藥材快檢的高效分析方法而被廣泛應用[3],并應用于三七粉末的來源和真偽鑒別[7-9],但目前尚未有報道利用近紅外光譜技術對三七主根、筋條 (側根)、絨根 (須根)、剪口、花、葉等所有部位的粉末進行判別分析。
本研究以三七的皂苷含有量為質控指標,利用NIRS結合PLS建立皂苷模型。同時結合主成分分析對三七不同部位分別進行定性鑒別,應用于三七主根粉的偽品分析,建立快速實用的多指標分析方法,為中藥材的整體質量控制和評價提供參考[10]。
1.1 儀器與試劑 WATERS 269高效液相色譜儀 (美國 WATERS公司);Diamonsil Plus C18(250 mm×4.6 mm,5 μm,北京迪馬科技有限公司);XS205電子分析天平 (上海梅特勒-托利多儀器有限公司);AntarisⅡ傅立葉變換近紅外光譜儀 (美國Thermo Fisher Scientific公司);DK-S14電熱恒溫水浴鍋 (上海森信實驗儀器有限公司);MEMMERT UNE200干燥箱 (上海美墨爾特貿易有限公司);高速中藥粉碎機 (山東省青州市精誠醫藥裝備制造有限公司)。乙腈 (批號 10900830728,色譜純)、甲醇 (批號10901407732,色譜純)(德國默克股份兩合公司);甲醇 (批號2017112032,分析純,天津市致遠化學試劑有限公司);三七皂苷R1(批號20130910,含有量92.78%)、人參皂苷Rg1(批號20130911,含有量94.63%)、人參皂苷Rb1(20131107,含有量95.87%)均由天士力醫藥股份有限公司提供;水為Milli-Q超純水。
1.2 藥材 三七主根53批,三七剪口、絨根、筋條、花、葉各5批,均由天士力醫藥集團股份有限公司提供,經浙江理工大學梁宗鎖教授鑒定為五加科植物三七Panax notoginseng(Burk.) F.H.Chen的主根、筋條、絨根、剪口、花、葉。藥材粉碎,過65目藥典標準篩,分別混勻,裝袋密封備用。
2.1 HPLC 參考藥典方法[1],測得主根皂苷含有量范圍為5.85%~9.27%、筋條為5.69%~6.39%、剪口為10.12%~11.90%、絨根為4.48%~6.62%、花為2.51%~5.28%、葉為0.38%~0.69%,見表1。

表1 各樣品中皂苷含有量測定結果Tab.1 Results of content determination of the saponins of various samples
2.2 光譜采集 采集方式為積分球固體采樣。樣品掃描次數64次,分辨率8.0 cm-1,每個樣品采集2張光譜,計算平均光譜以建立模型。各部位三七主根的近紅外原始光譜見圖1。

圖1 各樣品不同部位近紅外光譜圖Fig.1 Near-infrared spectra of different parts of various samples
2.3 皂苷含有量模型
2.3.1 校正集和驗證集 應用TQ Analyst 8.0軟件,從53批樣品中選擇具有代表性的43批作為校正集,含有量范圍分別為5.85%~9.27%,10批為驗證集,含有量范圍為6.09%~8.96%,驗證集的含有量范圍均在校正集之內,具有可驗證性。
2.3.2 光譜預處理 近紅外光譜中除了自身的光譜信息外,還容易受到儀器噪音以采集時固體粉末的顆粒大小和均一性的影響。在近紅外定性模型中,常用的預處理方法有多元散射校正法(MSC)、 標準歸一化法 (SNV)、 一階導數法(FD) 等[11-12]。 以 內 部 交 叉 驗 證 均 方 差(RMSECV)和R2作為評價指標,見表2,一階導數得到的模型數據最好。

表2 不同預處理方法的影響Tab.2 Effects of different spectra preprocessing methods
2.3.3 選擇建模波段 建模波段選擇范圍過窄,缺乏關鍵信息,范圍過寬又會包含大量的噪音和多余信息,因此,選擇最佳波段有利于提高模型的預測性和準確性[11]。由主根近紅外譜圖可知,7 500~12 000 cm-1吸收較少, 3 800~4 000 cm-1儀器噪音比較大,不適于建模。因此選擇在 4 000~7 500 cm-1嘗試建模,以 R2、RMSECV為評價指標,手動篩選后見表3。表明,4 100~7 250 cm-1為最佳建模波段。

表3 不同波長范圍的影響Tab.3 Effects of different wavelength coverage
2.3.4 主成分數 主成分數量過多,模型太復雜,出現過擬合現象。數量太少,則提取的信息不全面,模型的預測性降低[11]。本實驗以RMSECV為優化參數,RMSECV越小,模型的預測精度越高[13],因此,確定最佳因子數為9。見圖2。

圖2 RMSECV隨主因子數變化Fig.2 Changes of the RMSECV along with factors
2.3.5 建立定量模型 運用TQ Analyst 8.0軟件,通過PLS法對三七主根的皂苷含有量建立定量模型。外部驗證中實測值與參考值的相關圖見圖3。結果表明,RMSECV為0.278,R2為0.919 1,表明該模型的總體預測性高。

圖3 實測值與參考值的相關性Fig.3 Correlation between measured values and reference values
2.3.6 模型的驗證 根據2015版 《中國藥典》HPLC法測定的皂苷含有量作為實測值,與近紅外光譜建模后得到的預測值相比,見表4~5。表明,所建模型外部驗證集的實測值與參考值最大絕對誤差0.25,平均相對誤差為1.52%,t檢驗P值為0.210>0.05,表明驗證集的預測值與參考值之間無顯著性差異。結果表明,所建模型準確性高,預測性能好。

表4 模型驗證結果Tab.4 Results of the modelling verification

表5 驗證集參數比較Tab.5 Comparison of parameter of validation set
2.4 各部位判別分析定性模型
2.4.1 選擇訓練集與驗證集 78批樣品中隨機選擇5批主根,筋條、絨根、剪口、花、葉各1批作為驗證集,其余作為訓練集。訓練集樣本68批,驗證集樣本10批。
2.4.2 光譜預處理 應用TQ Analyst對樣品建立NIR判別分析定性模型時,判別分析的錯誤類別越少,正確率越高。主分成因子分析區域貢獻值越大表明信息越豐富,但超過95后表明光譜中噪聲對樣品自身信息干擾大,所以需要盡量控制低于95。并綜合考慮各個類別的第1主成分和第2主成分的二維散點圖中的區域分布是否明顯來選擇最佳的預處理方法。由表6~7得出,MSC+一階導數作為預處理方法正確率最高,分析區域貢獻值最大。

表6 不同預處理方法的影響Tab.6 Effects of different preprocessing methods

表7 不同預處理方法的分析區域貢獻值Tab.7 Contribution values of different preprocessing methods to the analysis area
2.4.3 建模波段 建模波段選擇過寬,包含的冗余信息較多,使得模型的預測性降低;選擇過窄,對應波段的信息不夠豐富,沒有代表性,判別分析正確率低。近紅外定性分析時,波段靠近4 000 cm-1方向是合頻區,越靠近往小的方向,峰的區分效果越好,重疊性越小,5 000 cm-1以上屬于倍頻區,越大峰形重疊越嚴重,而越靠近10 000 cm-1峰幾乎都是重疊在一起。通過觀察譜圖差異主要在3 800~7 500 cm-1,經過不斷手動優化嘗試后,得到3 807.15~6 500.00 cm-1為最佳建模波段。見表8。

表8 不同波長范圍的影響Tab.8 Effects of different wavelength coverage
2.4.4 主成分判別分析模型建立 經過上述分析,選擇 MSC+一階導數作為光譜預處理方法,3 807.15~6 500.00 cm-1為最佳建模波段,建立近紅外判別分析模型。見圖4。
2.4.5 模型驗證與評價 將選擇的10批樣品作為驗證集來評價模型的預測準確性,結果發現10批驗證集樣品的類別鑒別正確率為100%。由此可得,模型的準確度高,預測性能好,可用于三七不同部位的定性鑒別。

圖4 三七不同部位第1、第2主成分得分圖Fig.4 Scores of the first and second principal components for different parts of Panax.notoginseng
2.5 三七粉偽品
2.5.1 三七偽品制備 三七花和三七葉的顏色相對主根而言比較深,顏色區分度比較明顯,而筋條、絨根和剪口粉末顏色與主根接近,肉眼難以準確區分是否三七粉中摻有這些雜質,因此隨機選擇1批三七主根、筋條、絨根、剪口,將三者按不同比例進行混合,見表9,每份樣品10 g,得到15種摻雜粉。
2.5.2 近紅外光譜采集 分別將上述偽品粉末取約5 g置于旋轉樣品杯中,積分球固體采樣,掃描次數64次,分辨率8.0 cm-1,每個樣品采樣2次取平均光譜以建立模型。
2.5.3 主成分判別分析 將15份偽品作為驗證集,帶入建立的近紅外不同部位判別分析定性模型中,結果表明,該模型對三七粉中分別摻雜絨根10%、筋條45%、剪口60%及以上的偽品三七粉均可鑒別。見圖5。

表9 不同比例主根與其他部位混合鑒別情況Tab.9 Mixed identification of different proportions of taproot and other parts
3.1 NIRS與HPLC對比 NIRS具有高效、無損、綠色、環保的優點,能實現在線分析和實時監測,并且沒有復雜的前處理過程,能對三七各個部位通過模型進行鑒別。然而近紅外光譜測定的是倍頻及合頻吸收,因此靈敏度較差,通常要求檢測含有量大于1%;并且NIRS作為一種間接分析方法,需要大量的建模數據,基礎數據的準確性,分析方法的精確性以及化學計量學選擇的合理性等,都會影響最終的模型精度和預測性能[14]。而HPLC法可以定量測定物質含有量,數據精準,但前處理復雜繁瑣、耗費時間長,且難以通過皂苷含有量來區分三七藥材的不同部位。綜合比較得出,近紅外光譜技術在推廣應用,需要有精確的一級數據和合理的化學計量學方法。

圖5 摻雜三七粉的第一、第二主成分的得分圖Fig.5 Scores of the first and second principal components of adulterated Panax.Notoginseng powders
3.1 定量研究 文獻表明,三七不同部位總皂苷溶血性小,且三七主根總皂苷的免疫增強作用最好[15]。多糖組分在免疫調節方面活性顯著,而三七不同部位中多糖含有量有明顯差異,主根、筋條、毛根、花、莖葉和剪口中均含有多糖,其中主根含有量最高,莖葉含有量最低[16]。主根、筋條、剪口中的皂苷含有量和種類均不同,質量也有差異[17]。
本實驗測得三七不同部位中,剪口皂苷含有量最高,其次主根,接著是筋條和絨根,二者含有量范圍非常接近,而且與主根的含有量范圍有重疊部位,接下來是花和葉,葉中皂苷含有量測定范圍最低。在建立的皂苷含有量近紅外模型中,實測值平行樣品間最大偏差為1.91%,驗證集樣品的最大相對誤差為3.42%,平均相對誤差為1.52%,表明該模型準確性、預測性都較高。
3.2 NIR判別分析 目前企業生產時通常選擇三七不同部位的原材料進行加工,市售合格三七粉通常是以三七主根作為原材料,三七的筋條和須根雖然都有一定的藥用價值。但相對主根而言含有量較低,因此售價便宜,而剪口中皂苷含有量雖然比主根高,但不容易被人體直接吸收,通常用于企業制藥。三七的筋條和絨根也有一定的藥用價值,但有效成分相對較低,因此相對主根價格低廉。剪口主要成分含有量指標要遠高于法定標準,但剪口和筋條的灰分指標有不符合標準的風險[3]。
本實驗利用NIRS建立三七不同部位的主成分判別分析模型中,選擇MSC和一階導數作為預處理方法,3 807.15~6 500.00 cm-1為最佳建模波段,78批樣品中1批分類錯誤,驗證集分類正確率100%,總樣品分類正確率為98.72%。
為了進一步驗證模型的預測性能和提高模型的實用性,將三七摻雜粉作為驗證集帶入主成分判別分析模型中,在判別分析模型中,筋條、絨根和剪口含有量分別為10%、45%、60%及以上的三七摻雜粉均被鑒定出不是主根類別。經過主成分分析后,圖5表明,隨著三七粉偽品中筋條、絨根和剪口的比例不斷增加,數據點不斷從主根分布區域向這三個部位的分布區域移動,表9表明,三七偽品模型鑒別準確率高。
3.3 質量評價 本文采用近紅外光譜法,對三七主根皂苷含有量建立了定量分析模型,對三七藥材所有部位的鑒別建立了快速無損的定性分析方法。該模型經過驗證,對三七主根粉偽品同樣具有良好的鑒別能力,具有較強的實用性。結果表明,近紅外光譜技術高效、便捷,可從定量和定性等多方面對三七藥材進行整體質量評價,后期可通過不斷增加樣品量來提高各個模型的預測性和實用性。