李 斌, 蓮 花, 布 仁, 渠 弼, 白文明
(內蒙古醫科大學,內蒙古 呼和浩特 010110)
防風為傘形科植物防風Saposhnikoviadivaricate(Turcz.)Schischk.的干燥根,主產于我國內蒙古、遼寧、河北等北方或東北地區[1],具有祛風解表、勝濕止痛、止痙等功效[2]。防風中含有豐富的香豆素、色原酮、多糖、聚乙炔類成分[3],研究發現,防風具有抑制類風濕關節炎、陣痛、消化性潰瘍,保護神經系統,抗痙攣、抗炎、抗腫瘤等活性[4-8]。東北三省和內蒙古是防風的道地產區,其在我國境內的分布較廣,受到生長環境的影響,藥效成分的含量及臨床藥效等均可能出現較大差異[9]。加之,我國中藥材市場普遍存在混用、亂用及以次充好等現象,使得防風產地的鑒別非常重要。
近紅外分光譜法以其能夠進行快速、無損分析的特點,已廣泛應用于中藥材質量控制的研究[10-13]。雖然有報道基于(中)紅外光譜法可有效地判別不同產地的防風[14],但該方法需要將樣品壓片,耗時費力,無法滿足在線分析的要求。
本研究采集并購買內蒙古自治區(赤峰)、遼寧(阜新)、河北、甘肅、黑龍江這5個產地防風,利用漫反射方式采集近紅外光譜,結合主成分分析(PCA)和偏最小二乘判別分析(PLS-DA)等方法,建立預測防風產地屬性的快速無損分析方法。
1.1 儀器 NIRMaster傅里葉變換近紅外光譜儀(瑞士Buchi公司);DFY-1000C中藥粉碎機(上海左樂儀器有限公司);JET1002G/00電子天平(瑞士梅特勒-托利多公司)。
1.2 防風 防風共5批,分別為2019年采自內蒙古自治區赤峰、遼寧省阜新境內的2批,以及2018年購自河北、甘肅、黑龍江防風市場的3批,經內蒙古醫科大學藥學院生藥教研室渠弼副教授鑒定為正品,按每份約50 g的量分成若干份,中藥粉碎機粉碎,共得到內蒙古產15份、遼寧產15份、河北產30份、甘肅產30份、黑龍江產30份。
2.1 分析條件 溫度24~26 ℃;相對濕度45%~50%;粉末累積掃描次數32次;掃描范圍10 000~4 000 cm-1;分辨率為8 cm-1。
2.2 樣品測定 采用積分球漫反射法,將防風粉末置于樣品杯中,自動旋轉測量3個位置的近紅外光譜,結果見圖1。
2.3 數據分析 本研究采用主成分分析(PCA)、偏最小二乘判別分析(PLS-DA)建立判別不同產地防風的判別模型,并通過外部未知樣品對判別模型進行驗證。為了使不同產地防風光譜之間具有可比性,在建立相應模型前將對漫反射近紅外光譜進行K-M轉換[15];為了分離重疊吸收峰,并校正基線漂移和光散亂對近紅外光譜有效信息的影響,采用基于Savitzky-Golay算法的微分處理法(1階、2階微分)和標準正態變量變換處理法(SNV)對光譜進行前處理。

圖1 不同產地防風近紅外光譜圖
將不同產地防風進行隨機分組,分別為校正組95份(內蒙古、遼寧產各10份,河北、甘肅、黑龍江產各25份)、驗證組25份(各產地5份)。參照文獻[16-17]報道,基于校正組防風的近紅外光譜進行PCA分析,將近紅外光譜在各載荷上的得分投影到坐標系中,確定能表征不同產地防風差異的2個載荷,相同產地防風近紅外光譜將出現在坐標系的相近區域,而不同產地的將出現在坐標系的較遠區域,從而可進行區分。為了評價所建立模型的優劣,選用校正組以外的防風(驗證組)來驗證模型對未知樣品的鑒別能力。
參照文獻[18]報道,定義驗證組防風的95個近紅外光譜為自變量(X),各近紅外光譜的分組信息為因變量(Y)。由于本研究所用防風來源于5個產地,所以每1個近紅外光譜(自變量)對應的因變量數為5個,每1個因變量代表1個產地,當該因變量代表的產地與對應的近紅外光譜的產地一致時取值1,否則取值-1,再基于驗證組防風的自變量及因變量數據,利用PLS2算法建立判別防風產地的數學模型。為了避免監督學習算法出現過擬合現象,選用驗證組的樣品對預測模型的優劣進行評價,由于PLS2算法給出的預測結果為5個變量數值,故最接近1的變量所代表的產地即為防風原產地。另外,也可通過主成分分析對預測得到的因變量數據(PLS2模型獲得的預測數值)進行降低維度處理后,以二維坐標散點圖中的樣品分布區域(99.9%等概率區域)來判斷防風原產地,即相同產地防風出現在二維坐標系的相近區域內,不同產地的出現在較遠的區域。然后,采用坐標系散點圖的方式表示原產地預測結果,數據解析均基于FreeMat v4.0軟件完成。
3.1 PCA 圖2顯示,除校正組(圖2a)外,其余各組前處理光譜建立的模型都能將不同原產地防風進行分離,并且無重疊;99.9%等概率區域(橢圓處)無重疊,其中基于2階微分加SNV處理光譜的鑒別模型對校正組中不同產地防風的分離效果最佳,并對驗證組防風具有同樣的鑒別效果(圖2f),原產地鑒別的準確率為100%,故確定該模型為防風原產地的鑒別模型;內蒙古自治區、遼寧省產防風的等概率橢圓區域相對較大,即相同原產地的組內差異比其他原產地大,其原因可能是建立判別模型時上述2個產地的防風較少,導致通過PCA獲得的主成分所代表的與這2個產地防風特征有關的信息量降低,從而使組內差異變大。

圖2 基于校正組近紅外光譜建立的鑒別模型及驗證組防風鑒別結果(Ⅰ)
圖3顯示,4 344、4 444 cm-1位置附近的載荷值較大,表明近紅外吸收對判別模型的判別結果起到了顯著作用,是不同產地防風差異的關鍵因素;該處吸收峰主要來源于C-H基團的合頻振動,在近紅外光譜的對應位置(圖1a)上可觀察到強度較大者。另外,通過觀察經前處理(2階微分+SNV)后的低波數段的擴大圖(圖1b)發現,上述2個波數位置附近吸收強度及吸收峰形狀有較大差異。

圖3 主成分分析載荷圖
圖4顯示,不同產地防風近紅外光譜差異主要出現在低波數段,表明與該波數段吸收源對應的成分在不同產地防風中含量或分布狀況可能存在明顯差異,可得到很好的分離。
3.2 PLS-DA 圖5顯示,光譜前處理的有無對防風原產地判別結果的影響較小,即產地鑒別模型能很好地將不同產地防風進行分離,而且99.9%等概率區域(橢圓處)無重疊。綜合考慮散點圖上校正組防風各點的分散情況和模型對驗證組防風的預測準確度(圖5e),最終選擇基于二階微分處理光譜的PLS2算法為建立模型的方法,發現內蒙古自治區、遼寧省產防風的等概率橢圓區域相對較大,表明這2個產地防風組內差距比其他產地大,與PCA結果一致,其主要原因為當地防風數較少。
圖6顯示,5 028、4 924、4 664、4 472 cm-1附近的取值較大,表明上述波數處吸光度對判別結果的貢獻率較高,與上述波數對應的吸收源(成分)可能是不同產地防風差異的關鍵因素;該處吸收峰主要來源于C-H基團的合頻振動,近紅外光譜(圖1a)對應位置上可觀察到明顯較強的一系列吸收峰,與PCA結果一致,進一步證明是該波數段對應成分的含量或分布狀況等在不同產地防風之間產生差異,可得到很好的分離。

圖4 不同產地防風差光譜散點圖

圖5 基于校正組近紅外光譜建立的鑒別模型及驗證組防風鑒別結果(Ⅱ)

圖6 PLS-DA模型的回歸系數散點圖
防風是典型的道地藥材,藥用價值與原產地有著密切的關系,所以防風的原產地鑒別是其質量控制的重要環節。本研究基于近紅外光譜結合化學計量學的方法,建立通過防風的近紅外光譜預測原產地的快速、無損分析方法,且該方法的預測精度符合實際應用的要求。不同產地防風的藥效存在較大差異,而造成藥效差異的原因非常復雜,可能是多個藥效成分協同作用的結果,所以很難用單一或幾個化學成分的含量來評價其藥用價值。近紅外光譜的吸收主要來源于分子中含氫基團的倍頻和合頻振動,理論上中草藥中含有的全部有機物都將在該波段產生光譜吸收,即防風的近紅外光譜幾乎包含了所有藥效成分的光譜信息。利用近紅外光譜法對防風原產地進行鑒別分析,實際上是以防風中含有的絕大部分藥效物質為基礎進行的判別分析。所以,判別結果反映的是防風整體性質的差異,迎合中藥質量控制過程中整體評價藥材屬性的最新研究思路。本研究建立的防風原產地鑒別方法的操作非常簡單,僅需要將防風進行粉碎后采集近紅外光譜,并將近紅外光譜帶入數學模型即可。不僅分析速度快、樣品前處理簡單,而且光譜檢測前后藥材的藥用屬性不發生變化,有潛力作為制劑過程中中藥材原產地篩選的在線分析技術,提高中藥材質量控制的現代化程度。