石 杰, 李長(zhǎng)濱, 吳擁軍, 黃 偉, 嚴(yán)會(huì)會(huì), 王麗杰
(1.鄭州大學(xué) 化學(xué)系 河南 鄭州 450001; 2.鄭州大學(xué) 公共衛(wèi)生學(xué)院 河南 鄭州450001)
不同廠家冬凌草片的近紅外光譜主成分聚類分析
石 杰1, 李長(zhǎng)濱1, 吳擁軍2, 黃 偉1, 嚴(yán)會(huì)會(huì)1, 王麗杰1
(1.鄭州大學(xué) 化學(xué)系 河南 鄭州 450001; 2.鄭州大學(xué) 公共衛(wèi)生學(xué)院 河南 鄭州450001)
利用近紅外光譜對(duì)不同廠家的冬凌草片進(jìn)行鑒別歸屬,并進(jìn)行快速分類.采集不同廠家不同批次冬凌草片樣品的近紅外漫反射光譜,通過(guò)不同計(jì)量學(xué)方法進(jìn)行處理.結(jié)合主成分聚類分析法對(duì)不同廠家冬凌草片進(jìn)行聚類判別分析,分類識(shí)別正確率達(dá)100%,從而推斷出不同廠家冬凌草片成分及生產(chǎn)工藝上的差別.結(jié)果表明,該方法準(zhǔn)確、快速、簡(jiǎn)便,可用于不同廠家冬凌草片的分類鑒別和質(zhì)量控制.
近紅外光譜; 主成分; 聚類分析; 冬凌草片
作為一種新興的檢測(cè)手段,近紅外漫反射光譜技術(shù)可用于對(duì)樣品的直接測(cè)定,無(wú)需破壞樣品及制樣,操作簡(jiǎn)便、快速.近紅外光譜(NIRS)技術(shù)是利用全譜或部分波段的光譜數(shù)據(jù)進(jìn)行定性或定量分析的無(wú)損檢測(cè)技術(shù),廣泛應(yīng)用于煙草[1]、食品[2]、石油化工[3]等領(lǐng)域.近年來(lái),近紅外光譜技術(shù)已發(fā)展成為中藥定性判別和定量分析的新興方法[4-6].由于不同廠家的生產(chǎn)工藝和原輔料組成均存在差異,反映在近紅外光譜圖上使得對(duì)其進(jìn)行分類鑒別成為可能.
冬凌草為唇形科香茶屬多年生草本或亞灌木,自然分布于太行山南部.其味甘苦,性微寒,具有清熱解毒、消炎止痛、健胃活血之功效,對(duì)急慢性咽炎、扁桃體炎、口腔炎有顯著療效[7].冬凌草片由冬凌草浸膏制成,收載于衛(wèi)生部藥品標(biāo)準(zhǔn).作者采用近紅外光譜結(jié)合主成分聚類分析法,實(shí)現(xiàn)了對(duì)不同廠家冬凌草片快速、準(zhǔn)確的分類鑒別,對(duì)于冬凌草生產(chǎn)工藝的改進(jìn)和假藥的判別有一定的借鑒意義.
1.1儀器與樣品
Antaris 6700型近紅外光譜儀(美國(guó)Thermo Nicolet公司),配有銦鎵砷 (InGaSn)檢測(cè)器、積分球漫反射采樣系統(tǒng)、樣品旋轉(zhuǎn)器和石英樣品杯;石英研缽;OMNIC光譜采集軟件和TQ 8.0分析軟件;德國(guó)Bruker公司開發(fā)的OPUS 5.5分析軟件;藥典篩;BP210S型萬(wàn)分之一分析天平(德國(guó)賽多利斯公司).
河南省濟(jì)源市濟(jì)世藥業(yè)有限公司生產(chǎn)的冬凌草片(糖衣片)22批和冬凌草片(復(fù)方含片)22批,河南省安陽(yáng)市華安藥業(yè)有限公司生產(chǎn)的冬凌草片23批,河南省安陽(yáng)市路德藥業(yè)有限公司生產(chǎn)的冬凌草片25批,河南廣宇博科生物制藥有限公司生產(chǎn)的冬凌草片6批,共計(jì)98個(gè)批次.
1.2實(shí)驗(yàn)方法
分別取不同批次的冬凌草片劑20片,磨碎并過(guò)100目藥典篩,混勻后取8 g放入測(cè)量杯,扣除背景采集其近紅外光譜.采樣方式為積分球漫反射,光譜范圍為12 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32次,溫度25~27 ℃,相對(duì)濕度45%~50%.每個(gè)樣品重復(fù)測(cè)定3次,求其平均值作為樣品的標(biāo)準(zhǔn)光譜.每次掃描前都要對(duì)樣品進(jìn)行混勻,并用同一重物壓實(shí)以保證每次的密實(shí)程度一致.預(yù)處理方法為一階導(dǎo)數(shù)+矢量歸一化,聚類方法為Ward算法.98個(gè)批次冬凌草片的近紅外原始光譜疊加圖和一階導(dǎo)數(shù)光譜疊加圖見圖1.


圖1 98個(gè)批次冬凌草片的近紅外原始光譜(A)及一階導(dǎo)數(shù)光譜(B)Fig.1 The original NIR spectrum (A) and first derivative spectrum (B) of donglingcao tablets of 98 batches
2.1建模波段的選擇
建模前對(duì)光譜波段進(jìn)行篩選,既可避免引入過(guò)多冗余信息,也可避免由于波段選擇較窄而丟掉一些有用的信息.冬凌草片的光譜曲線在高頻段噪聲較大,通過(guò)譜區(qū)比較,發(fā)現(xiàn)譜圖在7 283~4 008 cm-1范圍內(nèi)信息量豐富,各種特征信息表現(xiàn)明顯,故取此波段進(jìn)行數(shù)據(jù)處理.
2.2光譜預(yù)處理方法的選擇
高頻隨機(jī)噪聲、基線漂移、樣本不均勻、光散射等因素都會(huì)對(duì)模型的預(yù)測(cè)準(zhǔn)確性和穩(wěn)定性產(chǎn)生較大的影響,因此需要對(duì)光譜進(jìn)行預(yù)處理以消除這種影響對(duì)預(yù)測(cè)帶來(lái)的誤差.由圖1可知,對(duì)樣品的原始譜圖進(jìn)行一階導(dǎo)數(shù)處理可以有效地消除樣品由于顏色差別引起的基線漂移,使譜圖特征信息更加明顯地表達(dá)出來(lái).通過(guò)比較樣品的近紅外原始光譜及一階導(dǎo)數(shù)光譜,發(fā)現(xiàn)一階導(dǎo)數(shù)光譜的鑒別效果優(yōu)于原始光譜.矢量歸一化用以消除光程變化或樣品顆粒大小、密實(shí)程度等變化對(duì)光譜產(chǎn)生的影響,選擇樣品的近紅外譜圖9點(diǎn)平滑一階導(dǎo)數(shù)+矢量歸一化方法進(jìn)行優(yōu)化處理.
3.1主成分分析
為了充分利用光譜信息,必須對(duì)光譜數(shù)據(jù)進(jìn)行降維處理.主成分分析是常用的有效降維方法,保留多少主成分取決于保留部分的方差和在方差總和中所占的百分比(即累積貢獻(xiàn)率) ,它標(biāo)志著前幾個(gè)主成分概括信息的多寡[8].本實(shí)驗(yàn)對(duì)一階導(dǎo)數(shù)+矢量歸一化法處理后的光譜數(shù)據(jù)進(jìn)行主成分分析,主成分?jǐn)?shù)對(duì)光譜的影響見表1,可以看出,不同主成分?jǐn)?shù)對(duì)鑒別結(jié)果起著關(guān)鍵的作用,前5個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到98.08%,主成分?jǐn)?shù)增加到6,累積貢獻(xiàn)率幾乎不變.綜合考慮選擇前5個(gè)主成分來(lái)概括表示樣品近紅外光譜的主要信息,此時(shí)可以把不同廠家的樣品區(qū)分開,分類結(jié)果與實(shí)際歸屬一致.

表1 主成分?jǐn)?shù)與累積貢獻(xiàn)率和錯(cuò)判例數(shù)的關(guān)系
3.2聚類分析
將98份樣品中的76份作為校正集用于建立判別分析模型,其余22份作為驗(yàn)證集用于檢驗(yàn)所建模型的性能.校正集樣品的原始光譜經(jīng)過(guò)一階導(dǎo)數(shù)+矢量歸一化法處理后,結(jié)合判別分析在7 283~4 008 cm-1波段內(nèi)建立判別分析模型,并對(duì)驗(yàn)證集進(jìn)行判別預(yù)測(cè).結(jié)果表明,該模型對(duì)校正集樣品的判別和驗(yàn)證集樣品的預(yù)測(cè)鑒別都與實(shí)際分類完全一致,判別分析結(jié)果見圖2.
聚類分析是一種無(wú)管理模式識(shí)別方法,常用于目標(biāo)觀測(cè)對(duì)象的分類,即利用表征觀測(cè)對(duì)象的一組變量對(duì)目標(biāo)進(jìn)行分類[9].因此,在主成分分析的基礎(chǔ)上引入聚類分析,可排除眾多化學(xué)信息中相互重疊的部分而又不丟失原始數(shù)據(jù)信息,使聚類分析的計(jì)算簡(jiǎn)化.本實(shí)驗(yàn)采用Ward算法對(duì)冬凌草片進(jìn)行聚類分析,結(jié)果5個(gè)廠家的冬凌草片被清晰地聚為5類.由此可見,建立的模型性能較好,能夠準(zhǔn)確、快速地判別不同廠家的冬凌草片.由樹狀圖可知,聚類分析能夠通過(guò)光譜間距離的大小,準(zhǔn)確地把同一廠家的樣品先聚為一類,然后再把與此廠家光譜性質(zhì)相近的樣品聚類,最后與其他廠家的產(chǎn)品聚類,依次進(jìn)行聚類直至把所有產(chǎn)品聚類完成.圖3中冬凌草片的聚類分析結(jié)果與實(shí)際分類結(jié)果一致.通過(guò)聚類分析,找出不同廠家樣品之間的信息特征,從而達(dá)到了鑒別的目的.

圖2 冬凌草片的判別分析圖Fig.2 Discriminate analysis diagram of donglingcao tablets

圖3 冬凌草片的聚類分析圖Fig.3 Clustering analysis diagram of donglingcao tablets
1)中藥的化學(xué)成分比較復(fù)雜,且由于絕大部分中藥輔料都含有淀粉、糊精、蔗糖等,成分相似,NIRS信息重疊嚴(yán)重,各樣品的特征信息很難從峰位、峰形、峰強(qiáng)等方面直觀鑒別,因此,必須借助于化學(xué)計(jì)量學(xué)的方法對(duì)譜圖進(jìn)行優(yōu)化處理,突出樣品之間化學(xué)成分的細(xì)小差異,從而達(dá)到鑒別的目的.不同廠家的冬凌草片由于其化合物的種類和含量、藥品采集以及制備方法存在差異,結(jié)合近紅外光譜技術(shù)和計(jì)量學(xué)處理技術(shù),使得不同廠家的樣品分類判別成為可能.
2)外界環(huán)境和外部因素對(duì)光譜的重現(xiàn)性影響比較大,因此,測(cè)樣時(shí)間要盡量集中并保持外部環(huán)境一致.作者對(duì)藥品顆粒度、裝樣量、密實(shí)程度進(jìn)行了統(tǒng)一處理,以增強(qiáng)不同廠家樣品光譜間的可比性,減少了外部因素引起的實(shí)驗(yàn)誤差.
3)NIRS聚類分析結(jié)果與實(shí)際分類完全吻合,說(shuō)明NIRS分析技術(shù)具有較好的重現(xiàn)性和可靠性.實(shí)驗(yàn)通過(guò)將NIRS與主成分聚類分析法相結(jié)合,建立了鑒別不同廠家冬凌草片的新方法.結(jié)果表明,該方法準(zhǔn)確、快速、無(wú)損,可用于不同廠家冬凌草片的判別分析,同時(shí)對(duì)冬凌草片生產(chǎn)工藝的改進(jìn)和冬凌草片假藥的初步判別也有一定的借鑒意義.
[1] 張鼎方.近紅外技術(shù)應(yīng)用于成品卷煙的內(nèi)在質(zhì)量穩(wěn)定性控制[J].福建分析測(cè)試,2009,18(2):39-44.
[2] 孫通,徐惠榮,應(yīng)義斌.近紅外光譜分析技術(shù)在農(nóng)產(chǎn)品/食品品質(zhì)在線無(wú)損檢測(cè)中的應(yīng)用研究進(jìn)展[J].光譜學(xué)與光譜分析,2009,29(1):122-126.
[3] 錢平,孫國(guó)琴,張存洲.基于近紅外光譜技術(shù)的石油組分定量分析新方法[J].光譜學(xué)與光譜分析,2008,28(12):2851-2854.
[4] 李艷英,白雁,陳志紅,等.近紅外漫反射光譜法測(cè)定不同廠家一清顆粒的含量[J].藥物分析雜志,2009,29(7):1126-1129.
[5] 吳擁軍,李偉,相秉仁,等.近紅外光譜技術(shù)用于白芷類中藥的鑒定研究[J].中藥材,2001,24(1):26-28.
[6] 聶黎行,王剛力,李志猛,等.近紅外光譜法在中藥輔料質(zhì)量控制中的應(yīng)用[J].中國(guó)中藥雜志,2009,34(17):14-17.
[7] 劉俊鵬,于玲,王亞娟.冬凌草片質(zhì)量標(biāo)準(zhǔn)研究[J].藥物研究,2008,46(13):31-32.
[8] 王麗,何鷹,王顏萍,等.近紅外光譜技術(shù)結(jié)合主成分聚類分析判別海面溢油種類[J].海洋環(huán)境科學(xué),2004,23(2):58-60.
[9] 劉木清,周德成,徐新元,等.聚類算法用于中藥材的近紅外光譜分析[J].光譜學(xué)與光譜分析,2007,27(10):1985-1988.
ClusteringAnalysisforPrincipalComponentsofDonglingcaoTabletsfromDifferentManufacturersbyNearInfraredSpectroscopy
SHI Jie1, LI Chang-bin1, WU Yong-jun2, HUANG Wei1, YAN Hui-hui1, WANG Li-jie1
(1.DepartmentofChemistry,ZhengzhouUniversity,Zhengzhou450001,China;2.CollegeofPublicHealth,ZhengzhouUniversity,Zhengzhou450001,China)
Near infrared spectroscopy (NIRS) was used in the identification and rapid classification of donglingcao tablets from different manufacturers. NIRS technology was employed to collect near infrared spectra of donglingcao tablets. Different chemometrics methods and clustering analysis for principal components were used to discriminate donglingcao tablets. The correct classification rate was 100%,and it could be concluded that the composition and production process of donglingcao tablets were different. The results indicated that the method was accurate,rapid,simple,and it could be applied to classification and quality controlling of donglingcao tablets produced by different manufacturers.
near infrared spectroscopy;principal component;clustering analysis;donglingcao tablet
O 657.3
A
1671-6841(2011)04-0067-04
2011-04-29
國(guó)家自然科學(xué)基金資助項(xiàng)目,編號(hào)J0830412;河南省重大公益科研項(xiàng)目,編號(hào)081100912500.
石杰(1950- ),男,教授,主要從事食品與藥物分析研究,E-mail:shijie@zzu.edu.cn;通訊作者:李長(zhǎng)濱(1983- ),男,碩士研究生,主要從事近紅外技術(shù)在藥物分析和新藥開發(fā)方面的研究,E-mail:lichangbin911@163.com.