劉瑞新 王艷麗 張耀 桂新景 王君明 王青曉 姚靜 張璐 施鈞瀚 李學林
中圖分類號 R943;TP311.1 文獻標志碼 A 文章編號 1001-0408(2019)02-0176-07
DOI 10.6039/j.issn.1001-0408.2019.02.07
摘 要 目的:建立基于Grubbs規則和MATLAB語言的異常值剔除方法,并評價其在藥物苦度評價中的的應用效果。方法:以Grubbs規則為參考,建立基于MATLAB語言的異常值自動循環剔除方法。選擇20名志愿者分別進行單組口嘗試驗(通草)和多組口嘗試驗(通草、明黨參、茯苓等10種藥材);選擇7個傳感器進行電子舌測試(川木通)。以上述試驗所得的苦度評價數據(口嘗試驗為苦度值,電子舌測試為傳感器響應值)為數據源,選擇5名研究者,采用基于Grubbs規則的查表逐一剔除法(方法一)、基于Grubbs規則的Excel軟件剔除法(方法二)、基于Grubbs規則和MATLAB語言的異常值自動循環剔除法(方法三)進行異常值的判定及剔除;以異常值剔除時間和錯誤概率為指標,評價上述3種方法的應用效果。結果:單組口嘗試驗苦度評價數據中有2個異常值,3種方法的剔除時間分別為(745.400 0±25.904 4)、(288.333 3±31.253 1)、(0.000 3±0.000 0)s,錯誤概率分別為20.0%、0、0;多組口嘗試驗苦度評價數據中有6個異常值,3種方法的剔除時間分別為(3 693.107 7±75.023 3)、(1 494.761 4±53.826 9)、(0.005 2±0.000 0)s,錯誤概率分別為10.0%、4.0%、0;電子舌測試苦度評價數據中有3個異常值,3種方法的剔除時間分別為 (2 992.673 3±84.117 6)、(1 276.367 1±55.024 5)、(0.002 3±0.000 0)s,錯誤概率分別為5.7%、2.9%、0。3種方法的剔除結果一致;方法二的剔除時間顯著短于方法一(P<0.01),方法三的剔除時間顯著短于方法一和方法二(P<0.01);3種方法錯誤概率無顯著差異(P>0.05)。結論:基于Grubbs規則和MATLAB語言的異常值自動循環剔除法可顯著縮短苦度評價數據異常值的剔除時間,提高數據處理效率,可用于藥物苦度評價。
關鍵詞 Grubbs規則;MATLAB語言;異常值;剔除;藥材;苦度評價
ABSTRACT OBJECTIVE: To establish the elimination method of outliers based on Grubbs rule and MATLAB language, and to evaluate the effects of it on drug bitterness evaluation. METHODS: Referring to Grubbs rule, the automatic cyclic outliers elimination method based on MATLAB language was established. Totally 20 volunteers were included in single oral taste test (Tetrapanax papyrifer) and multiple oral taste test (10 kinds of medicinal material as T. papyrifer, Changium smyrnioides, Poria cocos, etc.). Seven sensors were selected for electronic tongue test (Clematis armandii). The data of bitterness evaluation in above tests (oral taste test as bitterness value, electronic tongue test as response value of sensors) were used as the data source. Five researchers were selected and adopted table-by-table elimination method based on Grubbs rule (method one), Excel software elimination method based on Grubbs rule (method two) and automatic cyclic outliers elimination method based on Grubbs rule and MATLAB language (method three) to judge and eliminate the outliers. The effects of above three methods were evaluated with the removal time and error rate of outliers as indexes. RESULTS: There were two outliers in the data of bitterness evaluation in single oral taste test; the elimination time of the three methods were(745.400 0±25.904 4),(288.333 3±31.253 1)and(0.000 3±0.000 0)s, respectively; error rates were 20.0%, 0 and 0, respectively. There were six outliers in the data of bitterness evaluation in multiple oral taste test; the elimination time of three methods were (3 693.107 7±75.023 3), (1 494.761 4±53.826 9), (0.005 2±0.000 0)s, respectively; error rates were 10.0%, 4.0%, 0, respectively. There were three outliers in the data of bitterness evaluation in electronic tongue test; the elimination time of three methods were (2 992.673 3±84.117 6), (1 276.367 1±55.024 5), (0.002 3±0.000 0)s, respectively; error rates were 5.7%, 2.9%, 0, respectively. The elimination results of the three methods were consistent. The elimination time of method two was significantly shorter than that of method one (P<0.01); the elimination time of method three was significantly shorter than those of method one and method two (P<0.01). There was no significant difference in error rate of 3 methods (P>0.05). CONCLUSIONS: The automatic cyclic elimination method of outliers based on Grubbs rule and MATLAB language can significantly shorten the elimination time of outliers in data of drug bitterness evaluation, improve the efficiency of data processing, and is suitable for drug bitterness evaluation.
KEYWORDS Grubbs rule; MATLAB language; Outliers; Elimination; Medicinal material; Bitterness evaluation
對中藥湯劑的苦味實施有效遮掩是提高患者依從性的重要方法,而中藥藥材及其湯劑苦度客觀評價的實現是進行中藥苦味遮掩的前提[1]。現有中藥苦度的評價方法主要有體內和體外兩類,分別是經典人群口感評價方法(THTPM,以下簡稱“口嘗法”)[2]和電子舌評價方法[3-4]。但由于口嘗法的個體差異性和主觀性以及電子舌易受環境(溫度、濕度)及系統狀態的影響,常常會使得個別苦度評價數據值偏離預期[5-7]。因此,對試驗數據中異常值進行準確判定及剔除是確保苦度評價結果更符合客觀實際的重要環節。
現有的異常值判定規則及檢驗標準包括格拉布斯(Grubbs)檢驗[8]、狄克遜(Dixon)檢驗[9]等,其中Grubbs檢驗借助計算器或Excel表格進行計算,并通過查對臨界值表進行異常值的判定和剔除,是應用較為普遍的方法之一。然而上述檢驗方法的實現需要煩瑣的計算步驟和流程,效率較低且容易出錯[10]。在計算機技術高度發達的今天,能否基于數學家預設的檢驗規則,通過一定的自動化方法和程序來實現批量、快速、準確、系統的苦度測試數據中異常值的判定及剔除,尚未見公開報道。鑒于此,本研究建立了一種基于Grubbs規則和MATLAB語言對苦度測試數據中異常值進行快速、批量、準確判定和剔除的方法,以異常值剔除時間和錯誤概率為指標,就上述方法與常規方法在口嘗苦度評價數據及電子舌相關響應值處理中的應用效果進行評價和比較,旨在更加快速、準確地剔除苦度測試數據中的異常值,提高試驗數據的分析效率,現報道如下。
1 材料
BSA224S-CW型電子天平(德國Sartorius公司);JXJ-Ⅱ型臺式離心機(上海安亭科學儀器廠);ASTREE-Ⅱ型電子舌檢測裝置[法國Alpha MOS公司,配有7個電子舌傳感器(序號分別為ZZ、BA、BB、CA、GA、HA、JB),測試運行溫度:25 ℃]。
鹽酸小檗堿原料藥(四川省玉鑫藥業有限公司,批準文號:國藥準字H20044706,批號:101002);明黨參(批號:110224)、茯苓(批號:110105)、通草(批號:101122)、天花粉(批號:110105)、白薇(批號:110108)、益母草(批號:110108)、白及(批號:110118)、當藥(批號:110224)、苦楝皮(批號:110118)、蓮子心(批號:101121)、川木通(批號:110224)等11種中藥飲片均購自河南中一藥業公司,由河南中醫藥大學第一附屬醫院藥學部陳天朝主任藥師鑒定為真品,均符合2015年版《中國藥典》(一部)標準。其余試劑均為分析純,水為純化水。
2 方法
2.1 待測樣品的制備及苦度值定性、定量標準
2.1.1 口嘗參比溶液的制備及苦度值(I )定性、定量標準 采用口嘗法評價藥物苦度需先對志愿者進行苦度標準化培訓,然后以標準化苦度為參照進行樣品的苦度評價。根據本課題組前期成果及相關文獻[11-13],以水為溶劑制備5種不同質量濃度的鹽酸小檗堿溶液作為口嘗參比溶液,以代表5種苦度口感,其對應的I值定性描述、等級及定量范圍見表1。
2.1.2 口嘗待測樣品的制備 為使待測樣品更加接近臨床實際,按2015年版《中國藥典》(一部)中明黨參、茯苓、通草等10種飲片“用法與用量”項下用藥范圍平均值(如通草用量為3~5 g,則取4.0 g)的10倍,參照文獻[14]煎煮方法制得明黨參、茯苓、通草、天花粉、白薇、益母草、白及、當藥、苦楝皮、蓮子心質量濃度分別為22.5、31.25、10、31.25、18.75、48.75、26.25、22.5、11.25、8.75 mg/mL的口嘗待測樣品(溶液總體積均為4 000 mL,質量濃度均按生藥量計)。
2.1.3 電子舌待測樣品的制備 取川木通4.5 g(用量標準同“2.1.2”項),參照文獻[15]煎煮方法制得質量濃度為11.25 mg/mL(按生藥量計)的電子舌待測樣品。
2.2 口嘗試驗
2.2.1 志愿者篩選 本研究經河南中醫藥大學第一附屬醫院醫學倫理委員會審查批準后,對招募的志愿者進行了包括苦味敏感度等在內的篩選[16]。納入標準:(1)因20歲時味蕾細胞總數達到最高值,味覺較為敏感[17],故選擇20~30歲成年人;(2)無嚴重過敏史、遺傳病史,無膽囊炎,無不良嗜好,且近期無疾病史。排除標準:(1)最近2 d曾飲酒或吸煙者;(2)神經過度緊張者;(3)認為梔子黃水溶液有苦味者;(4)品嘗溶液前2 h進食(尤其是刺激性食物)者。本研究最終選擇健康志愿者20名(男性9名、女性11名)。上述志愿者均知情同意并簽署了知情同意書。
2.2.2 口嘗試驗 以不同質量濃度的鹽酸小檗堿參比溶液對20名志愿者進行口嘗試驗的苦度標準化培訓,隨后依次進行單組口嘗試驗和多組口嘗試驗。單組口嘗試驗:志愿者將37 ℃的通草口嘗待測樣品含于口中,15 s后吐出、漱口,并在苦度評價表中填入結果;多組口嘗試驗:志愿者在通草口嘗試驗的基礎上,依次對“2.1.2”項下其余9種藥材口嘗待測樣品進行苦度評價,方法同單組口嘗試驗,各藥材口嘗評價緩沖期為40 min。
2.3 電子舌測試
參照文獻[18]的方法對川木通電子舌待測樣品重復進行電子舌測試,每個傳感器均重復測量10次。
2.4 苦度評價數據來源
2.4.1 口嘗試驗苦度評價數據來源 以通草口嘗待測樣品的苦度評價數據(I值)為單組數據源,以通草、明黨參等10種藥材口嘗待測樣品的10組數據(每種藥材對應的I值為1組)為多組數據源。
2.4.2 電子舌測試苦度評價數據來源 以上述川木通電子舌待測樣品的7組數據(每個電子舌對應的傳感器響應值為1組)為多組數據源。
2.5 異常值剔除
本研究采用如下3種方法進行異常值剔除:基于Grubbs規則的查表逐一剔除法(方法一)、基于Grubbs規則的Excel軟件剔除法(方法二)以及本研究建立的基于Grubbs規則和MATLAB語言的異常值自動循環剔除法(方法三)。同時,以異常值剔除時間和錯誤概率為指標,評價上述3種方法的應用效果。其中,異常值剔除時間為計時器所記錄的自異常值剔除開始至結束所用的時間,錯誤概率(P)=n/m×100%[將每1人對1組數據計算1次定義為1人次,x人對y組數據分別計算1次,則總人次記為m(m=x×y);若其中第i人對其計算的共ni組數據計算錯誤,則計算錯誤的總人次記為n(n=Σni)人次]。
2.5.1 方法一 (1)排列數據:將n個測量數據由小到大排列;(2)計算其平均值(x)和標準差(s);(3)計算偏離值(Dmax/Dmin),即平均值與最大值/最小值差值的絕對值;(4)確定可疑值(xi):判定偏離值大小,偏離值大的為可疑值;(5)計算Gi值:Gi=│xi -x│/s(式中,i表示可疑值的排列序號;Gi為Grubbs檢驗的統計量,即可疑值與均值的差的絕對值再除以標準差);(6)異常值判定:顯著水平(α)取0.01、0.05或0.1,通過查閱Grubbs臨界值表[7]得臨界值Gs,計算Gi/Gs>1是否成立:若成立,則xi為異常值;否則這組數中沒有異常值;(7)當xi為異常值時,將xi剔除,然后繼續對剩余數據按照上述方法進行異常值的判定和剔除,直到這組數據中無異常值;(8)重復上述步驟對其他組進行判定與剔除。
2.5.2 方法二 采用Excel 2010軟件建立列表進行排序,并計算x、s、Gi等參數,按“2.5.1”項下步驟進行異常值的判定與剔除。
2.5.3 方法三 (1)單組數據異常值的循環剔除:參照“2.5.1”項,①錄入原始數據(x)、顯著水平(α)和尾數值(tail)后,輸入函數[xnew,del,index]=Grubbs(x,α,tail),具體計算過程參照文獻[7]。②基于MATLAB語言并按照算法流程圖(見圖1)編制相關程序。③操作方法:上述操作在Windows 7或以上版本、并基于MATLAB 7.0及以上版本運行,將編寫相應程序的“M”文件拷至MATLAB的工作路徑中,在選定顯著水平以及尾數值后,于MATLAB的命令窗口內輸入原始待檢數據矩陣,然后運行相應命令,即可實現對異常值的批量、快速、循環剔除。(2)多組數據異常值的循環剔除:基于MATLAB語言編制相關程序、操作方法同“單組數據異常值的循環剔除”,其算法流程見圖2。
2.5.4 不同異常值剔除方法應用效果的比較 隨機選擇5名研究者,采用上述3種方法對“2.4”項下數據源的異常值進行判定及剔除,記錄每種方法的剔除時間和錯誤概率,并進行比較。
2.6 統計學方法
采用SPSS 22.0軟件對數據進行統計分析。計量資料以x±s表示,組間比較采單因素方差分析;計數資料以率表示,組間比較采用Kruskal-Wallis檢驗。P<0.05為差異有統計學意義。
3 結果
3.1 苦度評價結果
20名志愿者單組、多組口嘗試驗以及電子舌測試苦度評價結果分別見表2~表4。
3.2 異常值剔除結果
3.2.1 方法一 (1)單組口嘗試驗苦度評價數據源的異常值剔除結果:志愿者編號為7和11的數據為異常值,應予以剔除;(2)多組口嘗試驗苦度評價數據源的異常值剔除結果:第2組7和14號、第3組7和11號、第4組11號、第8組12號的數據均為異常值,應予以剔除。(3)電子舌測試苦度評價數據源的異常值剔除結果:ZZ傳感器的第1次測試數據、BA傳感器的第1次測試數據和HA傳感器的第1次測試數據均為異常值,應予以剔除。
3.2.2 方法二 單組、多組口嘗試驗以及電子舌測試苦度評價數據源的異常值剔除結果同“3.2.1”。
3.2.3 方法三 單組、多組口嘗試驗以及電子舌測試苦度評價數據源的異常值剔除結果同“3.2.1”。(1)單組口嘗試驗苦度評價數據源輸出矩陣為[0.500 0 0.600 0 0.800 0 0.600 0 0.500 0 0.500 0 0.800 0 0.700 0 0.500 0 0.500 0 0.500 0 0.800 0 0.900 0 0.800 0 0.600 0 0.800 0 0.600 0 0.500 0],剔除的測試數據為[1.500 0 2.200 0],剔除的測試數據原始編號為[7 11],即剔除了志愿者7和11對應的數據(1.5、2.2),詳見圖3。(2)多組口嘗苦度評價數據源輸出新矩陣為[20×1 double] [18×1 double] [18×1 double] [19×1 double] [20×1 double] [20×1 double] [20×1 double] [19×1 double] [20×1 double] [20×1 double](注:[20×1 double]表示為20行1列的雙精度數據矩陣,下同),剔除值矩陣為[] [2×1 double] [2×1 double] [2.600 0] [] [] [] [2] [] [],剔除值的編號矩陣為[] [2×1 double] [2×1 double] [11] [] [] [] [12] [] []。其中,共顯示“數據組不含溢出值!”6次,提示10組數據中有6組不含異常值,而第2、3、4、8組數據均存在異常值,在MATLAB中打開相應矩陣,即可得到相應的數據,詳見圖4。(3)多組電子舌苦度評價數據源輸出新矩陣為[9×1 double] [9×1 double] [10×1 double] [10×1 double] [10×1 double] [9×1 double] [10×1 double],剔除值矩陣為[3.412 8e+003] [1.138 9e+003] [] [] [] [1.473 6e+003] [],剔除值的序號矩陣為[1] [1] [] [] [] [1] [],說明第1列的第1個數據、第2列的第1個數據和第6列的第1個數據均為異常值,應予以剔除,詳見圖5。
3.3 3種剔除方法的比較結果
方法二的剔除時間顯著短于方法一,方法三的剔除時間顯著短于方法一和方法二,差異均有統計學意義(P<0.01);除方法三的錯誤概率全部為0,方法一和方法二的錯誤概率分別為5.7%~20.0%、0~4.0%,但組間比較差異均無統計學意義(P>0.05),詳見表5。
4 討論
常用的苦度評價方法包括口嘗法和電子舌法,均可因志愿者個體差異及電子舌環境差異而存在異常值[6],故需要對其進行合理判定及剔除。Grubbs法為目前常用異常值剔除的方法之一,是一種通過將統計量Gi及其對應臨界值進行比較來判定和剔除異常值的檢驗方法,適用于單組數據不超過100的樣本。此外,Grubbs法每次操作僅能對單組數據中最大值或最小值中的1個進行剔除,故當該組存在多個異常值時,需要進行多輪循環剔除,導致該方法存在效率低、易錯風險大等缺點[19]。由此可見,如何快速運用Grubbs規則進行異常值剔除,對提高試驗效率顯得尤為重要。為此,本研究以2015年版《中國藥典》(一部)“性狀”項下描述為“味淡”“味微苦”“味苦”的11種中藥飲片為對象[每種飲片只有1種味覺描述,以保證苦度評價的準確性[20]。此外,口嘗法選擇10種不同苦味程度的飲片進行評價;由于電子舌傳感器較為敏感,且有7個傳感器同時進行測試,故選擇苦味閾值較低的單味飲片川木通進行測試],建立基于Grubbs規則和MATLAB語言的異常值自動循環剔除法;以剔除時間和錯誤概率為指標,對上述方法與基于Grubbs規則的查表逐一剔除法和Excel軟件剔除法的應用效果進行比較。
本研究結果顯示,基于Grubbs規則和MATLAB語言的異常值自動循環剔除法的剔除時間顯著短于其他兩種方法,差異均有統計學意義,提示該方法能有效縮短異常值剔除所用的時間。該方法基于MATLAB語言進行計算機運算,是所耗時間明顯更短的根本原因。基于Grubbs規則和MATLAB語言的異常值自動循環剔除法的錯誤概率與其他兩種方法比較差異均無統計學意義,提示三者間并無明顯差異,這可能與受試志愿者數量較少、樣本量較小有關。
綜上所述,基于Grubbs規則和MATLAB語言的異常值自動循環剔除法可快速、準確、批量地進行苦味異常值的多輪循環剔除,并一次性給出剔除結果,可免除反復核對臨界值表、逐個逐級剔除數據的煩瑣操作,有助于縮短異常值剔除時間、提高原始數據處理效率,可為醫藥生產、研發及其他相關的數據測試與分析領域中異常值的判定與剔除提供參考。但由于本法在MATLAB語言下進行,因此要求操作人員具備簡單的MATLAB語言基本知識,加之軟件運行要求較高,故有待于后續研究進一步完善。
參考文獻
[ 1 ] 劉斌斌,簡暉,田佳明,等.中藥矯味與掩味技術的研究進展及問題分析[J].中國實驗方劑學雜志,2016,22(16):229-234.
[ 2 ] LI L,NAINI V,AHMED SU. Utilization of a modified special-cubic design and an electronic tongue for bitterness masking formulation optimization[J]. J Pharm Sci,2007,96(10):2723-2734.
[ 3 ] 李學林,陳鵬舉,桂新景,等.電子舌在羥丙基-β-環糊精抑苦規律研究中的應用[J].中草藥,2017,48(20):4235-4244.
[ 4 ] LI X,GAO X,LIU R,et al. Optimization and validation of the protocol used to analyze the taste of traditional Chinese medicines using an electronic tongue[J]. Exp Ther Med,2016,12(5):2949-2957.
[ 5 ] FIELD MS. Application of robust statistical methods to background tracer data characterized by outliers and left-censored data[J]. Water Res,2011,45(10):3107- 3118.
[ 6 ] BUCKLEY JA,GEORGIANNA TD. Analysis of statistical outliers with application to whole effluent toxicity testing[J]. Water Environ Res,2001,73(5):575-583.
[ 7 ] 中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會. GB/T4883-2008數據的統計處理和解釋:正態樣本離群值的判斷和處理[S].北京:中國標準出版社,2008:4-5.
[ 8 ] JAIN RB. A recursive version of Grubbs’ test for detecting multiple outliers in environmental and chemical data[J]. Clin Biochem,2010,43(12):1030-1033.
[ 9 ] GRAAFLAND H,SEIGNALET J,DONADIO D,et al.Our experince with antiglobulin consumption (Dixon test) in the study of antibodies bound to platelets[J]. Rev Fr Transfus Immunohematol,1981,24(4):389-404.
[10] 尹江麗,王琳靜.兵器試驗中的異常值檢驗[J].四川兵工學報,2013,34(6):137-139.
[11] 中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會. GB/T12315-1990感官分析方法學排序法[S].北京:中國標準出版社,2008:4-5.
[12] 祝國強,杭國明,滕海英,等.談談兩總體比較的非參數檢驗方法[J].數理醫藥學雜志,2011,24(5):524-525.
[13] 劉瑞新,張杏芬,李學林,等.3種口嘗評價方法用于藥物苦度評價的比較[J].中國實驗方劑學雜志,2013,19(20):118-122.
[14] 李學林,吳子丹,劉瑞新,等.口嘗法評價中藥湯劑苦味的研究[J].中國實驗方劑學雜志,2011,17(23):11-13.
[15] 劉瑞新,李慧玲,李學林,等.基于電子舌的穿心蓮水煎液的掩味效果評價研究[J].中草藥,2013,44(16):2240- 2245.
[16] 李學林,王盼盼,劉瑞新,等.3種掩味劑單獨或聯合應用對黃柏的掩味作用探究及掩味前后化學成分的比較[J].中國實驗方劑學雜志,2017,23(2):7-11.
[17] 王優杰,徐德生,馮怡.中藥及其制劑苦味評價方法的建立[J].中國中藥雜志,2007,32(15):1511-1514.
[18] LIU R,ZHANG X,ZHAGN L,et al. Bitterness intensity prediction of berberine hydrochloride using an electronic tongue and a GA-BP neural network[J]. Exp Ther Med,2014,7(6):1696-1702.
[19] 周中漢,王漢江,李梅,等.利用DPS剔除測量數據中的異常值[J].計量技術,2007(10):61-63.
[20] 國家藥典委員會.中華人民共和國藥典:一部[S].2015年版.北京:中國醫藥科技出版社,2015:210.
(收稿日期:2018-05-02 修回日期:2018-10-29)
(編輯:張元媛)