張一凡,周蘇娟,孟 江,左 蓉,林華堅,孫 悅,王淑美[.廣東藥科大學中藥學院/國家中醫藥管理局中藥數字化質量評價技術重點研究室/廣東高校(省)中藥質量工程技術研究中心,廣州 50006;.廣東藥科大學信息工程學院,廣州 50006]
姜炭是干姜炒炭后的炮制品,味苦而澀,其性守而不走,長于溫經止血,是臨床治療虛寒性出血癥的經典溫里止血藥[1]。目前對姜炭的質量控制,2020年版《中國藥典》的標準為“表面焦黑色,內部棕褐色,體輕,質松脆。味微苦,微辣。以含6-姜辣素(C17H26O4)計不得少于0.050%,浸出物不得少于26.0%”[1]。顏色氣味等指標存在主觀性較強、易受到周圍環境的影響和標準不一致等問題[2]。化學成分的含量測定,能在一定程度上反映飲片質量,但其測定耗時耗力,同時化學試劑會對環境造成一定的污染,另外飲片的顏色氣味和藥效成分的相關性不清楚。
機器視覺也稱為計算機視覺,是一門涉及人工智能、神經生物學、計算機科學、圖像處理及模式識別等多個領域的科學[3]。機器學習是一門人工智能的科學,研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能[4]。機器視覺融合機器學習(即機器視覺系統)可以把圖像信息數字化,同時利用計算機模擬人的判別準則去理解和識別圖像信息,達到分析圖像和成分間關系并做出結論的目的,最終用于飲片實際鑒別和質量控制。目前機器視覺系統在中藥飲片的定性定量分析中得到廣泛應用[5―8]。
姜炭的主要化學成分為姜酚、姜烯酚、姜酮等姜辣素類成分,現代藥理研究表明,姜辣素(6-姜酚、8-姜酚、10-姜酚)可以促進血液循環,抑制血栓和血小板聚集,而姜烯酚和姜酮具有良好的抗氧化和抗炎活性[9―12]。因此,本文選擇6-姜酚、8-姜酚、10-姜酚、姜酮、6-姜烯酚為姜炭不同炮制程度飲片的指標性成分,采用高效液相色譜(HPLC)法測定這5個成分含量,再通過機器視覺系統對飲片顏色特征進行數字化信息處理,再利用主成分分析(principal component analysis,PCA)、線性判別分析(principal component analysis,LDA)、偏最小二乘法-判別分析(partial least squares-discriminant analysis,PLSDA)和支持向量機(support vector machine,SVM)等機器學習算法建立基于飲片外觀顏色的定性判別模型和顏色-成分的定量模型,對不同炮制程度姜炭進行定性、定量分析,為姜炭炮制程度控制和質量評價提供參考依據。具體研究思路見圖1。
本研究所用主要儀器有LC-20A型HPLC儀(日本Shimadzu公司)、JP-105A型高速多功能粉碎機(永康市久品工貿有限公司)、BSA124S型萬分之一電子天平(德國Sartorius公司)、FUJI X-T2型數碼相機(日本Fuji公司)等。
本實驗共收集干姜飲片20批,分別來自四川、云南、安徽等產地,并經廣東藥科大學中藥學院劉基柱教授鑒定為姜科植物姜Zingiber officinaleRosc.的干燥根莖。課題組采用2020年版《中國藥典》(四部)收載的炮制通則項下砂燙法對20批干姜進行炮制,以河砂溫度為310~330 ℃分別炮制 7~10 min、13~17 min、18~22 min,得到輕炭飲片(外表焦黑、內黃色)、標炭飲片(外表焦黑、內棕褐色)、重炭飲片(內外均焦黑)[13],樣品來源信息見表1。6-姜酚(批號CHB180306)、8-姜酚(批號CHB180305)、10-姜酚(批號CHB180311)、6-姜烯酚(批號CHB180307)、姜酮(批號CHB19012)均購自成都克洛瑪生物科技有限公司,純度均大于98%。甲醇、乙腈為色譜純,水為蒸餾水。

表1 干姜及其輕炭、標炭、重炭飲片的樣品信息表
2.1.1 混合對照品溶液的制備 分別精密稱取6-姜酚對照品5.04 mg、8-姜酚對照品2.40 mg、10-姜酚對照品4.50 mg、6-姜烯酚對照品4.50 mg、姜酮對照品4.80 mg,分別置于1 mL容量瓶中,用甲醇溶解并定容,混勻,即得各單一對照品儲備液。分別精密吸取各單一對照品儲備液6-姜酚0.5 mL、8-姜酚0.2 mL、10-姜酚0.4 mL、6-姜烯酚0.2 mL、姜酮0.1 mL,置于10 mL容量瓶中,加甲醇至刻度,即得混合對照品溶液。
2.1.2 供試品溶液的制備 取樣品粉末(過80目篩)0.5 g,精密稱定,置50 mL三角錐形瓶中,精密加入20 mL甲醇,蓋好瓶塞,稱定質量,超聲(功率300 W、頻率50 kHz)提取40 min,放冷至室溫,用甲醇補足減失質量,搖勻,過0.45 μm微孔濾膜,取續濾液,封口,貼好標簽,于4 ℃冰箱中保存備用。
2.1.3 色譜條件 以UltimateTMXB-C18(4.6 mm×250 mm,5 μm)為色譜柱;甲醇(A)-0.1%磷酸溶液(B)為流動相進行梯度洗脫(0~15 min,45%A→50%A;15~20 min,50%A→70%A;20~60 min,70%A→85%A;60~70 min,85%A→95%A;70~80 min,95%A);檢測波長為280 nm;流速為 0.6 mL/min;進樣量為 10 μL;柱溫為30 ℃。
2.1.4 方法學考察 (1)專屬性考察:分別取混合對照品溶液、干姜及其不同炮制程度姜炭供試品溶液、空白溶液(甲醇),按“2.1.3”項下色譜條件進樣分析,色譜圖見圖2(空白圖略)。結果顯示,對照品溶液與供試品溶液中5種成分色譜峰保留時間一致,空白溶液無干擾,表明方法專屬性良好。
(2)線性關系考察:精密吸取上述混合對照品溶液,照倍比稀釋法,依次制備得到不同質量濃度的混合對照品溶液,按“2.1.3”項下色譜條件進樣分析,以對照品質量濃度為橫坐標(X)、其峰面積為縱坐標(Y),繪制標準曲線。結果見表2。

表2 6-姜酚等5種成分的線性關系考察結果
(3)精密度考察:取混合對照品溶液,按“2.1.3”項下色譜條件連續進樣6次。結果顯示,6-姜酚等5種成分峰面積的RSD均小于2.00%(n=6),表明儀器精密度良好。
(4)重復性考察:取干姜(SP03)粉末6份,精密稱定,按“2.1.2”項下方法制備供試品溶液,按“2.1.3”項下色譜條件進樣分析,代入線性回歸方程計算含量。結果顯示,6-姜酚等5種成分含量的RSD均小于3.00%(n=6),表明方法重復性良好。
(5)穩定性考察:將同一供試品溶液(SP03)分別于室溫下放置0、2、4、8、12、24 h時按“2.1.3”項下色譜條件進樣分析。結果顯示,6-姜酚等5種成分峰面積的RSD均小于3.00%(n=6),表明供試品溶液在24 h內基本穩定。
(6)加樣回收率考察:精密稱定已知含量的干姜(SP03)粉末6份,每份0.25 g,按照約1∶1的比例加入各對照品,按“2.1.2”項下方法制備供試品溶液,按“2.1.3”項下色譜條件進樣分析,計算得姜酮、6-姜酚、8-姜酚、10-姜酚、6-姜烯酚的平均加樣回收率分別為100.43%、100.47%、100.27%、100.02%、99.84%,RSD 分 別 為1.91%、1.38%、2.18%、2.07%、1.91%(n=6),表明方法準確度良好。
2.1.5 含量測定 取干姜及其不同炮制程度姜炭樣品粉末,按“2.1.2”項下方法制備樣品,按“2.1.3”項下色譜條件進樣分析,每個樣品重復測定3次,記錄各樣品峰面積,代入線性回歸方程求出各樣品中各成分的含量,結果見圖3。隨著炮制程度的加深,姜酮在炮制后產生且含量先增加后降低,標炭中含量最高;6-姜酚、8-姜酚和10-姜酚的含量逐漸降低;6-姜烯酚含量先增加后減少。
2.2.1 拍攝參數設置 拍攝參數為所用型號燈箱推薦參數:手動對焦模式,光圈F/8,快門速度1/60 s,IOS 200,圖像色彩為RGB模式,分辨率為4 000×4 000,圖像保存格式為jpeg格式。被拍攝樣品放置于燈箱底部的白紙正中央上,以減少背景顏色的干擾;采用三腳架固定鏡頭角度垂直向下,以防止角度偏移或拍攝過程中抖動引起飲片圖像失真。
2.2.2 圖像預處理 將樣品圖像進行降噪處理,減少圖像顏色失真,提高圖像質量;同時對圖像中的樣本與背景進行分離,提取目標區域,減少背景顏色的干擾。
(1)降噪處理:采用Bitonic濾波降噪器,除去由于光源不穩定、相機抖動等因素,在拍攝飲片的過程中會不可避免地引入噪聲或者雜色,結果示例見圖4。結果顯示,降噪后圖像在最大限度保留圖像原有信息的情況下對圖像噪點進行了一定的抑制或消除,提高了圖像的質量。
(2)目標區域選擇:在RGB顏色空間中,純黑色(R=0,G=0,B=0)背景能最大限度地減少背景的干擾,因此對飲片圖像進行前景與背景的分離。通過使用Matlab軟件中的Image Segmenter工具箱,對姜炭飲片圖像進行目標區域選擇。結果如圖5所示,藍色區域為自動識別飲片主體區域,藍色為勾畫前景后計算機學習識別的前景區域,然后通過勾畫背景色對背景進行自動識別并將背景色替換為純黑色。
2.2.3 圖片顏色特征值的提取 以RGB顏色空間為基準,通過Matlab軟件對樣本圖像的像素點進行顏色特征提取,得到R、G、B值;同時將RGB顏色空間分別轉化為L*a*b*顏色空間、HSV顏色空間,提取得到L*、a*、b*值和H、S、V值。
(1)RGB顏色空間特征值提取:RGB顏色空間,也稱三基色模式,是生活中最常用的一個模型。它以R(Red:紅)、G(Green:綠)、B(Blue:藍)3種基本色為基礎,進行不同程度的疊加,進而產生廣泛且豐富的顏色。R、G、B值的范圍均為0~255,通過選取圖像上的任一像素點,可獲得該像素點的R、G、B值。通過Matlab軟件提取圖片顏色特征值。
(2)L*a*b*顏色空間特征值提取:L*a*b*顏色空間由L*、a*和b*這3個要素組成,其中L*表示顏色的亮度(范圍0~100,L*=0表示黑色,L*=100表示白色),a*和b*為2個顏色通道,a*表示紅綠色軸(范圍-128~127,+a*表示紅色,-a*表示綠色),b*表示黃藍色軸(范圍-128~127,+b*表示黃色,-b*表示藍色)。由于L*a*b*顏色空間所計算處理顏色偏差程度與人們主觀感受相似,因此,將圖像從RGB轉換為L*a*b*[14]。RGB顏色空間無法直接轉化為L*a*b*顏色空間,需按照RGB-XYZ-L*a*b*進行轉換,轉換公式如下:
(3)HSV顏色空間特征值提取:HSV是一種比較直觀的顏色模型,它與人眼對顏色的主觀認識相對比較符合[15]。HSV顏色空間由色調(H)、飽和度(S)、明度(V)這3個參數組成。其中H為顏色的基本屬性,即為常用的顏色名稱,如青色、品紅、紅色等;S為顏色的鮮艷程度,飽和度越高則顏色越鮮艷,反之顏色越灰;V表示顏色的明亮程度。轉換公式如下:
2.2.4 機器視覺技術的精密度和穩定性考察 取干姜(SP15)樣品,按“2.2.1”項下拍攝參數在同一時間點內連續拍攝6次,連續6 d在同一時間點拍攝,并按“2.2.2”項下圖像預處理和“2.2.3”項下圖像顏色特征提取方法提取顏色特征。9個顏色特征值的RSD均小于3%,表明機器視覺技術的精密度、穩定性良好。
2.2.5 干姜及其不同炮制程度姜炭樣品顏色測量 為了保證樣品的代表性和均勻性,對干姜及其不同炮制程度姜炭進行顏色測量,每批次中隨機抽取40個飲片進行拍攝,共采集到3 200張飲片圖像。將獲得的飲片圖像按照“2.2.2”項下圖像預處理和“2.2.3”項下提取其顏色特征值,結果見表3。
表3 干姜及其不同程度姜炭的顏色特征值測定結果(±s,n=40)

表3 干姜及其不同程度姜炭的顏色特征值測定結果(±s,n=40)
樣品干姜輕炭飲片標炭飲片重炭飲片R G B L*a*b*H S V 184.98±4.70 99.00±11.92 68.05±10.63 61.23±3.29 168.23±5.49 77.87±7.98 54.37±8.02 60.23±3.10 110.15±7.58 43.11±2.98 31.10±4.82 44.80±2.89 69.30±1.95 34.62±3.72 23.74±3.82 25.13±1.38-0.73±0.86 5.12±1.39 3.25±1.23-2.13±0.44 32.29±1.74 23.85±3.58 16.89±2.88 9.75±0.66 261.15±6.63 139.77±6.83 96.08±15.01 86.45±4.65 65.97±2.15 30.54±3.13 21.32±3.15 23.62±1.21 43.19±2.97 16.90±1.17 12.20±1.89 17.57±1.13
從表3看出,在RGB顏色空間中,R、G、B3個特征值總體趨勢是隨著炮制程度的加深而降低的,這三者的降低造成干姜在炮制過程中隨著炮制程度的加深而呈現外觀明亮度的降低,即影響L*a*b*顏色空間的L*與b*,L*在炒炭過程中由69.30±1.95降低至23.74±3.82,b*在炮制過程中由32.29±1.74降低至9.75±0.66,這與干姜在炮制過程中外觀顏色由黃白色逐漸炭化變黑相吻合。而a*有波動,但變化幅度較小,可能因為外觀呈黑色以致紅綠色變化不明顯,因此無法在數值上體現炮制前后的差異性。HSV顏色空間中,H由261.15±6.63降低至86.45±4.65,說明在炮制過程中飲片外觀由淡黃色逐漸變為棕褐色;S總體來說呈下降趨勢,這與干姜在炮制過程中黃色調逐漸消退從而導致飽和度降低相一致;V值隨著炮制過程的加深導致黑色面積逐漸增加而降低。在各顏色值的變化過程中(a*除外)發現,從生品到輕炭,從輕炭到標炭,從標炭到重炭降低幅度依次減小,其中G、B、L*、S、V從標炭飲片到重炭飲片反而有略微的增加,這可能和不同炮制程度顏色比較接近,其中標炭飲片和重炭飲片表面均為焦黑色或黑色,顏色更為接近,且黑色對于藍綠色、飽和度區別不大,而出現數據比較接近的原因。故需要結合多個指標進行綜合判斷分析。
2.3.1 PCA模型判別分析 本實驗將干姜及其不同炮制程度姜炭樣品顏色特征作為輸入變量,建立基于顏色特征的PCA模型判別。該PCA模型中當主成分數為2時,累積解釋率為99.78%(PC1=85.47%,PC2=14.31%),前2個主成分能較好地解釋樣品99.78%的顏色特征,說明提取的信息具有較好的代表性。該PCA模型的得分如圖6所示,由圖可知,除了4批輕炭飲片與標炭飲片比較接近外,其余炮制品均能被較好分離,提示通過將顏色客觀量化從而區分不同炮制程度姜炭具有一定的可行性。后續實驗將采用有監督模式識別方法通過進一步學習提高判別的準確率。
2.3.2 有監督模式識別的干姜及其不同炮制程度姜炭的判別 為了提高模型對姜炭不同炮制品的判別效果,基于樣品圖像提取的顏色特征值,采用有監督模式識別方法,包括LDA、PLS-DA和SVM。以提取的9個顏色特征值(R、G、B、L*、a*、b*、H、S、V)作為自變量,樣品類別標簽(干姜、輕炭飲片、標炭飲片、重炭飲片)作為因變量,以樣品正確判別率為指標,采用10-折交叉驗證法和外部驗證法來評價模型性能。本次實驗共有干姜及其不同炮制程度姜炭樣品80批,將其隨機分為訓練集(56批)與驗證集(24批),訓練集用來訓練模型,從而選出模型的最佳參數;驗證集用于測試模型的應用效果。3種模型識別的識別結果如表4所示,PLS-DA對于不同炮制程度姜炭的交叉訓練模型效果較差,標炭飲片預測準確度為11/14;LDA和SVM對所有批次樣品識別的準確率都較高,兩者在交叉驗證訓練過程中對全部類別的預測準確度均達100%,在外部驗證中僅將1個標炭飲片樣品誤判為輕炭飲片樣品。綜上所述,LDA、SVM模型識別方法建立的模型對于姜炭炮制程度的預測結果準確快速,其中SVM對于學習和處理樣本顏色特征間存在的非共線問題具有較大的優勢,故選擇SVM用于接下來的不同炮制程度姜炭的定量模型。

表4 不同模型識別方法對干姜及其不同炮制程度姜炭的識別結果
2.4.1 顏色-成分相關性分析 使用SPSS 23.0軟件將干姜及其不同炮制程度姜炭的圖像顏色特征值與內在成分含量進行Pearson相關性分析,結果見表5。結果顯示,除6-姜酚、8-姜酚、10-姜酚與顏色特征值a*無差異外,其余各成分和顏色特征值均具有顯著差異性。姜酮與顏色特征值R、G、B、L*、b*、H、S、V呈顯著負相關關系,6-姜酚、8-姜酚和顏色特征值a*呈負相關關系,其他成分與顏色特征值均呈正相關關系。故進一步對顏色和5種成分進行定量預測模型分析。

表5 干姜及其不同炮制程度姜炭的圖像顏色特征值與內在成分的Pearson相關性分析結果
2.4.2 顏色-成分定量分析 將9個顏色特征值(R、G、B、L*、a*、b*、H、S、V)作為自變量,5個成分含量作為因變量,使用SVM建立成分含量回歸模型,采用10-折交叉驗證法和外部驗證法評價模型性能,以決定系數(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)作為回歸模型的評價指標。R2越大,RMSE越小,RPD值越大,表明定量模型的性能越好。樣品劃分方法同“2.3.2”項下,成分含量定量預測模型結果如表6所示。由表6可知,5種成分的RPD值均大于2,說明SVM對5種成分均有著較好的預測能力。各成分的驗證集相關系數(R2P)與訓練集的相關系數(R2C)中姜酮為0.633 9與0.683 3,其余4種成分的R2P和R2C均大于0.75,提示用SVM建立的模型預測5種成分含量時,除姜酮的穩定性較差,其余4種成分穩定性均較好。綜上,基于機器視覺顏色數字化融合SVM機器學習方法建立的定量模型可用于預測不同炮制程度姜炭中的6-姜酚、8-姜酚、10-姜酚、6-姜烯酚4種成分的含量。

表6 干姜及其不同炮制程度姜炭的顏色-成分含量定量模型結果
顏色特征是傳統中藥質量評價和中藥炮制程度判斷的重要標準,但由于不可避免的感官差異、主觀性等原因,顏色特征評價容易受到干擾。隨著技術的發展,計算機視覺系統在農業、食品、中藥和生物科學等領域得到了廣泛的應用。機器學習為人工智能的重要組成部分,通過一定數目樣本的學習能夠根據顏色特征進行樣品的鑒別,同時進行含量的預測。本文采用機器學習算法中應用最多的LDA、PLS-DA和SVM對不同炮制程度姜炭進行定性判別,結果LDA和SVM對所有批次樣品識別的準確率達到100%。相對于LDA,SVM是在統計學習理論的基礎上發展起來的,是一種專門研究小樣本條件下機器學習的理論,它也比PLS-DA具有更強的逼近能力和泛化能力;與LDA相比,SVM對于學習和處理樣本存在的非共線問題具有較大的優勢,SVM更適合用小樣本非共線性問題的建模預測[16]。故本研究將計算機視覺與SVM機器學習相結合,建立干姜及其不同炮制程度姜炭炮制品顏色參數和5種成分含量之間的定量模型,預測炮制過程中外部顏色與內部化學成分含量的變化,結果發現除了姜酮SVM模型的穩定性較差外,6-姜酚、8-姜酚、10-姜酚、6-姜烯酚4種成分的含量預測具有較高的預測精度、較好的穩定性和較小的預估錯誤率。因此,機器視覺系統可為姜炭等中藥飲片的質量鑒別和炮制程度的控制提供一種快速、簡單、高效的質量檢測方法,可為批量大生產和智能化生產提供科學分析依據。