崔紅新,楊帥朋,張濘杰,王子翰,黃 瓊,趙 迪,馮素香,3
1.河南中醫藥大學藥學院(鄭州 450046)
2.河南中醫藥大學呼吸疾病中醫藥防治省部共建協同創新中心(鄭州 450046)
3.河南中醫藥大學河南省現代中藥研發與應用工程研究中心(鄭州 450046)
在藥物制劑生產工藝過程中,為了達到最佳工藝條件,技術人員常把因素對工藝的影響作為重要課題研究[1-2]。傳統研究因素間關系的常用分析方法包括正交設計、均勻設計及回歸分析等,這些方法不僅需要統計的相關性判斷、假設檢驗等,還需要進行大量的試驗或足夠大的樣本量,同時傳統統計方法的結果形式比較單一,無法動態分析因素之間、因素和試驗結果指標間的相關關系[3-7]。粗糙集理論是一種能有效分析不精確、不完整和不一致信息數據的數學方法,不需要提供所處理數據之外的其他先驗知識,而是通過對數據進行分析和推理,挖掘隱含的關系,進而揭示因素之間動態變化的潛在規律。
粗糙集理論目前已廣泛應用于數據挖掘、故障檢測和工程控制等領域,但在醫藥領域中的應用較少[8-12]。本研究以《中醫藥統計學》中“優化經典名方‘四物湯’提取工藝,提高藥材的有效成分提取率”為例[13],以該案例中正交設計試驗預處理數據為數據來源,采用粗糙集理論決策方法,探討四物湯提取生產工藝過程中因素之間的相互作用,提高有效成分提取率,尋求最佳組合搭配。
粗糙集理論由波蘭數學家Z.Pawlak 于1982年提出[14]。該理論的基本思路是首先確立考察工藝的因素,對數據資料離散化處理,建立信息表,繼而形成條件屬性與決策屬性的決策表,進行決策表屬性約簡,利用粗糙集理論的決策分析系統,處理決策表的數據,得出條件屬性和決策屬性之間的決策規則模型。通過進一步分析決策規則模型,探尋各因素之間以及因素和結果指標之間的動態內在規律。
本研究旨在探究四物湯提取生產工藝過程中提取時間、加水量和提取次數對試驗指標藥材多糖成分含量的影響,利用正交設計的正交表L9(34)安排試驗,進行預處理[13],試驗因素水平及試驗結果分別見表1 和表2。

表1 四物湯提取因素水平Table 1.The extraction factor level of Siwu decoction

表2 四物湯提取因素正交試驗結果Table 2.Orthogonal test results of Siwu decoction extraction factors
利用正交設計試驗方案的數據作為論域,提取時間、加水量和提取次數作為條件屬性,多糖成分含量作為決策屬性,條件屬性按其數值從小到大進行離散,決策屬性按其數值從小到大進行離散,建立因素與試驗指標多糖成分含量的相關關系決策表,見表3。

表3 四物湯提取因素水平與多糖成分含量水平相關關系的決策表Table 3.The decision table of the correlation between the extraction factor level and the content level of polysaccharide in Siwu decoction
建立決策表后,進行屬性約簡,建立決策規則模型:Rx: desc([X]C)→desc([X]D),其中desc([X]C)表示因素提取時間、加水量和提取次數的特定取值,desc([X]D)表示試驗指標藥材多糖成分含量的特定取值。決策規則Rx: desc([X]C)→desc([X]D)表示因素提取時間、加水量和提取次數取不同水平時,指標多糖成分含量水平的變化。通過此決策規則模型可以探究因素對多糖成分含量的影響,以及因素之間相互作用的內在規律。
采用粗糙集軟件Rosetta 進行數據分析,將因素水平與多糖成分含量水平相關關系的決策表載入Rosetta 系統后,軟件基于粗糙集理論的KDD決策分析系統,根據粗糙集理論對決策表數據進行處理、逐步分析,得到決策規則結果。按照決策屬性的離散原則,決策屬性水平越高表示藥材多糖成分含量越高,提取效果越好,根據此規則對四物湯提取工藝規則表模型進行分析。利用Excel 軟件繪制三維曲面圖,橫軸分別表示提取時間、加水量或提取次數的水平,縱軸表示多糖成分含量的水平,曲面的不同顏色表示多糖成分含量的不同水平,水平顏色從高到低依次為淺灰色、粉色、淺藍色、綠色、深藍、黃色、深灰色、深橘色、橘色。
根據Rosetta 軟件的決策模型,按照選取支持度均達到最小值0.1 和置信度達到1 的標準,獲取Ga(genetic algorithm)規則表,見表4。

表4 四物湯提取工藝模型規則表Table 4.Rule table of the extraction process model of Siwu decoction
由表4 的決策規則1~9 條可以看出,提取時間水平為1、加水量水平為1~3 時,多糖成分含量總水平平均值為6/3;提取時間水平為2、加水量水平為1~3 時,多糖成分含量總水平平均值為17/3;提取時間水平為3、加水量水平為1~3 時,多糖成分含量總水平平均值為22/3。說明當提取時間水平、加水量水平增高時,多糖成分含量水平呈遞增趨勢,見圖1。

圖1 提取時間、加水量與多糖成分含量水平的三維曲面圖Figure 1.Three-dimensional curved surface diagram of extraction time, water content and polysaccharide content level
由表4 的決策規則10~18 條可以看出,提取時間水平為1、提取次數水平為1~3 時,多糖成分含量總水平平均值為6/3;提取時間水平為2、提取次數水平為1~3 時,多糖成分含量總水平平均值為17/3;提取時間水平為3、提取次數水平為1~3 時,多糖成分含量總水平平均值為22/3。說明當提取時間水平、提取次數水平增高時,多糖成分含量水平呈遞增趨勢,見圖2。

圖2 提取時間、提取次數與多糖成分含量水平的三維曲面圖Figure 2.Three-dimensional curved surface diagram of extraction time, extraction times and polysaccharide content level
由表4 的決策規則19~27 條可以看出,加水量水平為1、提取次數水平為1~3 時,多糖成分含量總水平平均值為6/3;加水量水平為2、提取次數水平為1~3 時,多糖成分含量總水平平均值為17/3;加水量水平為3、提取次數水平為1~3 時,多糖成分含量總水平平均值為22/3。說明當加水量水平、提取次數水平增高時,多糖成分含量水平呈遞增趨勢,見圖3。

圖3 加水量、提取次數與多糖成分含量水平的三維曲面圖Figure 3.Three-dimensional curved surface diagram of water addition, extraction times and polysaccharide content level
根據決策規則1~9 可知,當提取時間為3 水平、加水量為3 水平時,多糖成分含量為9 水平;由規則10~18 可知,當提取時間為3 水平、提取次數水平為3 或2 時,多糖成分含量水平為8 或9 水平;由規則19~27 可知,加水量為3 水平、提取次數水平為3 或2 時,多糖成分含量水平為8 或9 水平。綜合平衡以上三因素與試驗指標的內在關系,四物湯優化提取工藝的三因素三水平最佳搭配為提取時間為3 水平、加水量為3 水平、提取次數為2 水平,即提取時間為1.5 小時、加水量為1 ∶ 20、提取次數為2 次。
基于三維曲面圖,結合決策規則中提取時間、加水量、提取次數水平與多糖成分含量水平的動態變化規律可以發現,當提取時間、加水量、提取次數水平均增高時,多糖成分含量水平呈遞增趨勢。
本研究結果顯示,當提取時間為1.5 小時、加水量為1 ∶ 20、提取次數為2 次時,試驗結果最好,此結果與參考資料中采用正交設計分析的結果一致[13]。正交設計分析方法是利用方差分析的原理,多次對因素不同水平進行計算,得出最佳搭配,但該方法計算量大,且不能充分反映因素之間的內在聯系。本研究采用粗糙集理論方法能夠以動態變化形式,以結局指標與三因素不同水平變化影響的過程為研究重點,充分反映各因素之間以及因素和試驗結果之間的相關關系,從更深層次揭示因素之間的內在規律。
本研究結果表明,粗糙集理論方法能夠有效分析和推理不完整的數據信息,挖掘因素之間的相關關系,它不同于基于概率論為基礎的數據挖掘,不需要進行相關性的系列假設檢驗。與模糊數學理論及證據理論方法的數據挖掘相比,粗糙集理論方法不需要提供所處理信息之外的任何預知知識。因此,該方法可作為醫藥科學領域解決實際問題的一種實用方法。
綜上所述,本研究以四物湯為例,探究工藝因素之間以及因素與結果指標之間的相關關系,應用粗糙集理論決策規則模型的方法更全面地揭示事物之間的內在動態規律,并提供一種新穎的研究方法,從而進一步提高藥物制劑的工藝質量。