春 柳,馮貞貞,李建生,**,謝 洋,趙虎雷,韓偉紅,王曉春
(1.河南中醫藥大學呼吸疾病中醫藥防治省部共建協同創新中心/河南省中醫藥防治呼吸病重點實驗室 鄭州 450046;2.河南中醫藥大學第一附屬醫院 鄭州 450000)
證候研究已經成為制約中醫藥發展的一個主要問題,尤其體現在明確診斷方面[1],辨證的準確與否,是決定臨床療效的關鍵。多數研究[2-5]都致力于采用統計方法篩選與證候相關的癥狀,并計算各癥狀對證候的貢獻度,以 “主癥+次癥” 的模式建立診斷模型,這些對證候診斷規范建立有一定意義。然而,癥狀作為辨證的依據往往不是孤立的,而是相互聯系的,一些相關癥狀共同出現時,可以形成各自構成者原先不具備的新的辨證價值,或大于原先構成者各自辨證價值的累加[6]。因此,在明確常見證候主要癥狀的前提下,探討癥狀間關系及其對證候的貢獻度,進一步明確證候診斷依據,對提高證候診斷標準的診斷效能具有重要意義。已往基于597例654份新冠肺炎臨床調查數據,探討了新冠肺炎10個常見證候及其癥狀特征;并以濕熱蘊肺證為例,結合關聯規則與貝葉斯網絡技術,初步建立了明確證候的癥狀間關系及其對證候貢獻度的方法[7]。本研究進一步探討新冠肺炎各常見證候中常見癥狀群及其對證候的貢獻度、初步建立常見證候診斷依據,以期為建立新冠肺炎中醫證候診斷標準提供依據。
本研究數據來源于2020年2月1日-2020年2月26日河南省定點醫院采集的597例654份新冠肺炎患者臨床調查資料。具體西醫診斷及中醫辨證標準、納排標準、調查內容與質量控制參見有關文獻[4]。
1.2.1 關聯規則
采用SPSSModeler 14.1軟件,構建 “數據源-類型-Apriori-網絡” 數據流。篩選各個證候中頻率≥10.0%的癥狀輸入到關聯規則模型中,設置最小支持度10%,最小置信度80%,指定前項中包含的最大項目數為1。構建各常見證候中關聯較強的癥狀組合。
1.2.2 貝葉斯網絡
基于SPSSModeler14.1軟件,以各個證候為目標變量,以篩選出頻率≥15.0%的癥狀為輸入變量,建立貝葉斯網絡模型。構建各個證候中癥狀間的因果關系,并用條件概率定量的方式表示其強弱程度。
將同時滿足以下條件的癥狀組合作為各證候中常見癥狀群:①關聯規則中支持度>10%、置信度>80%及提升度>1的二項關聯組合;②貝葉斯網絡條件概率≥0.45的癥狀組合。最終得出新冠肺炎各常見證候的常見癥狀群。并經貝葉斯公式進一步推導,得出每組癥狀群出現時各個常見證候出現的條件概率,將其作為證候診斷的貢獻度。
2.1.1 頻數分布
涉及病例90份。頻率≥10.0%的癥狀25個,包括乏力(44.44%)、發熱(40.00%)、咳嗽(40.00%)、舌質淡(37.78%)、苔白膩(28.89%)等。
2.1.2 癥狀間的關聯規則分析
二項關聯分析顯示強關聯規則有6條,包括咳嗽?胸悶,舌質淡?脈濡,發熱?惡寒等(表1)。

表1 濕遏肺衛證癥狀間二項強關聯規則
2.1.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有5組,分別是:頭身困重、乏力(0.45);脈浮、苔白膩(0.73);咳嗽、痰少(0.54);胸悶、咳嗽(0.47);惡寒、發熱(0.53)(表2)。

表2 濕遏肺衛證癥狀群條件概率
2.2.1 頻數分布
涉及病例140份。頻率≥10.0%的癥狀25個,包括舌質淡(55.71%)、咳嗽(44.29%)、乏力(44.29%)、發熱(41.43%)、苔白膩(30.71%)等。
2.2.2 癥狀間的關聯規則分析
二項關聯分析顯示強關聯規則有6條,包括肢體酸痛?頭痛,舌質淡?苔白膩,舌質淡?脈濡等(表3)。

表3 寒濕郁肺證癥狀間二項強關聯規則
2.2.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有5組,分別是:苔白膩、舌質淡(0.53);惡寒、發熱(0.45);痰少、痰白(0.58);乏力、苔厚(0.66);咳嗽、痰白(0.91);頭痛、肢體酸痛(0.94)(表4)。

表4 寒濕郁肺證癥狀群條件概率
2.3.1 頻數分布
涉及病例34份。頻率≥10.0%的癥狀28個,包括發熱(47.06%)、惡寒(41.18%)、氣短(41.18%)、乏力(41.18%)、鼻塞(38.24%)等。
2.3.2 癥狀間的關聯規則
二項關聯分析顯示強關聯規則有9條,包括咽痛?咽干,咽干?咽痛,咳嗽?痰黃等(表5)。

表5 風熱犯肺證癥狀間二項強關聯規則
2.3.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有5組,分別是:流涕、鼻塞(0.83);咽干、咽痛(0.96);舌質紅、脈浮數(0.81);痰黃、咳嗽(0.96);胸悶、胸痛(0.70)(表6)。

表6 風熱犯肺證癥狀群條件概率
2.4.1 頻數分布
涉及病例121份。頻率≥10.0%的癥狀36個,包括發熱(53.72%)、咳嗽(47.93%)、舌質紅(45.45%)、脈數(43.80%)、苔膩(42.15%)等。
2.4.2 癥狀間的關聯規則分析
二項關聯分析顯示強關聯規則有11條,包括咳嗽?痰黃,胸悶?氣促,舌質紅?舌質紫暗等(表7)。

表7 濕熱蘊肺證癥狀間二項強關聯規則
2.4.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有12組,主要包括:口渴、發熱(0.50);痰粘稠、痰黃(0.78);脈數、口渴(0.61);舌質紅、脈數(0.57)(表8)。

表8 濕熱蘊肺證癥狀群條件概率
2.5.1 頻數分布
涉及病例93份。頻率≥10.0%的癥狀29個,包括低熱(55.91%)、咳嗽(46.24%)、納呆(43.01%)、乏力(41.94%)、苔白膩(39.78%)等。
2.5.2 癥狀間的關聯規則分析
二項關聯分析顯示強關聯規則有7條,包括頭身困重?脘痞,苔白膩?脈濡,咳嗽?胸悶等(表9)。

表9 濕阻肺胃證癥狀間二項強關聯規則
2.5.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有6組,分別是:舌質淡、脈滑(0.59);苔白膩、脈濡(0.93);痰少、痰粘稠(0.64);胸悶、咳嗽(0.76);納呆、嘔惡(0.96);脘痞、頭身困重(0.77)(表10)。

表10 濕阻肺胃證癥狀群條件概率
2.6.1 頻數分布
涉及病例93份。頻率≥10.0%的癥狀33個,包括納呆(44.09%)、發熱(41.94%)、咳嗽(40.86%)、胸悶(40.86%)、乏力(40.86%)等。
2.6.2 癥狀間的關聯規則
二項關聯分析顯示強關聯規則有9條,包括大便秘結?腹脹,咳嗽?痰黃,胸悶?氣促等(表11)。

表11 疫毒閉肺證癥狀間二項強關聯規則
2.6.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有7組,分別是:胸悶、氣促(0.88);痰黃、咳嗽(0.47);痰少、痰粘稠(0.60);發熱、煩躁(0.46);大便秘結、腹脹(0.99);舌質紅、苔黃膩(0.94);脈滑數、舌質紫暗(0.76)(表12)。

表12 疫毒閉肺證癥狀群條件概率
2.7.1 頻數分布
涉及病例29份。頻率≥10.0%的癥狀24個,包括呼吸困難(44.83%)、氣促(41.38%)、發熱(41.38%)、納呆(41.38%)、神昏(37.93%)等。
2.7.2 癥狀間的關聯規則
二項關聯分析顯示強關聯規則有8條,包括胸悶?喘息,苔厚膩?舌質紫暗,大汗淋漓?四肢逆冷等(表13)。

表13 內閉外脫證癥狀間二項強關聯規則
2.7.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有6組,分別是:氣促、呼吸困難(0.83);苔厚膩、舌質紫暗(0.95);大便秘結、口唇紫暗(0.45);四肢逆冷、大汗淋漓(0.96);大汗淋漓、口唇紫暗(0.45);神昏、口唇紫暗(0.66)(表14)。

表14 內閉外脫證癥狀群條件概率
2.8.1 頻數分布
涉及病例55份。頻率≥10.0%的癥狀26個,包括發熱(56.36%)、納呆(43.64%)、咳嗽(40.00%)、嘔惡(32.73%)、舌質淡(29.09%)等。
2.8.2 癥狀間的關聯規則分析
二項關聯分析顯示強關聯規則有9條,包括乏力?自汗,咳嗽?氣短,納呆?嘔惡等(表15)。

表15 肺脾氣虛證癥狀間二項強關聯規則
2.8.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有7組,分別是:苔薄、脈浮(0.45);脈沉細、苔白膩(0.89);咳嗽、胸悶(0.50);氣短、咳嗽(0.46);腹脹、便溏(0.88);納呆、嘔惡(0.93);乏力、納呆(0.46)(表16)。

表16 肺脾氣虛證癥狀群條件概率
2.9.1 頻數分布
涉及病例27份。頻率≥10.0%的癥狀26個,包括咽干(44.44%)、干咳(44.44%)、乏力(44.44%)、自汗(44.44%)、舌質紅(44.44%)等。
2.9.2 癥狀間的關聯規則
二項關聯分析顯示強關聯規則有8條,包括咳嗽?便溏、咳嗽?痰少、咽干?口渴等(表17)。

表17 氣陰兩虛證癥狀間二項強關聯規則
2.9.3 癥狀間的貝葉斯網絡分析
存在直接因果關系且條件概率≥0.45的癥狀組合有5組,分別是:口渴、咽干(0.90);咳嗽、痰少(0.59);神疲、苔薄(0.59);舌質紅、口渴(0.63);自汗、乏力(0.90)(表18)。

表18 氣陰兩虛證癥狀群條件概率
綜合以上結果,將最終得到的常見癥狀群作為證候的診斷依據,并經貝葉斯公式,得出各常見癥狀群對證候的貢獻度。
2.10.1 濕遏肺衛證
①發熱,惡寒;②咳嗽,胸悶;③頭身困重,乏力;④苔白膩,脈浮。對證候診斷的貢獻度分別為0.32、0.18、0.49、0.86。
2.10.2 寒濕郁肺證
①發熱,惡寒;②咳嗽,痰白;③頭痛,肢體酸痛;④舌質淡,苔白膩。對證候診斷的貢獻度分別為0.41、0.33、0.70、0.49。
2.10.3 風熱犯肺證
①咳嗽,痰黃;②鼻塞,流涕;③咽干,咽痛;④舌質紅,脈浮數。對證候診斷的貢獻度分別為0.10、0.37、0.18、1.00。
2.10.4 濕熱蘊肺證
①發熱,口渴;②咳嗽,痰黃;③胸悶,氣促;④納呆,頭身困重;⑤苔黃膩,脈滑數。對證候診斷的貢獻度分別為0.47、0.49、0.46、0.61、0.95。
2.10.5 濕阻肺胃證
①咳嗽,胸悶;②納呆,嘔惡;③頭身困重,脘痞;④苔白膩,脈濡。對證候診斷的貢獻度分別為0.34、0.42、0.82、0.53。
2.10.6 疫毒閉肺證
①胸悶,氣促;②痰黃,咳嗽;③煩躁,發熱;④大便秘結,腹脹;⑤舌質紅,苔黃膩;⑥脈滑數,舌質紫暗。對證候診斷的貢獻度分別為0.37、0.31、0.53、0.63、0.70、0.72。
2.10.7 內閉外脫證
①呼吸困難,氣促;②大汗淋漓,四肢逆冷;③舌質紫暗,苔厚膩。對證候診斷的貢獻度分別為0.44、
0.55、0.50。
2.10.8 肺脾氣虛證
①咳嗽,氣短;②乏力,自汗;③納呆,嘔惡;④腹脹,便溏;⑤苔白膩,脈沉細。對證候診斷的貢獻度分別為0.20、0.42、0.21、0.56、0.91。
2.10.9 氣陰兩虛證
①咳嗽,痰少;②口渴,咽干;③乏力,自汗;④舌質紅,脈細數。對證候診斷的貢獻度分別為0.16、0.52、0.46、0.60。
缺乏規范的證候診斷標準是目前制約中醫藥療效提高的關鍵問題之一[8]。近年來,隨著多種數據挖掘方法[9-13]逐步引入到中醫證候研究領域,越來越多的研究著力于證候診斷標準的建立。然而在中醫證候診斷標準建立的過程中,以往研究[14-17]多針對單一癥狀或癥狀間關系,只考慮單獨癥狀對證候的影響,如此將忽略具有密切聯系的癥狀群,具有一定的局限性。證候對應的癥狀組合有哪些?癥狀組合中,癥狀對證候的貢獻度如何以定量的形式表示出來[9],需要進一步探索。例如單獨的 “發熱” 這一癥狀對診斷表證的貢獻度有限,而當其與 “惡寒” 同時出現,作為癥狀群的時候,基本上就可以確定為表證。因此,在進行證候診斷規范建立的過程中要考慮到癥狀之間客觀存在的聯系,而不是把癥狀孤立起來,從單一癥狀研究走向對癥狀群的研究[18]。
關聯規則分析中支持度是癥狀在證候中同時出現的概率,置信度是衡量關聯規則的可信程度,二者結合來量化高頻癥狀之間的相互關系,使之作為證候中一組強關聯癥狀組合。貝葉斯網絡主要由節點和弧組成,其中每個節點代表一個隨機變量,而每條弧代表一個概率依賴[19]。如果兩個節點間有箭頭連接,說明兩者之間有因果聯系,并用條件概率表達事件變量間關系的強度。結合貝葉斯及關聯規則,能篩選出證候中關聯較強、具有普遍性的癥狀組合。因此,本研究結合運用兩種數據挖掘方法,將同時滿足 “關聯規則中支持度>10%、置信度>80%及提升度>1的二項關聯組合且貝葉斯網絡條件概率≥0.45” 的癥狀組合作為常見癥狀群。如在濕遏肺衛證中苔白膩&脈浮,支持度21.11%、置信度100.00%、提升度3.46,且在貝葉斯網絡中二者存在直接因果關系(條件概率為0.71)。通過貝葉斯公式進一步推導,得出苔白膩&脈浮對濕遏肺衛證的證候診斷貢獻度為0.86。最終得出濕遏肺衛證中發熱&惡寒、咳嗽&胸悶、頭身困重&乏力、苔白膩&脈浮4組常見癥狀群,其中苔白膩&脈浮對該證診斷貢獻度最大(0.86),該證多見于新冠肺炎輕型[20],新冠肺炎病因多為外感濕毒之邪[21],初期病在肺衛,當見苔白膩、脈浮等表證,故兩癥狀同時出現時對濕遏肺衛證證候診斷貢獻度較大;初期病位在表,為邪氣客于皮毛肌表,故有發熱、惡寒之表證;又因濕性重濁,為陰邪,易阻遏氣機,故見頭身困重、乏力,這兩組癥狀群對診斷濕遏肺衛證具有一定貢獻;此次新冠肺炎主要表現為肺系癥狀,多個證候均可見咳嗽、胸悶等肺系病癥狀,故這兩個癥狀同時出現時對診斷濕遏肺衛證特異性不強,貢獻度較小。此外,其他證候常見癥狀群及其對證候診斷的貢獻度與臨床較為相符,據此初步建立新冠肺炎常見證候診斷依據。
本研究中,肺脾氣虛證中的自汗、乏力,氣陰兩虛證中的舌質紅、脈細數,貝葉斯網絡分析顯示其條件概率分別為0.39、0.42,考慮以下原因,亦將其作為常見癥狀群:①本研究納入的肺脾氣虛證、氣陰兩虛證樣本量較小,研究結果可能出現偏倚;②關聯規則顯示以上兩組癥狀的支持度、置信度均較高;③結合專業知識,以上兩組癥狀對其證候的診斷具有重要意義,經貝葉斯公式得出其對證候的貢獻度較高,分別為0.42、0.60,故將其列為證候的診斷依據。由于樣本量較少的原因,邪陷心包證的計算無法實現預期目標。
綜上所述,在對新冠肺炎常見證候及其臨床特征進行分析的基礎上,進一步綜合關聯規則與貝葉斯網絡技術對主要癥狀進行相關性分析并計算貢獻度,建立常見證候診斷依據,具有較好的可行性。這不僅為新冠肺炎證候診斷標準的建立提供客觀依據,也為其他疾病的證候標準研究提供新的方法。然而,對于初步建立的證候診斷依據,如何將其組合形成具體的診斷條件,尚需進一步深入研究。