屈云艷,王 偉,許 寧,熊周璇,張婷婷,曲蒙蒙,高 梅,余海濱
(1.河南中醫藥大學,河南 鄭州 450000 2.河南中醫藥大學第一附屬醫院,河南 鄭州 450000)
支氣管擴張癥是由于遺傳、繼發感染、免疫等原因引起支氣管樹病理性、不可逆性擴張,進而反復發生化膿性感染的氣道慢性炎癥。病情持續進展會嚴重損壞患者正常肺組織及其功能,嚴重降低患者生活質量,無論是對個人還是社會,都造成了沉重的經濟負擔[1]。中醫藥在緩解支氣管擴張癥臨床癥狀、降低發作頻率、改善肺功能等方面有顯著療效。然而缺乏規范的證候診斷標準是限制中醫藥充分發揮療效的重要原因之一,因此對支氣管擴張癥常見證候及癥狀分布特點進行研究,對支氣管擴張癥證候診斷標準的建立尤其重要[2]。本研究基于有關支氣管擴張癥患者的病歷記錄,運用不同的統計學及數據分析方法,探究支氣管擴張癥的常見證型及其癥狀分布特點,為支氣管擴張癥中醫證型標準的建立提供客觀依據。
1.1 數據提取 基于醫院信息數據系統,提取2012年1月至2019年12月于河南中醫藥大學第一附屬醫院呼吸科住院的2 907例支氣管擴張癥患者的電子病歷,利用人機協同表型譜標注系統對所需陽性癥狀及證候詞條信息進行抽取[3]。
1.2 癥狀及證候術語規范 對癥狀及證候類數據的規范化替換、拆分主要參考《中醫臨床診療術語》[4]、《中醫證候鑒別診斷學》[5]等。如“咳痰,色黃”規范為“咳黃痰”,“口、鼻、咽干燥”拆分為“口干,鼻干,咽干”,“形體消瘦”和“近期體質量下降”統一為“消瘦”,證型“痰濁壅肺證”“痰濕蘊肺證”統一規范為“痰濕阻肺證”。
1.3 統計學方法 使用頻次描述統計規范化之后的臨床常見證候分布情況;采用Lantern 5.0軟件構建隱結構模型[6],應用爬山法(LTM-EAST)算法建立支氣管擴張癥隱結構模型,結合醫學專業知識綜合聚類并分析判斷常見證型;運用SPSS 20.0軟件,開展因子分析降維及系統聚類分析[7],用最大方差法得出旋轉因子載荷矩陣,提取公因子,設置平方歐氏距離計算各類之間的距離,組間聯接方法進行維度分類,進行系統聚類分析,結合樹狀圖及專業知識推斷出支氣管擴張癥的常見中醫證型。
2.1 2 907例支氣管擴張癥癥狀及證型分布情況 納入的2 907份病例記錄中涉及43個給定證候,其中頻率大于5%的有痰熱蘊肺證、痰濕阻肺證、肺氣陰兩虛證、痰瘀阻肺證、肺脾氣虛證、肺腎氣虛證,頻次≥10次的證型見表1。涉及219個癥狀,其中頻次>30次的癥狀有67個。見圖1。

表1 支氣管擴張癥中醫證型分布
2.2 癥狀隱結構模型分析
2.2.1 構建隱結構模型 應用Lantern 5.0軟件,對頻次>30次的癥狀,共計67個顯變量(X1、X2、X3……X67)進行隱結構模型構建,得出23個隱變量(Y0、Y1、Y2……Y23),每個隱變量有2個到多個隱類,共54個隱類。見圖1。

注:每條邊的粗細顯示兩個節點之間的互信息大小,邊越粗代表兩節點關系越密切,括號內數值為隱類個數
2.2.2 綜合聚類及模型詮釋 在構建的隱結構模型基礎上,依據醫學專業知識,綜合考慮某證候多個側面信息,選取能反映其所有側面的顯變量,進行綜合聚類及模型詮釋,得到該證候的綜合聚類模型。例如,隱結構模型圖(見圖1)中Y6中易感冒、乏力、面色白等,Y12中口渴、手足心熱、胸痛,Y13自覺發熱、口干、咽干,Y23自汗出、盜汗、腰痛,都與肺氣陰兩虛有關,因此對隱變量Y6、Y12、Y13、Y23進行綜合聚類分析,結果見圖2。對23個隱變量進行綜合聚類后,得到8個聚類即推出8個證型(記為Z1、Z2……Z8),見表2。對其他綜合聚類結果進行類似的詮釋分析,得到Z1—Z8共8個綜合聚類結果,具體對應證候見表2。

表2 隱結構綜合聚類

圖2 Z1綜合聚類結果
模型詮釋以Z1(肺氣陰兩虛證)為例,信息曲線圖顯示了累計信息覆蓋達到95%的癥狀特征分布情況,從圖3中可見咽干、口渴、口干、易感冒癥狀信息覆蓋率已達到95%。類概率分布表中隱變量Z1把數據分為S0、S1兩個隱類,其中S0占總人群的71%,S1占29%。每個癥狀有兩種表現形式,其中S0列代表癥狀不出現的概率,S1列代表癥狀出現的概率,見表3。以Z1為例,S1類人群中咽干、口渴、口干、易感冒、自汗出、盜汗、手足心熱癥狀出現的概率依次為0.8、0.63、0.81、0.78、0.54、0.16、0.10,而S0中出現上述癥狀的概率依次為0.08、0.03、0.13、0.17、0.15、0.01、0.07等,對比可知,癥狀在S1類人群中出現的概率較高,可認為是肺氣陰兩虛證的表現,S0則是沒有肺氣陰兩虛證表現。

注:紅色曲線表示各癥狀與Z1兩兩互信息(關聯程度)高低;藍色曲線表示各癥狀對Z1的互信息的累積覆蓋度

表3 Z1(肺氣陰兩虛證)概率分布表
2.3 系統聚類分析 使用SPSS軟件對頻次大于60次的52個癥狀進行因子分析。首先,對各變量之間的相關性進行檢測,檢測結果KMO值為0.711,Bartlett的球形度檢驗對應的P值小于0.001,表示各變量不獨立存在,相互之間有明顯關聯性,可進行因子分析,使用相關性矩陣方法分析,用最大方差法獲得旋轉因子載荷矩陣,最終提取18個公因子(記作F1、F2……F18),保留因子載荷系數≥0.3的變量。
對所提取的公因子進行系統聚類分析,并繪制聚類樹狀圖(見圖4),在選擇閾值為12.5的情況下,得到10類變量組合(記為C1、C2……C10),根據各公因子所代表的癥狀(因子載荷系數≥0.3),結合專業知識,推導出10個證型,其中C1由公因子F6、F13、F15組成(陰虛內熱兼血瘀證);C2由F4、F5、F7、F10、F18組成(肺脾氣虛兼外感證);C3包括F16(痰熱蘊肺證);C4包括F9(痰濕阻肺證);C5包括F1、F11(肺氣陰兩虛證);C6包括F8(兼證絡傷咳血證);C7包括F2、F3(肺腎氣虛證);C8包括F17(脾氣虛證);C9包括F14(風熱犯肺證);C10包括F12(陰虛肺熱證)。見表4。

表4 因子分析與系統聚類分析結果

圖4 聚類分析樹狀圖
2.4 支氣管擴張癥中醫常見證型 綜合以上結果,痰熱蘊肺證、痰濕阻肺證、肺氣陰兩虛證、肺脾氣虛證、肺腎氣虛證在隱結構及系統聚類結果中均出現,證型頻次統計中占比也較高,而風熱犯肺證、痰瘀阻肺證及陰虛肺熱證在兩種分析結果中出現,但證型頻次占比相對較低。參考中醫證型標準的制定原則,3種數據分析方法中重復出現至少2次的有痰熱蘊肺證、痰濕阻肺證、風熱犯肺證、痰瘀阻肺證、肺氣陰兩虛證、陰虛肺熱證、肺脾氣虛證、肺腎氣虛證8個證型,可認為是支氣管擴張癥的臨床常見中醫證型,見表5。

表5 支氣管擴張癥常見證型及癥狀分布
中醫證候數據具有非線性、復雜性、非定量性等特點[8],需運用與中醫辨證理論相貼合的現代數據分析技術,從海量數據中發掘其中隱含的有意義的聯系[9]。目前常用的證候數據分析方法可大致分為有監督和無監督數據分析方法兩大類[10],不同的分析方法各有優缺點,為形成優勢互補提高研究結果的可信度,本研究采用3種不同的數據分析方法,其中隱結構模型、系統聚類分析均屬于無監督的分析方法,頻數描述性分析屬有監督的分析方法。隱結構模型基于證候數據的多維多階性[11],為中醫辨證建立的一種客觀、定量的研究方法[12-13],本研究提取臨床中真實的電子病歷中記錄的支氣管擴張癥癥狀(顯變量),構建隱結構模型,結合專業知識綜合聚類后,推出8個臨床常見證型??偰P图案骶C合聚類模型的貝葉斯信息標準(BIC)評分均較好。本研究在進行因子分析及系統聚類時發現,若選取的癥狀頻次過低,則因子分析時旋轉成分矩陣無法收斂,或聚類樹狀圖不能歸納出有實際意義的證型,當提取頻次>60次的52個癥狀變量時,可得到較為理想的聚類結果,結合專業知識,進而推斷出各聚類所代表的10個潛在證型。綜合有監督學習方法中的頻數描述分析結果最終推出支氣管擴張癥8個臨床常見證型。
支氣管擴張癥病程長且病理改變不可逆轉,臨床表現為持續或反復性咳嗽、咳痰,或伴有痰中帶血、咯血,在中醫學中歸屬于“咳嗽”“咯血”“肺癰”“肺痿”范疇[14]。支氣管擴張癥多因稟賦不足、外邪侵襲、久病虛損、癥積阻塞,病性為本虛標實,急性發作期偏于邪實,慢性遷延期偏本虛,實邪為痰熱、痰濕、瘀血,正虛多為氣虛、陰虛、氣陰兩虛[15]。本研究總結出支氣管擴張癥8種常見證型,包括痰熱蘊肺證、痰濕阻肺證、風熱犯肺證、痰瘀阻肺證、肺氣陰兩虛證、陰虛肺熱證、肺脾氣虛證、肺腎氣虛證,以上證型在既往文獻研究中均有報道[16-19]。根據病程演變,本病初期因外邪侵襲肺衛、風熱為主,內郁于肺,或肺臟蓄熱,又受外風,熱傷肺氣,肺失宣降,臨床可表現為風熱犯肺證;急性發作期即感染期,總屬邪熱蘊肺,蒸液為痰,熱毒浸淫及血,熱傷血脈,血為之凝聚,臨床表現為痰熱蘊肺證、痰瘀阻肺證;緩解期以正虛或正虛邪戀為主,因病程遷延不愈,肺氣損傷日久,累及脾土,脾為肺之母,子盜母氣,導致肺脾氣虛證;脾失運化,無以化生、疏布津液,聚生痰液,則見痰濕阻肺證;肺虛損日久,母病及子,累及腎臟,致腎不納氣,則可見肺腎氣虛證;肺體受損,傷陰耗氣,致肺氣陰兩虛,或陰虛生內熱,或正虛邪戀,陰津已虧,邪熱未去,則可見陰虛肺熱證。
本研究尚存在兩點需要注意的問題:一是由于醫院系統原因未提取出舌脈信息,使證型癥狀描述不夠全面;二是隱結構分析中某個綜合隱類中會出現個別與整體證型不符合的癥狀[20],增加了模型解釋的難度。如綜合聚類C2中,反酸燒心、腰痛癥狀并不符合肺脾氣虛兼外感證的特點,考慮以下幾個原因:首先,研究數據來源于呼吸科住院患者出院診斷中存在“支氣管擴張癥”這一診斷的病歷,且老年人居多,患者多存在合并病,混雜因素較多;其次,該病病機本虛標實,臨床常見虛實夾雜之兼證,顯現的癥狀亦會出現虛實夾雜的現象。