劉 超,陳恒文,劉蘭椿,白 京,王 階**
(1. 北京中醫藥大學研究生院 北京 100029;2. 中國中醫科學院廣安門醫院 北京 100053;3. 陜西中醫藥大學第一臨床醫學院 咸陽 712046)
冠心病嚴重威脅人類健康,已經成為全球重大公共衛生問題。冠心病多發生于中老年人群,根據團隊前期的研究發現[1-3],冠心病患者多在血瘀證的基礎上兼有腰膝酸軟、頭暈耳鳴和健忘等癥狀,出現“陽微陰弦”腎虛血瘀的臨床表現,通過補腎活血的治療方法,可以明顯改善患者癥狀,提高臨床療效。然而,目前關于不穩定型心絞痛(Unstable angina,UA)腎虛血瘀證患者中醫證候特征的研究相對較少,缺乏對腎虛血瘀型UA 中醫病機的全面認識,限制了中醫藥在臨床中的應用。中醫證候客觀化研究一直是中醫藥領域研究的熱點,近年來多種數據挖掘技術,如:人工神經網絡、決策樹、Logistic 回歸、貝葉斯網絡等多種算法廣泛應用在中醫證候客觀化的研究當中[4]。但不同算法之間優勢各異,適用的數據類型也有所差別,如何從眾多統計方法中遴選出一種最優算法,并形成靈敏度高、特異性強的中醫辨證依據,是實現中醫證候診斷定量化和標準化的關鍵。因此,本研究擬通過對基于多種算法構建的UA 腎虛血瘀證診斷模型的研究,形成一個準確率高且符合臨床實際的中醫辨證診斷模型,并為進一步規范UA 腎虛血瘀證中醫證候診斷標準提供客觀依據。
研究病例來自2018年1月-2018年12月在首都醫科大學附屬北京安貞醫院、中國中醫科學院廣安門醫院、新鄉醫學院第一附屬醫院和云南省中醫院經冠脈造影確診的199 例UA 患者。西醫診斷標準參照2014年美國心臟協會/美國心臟病學會制定的非ST段抬高型急性冠脈綜合征指南[5];中醫腎虛血瘀證診斷標準參照中華中醫藥學會心血管病分會2018年頒布的《冠心病心絞痛主要證型的診斷標準》[6]。本試驗已取得中國中醫科學院廣安門醫院倫理委員會批準(倫理編號:2017-058-KY-01)。
納入標準:符合上述診斷標準;年齡大于18歲;自愿參加本研究并簽署知情同意書。排除標準:近1 周內有急性感染、創傷、燒傷和手術史的患者;高血壓控制不良、嚴重室性心律失常、Ⅲ度房室傳導阻滯的患者;經檢查證實為其它心臟疾病、重度神經官能癥、頸椎病、甲亢、更年期癥候群、膽心病、胃及食管反流等所致的胸痛者;慢性阻塞性肺疾病急性加重期和呼吸衰竭的患者;合并肝、腎、造血系統嚴重原發性疾病的患者;合并精神病或智力障礙的患者;妊娠或哺乳期婦女。
根據調查內容和研究目的,設計《冠心病不穩定型心絞痛腎虛血瘀證患者臨床信息調查表》,主要內容包括:患者基本資料、既往史、生命體征、腎功能、血脂、心電圖、冠脈造影結果、中醫四診信息、GRACE 評分和Gensini積分。對符合納入標準的患者在入院24 h內進行信息采集,并于48 h 內行冠脈造影術,記錄冠脈造影結果。中醫證候由至少3名副主任醫師及以上職稱的臨床醫生進行判定。數據采用雙人雙機的錄入方法,用EXCEL建立數據庫。
試驗開始前,對多中心調查者進行集中或網絡在線培訓,明確本試驗的目的、方法、流程以及問卷調查填寫標準;試驗中,嚴格執行診斷及納入、排除標準,采取統一規范的信息采集標準,盡量減少選擇偏倚和信息偏倚;同時,運用內部檢查和外部監查的方式,對多中心實施不定期現場或電話監查,及時發現和解決問題,以確保調查結果的真實、可靠。
表1 UA腎虛血瘀證與非腎虛血瘀證患者一般資料比較
采用SPSS 20.0軟件對數據進行統計學分析,計量資料采用t檢驗或非參數檢驗,計數資料采用Χ2檢驗,以P<0.05為差異有統計學意義。將具有統計學意義的臨床指標及中醫四診信息作為自變量,以“腎虛血瘀證”作為因變量,運用SPSS Modeler 18.0軟件中的反向傳播(Back-propagation,BP)神經網絡、徑向基函數(Radial basis function,RBF)神經網絡、C5.0 決策樹、分類回歸樹(Classification and Regression Tree,C&RT)決策樹、卡方自動交互檢測法(Chi-squared Automatic Interaction Detector,CHAID)決策樹、隨機森林、逐步Logistic 回歸和貝葉斯網絡8種算法構建UA 腎虛血瘀證診斷模型,隨機抽取數據庫中50%數據作為訓練集以構建模型,另外50%數據作為測試集以驗證模型的準確性,反復驗證達到較穩定狀態,進而輸出最佳診斷模型。同時計算模型的受試者工作特征(Receiver operating characteristic,ROC)曲線下面積(Area under the curve,AUC)以評估模型優劣。
經臨床辨證,199例UA 患者中腎虛血瘀證患者有145例(72.86%),非腎虛血瘀證患者有54例(27.14%)。兩組患者在性別、年齡、身高、體重和吸煙時長方面差異有統計學意義(P<0.05或P<0.01)(表1)。
通過對患者中醫四診信息的收集發現,兩組患者共有23個項目存在差異,UA腎虛血瘀證患者較UA非腎虛血瘀證患者多見胸痛、健忘、乏力、心煩易怒、自汗、失眠、口干口渴、腰膝酸軟、口苦、耳鳴、口唇紫暗、畏寒、夜尿多、齒松、肢體麻木、耳聾、盜汗、腰冷、黯紅舌、口黏膩和渴不欲飲,而少見淡紅舌和胖大舌,且組間差異有統計學意義(P<0.05或P<0.01)(表2)。
表2 UA腎虛血瘀證與非腎虛血瘀證患者中醫四診信息差異
UA腎虛血瘀證患者在收縮壓和GRACE評分上與UA非腎虛血瘀證患者存在差異,且差異有統計學意義(P<0.05 或P<0.01);在舒張壓、心率、肌酐、尿素、總膽固醇、甘油三酯、高密度脂蛋白、低密度脂蛋白、ST段壓低大于0.5 mv、冠脈狹窄程度、冠脈病變支數和Gensini積分方面不存在顯著性差異(P>0.05)(表3)。
表3 UA腎虛血瘀證與非腎虛血瘀證患者客觀指標差異
將上述30 個具有顯著差異的中西醫資料(P<0.05)作為自變量,構建基于8種算法的UA 腎虛血瘀證診斷模型。研究發現基于BP 神經網絡構建的診斷模型較其它算法整體性能更優,其訓練集的準確率、靈敏度和特異度分別為96.33%、96.39%和96.15%,ROC 曲線下面積為0.993;測試集的準確率、靈敏度和特異度分別為94.44%、98.39%和85.71%,ROC 曲線下面積為0.967。BP 神經網絡對UA 腎虛血瘀證具有良好的辨識能力(表4)。
表4 基于多種算法構建的UA腎虛血瘀證診斷模型的比較
UA 腎虛血瘀證BP 神經網絡診斷模型由3 層結構組成,包括了含30個自變量的輸入層、3個隱節點的隱藏層,以及1個結局指標的輸出層(圖1)。在模型構建中貢獻度前10 的指標為年齡(0.0894)>腰膝酸軟(0.0737)>夜尿多(0.0717)>胖大舌(0.0693)>GRACE評分(0.0692)>收縮壓(0.0663)>口唇紫暗(0.0482)>齒松(0.0453)>失眠(0.0450)>健忘(0.0399)(表5)。UA 腎虛血瘀證與年齡、GRACE 評分和收縮壓密切相關,常見腰膝酸軟、夜尿多、口唇紫暗、齒松、失眠和健忘等癥狀,而較少出現胖大舌。
圖1 UA腎虛血瘀證3層BP神經網絡模型
表5 BP神經網絡診斷模型中貢獻度前10的自變量
中醫證候具有復雜性、非線性和非定量性的特點,如何實現中醫證候的客觀化和標準化一直是中醫證候研究的熱點,而方法學一直是限制其發展的最大瓶頸。隨著大數據、人工智能時代的來臨,多種數據挖掘算法如人工神經網絡、決策樹、Logistic 回歸等廣泛應用在中醫證候的客觀化研究當中,形成了中醫智能辨證診斷模型,可有效對中醫證候進行分類預測,并獲得與之相關的預測因子,構建起現代病理生理與中醫病因病機之間的聯系,一定程度上為中醫證候客觀化研究提供了新的策略[7-9]。然而不同算法之間各有優勢,適用的數據類型也有所差別,面對復雜的臨床資料信息時,若僅采用單一的算法進行模型構建,往往會造成偏倚的產生,影響結果的可信度。只有通過對不同算法構建的模型進行比較,才能尋找到最佳診斷模型,這樣不僅能夠降低因單一統計方法而造成的系統誤差,還能夠排除混雜因素的干擾,使結果更加接近中醫證候的本質。本研究通過對8種算法構建的UA 腎虛血瘀證診斷模型性能的比較發現,BP 神經網絡構建的中醫辨證診斷模型在準確率、靈敏度和特異度上均優于其它算法,可較好地識別UA 腎虛血瘀證,形成較為準確的中醫辨證依據。
人工神經網絡是一種模擬人腦神經網絡結構和功能對數據進行分析和處理的數據挖掘方法,可從一組無秩序、無規則的數據中推演出一套分類規則,實現對研究對象的正確分類和精準預測[10]。本研究中構建模型性能較好的BP 神經網絡算法是人工神經網絡中的經典算法之一,它是建立在梯度下降算法基礎上的多層神經網絡,由輸入層、隱藏層和輸出層組成,層與層之間通過Sigmod 函數連接,通過從后向前逐層把誤差反向傳播到上一層,并不斷對鏈接權重進行調整,建立起輸入與輸出間的非線性映射關系,進而達到對結局指標的精準預測[11]。BP 神經網絡具有高度的并行性、良好的容錯性以及強大地處理非線性問題的能力[12],不僅能夠對中醫證候中所蘊藏的大量信息進行充分識別,從中提取出證候特征的規律,建立起中醫證候與外在客觀指標間的非線性映射關系,而且還能夠以其強大的自學習、自組織和自適應能力加強對邊緣模糊病例的辨識,提高中醫證候的診斷效率,使結果更加接近中醫證候的真實面貌[13]。
既往研究也發現BP 神經網絡較其它算法具有一定的優勢。傳統的Logistic回歸僅限于線性可分問題,對于線性不可分問題,BP 神經網絡明顯優于Logistic回歸[14]。另外,BP 神經網絡應用比較靈活,對數據的要求也較傳統方法低,分析過程中可利用大量的參數解釋變量間復雜的非線性關系,從而構建準確率較高的診斷模型[15]。此外,有研究也發現BP 神經網絡在對大腸癌虛實證型的分類處理上性能要優于決策樹模型,且更適合于中醫證候中非線性映射關系的處理[16]。同樣,通過BP 神經網絡建立的食管癌預測模型,較C5.0 決策樹和Logistic 回歸,有更好的預測效果,模型ROC 曲線下面積也最大,且各曲線下面積差異有統計學意義[17]。然而,并不是所有情況下BP 神經網絡算法都是最優的,基于RBF 神經網絡建立的高血壓病陰陽兩虛證診斷模型就優于BP 神經網絡,并且其模型結構簡單、收斂速度快[18]。因而,在面對不同類型的臨床資料時,只有通過對不同算法構建的模型進行比較,才能尋找到符合該類研究的最佳診斷模型,得出的結果才更加可靠。
本研究通過BP 神經網絡不僅發現了對診斷UA腎虛血瘀證重要的癥狀體征,如腰膝酸軟、夜尿多、口唇紫暗、齒松、失眠和健忘等,還發現UA 腎虛血瘀證與患者年齡、收縮壓以及GRACE 評分密切相關。年齡是BP 神經網絡中貢獻度最高的因子。冠心病多發生于40 歲以上的中老年人群,隨著年齡的增長,腎氣逐漸衰退,《素問·陰陽應象大論》云:“年四十,而陰氣自半也”“年六十,陰痿,氣大衰,九竅不利,下虛上實”,說明人到老年則腎之陰陽不足。腎陽虛則心陽不振而陰寒內生,寒凝則血瘀,血運不暢,不通則痛;腎陰精不足,則心之陰血內耗,陰血虧虛不能滋養心脈,心脈失養發生胸痛,不容則痛,故《素問·藏氣法時論》道:“腎病者……虛則胸中痛”,《景岳全書》又說到:“凡房勞過度,腎虛羸弱之人,多有胸脅間隱隱作痛”。同時,血液運行又必須依靠腎陽的蒸動,心陽才能推動血液正常運行,若命門火衰則心失于溫運,致心陽不足而“無力行舟”,留而為瘀,《醫林改錯》云:“元氣既虛,必不能達于血管,血管無氣,必停留而為瘀”。此外,研究還發現隨著年齡的增長,老年患者會從生理和病理上表現出腎虛血瘀的基本改變[19]??梢姡挲g因素可能是UA 患者出現腎虛血瘀證的重要原因。
此外,收縮壓的高低也是診斷UA 腎虛血瘀證的重要因子。既往臨床研究發現單純性收縮期高血壓是老年人常見病,多與腎虛血瘀、陰虛陽亢相關[20]?,F代研究也證實,腎虛會導致患者大動脈彈性功能的下降,表現出早期的動脈硬化,而大動脈血管的老化會直接導致收縮期血壓的升高[21],正如“髓海不足,則腦轉耳鳴,脛酸眩冒”中的描述。同樣,血瘀亦是高血壓產生的關鍵因素。血瘀證在微觀上會表現出血流變學改變、微循環障礙、血小板功能異常以及內皮功能的損害,使血液處于濃、粘、凝、聚的狀態,這些異常改變會導致血壓的升高[22-24],故《仁齋直指方論》道:“瘀滯不行,皆能眩暈”。因此,高血壓可能是UA 腎虛血瘀證發生的危險因素之一。
再者,GRACE 評分對UA 腎虛血瘀證的診斷也較為重要。GRACE評分由心功能Killip分級、收縮壓、心率、年齡、肌酐、院前心臟驟停、ST 段下移和心肌酶升高組成[25,26],可較好地預測患者住院期間以及6個月內不良心血管事件的發生率,GRACE 評分越高,死亡風險越大,中危、高?;颊咚劳雎史謩e是低?;颊叩?倍和12倍[27]。既往研究證實,GRACE評分與腎虛證高度相關,腎虛型UA 患者往往具有較高的風險,更容易出現心血管不良事件[28]。同時,血瘀證在GRACE 評分的高危組中也最為常見(90.5%),當患者出現血瘀+陽虛+痰濁偏寒證時,其6個月內發生全因死亡事件的可能性相對較高[29]。因而,當UA 患者GRACE 評分較高時,其屬于腎虛血瘀證的可能性也較大,臨床預后也相對不良。
綜上所述,本研究通過對多種算法構建的中醫辨證模型的比較,初步形成了準確率較高且符合臨床實際的UA 腎虛血瘀證BP 神經網絡辨證診斷模型,為UA 腎虛血瘀證的中醫證候診斷提供了客觀依據。但由于本研究所涉及的樣本量有限,檢測的生物學指標相對較少,未能對UA 腎虛血瘀證的“微觀辨證”提供更多的數據支持。同時,不同算法之間并沒有優劣之分,只是適用的條件不同,雖然本研究中基于BP 神經網絡構建的模型效果最優,但其能否很好地應用于其它中醫證候類型的辨識中,還有待進一步驗證。因此,在分析不同臨床數據時,應采用多種算法進行比較,并根據其數據特點,選取最合適的算法,以構建準確性相對較高的診斷模型。