劉超 ,高嘉良,董艷,黃信生,林飛,李易,張振鵬,李軍,王階
1.北京中醫藥大學,北京 100029;2.中國中醫科學院廣安門醫院,北京 100053;3.首都醫科大學附屬安貞醫院,北京 100029;4.新鄉醫學院第一附屬醫院,河南 新鄉 453199;5.云南省中醫院,云南 昆明 650021
冠狀動脈臨界病變(borderline coronary lesion,BCL)又稱中等程度狹窄,是冠狀動脈管腔直徑狹窄在30%~70%的病變[1]。6%的BCL 患者在1 年內會發生心肌梗死而接受介入治療[2],而86.9%需要介入治療的罪犯血管是先前造影<60%的BCL[3]。BCL 屬于冠心病的早期階段,通過積極有效的干預措施,可延緩疾病進展,降低心血管不良事件發生率。研究顯示,中醫藥對穩定斑塊、延緩冠狀動脈粥樣硬化進展、改善BCL 患者生活質量療效顯著[4-6]。但目前尚缺乏公認的針對BCL 的中醫證候診斷標準,導致中醫藥在冠心病早期診斷、早期治療中的作用難以得到充分發揮。
近年來,多種數據挖掘技術廣泛應用于中醫證候診斷的量化和客觀化研究當中,并且取得一定成果[7-8],特別是人工神經網絡以其良好的容錯性、自組織性、自適應性及非線性并行處理能力,在中醫證候客觀化研究中具有長足的優勢[9]。因此,本研究采用誤差反向傳播(back propagation,BP)神經網絡構建BCL 患者證候要素及其常見組合的中醫辨證診斷模型,以期為規范BCL 中醫證候診斷標準提供客觀依據。
采集2018 年1-12 月中國中醫科學院廣安門醫院、首都醫科大學附屬北京安貞醫院、云南省中醫院和新鄉醫學院第一附屬醫院經冠狀動脈造影確診的BCL 患者814 例,其中男性464 例,女性350 例,年齡33~99 歲,平均年齡(63.87±10.55)歲,合并高血壓病574 例(70.52%)、2 型糖尿病241 例(29.61%)、高脂血癥375 例(46.07%)、心房纖顫27 例(3.32%)、腦梗死114 例(14.00%)。本研究經中國中醫科學院廣安門醫院倫理委員會審查批準(2017-058-KY-01)。
BCL 診斷標準采用美國心臟病學院(ACC)/美國心臟病學會(AHA)制定的《冠狀動脈造影指南》[1]。中醫證候要素診斷標準參考《冠心病中醫辨證標準》[10]和《冠心病心絞痛證候要素診斷標準》[11],分為血瘀、氣滯、痰濁、熱蘊、寒凝、氣虛、陰虛和陽虛8 個證候要素。
①經冠狀動脈造影證實左前降支、回旋支和右冠狀動脈中至少有1 支血管管腔直徑狹窄30%~70%或左主干管腔直徑狹窄30%~50%,且其余血管管腔狹窄程度均小于70%者;②年齡>18歲;③患者自愿參加本研究并簽署知情同意書。
①近1周內有急性感染、創傷、燒傷和手術史者;②高血壓控制不良、嚴重室性心律失常、Ⅲ度房室傳導阻滯者;③經檢查證實為其他心臟疾病、重度神經官能癥、頸椎病、甲狀腺功能亢進、圍絕經期綜合征、膽心病、胃及食管反流等所致胸痛者;④慢性阻塞性肺疾病急性加重期和呼吸衰竭者;⑤合并肝、腎、造血系統嚴重原發性疾病者;⑥合并精神病或智力障礙者;⑦妊娠或哺乳期婦女。
根據調查內容和研究目的設計《冠狀動脈臨界病變患者中醫證候要素臨床調查表》[12],主要包括一般情況、既往史、臨床診斷、癥狀、體征、舌象、脈象和冠狀動脈造影結果。患者入院24 h內進行信息采集,并于48h內行冠狀動脈造影術,記錄造影結果,剔除非BCL者。調查表填寫完成后,根據中醫證候要素診斷標準,由至少2名副主任及以上職稱醫師判定證候要素,獲得一致結論后,將所列出的證候要素進行組合,得出證候要素組合形式。
試驗前對各中心參與調查者進行現場或網絡培訓,明確本研究的目的、方法、流程及問卷調查填寫標準;試驗過程中嚴格執行診斷及納入、排除標準,采取統一規范的信息采集標準,盡量減少選擇偏倚和信息偏倚;同時運用內部檢查和外部監查方式,對多中心實施不定期現場或電話監查,及時發現和解決問題,以確保調查結果真實可靠。
臨床調查表共涉及110個中醫四診信息,將每項四診信息用1個二進制位進行標識,“有”賦值為“1”,“無”賦值為“0”;同時將各量表中由中醫專家判定的證候要素及證候要素組合的“有”“無”分別賦值“1”“0”。雙人雙機錄入數據,用Excel2010建立數據庫。
利用SPSSModeler 18.0軟件,建立基于BP神經網絡的BCL患者證候要素及其常見組合的中醫辨證診斷模型。BP神經網絡由輸入層、隱藏層和輸出層組成。輸入層為自變量,輸出層為因變量,隱藏層的層數和節點數決定了該神經網絡模型的復雜程度。BP神經網絡先將自變量隨機賦予權重,并將預測結果與已知結果進行比較,通過輸出層的預測誤差反向估計上一層隱節點的預測誤差,從后向前逐層將誤差反向傳播到輸入層,從而實現對鏈接權重的調整,尋找到最佳診斷模型[13]。本研究采用3層BP神經網絡模式,將110個四診信息作為輸入層,證候要素及其常見組合作為輸出層,隱藏層設置為單層,其最佳節點數由Modeler18.0軟件通過反復訓練尋找最優的網絡結構確定(見圖1)。隨機抽取數據庫中70%數據作為訓練集,另外30%數據作為驗證集以驗證模型準確性,反復驗證以達到較穩定狀態,最終得出BP神經網絡模型,并計算模型受試者工作特征曲線下面積(AUC)以評估模型優劣。Modeler18.0軟件對證候要素及其常見組合的中醫辨證診斷模型構建流程見圖2。

圖1 3 層BP神經網絡結構

圖2 證候要素及其常見組合的中醫辨證診斷模型構建流程
814 例BCL患者涉及的8 種證候要素可分為實性證候要素和虛性證候要素(見表1)。實性證候要素出現頻率由高到低依次為血瘀(47.67%)>氣滯(32.43%)>痰濁(21.99%)>熱蘊(21.87%)>寒凝(1.60%),虛性證候要素依次為氣虛(59.46%)>陽虛(24.96%)>陰虛(19.16%),其中氣虛、血瘀和氣滯是BCL患者最主要的證候要素,可涵蓋86.98%(708/814)的患者。

表1 814 例BCL 患者證候要素分布
814 例BCL 患者共涉及94 種證候要素組合形式,虛實夾雜證442 例(54.30%),實證201 例(24.69%),虛證171 例(21.01%)。根據證候要素的定義可分為單因素證、雙因素組合證、三因素組合證和四因素組合證等,其中以雙因素組合證最多(41.15%),其次為單因素證(24.69%)和三因素組合證(20.15%)。出現頻率>2%的證候要素組合(見表2)中,單因素證以氣虛、血瘀最多,雙因素組合證以“氣虛+血瘀”“氣虛+氣滯”和“氣滯+血瘀”最多,三因素組合證以“氣虛+血瘀+氣滯”最多。
本研究共形成了血瘀、氣滯、痰濁、熱蘊、氣虛、陰虛和陽虛7 種證候要素的BP 神經網絡中醫辨證診斷模型,寒凝證由于病例數過少未能形成辨證診斷模型。所形成的模型訓練集準確率均超過90%,驗證集準確率均超過85%,訓練集平均準確率為94.51%,驗證集平均準確率為88.29%,模型平均AUC 為0.953(見表3)。各證候要素模型中貢獻度前10 位的四診信息見表4。

表2 814 例BCL 患者證候要素組合形式(頻率>2%)

表3 814 例BCL 患者證候要素中醫辨證診斷模型

表4 814 例BCL 患者各證候要素中醫辨證診斷模型貢獻度前10 位的四診信息
本研究對5 種常見的證候要素組合形式“氣虛+血瘀”“氣虛+氣滯”“氣滯+血瘀”“氣虛+陰虛”和“氣虛+血瘀+氣滯”構建BP 神經網絡中醫辨證診斷模型,訓練集準確率均超過98%,驗證集準確率均超過90%,訓練集平均準確率為99.47%,驗證集平均準確率為94.34%,模型平均AUC 為0.996(見表5)。常見證候要素組合的中醫辨證診斷模型中貢獻度前10 位的四診信息詳見表6。

表5 814 例BCL 患者常見證候要素組合的中醫辨證診斷模型

表6 814 例BCL 患者常見證候要素組合的中醫辨證診斷模型中貢獻度前10 位四診信息
BCL 是冠心病的早期階段,屬中醫學“胸痹心痛”范疇。《金匱要略.胸痹心痛短氣病脈證治》言:“夫脈當取太過不及,陽微陰弦,即胸痹而痛,所以然者,責其極虛也。”本虛標實是胸痹心痛的核心病機。本研究顯示,BCL 患者病機多為本虛標實,本虛以氣虛為主,標實以血瘀和氣滯為要。在證候要素組合上,“氣虛+血瘀”“氣虛+氣滯”“氣虛+血瘀+氣滯”為最常見的組合形式,氣虛、血瘀和氣滯可涵蓋86.98%的BCL 患者。既往研究發現,冠狀動脈狹窄程度在50%~75%的常見證候為氣滯血瘀證和氣虛血瘀證,氣滯血瘀證患者病變程度較輕[14]。有學者認為,BCL 以滯、瘀為主,病理上多表現為血管內皮功能紊亂和血管痙攣[15]。由此可見,氣虛、血瘀和氣滯是BCL 的主要病機。氣虛為始動因素,多由年老體衰,臟腑機能減退所致。氣虛則血運不暢,心脈痹阻,發為胸痹。《醫林改錯》有“元氣既虛,必不能達于血管,血管無氣,必停留而瘀”;氣虛則無力行氣,氣機郁滯,氣結在胸,可見胸脅脹痛等。《景岳全書》有“氣血不虛則不滯,虛則無有不滯”。血瘀為重要的致病因素,瘀血阻絡,血脈不暢,心失濡養,則胸痹心痛,故有“心痹者,脈不通”和“夫脈者,血之府也……澀則心痛”之說;氣隨血行,血不行則氣不暢,血瘀可致氣滯,進而引發胸滿,如《金匱要略.驚悸吐衄下血胸滿瘀血病脈證治》云:“病人胸滿,唇痿舌青……為有瘀血。”氣滯為胸痹發生的關鍵誘因。肝失條達,氣滯心胸,氣血逆亂,血液不能正常運行,停滯脈中,瘀阻心脈,而發胸痹,《雜病源流犀燭.心病源流》曰:“七情失調可致氣血耗逆,心脈失暢,痹阻不通而發心痛”;肝失疏泄,不能助心行血,心氣不足,則血行不暢,日久可致心脈痹阻而引起心痛,《薛氏醫案》道:“肝氣通則心氣和,肝氣滯則心氣乏。”因此,氣虛、血瘀和氣滯三者互為因果、相互促進,共同構成BCL 的核心病機。
中醫證候是疾病某一發展階段病因、病理、病位和病勢的綜合體現,是一個高維高階非線性的復雜系統[16]。王永炎院士提出的中醫證候要素理論,通過“降維升階”的方法,將復雜的中醫證候系統分解成較為簡單的證候要素來研究,再通過證候要素間的組合、證候要素與其他傳統辨證方法的組合,建立多維多階的辨證方法體系,為解決中醫證候中出現的復雜、多變、動態的問題提供了可行方法[17-18]。然而,作為構成證候最小單元的證候要素,仍存在癥狀與癥狀間、癥狀與證候要素間模糊、復雜、非線性的關系,其診斷也多由醫師憑主觀判斷而來,受限于外界光線、溫度等環境因素的影響,缺乏客觀標準,辨證精確性和重復性較差。如何對海量中醫信息進行整合、分析,并提取出證候要素內在規律,實現中醫證候診斷客觀化和標準化,仍然是目前的研究難點和熱點。數據挖掘是為解決“數據豐富,知識貧乏”而興起的邊緣科學之一,融合了機器學習、統計學、信息科學等多門技術,是目前數據信息處理的一個主要領域,現已廣泛應用于中醫證候規范化研究[7]。
人工神經網絡是數據挖掘中的重要算法之一,通過模擬人腦神經網絡的結構和功能對數據進行有效處理,進而識別出數據中隱藏的復雜規律[19]。它突破了傳統線性信息處理模式,采用高度非線性信息處理方式,具有高度的并行性、良好的容錯性及強大的非線性映射能力[20]。中醫證候體系的復雜性決定其研究應從非線性設計著手,人工神經網絡以其超強的處理非線性問題的能力,在解決中醫證候研究中遇到的非線性問題上具有優勢。它能夠充分識別表現于外的“候”的表征信息,并從大量樣本中提取出證候特征規律,建立起“證”與“候”的非線性映射關系,同時以其強大的自學習、自組織和自適應能力加強對邊緣相似病例的辨識,使中醫證候診斷模型更加接近證候的真實面貌[21]。BP 神經網絡是建立在梯度下降算法基礎上的多層神經網絡,由輸入層、隱藏層和輸出層構成,層與層之間的激活函數為Sigmoid 型可微函數,通過從后向前逐層將誤差反向傳播到輸入層,并不斷對鏈接權重進行調整,以實現輸入與輸出間的任意非線性映射,這一特性使其能夠很好地應用于中醫證候非線性建模[22]。
本研究通過BP 神經網絡構建出準確率較高的7種證候要素和5 種常見證候要素組合的辨證診斷模型,篩選出各證候要素及其常見組合的核心四診信息,建立起證候要素及其常見組合與四診信息間的非線性映射函數。同時,BP 神經網絡可對各證候要素及其常見組合中的四診信息進行定量化解析,如血瘀證為黯紅舌>口唇紫黯>弦脈>肢體麻木>舌生瘀斑等,氣虛證為乏力>氣短>自汗>心悸>胸悶等,氣滯證為心煩易怒>脘腹脹滿>胸脅脹滿>口苦>善太息等,氣虛證+血瘀證為乏力>黯紅舌>口唇紫黯>自汗>心悸等,上述四診信息都是中醫傳統辨證診斷的重要條目,也是臨床證候診斷的主要依據。此外,本研究常見證候要素組合辨證診斷模型的隱藏層節點數多于單一證候要素,并且其模型復雜程度也更高,從側面反映出證候是由最小單元證候要素組成的復雜多維多階系統,通過BP 神經網絡可對中醫證候進行逐層剖析,建立起“證候-證候要素-四診信息”的非線性映射關系。
綜上所述,本研究基于BP 神經網絡初步形成了準確率較高且符合臨床實際的BCL 證候要素及其常見組合的中醫辨證診斷模型,為冠心病早期中醫證候診斷提供了客觀依據,為中醫辨證體系規范化、客觀化提供了可行策略。但本研究僅涉及中醫四診信息,尚未涉及生物學指標,證候要素與生物學實質間的關聯還有待進一步驗證。近年來,隨著系統生物學的興起,基因組學、蛋白質組學、代謝組學等多組學的開發,為中醫證候的生物學實質研究提供了先進技術手段。今后研究應充分利用數據挖掘算法中的最新研究成果,并結合新興生物學技術,開展跨學科、跨領域、多角度的中醫證候客觀化研究。