魏 珂,司春嬰,王 賀,劉小明,關懷敏**
(1. 河南中醫藥大學第一臨床醫學院 鄭州 450000;2. 河南中醫藥大學第一附屬醫院心臟中心鄭州 450000;3. 中原工學院計算機學院 鄭州 450000)
人工智能(artificial intelligence,AI)的概念最早于1956 年在達特茅斯會議提出,旨在模仿人類的思維過程、學習能力并賦予計算機執行認知功能的能力[1]。近年來,獲益于醫學大數據的爆炸式增長以及計算機的運算速度提升,基于機器學習算法的人工智能技術滲透到醫學的各個領域。在心血管病方面,傳統的診療過程依賴于臨床醫師對患者的臨床癥狀,心電圖(electrocardiogram,ECG)、影像學以及血液檢驗結果的分析。而心臟血管影像精細,心電圖圖形復雜,利用人工智能技術輔助醫學影像自動化解釋,能夠減少主觀因素帶來的誤判,提高臨床診療效率。同時,在心血管病風險評估領域,人工智能可以通過深度整合心血管疾病大數據,構建疾病的風險預測模型,預測病情的演變,有助于醫生提供個性化的精準診療[2]。在當前新冠肺炎疫情下,通過手術機器人對患者進行經皮冠狀動脈介入治療(percutaneous coronary intervention,PCI),可以減少與新冠肺炎患者近距離接觸,降低暴露風險[3,4]。目前,人工智能在心血管病領域中的應用成為了交叉學科中的研究熱點。本文旨在綜合國內外學者在心血管病領域開展的人工智能研究,以期為人工智能在心血管病領域中的進一步研究提供參考。
機器學習是AI的核心,是使計算機智能化的根本途徑。機器學習是指計算機在沒有先驗知識的情況下,通過對樣本數據進行學習,從原始數據中提取特征構建模型,然后利用模型對新的數據進行預測分類[5]。在訓練模型的過程中,數據是機器學習算法的第一要素,也是AI 的基石。目前,醫院儲存有海量電子病歷、影像學資料和實驗室檢查數據,從而加速了機器學習在醫學領域的發展。在心血管病領域應用中,機器學習根據所處理數據以及訓練方法的不同,可以分為監督學習和無監督學習[6]。
監督學習是指算法通過學習帶有標注的數據集和相應的輸出結果,找到輸入的數據與輸出數據間所存在的某種映射關系[7]。因此,常應用于構建疾病風險預測模型,如對急性冠脈綜合征患者PCI 術后發生主要心血管不良事件(major adverse cardiovascular events,MACE)進行預測[8]。常見的監督學習算法有logistic 回歸,支持向量機、樸素貝葉斯和隨機森林(表1)。無監督學習尋求發現數據集中變量間的底層結構,無需提前對樣本數據進行標注,以揭示數據間潛在的內在聯系。包括從豐富的組學大數據中自動提取分子特征,發現新的發病機制、基因型或表型[9,10]。Chung[11]等利用無監督算法在小鼠心臟重塑過程中對小鼠的基因組學,蛋白質組學和代謝組學進行了分類,以尋找心臟疾病遺傳模式背后的邏輯。無監督學習常見的算法有聚類和降維。
在過去的五年里,AI的巨大進步主要是由深度學習算法推動的[12]。2016年Google公司開發的一款名為AlphaGo 的深度學習算法擊敗了人類頂尖圍棋選手,由此掀起了近5年來的AI熱潮[13]。深度學習是機器學習的子領域,其本身不是一種獨立的學習方法,以傳統神經網絡算法為基礎,一種多層疊加的神經網絡模型(通常5-25 層)[14]。由于深度學習模型在處理大樣本量數據以及計算機視覺領域中的優異表現,這也使深度學習算法在醫學影像自動化解讀方面戰勝了很多經典的機器學習算法[15]。如Gharaibeh[16]等構建深度學習模型通過學習冠脈光學相干斷層成像(optical coherence tomography,OCT),可以自動識別鈣化斑塊、精準分割血管輪廓以及量化管腔面積狹窄率,進而輔助醫生優化手術方案。常見的深度學習算法模型有卷積神經網絡(convolutional neural networks,CNN)和循環神經網絡。
心血管病的發生是由遺傳、環境和行為學等多因素造成?,F階段臨床常用的危險分層工具都是基于回歸模型來分析心血管的危險因素,例如在臨床和科研中廣泛應用Framingham 心血管風險評分和Grace危險評分。但是傳統的回歸模型無法分析臨床變量間交互作用產生的潛在影響,而心血管病各危險因素間的關系又非相互獨立,部分心血管病危險因素間存在著明顯正相關[17]。與傳統的回歸模型相比,機器學習算法可以分析危險因素之間的交互作用,對于非線性的臨床數據的處理有著先天優勢,可以構建更為精準的心血管風險評估模型[18]。
對心血管病進行風險評估和危險因素管理是預防心血管病的重要措施。隨著國民生活方式的轉變以及我國人口老齡化進程的加速,中國心血管病危險因素流行趨勢明顯,導致以心血管疾病為代表的慢性病發病人數持續增加,發病年齡不斷前移[19]。面對心血管病的負擔不斷加重,提高防治水平仍是我們努力的方向。自古以來,我國醫學家對疾病預防的研究從未止步,在西醫尚未被引進我國的時候,醫者們就用中醫理論對疾病預防的理念進行了闡述。“治未病”的思想從《黃帝內經》中“圣人不治已病治未病,不治已亂治未亂”到《傷寒雜病論》中“上工治未病”[20]。后經歷長期實踐,歷代醫學家對其有所發揮,逐步構成了大醫學家孫思邈的“未病先防、既病防變、瘥后防復?!钡睦碚擉w系[21]。通過掌握潛在的發病因素,在疾病還未發生之時,對危險因素主動干預,防患于未然,這些理念也奠定了我國預防醫學理論基礎[22]。將中醫治未病的思想與機器學習算法相結合,對心血管疾病進行早期風險預測,是檢出高風險個體的必要手段,有助于醫務人員對高危個體制定近遠期的治療方案。同時,根據不同的病癥類型進行辨證施治,以患者取得最大受益為宗旨,也體現了現代精準醫療的思想。辨證論治是將非線性、高維性和異構性的復雜數據系統化的過程[23]。冠心病心絞痛證候要素主要包括氣虛、血瘀、痰濁、熱蘊、氣滯、陽虛、寒凝、陰虛。其發生由“心主血脈”的功能失調引起,而血瘀和氣虛作為主要病因貫穿于冠心病PCI 術后始終[24]。傳統中醫對于癥候的辨識往往取決于醫師的主觀意識和經驗累積,癥候辨識的精確性和重復性較差。而機器學習模型可以通過學習大樣本癥候數據,提高對于癥候的辨識。許朝霞[25]等基于支持向量機和人工神經網絡模型對心血管疾病的6 種中醫證候進行分類識別。研究納入2218 例心血管病患者的癥候信息,采用隨機樣本多次訓練預測取平均值的方法,計算預測準確率。結果表明基于人工神經網絡對于癥候辨識的準確率最高,對于氣虛、痰濁、血瘀識別的準確率分別為92.4%、77.8%和63.1%,為心血管病證候的機器學習分類模型相關研究提供了參考。

表1 機器學習算法介紹
醫療大數據驅動下的疾病風險預測模型,可以對心血管等慢性病的早期識別和預防,以減輕醫療衛生系統的負擔[26],與此同時,通過心血管病風險預測模型,能讓患者本人更清楚自己身體狀況,增強患者健康管理意識,改變不良的生活習慣,這與中醫理論“治未病”的預防理念也相契合。
在心血管病介入治療過程中,風險-獲益評估是對患者進行血運重建治療決策的基礎。運用危險評分可在血運重建前用于預測患者結果,為患者選擇PCI 或是冠狀動脈旁路移植術治療,也可以預測心肌血運重建術后MACE 事件的發生率[27]。目前在臨床血運重建常用的危險評分主要有SYNTAX Ⅱ評分、EuroSCOREⅡ評分。評分系統整合了臨床和冠狀動脈病變解剖學因素,如靶血管分布、嚴重程度、分叉病變等解剖特點,根據積分的高低為血運重建患者進行風險評估。但是基于傳統回歸模型的危險評分只能分析少量的心血管危險因素,而機器學習模型可以通過全面整合患者心血管病危險因素和靶病變血管影像資料,預測冠心病患者將來是否需要進行血運重建,以及 PCI 術后 MACE 事件風險預測[28]。Baskaran[29]等基于1503 名疑似冠心病患者的91 個臨床變量組成的數據集(包括靶病變血管數量、位置、狹窄程度、性別、年齡、BMI、糖尿病和高血壓病史等記錄),利用XGBoost 模型構建冠心病患者1 年內血運重建的預測模型。并采用五折交叉驗證,通過受試者工作特征曲線下面積(area under curve,AUC)評估模型效果。研究將患者分為侵入性冠狀動脈造影(invasive coronary angiography,ICA)組和冠狀動脈CT 血管造影(coronary CT angiography,CCTA)組,分別基于兩組的各自冠脈參數和臨床指標構建預測模型。結果表明,無論模型的冠脈影像參數是來自于ICA 還是來自CCTA,對于患者1 年內是否進行血運重建的預測無明顯差異,但是當去除冠脈影像變量時會大大降低模型性能,風險預測模型的AUC 從0.95 下降至0.63。該研究為進一步構建血運重建預測模型提供了基礎。血運重建對于冠心病患者的治療并不是一勞永逸,如PCI 術后發生支架內再狹窄(in-stent restenosis,ISR)依然是PCI術后面臨的考驗。ISR是指支架全程和/或支架兩端5 mm節段內管腔丟失,導致管腔狹窄程度≥50%,表現為再次發生心絞痛或急性心肌梗死等。Sampedro[30]基于機器學習算法開發了ISR 風險預測模型,研究納入263名急性心?;颊逷CI 治療后的68 個臨床變量作為數據集,主要包括冠脈造影參數和臨床指標。其中23名患者在12 個月的隨訪中發生ISR。但是由于ISR 事件數量相對較少,所以模型采用十折交叉驗證限制模型過擬合。結果表明糖尿病、多支病變、植入支架數量、最小管腔直徑以及PCI 術后血小板異常升高是發生ISR 的主要預測因子。此外,一些團隊基于機器學習模型開發了用于預測院內心臟驟停[31]、院外心臟驟?;颊哳A后評估模型[32]。如Johnsson[33]等基于人工神經網絡構建了院外心臟驟停后缺血性腦損傷患者的神經系統預后預測模型。研究通過納入932名心臟驟?;颊邚吞K后的54個臨床變量,根據腦功能分類量表對心臟驟停患者的神經功能預后進行分類(1-2 級為神經功能預后良好,3-5級為神經功能預后不良)。結果表明,與臨床現有基于Logistic 回歸的TTM 風險評分相比,人工神經網絡模型對于心臟驟停后缺血性腦損傷患者的神經系統預后有著更精準的預測性能(AUC:0.904vs0.839)。該研究可能會改善院外心臟驟?;颊邚吞K后缺血性腦損傷患者的神經功能預后。
較傳統臨床評分,基于機器學習構建的疾病風險預測模型可以分析大型復雜數據集中自變量之間的相關性,并且通過整合術前、術中、術后的靶病變血管影像參數和心血管危險因素,優化風險預測模型,提高了對冠心病危險分層的準確性和血運重建后MACE事件的預測能力,為早期識別高風險患者,改善醫生的臨床決策提供了幫助。
醫學影像是心血管檢查的重要組成部分,在臨床心血管疾病診療中不可缺少。目前,一些心臟指標參數仍依賴于半自動軟件的測量,操作比較費時費力。其次,一些檢查依賴于醫生主觀視覺判斷,而主觀判斷缺乏標準化。通過醫學影像大數據來驅動機器學習模型完成自動化分析心臟的結構和功能等任務[34],進而輔助醫生快速完成心血管影像學分析。這里對AI輔助心臟相關影像學檢查做簡單介紹。
冠狀動脈血流儲備分數(fractional flow reserve,FFR)是診斷冠狀動脈血管生理功能的金標準[35],能特異地反映心外膜下冠狀動脈狹窄的功能學嚴重程度,并且FFR 指導下的介入治療被證實能改善患者的預后[36]。但是由于其相關成本和有創性,臨床上僅有10%-20%血運重建在FFR指導下進行。近年來,基于CCTA 圖像通過管腔分割重建冠狀動脈樹的三維模型,應用流體力學分析方法實現FFR 的計算,成為了新的臨床研究熱點。但是基于三維冠脈模型的FFR運算量大,計算時間往往長達幾個小時,限制了其在臨床上的應用。隨著AI 技術在醫學影像領域中的發展,通過深度學習模型分析冠脈樹解剖結構和血流動力學間的復雜關系,可以在幾分鐘內迅速獲得冠脈樹每個節段的FFR[37]。Kurata[38]等通過回顧性分析74 例患者的91 支血管,評估了CT-FFR 診斷冠脈狹窄的準確性。結果表明,在以血管為單位分析時,CT-FFR 的診斷敏感度和特異度分別為89%和75%,AUC 為0.907。在以患者為單位分析時,CT-FFR 的診斷敏感度和特異度分別為90%和78%,AUC 為0.91,與侵入性FFR 檢查的相關系數為0.786。表明基于深度學習的CT-FFR 系統與通過壓力導絲測量的FFR 達到了較好一致性,并且進行CT-FFR 檢查的患者平均分析時間為16.4±7.5 min,實現了對冠脈狹窄功能學的實時評價。據Kimura[39]的研究,CT-FFR 較原本基于ICA指導的治療,可以降低32%的治療成本。綜上,CT-FFR結合了CCTA 與FFR 各自的優勢,可以從解剖和功能兩方面評估冠脈狹窄,避免了對患者進行侵入性冠狀動脈造影以及腺苷的不良反應,減輕了患者負擔[40]。
ECG 具有無創、價格低廉等優點,是臨床上評價心臟功能最基本的工具之一。從識別各類型心律失常到急性冠脈綜合征的診斷,ECG 都是重要的檢查方式。目前,幾種ECG 自動分類的算法高度依賴于訓練的數據集,無法處理較大的類內差異,在處理新的ECG 時表現不佳[41]。隨著深度學習算法在ECG 中的應用,減少了ECG 圖像特征提取過程中計算的復雜度,使機器學習模型輔助ECG 解釋的準確性得到了實質性提升[42]。Attia[43]等開發了1種深度學習模型,用于識別竇性心律期間房顫患者。由于房顫通常無癥狀,現有的篩選方法需要對患者進行連續監測,因此檢測不足且低效。該研究利用CNN 算法探測正常竇性心律時心房顫動的ECG 特征,來鑒別心房顫動患者。模型AUC 為0.87,表明模型對心房顫動患者有良好的分辨力。在另1 項研究中,Huanun[44]等利用深度學習算法學習91232 份ECG 組成的訓練集數據,開發了可以檢測12 種心律失常的分類模型。使用測試數據集驗證時,模型的AUC為0.97,敏感性超過了6位心臟病專家的平均值(0.83vs0.78)。這些研究表明,端到端的深度學習算法訓練的心律失常分類模型,其診斷性能與心臟病專家有著較強的一致性,降低了計算機自動解釋ECG的誤診率。目前,除了將AI技術應用在自動診斷ECG,一些可穿戴設備也用于心臟監測和ECG 記錄,如一些手腕佩戴的自動節律分析設備通過獲取單導聯心電信號,捕捉實時心電數據,將數據反饋給用戶和家人手機,對心臟電生理活動進行檢測[45]。
超聲心動圖檢查臨床應用廣泛,可以幫助臨床醫生快速準確評估心臟結構和功能。目前,超聲心動圖的影像解讀主要在操作者目測下完成,主觀性較強。隨著深度學習算法在計算機視覺領域中的應用,實現了對超聲心動圖影像的視點識別、圖像分割、結構和功能的量化。有研究基于監督學習算法實現了心臟重構和功能障礙早期階段的檢測,進而對心臟疾病早期干預[46]。Zhang[47]等基于 CNN 算法學習了 14035 張超聲心動圖影像,通過對心臟結構的自動識別與分割,實現心腔結構的量化以及計算射血分數。與手動分割超聲心動圖的測量結果相比,前者的精準度優于傳統的手工裸眼標記測量,且效率更高。除此之外,該研究團隊通過深度學習模型學習8666 張超聲心動圖影像,完成自動檢測肥大性心肌病,心臟淀粉樣變性和肺動脈高壓三種疾病。不僅實現了對超聲心動圖的自動解釋,還實現了對疾病的自動診斷,提高了超聲科醫生的工作效率,并且有助于超聲心動圖結果的可重復性和標準化[48]。
單光子發射CT(single photon emission computed tomography,SPECT)利用心肌血流灌注顯像劑的示蹤特性,觀察心肌血流灌注和存活情況,對早期冠心病的診斷敏感性較高。在SPECT 心肌灌注成像中,對左心室和二尖瓣平面分割仍然受限于操作者的視覺評估和手動調整,而瓣膜平面定位的精確與否將影響心肌灌注的量化[49]。Betancur[50]等利用支持向量機模型通過對瓣膜平面精確分割,提高了SPECT 心肌血流灌注自動分析的準確性。該團隊在另一項研究中利用LogitBoost 算法回顧性分析了2619 名冠心病患者SPECT 圖像特征和臨床數據(年齡,性別,高血壓,血脂異常,吸煙,糖尿病和冠心病家族史等),預測冠心病患者3年發生MACE 事件的風險。結果顯示機器學習算法用于MACE 事件預測的brier 分數為0.07,表明基于機器學習算法的MACE 事件風險預測模型與觀察到的患者3年間發生MACE事件高度符合[51]。
目前,AI在心血管影像領域的應用均以自動化影像分析為核心。與手動測量心臟影像相關參數相比,AI減輕了影像科醫生手動分割圖像的工作量,提升了診斷的準確性和效能。與此同時,機器學習通過將心血管影像學資料轉化為可挖掘的數據,篩選出關鍵的影像特征,以構建疾病的診斷和預后風險評估模型。
目前,AI 技術在心血管病的醫學影像分析,疾病風險預測和患者健康管理過程中取得了良好的表現。但是現階段將AI 技術廣泛轉化到臨床實踐的工作中仍存在一些問題:影像自動分割模型和疾病危險評估模型的精準與否,與用來訓練模型的數據質量密切相關。低質量的影像數據和數據標注不恰當會導致錯誤的分類和預測結果。雖然我國有豐富的臨床電子醫療數據,但數據的標準化有待進一步提高。算法本身所存在的問題,例如深度學習網絡在樣本量較小的數據集上訓練時,會有過擬合風險。過擬合則會導致其他數據集部署到該模型時通用性較差[52]。同時,目前對于一些算法內在邏輯認識還不夠清楚,無法說服大多數心臟病學從業人員在臨床工作中使用“黑匣子”診斷。
未來,隨著機器學習算法的優化以及醫療數據標準化程度的提升,通過構建可靠的冠心病風險分層和結局預測模型,幫助醫生篩查出高風險患者,從而制定個性化治療和健康管理方案,降低心血管病的發病率,以緩解醫療衛生系統的負擔。與此同時,傳統基于患者自我健康管理往往效果不顯著,通過算法模型進行結局預測分析,使患者更了解自己的健康狀況,以增強患者本人的健康管理意識。綜上,為了實現這種新技術的臨床應用,后續仍需要優化機器學習算法以及提高醫療數據的標準化,以期我國AI技術在醫療領域的發展有望進一步提速。