黃曉紅、曾俊童、胡圣懿綜述,鄭哲審校
心電信號是心肌電活動產生的生物信號。近年來,人工智能(AI)技術輔助的心電信號如心電圖(ECG)和光電容積脈搏波(PPG)信號的分析逐漸成為研究熱點[1]。在中國,心血管疾病患病率處于持續上升階段[2],ECG 作為一種無創的心電監測手段,對其有重要的診斷價值[3]。但對ECG 的準確解讀為臨床運用的主要局限,且ECG 的解讀規則長期無更新[4]。近年來,PPG 作為一種新興心電信號,已被證實與ECG 之間存在高度相關性[5]。PPG 通過記錄血管中血流量的變化反映心臟泵的狀態,基于PPG的心電參數測定已被廣泛用于便攜醫療設備中指氧、心率、血壓等信號的連續監測中。
隨著醫療大數據的發掘和應用,AI 技術在處理復雜醫學信息方面展示出巨大潛力。機器學習(ML)作為運用最廣泛的AI 技術,在自動分析和學習變量之間關聯模式方面存在優勢。深度學習(DL)通過模仿人腦多層神經網絡結構與分析模式,學習輸入數據的內在規律和表現層次,并進行自動預測。其中,卷積神經網絡模型(CNN)尤其擅長以圖像為輸入信號的預測任務,因而在AI 輔助心電信號波形分析中應用廣泛[6]。
本綜述總結了國內外近年來AI 輔助ECG(AIECG)和PPG 分析在心血管疾病診療中的最新研究進展,并討論目前研究的局限性與未來推廣的關注重點。
心肌缺血的常見ECG 表現包括ST 段或T 波改變等,但在臨床診療中其靈敏度和特異度并不理想[7]。對于缺血性心臟病,目前多數AI-ECG 分析算法研究主要集中于急性冠狀動脈綜合征(ACS)。Al-Zaiti 等[8]利用一組前瞻性急診胸痛患者(n=745)的ECG,分別構建了三種預測ACS 的ML 模型,并在另一組外部隊列中(n=499)進行驗證。結果顯示,聯合三種ML 模型對ACS 預測的AUC 可達0.82(95%CI:0.77~0.86),顯著優于臨床醫師AUC [0.67(95%CI:0.61~0.74)],同時其靈敏度達到77%,相比臨床醫師(40%)和商業心電圖診斷軟件(25%)均明顯提高。此外,一系列研究提示,ECG 中存在大量潛在急性心肌缺血相關信息有待開發。Bouzid 等[9]基于專家的識別與ML 特征提取的方法,從544 個ECG 的時間-空間特征中確定了73 個同時具有生理學基礎與數據關聯性的心肌缺血特征,并證實了由這些特征構建的邏輯回歸模型在驗證集(n=499)中診斷ACS 的靈敏度顯著優于臨床醫師與商業ECG診斷軟件(72% vs.40% vs.25%)。此類相關新型ECG 特征對今后心肌缺血診斷規則更新有重要參考價值。
近年來,心律失常的ECG 輔助分析與診斷成為AI 算法的重要研究熱點。Hannun 等[10]利用來自53 549 例患者的91 232 張單導聯ECG 訓練了一個端到端的深度神經網絡(DNN)模型,可將輸入的ECG自動分為包括正常心律、噪音信號以及10 種常見心律失常在內的12 類預測結果。在包含328 張ECG的獨立驗證集中,模型對各類心律失常預測的平均AUC 約為0.91,調和平均數(F1)顯著優于心內科醫師的平均水平(0.837 vs.0.780)。研究者進一步將該算法遷移至一個外部公共ECG 數據庫中進行端對端訓練并驗證(n=8 528),得到相似的效能(F1=0.830),提示其存在較好的外推性。Zhu 等[11]的研究算法實現對有多個心律失常診斷的ECG 識別,平均F1 值達到0.887,進一步驗證了AI 輔助ECG 心律失常分析應用的廣泛性。
心房顫動(房顫)在國內外AI-ECG 研究中已初步取得較好的預測效果。Cai 等[12]開發了一種一維深度密集連接神經網絡模型以識別ECG 上房顫信息,該研究利用多中心16 557 張12 導聯10 s ECG訓練模型,模型在測試集的準確度與靈敏度分別達到(99.35±0.26)%和(99.19±0.31)%。除了識別ECG 中已明確存在的房顫信號外,Attia 等[13]實現了在當前無明顯房顫特征信號的ECG 中分析并預測未來房顫發生;其研究假設此類患者在ECG 上出現房顫特征性變化前心臟已經存在如纖維化等結構變化,但其所反映的細微ECG 變化難以被人眼所識別。因此,該團隊利用來自180 922 例患者的649 931 張竇性ECG,訓練并驗證了一個可通過分析無明確房顫特征的ECG 來預測患者既往是否曾發生過房顫的CNN 算法。在一個包含3 051 例(8.4%)曾有至少一次明確房顫的患者測試集中,所訓練的AI 輔助算法實現正確預測的AUC 可達0.87(95%CI:0.86~0.88),提示基于CNN 圖像識別技術的ECG 輔助分析算法對于細微、非特異性房顫特征的識別存在一定可行性。
許多心血管疾病盡管缺乏明確ECG 診斷標準,但其相關的心臟結構與功能變化仍有可能引起ECG改變。因而,利用AI 技術分析相關ECG 并進行預測,有望用于提高疾病診斷驗前概率,輔助高危人群的早期診療。
左心功能不全與相關臨床危險因素、B型利鈉肽、某些心電圖特征等顯著相關,但其預測效能均欠佳,疾病篩查的成本-效益比有待考量[14]。為提高基于ECG 信息的左心室功能不全的診斷效能,Attia 等[15]納入來自44 959 例患者的12 導聯ECG 構建了一個預測左心室收縮障礙(LVSD)的CNN 模型,該模型在52 870 例患者的外部驗證中取得了較好的預測效果(AUC:0.93)。同時,即使被該模型識別為陽性、但實際目前非LVSD(即假陽性)的患者,其未來發生LVSD 的風險相比陰性患者升高4 倍以上,提示模型預測結果存在一定預后危險分層價值。Jentzer 等[16]進一步構建了一個LVSD死亡風險預測AI-ECG模型,預測結果與住院死亡率(校正后OR=1.05,95%CI:1.03~1.08)及1 年死亡率(校正后HR=1.04,95%CI:1.03~1.05)相關。同樣,Kagiyama 等[17]構建了一個預測左心室舒張速度的AI-ECG 模型,其內部驗證和外部驗證平均絕對誤差分別為1.46 cm/s 和1.93 cm/s,提示ECG 有望作為左心舒張障礙的初步預測手段。
HCM 存在相應的非特異ECG 表現(如電軸左偏、左心室高電壓、T 波倒置和異常q 波等)。Ko等[18]納入梅奧診所3 060 例HCM 患者及63 941 例對照,訓練并驗證了一個HCM 的CNN 預測模型,AUC 可達到0.95(95%CI:0.94~0.97);亞組分析提示該模型在年輕人(< 40 歲)中的診斷效能尤其好。Tison 等[19]基于36 186張12導聯ECG所構建的CNN-ECG 模型在結合臨床變量基礎上對HCM 預測的AUC 可達到0.91(95%CI:0.90~0.92)。研究者進一步發現,對該模型HCM 預測具有高度提示意義的ECG 特征包括V1導聯ST-T 段后半段、P 波時長、QT 間期、PR 間期等。
超聲心動圖為心臟瓣膜疾病的主要評估與診斷方式[20],但ECG 中也存在許多疾病相關信息。Kwon 等[21]納入32 186 張ECG 構建了一個預測主動脈狹窄(AS)的CNN 模型,在10 865 張ECG 構成的外部驗證隊列中,該模型的AUC 可達到0.861(95%CI:0.858~0.863)。靈敏度分析提示,胸前導聯T 波為模型識別重度AS 的關鍵ECG 特征。Cohen-Shelly 等[22]利用梅奧診所258 607 份ECG 也構建了一個CNN 模型(AUC:0.85),在15 年隨訪中顯示,即使被模型預測為假陽性的患者,其發生中重度AS 的風險是真陰性患者的兩倍以上(HR=2.18,95%CI:1.90~2.50),提示這種基于ECG 的模型預測結果可作為AS 疾病預測的潛在“生物標志”?;陬愃频姆椒?,Kwon 等[23]納入56 670 張ECG 構建CNN 模型以預測中重度二尖瓣反流,也獲得了較好的預測效能(AUC:0.877),提示AI 分析技術有望提高多種心臟瓣膜病的ECG 預測效能。
相較傳統數理統計分析,AI/ML 模型可自動提取、整合大量潛在PPG 信號特征用于模型預測(表1),利用高效的分析計算能力,深入發掘變量間的復雜關聯性,提升模型整體的預測效果。

表1 基于PPG 信號的心律失常監測研究
可穿戴設備因其無創、便攜性,可實現對于機體生物信號的連續監測與采集。智能手表為近年來最廣泛普及與研究的可穿戴智能設備,其已實現通過PPG 信號采集以監測、預測心律失常事件的發生。2017 年基于美國大規模社區人群的Apple 心臟研究入組419 297 例蘋果手表使用者,在為期117 d的中位觀察時間中,共2 161 例(0.52%)佩戴者收到不規則心律提示,其中450 例受試者完成后續確診性ECG 評估;結果顯示,明確診斷房顫的比例(即陽性預測值,PPV)為34%(95%CI:29%~39%)[29]。類似地,Guo 等[30]納入187 912 例華為智能手表使用者的華為心臟研究中,262 例受試者收到可疑通知且完成確診評估,其中227 例最終確診存在房顫,PPV 為91.6%。相比于Apple 心臟研究,華為心臟研究對PPG 信號分析額外制定了一套更為嚴苛的規則判斷算法,以提高其發出的可疑房顫通知的準確性。盡管目前消費市場上已有多種具備類似心律監測功能的可穿戴設備,但達到醫療器械監管要求的設備數量仍較少。
由于可穿戴設備需要與人體直接接觸采集PPG信號,因而易受采集部位移動帶來的影響。近年來,出現了以分析現成視頻影像中監測部位光線顏色變化進而提取出視頻PPG(iPPG)的非接觸式PPG 技術,以期用于廣泛人群中更優成本-效益比的房顫篩查。Yan 等[31]通過智能手機攝像頭采集217 例住院患者的面部視頻錄像,進而提取iPPG 信號并分析其脈搏間變異性,以實現房顫檢出。研究結果顯示,基于iPPG 的房顫監測靈敏度和特異度分別為95%和96%,且與同期采集的指尖PPG 信號監測房顫的結果具有高度一致性(k=0.86,95%CI:0.79~0.93),初步驗證了分析iPPG 用于房顫監測的可行性。Yan等[32]進一步利用iPPG 采集的非接觸特點,將5 例患者同時拍攝于視頻畫面內,并利用一個此前驗證用于房顫監測的DNN 算法[25]來分析上述多例患者的iPPG。結果顯示,在區分房顫與竇性心律方面,算法靈敏度可達到93.8%,特異度為98.1%;且同時將一段視頻內5 例患者均判斷正確的概率為79.7%。基于該研究所展示的非接觸式、多人同時房顫監測場景,將有望嘗試于房顫大規模社區人群篩查。隨著相關傳感器技術進步以及基于PPG 心電分析設備研究的開展,未來在心律失常移動監測領域將涌現出更多相關研究與產品[33]。
盡管AI 模型預測效果在多項研究中已取得令人滿意的效果,但在臨床應用與推廣方面仍存在較大阻礙,未來的工作應注意以下幾方面。
目前AI 輔助心電分析研究多由單中心開展,其預測效能在外部研究的表現尚不明確。Attia 等[34]對其基于單中心ECG 所訓練的LVSD 預測模型進行外部驗證時,模型靈敏度僅為26.9%,顯著低于其原始訓練人群(靈敏度:86.3%)。對于數據驅動的AI 模型構建而言,多中心的數據來源是訓練數據體量與廣度的保證。此外,臨床實踐中不同中心、不同儀器所采集的心電信號種類與格式均可能存在差異,這將顯著影響模型于外部驗證中的效能。因此,多渠道來源的訓練數據與廣泛的外部驗證,應為此類AI 模型臨床應用的重點。目前,已有公共數據庫(如PhysioBank、PhysioToolkit、PhysioNet[35]、PTBXL[36]等)為基于心電信息的AI 模型開發提供龐大且多樣的數據來源。
AI 算法結果的解釋性(“黑箱”問題)是限制其臨床應用的主要困難,也是包括監管部門、臨床醫師以及患者等多方參與者是否信任AI 算法的重要前提。Lin 等[37]通過對不同面部區域的遮蓋,從而明確所開發的基于面部照片的冠心病AI 算法預測的重點關注區域,與既往文獻報導的冠心病相關面部特征存在一致性。這在提示算法可能工作原理的同時,提升了算法效果的可信度。類似地,Cohen-Shelly 等[22]借助顯著性地圖分析展示了算法關注的ECG 重點區域。Bouzid 等[9]則通過結合專業領域知識與算法數據篩選,共同提取73 個與ACS 相關的ECG 特征,進而利用這些特征構建了一個內在可解釋的ACS 預測算法。這類AI 算法可解釋性研究不僅增加了算法預測的可信度,也有助于發現新的臨床知識。
目前基于AI 算法的心電分析涉及疾病的篩查、診斷及預后等多種臨床場景,尚未明確其在實際臨床診療中的最佳運用環節及適應證等,且普遍存在回顧性數據采集、缺乏嚴格外部人群驗證等問題,仍應通過開展前瞻性臨床試驗來論證其是否能夠帶來臨床獲益。Glissen 等[38]開展的全球首個驗證AI算法臨床有效性的獨立外部隨機對照臨床試驗,論證了在臨床中醫師在基于結腸鏡視頻的AI 輔助下,相比單純醫師常規診療的腺瘤漏診率降低近36%,單次腸鏡平均腺瘤檢出率增加近33%,明確了該AI算法的臨床應用場景及獲益。
心電信號如ECG、PPG 在臨床具有重要應用價值,AI 技術有望充分發掘其中大量未知信息、提高心電信號分析的預測效果。目前,基于AI 技術的心電信號分析模型已在多種心血管疾病的診斷中展示出較高的預測效果。搭載于可穿戴設備的PPG 信號采集可實現長程、持續的心律監測,而非接觸式的iPPG 信號則有望進一步提高疾病篩查的效率。目前研究的主要局限性包括模型訓練與驗證的數據庫來源單一、缺少高質量的外部人群驗證、模型機制與結果的可解釋性工作較不足等方面。因此,未來研究應將模型外推性、可解釋性以及真實臨床場景評估作為研究的重要方向。
利益沖突:所有作者均聲明不存在利益沖突