秦地茂 李夢依 吳霜 鄧祁 姚堯 劉英杰 鄭穎
(西南交通大學附屬醫院 成都市第三人民醫院 成都市心血管病研究所,四川 成都 610031)
在21世紀,隨著大數據的爆發和算法的改進,人工智能飛速發展,因其有從海量數據中學習的能力,并將結果應用于不同的環境,被稱之為21世紀科技領域的皇冠。基于人工智能的應用已在包括醫學的許多領域中開展。最近,研究者們將其用于臨床疾病的預測和診斷[1]。心血管疾病是全世界范圍內最主要的死亡原因之一,在廣大發展中國家,心血管疾病負擔正逐漸增加。目前,基于人工智能的系統已廣泛應用于心血管成像和心血管疾病風險預測[2-4],尤其是支持向量機算法。
然而,人工智能在心律失常方面的應用依舊是冰山一角。心房顫動(房顫)作為一種主要的心律失常,與卒中和心力衰竭密切相關,危害極大,增加了社會和經濟負擔。對于房顫,現有的篩查手段不佳,而人工智能在該領域發展十分迅速,潛力極大[5]?,F主要闡述人工智能預測房顫的進展。
人工智能主要指模擬和模仿人類智能以解決實際問題的計算程序。20 世紀 50 年代“人工智能”被首次提出,至今60多年的發展,人工智能以機器學習、深度學習為核心,在視覺、語音、通信等領域快速發展,悄然改變著人們的生活及工作方式。人工智能可從海量數據中學習,并基于學習的模型執行任務,而機器學習是人工智能中主要的核心領域,主要基于人類經驗和知識所創建的預設規則而執行任務。其主要目的在于構建類似人腦的神經網絡,運算模型主要包括人工神經網絡和卷積神經網絡。
機器學習主要包括了監督學習、非監督學習及深入學習等。監督學習中目前最常用的算法是人工神經網絡和支持向量機。非監督學習包括了聚類算法和關聯規則算法等。深入學習包括了循環神經網絡、卷積神經網絡以及深度神經網絡[1]。
在這些機器學習方式中,比較值得提出的是支持向量機,它是一種二類分類模型。它的基本模型是定義在特征空間上的間隔最大的線性分類器,間隔最大使它有別于感知機;支持向量機還包括核技巧,這使它成為實質上的非線性分類器。支持向量機的泛化錯誤率較低,具有良好的學習能力,且學到的結果具有很好的推廣性,這些優點使得支持向量機十分流行。
房顫是一種常見的節律紊亂,與缺血性腦血管事件和心力衰竭的風險有關[3]。在人工智能應用于臨床醫學之前,大量的研究已經證實了多個可以預測房顫的危險因素,包括房顫病史、實驗室數據(如心臟炎癥生物標志物等)、影像學數據(如心臟計算機斷層掃描、心臟磁共振成像、超聲心動圖等)和電生理數據。在機器學習的預測中,最常見的變量有年齡、種族、身高、體重、血壓、吸煙狀況、用藥情況和合并癥。另外一些心臟結構異常的變量,包括心房纖維化、心房擴大、二尖瓣反流和心房應變,已被證明是房顫的預測因素[6-8]。另外,其他的一些變量,如C型利尿鈉肽、C反應蛋白、半胱氨酸蛋白酶抑制劑和血管內皮功能障礙等指標也被逐漸引入房顫的預測之中[9-10]。總體而言,有大量的臨床變量已被證明可以單獨或與其他變量聯合來預測房顫。
2.2.1 心電圖結合臨床數據預測房顫
在一項納入了200萬例受試者的大型研究中,Tiwari等[11]將200多個最常見的健康數據(包括人口統計學和共病數據)與機器學習模型相結合預測6個月之內的房顫,最后其曲線下面積(area under curve,AUC)為0.79,該結果與非機器學習的臨床房顫風險評分是一致的。Sekelj等[8]對來自英國的200多萬初級保健患者預測7年的房顫事件的研究中,另一種機器學習算法在訓練數據集中AUC為0.83,而在驗證數據集中AUC為0.87,這表明與傳統的風險評分相比,機器學習模型性能更好。
在最近一項近300萬例患者的英國的研究[11]中,研究人員將一種帶有時變協變量的機器學習算法與Charge-AF風險評分進行了比較。研究結果提示時變模型的AUC為0.827,而應用于同一人群的Charge-AF風險評分的AUC為0.725,其中,充血性心力衰竭對房顫事件的預測貢獻最大。雖然這些算法沒有經過前瞻性的測試,也沒有得到外部驗證,但其樣本量大、數據充分,可靠性有較大的保證。然而,現有的機器學習算法也存在諸多缺陷,許多因素會影響結果的真實性。首先,不同研究的隨訪時間差異很大,從6個月到10多年不等,這將導致隨訪時間不足,如Tiwari研究隨訪時間為6個月,可能由于隨訪時間較短而降低了測試性能,不能真正辨別出“真假陽性”。
2.2.2 心電圖的數據模擬預測房顫
心電圖的自動解析中監督學習最為常見,原因在于機器學習模型能夠精準識別不同的心電圖波形。此外,一些判斷ST段變化以及房顫和傳導阻滯的模型也被廣泛應用[10]。例如,有研究者提出了一種新型的心律特征提取方法,該方法使用小波變換和自回歸建模來描記心電圖,然后運用支持向量機對不同心律失常進行分類。驗證結果發現該方法對竇性心律、左束支傳導阻滯、右束支傳導阻滯、室性期前收縮和房性期前收縮測試準確度分別為100%、98.66%、100%、99.66%和100%。
此外,利用大量心電圖的數據模擬醫生分類和識別房顫是另外一種方法。后者可分為以下幾類:(1)基于心電圖波形預測房顫:主要是P波,其理論依據在于即使心臟結構似乎完全正常,在房顫發生之前,心房可能就存在纖維化、缺血、心肌肥大,這些可能導致輕微的、在心電圖上肉眼難以察覺到的P波改變。以前的一些研究[12-14]結果表明,心電圖表現如P波持續時間、離散度和振幅,以及心房期前收縮的形態和頻率,已被證明可以預測房顫的發生,其AUC為0.69~0.87。當然,除P波改變之外,如QRS波群、T波改變也被用于預測房顫。一項研究[15]納入了652例接受24小時動態心電圖監測的患者。結果發現房性期前收縮收縮特征占收縮負荷百分比是房顫的危險因素,其AUC為0.58。此外,心電圖的諸多成分已被證明與消融后房顫復發的風險相關。例如,在一項對140例患者的研究[16]中,包括房顫患者心電圖的主導頻率、規則指數和組織指數在內的多個心電圖特征對房顫消融后的復發顯示出預測價值。(2)基于心率變異性預測房顫:Ebrahimzadeh等[17]在53例心電圖記錄的患者中進行了一項小型研究,試圖使用心電圖監測中的心率變異性分析評估不同的機器學習技術以預測房顫。在這項自身對照研究中,所有患者都有陣發性房顫發作,其中房顫發作前30 min獲得的5 min心電圖節段(房顫標記)與房顫終止45 min后獲得的5 min心電圖節段(非房顫標記)進行比較。研究者從心率變異信號中識別出線性、非線性和時頻特征,且發現組合的機器學習方法比傳統的機器學習分類器(多層感知器、K最近鄰和支持向量機)性能更好。
2.2.3 利用生物信息學數據預測房顫
其他的包括基于心電圖時程以及導聯也被應用于房顫的預測,但是,總體而言,研究較少,目前未得到廣泛推廣。此外,利用機器學習挖掘生物信息學預測房顫也逐漸成為現實。一項生物信息學研究[18]從基因表達綜合(gene expression omnibus,GEO)數據庫中下載了4個微陣列數據集,包括130個瓣膜性心臟病患者房顫或竇性心律的心房樣本。采用微陣列薈萃分析來鑒定差異表達基因。研究者利用涉及微陣列薈萃分析的130個樣本的訓練集,將基于機器學習相關性的特征選擇方法(correlation-based feature selection,CFS)引入了房顫的選定基因。結果鑒定出30種具有一致趨勢的生物標志物。此外,通過CFS方法從30種生物標志物中選擇了10個核心基因,包括8個上調基因(CD44、CHGB、FHL2、GGT5、IGFBP2、NRAP、SEPTIN6和YWHAQ)和2個下調基因(TNNI1和TRDN)。其準確率為87.5%,AUC為0.995。
2.2.4 房顫復發的預測
除了對房顫的預測之外,少量研究探討了機器學習對于預測房顫復發的作用。國外的一項研究[19]探討了機器學習預測射頻消融術后房顫復發的風險:在訓練集中,低風險組的AUC值為0.935,中危組的AUC值為0.855,高危組的AUC值為0.965。機器學習模型成功地預測了測試集中的高危組房顫的風險。這些結果提示機器學習成功地將射頻消融術后進展為永久性房顫的高?;颊哌M行了分類。這項結果也在另一個大型的觀察性研究中得到了證實[20]。
人工智能已滲透入醫學的方方面面,與傳統統計方法相比,機器學習引入了云計算,在海量樣本的支持下,更容易發現內在的規律,在預測房顫方面已經初步顯示出優越性,此外,機器學習終端設備(如手機及智能設備)的出現可以給醫療提供實施決策,給患者帶來較好的體驗。然而,機器學習中,數據的清洗、數據庫的整合以及倫理方面仍然存在諸多應用的難點,真正應用于臨床仍然存在一定時間。