郭家鋆, 魯鴻飛, 佘佳琦, 吳 東, 曾蒙蘇, 金 航*
1. 上海市影像醫(yī)學(xué)研究所,上海 200032 2. 復(fù)旦大學(xué)附屬中山醫(yī)院放射科,上海 200032
隨著心臟磁共振成像(cardiac magnetic resonance imaging,CMRI)對心臟疾病診斷、風(fēng)險評估和治療決策的臨床價值得到廣泛認(rèn)可[1],Cine序列作為CMRI的重要環(huán)節(jié)在心功能分析和心臟疾病診斷中越來越重要。雖然臨床上心超的應(yīng)用遠(yuǎn)多于CMRI,且心超的斑點追蹤技術(shù)能有效捕捉心肌運動,但CMRI空間分辨率和軟組織分辨率更有優(yōu)勢,同時能順應(yīng)心室形態(tài),分析心功能更為可靠,被作為參照標(biāo)準(zhǔn)。
目前三維CMRI圖像的人工智能分析和評價也是研究熱點。由于Cine序列圖像數(shù)量多,傳統(tǒng)手動分析方法耗時較長,人工智能的發(fā)展有望解決這一問題。但是,目前人工智能對于心腔大小和心肌厚度明顯異常患者的診斷價值需要更多研究來評價[2-3]。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)作為人工智能算法的基礎(chǔ),一直在不斷突破自動圖像分析的極限[4-5]。然而,全自動心臟分割仍然存在幾個難題,例如:心臟運動和機器干擾;乳頭肌和心內(nèi)膜小梁干擾[4-5];心房和心室以及腔室和血管的鑒別。盡管多項研究[6-8]已證明自動心臟分割能勝任CMRI分析,但臨床上仍傾向于半自動分割。
左心室功能(LV)與常見心肌病的診斷和治療密切相關(guān),如肥厚型心肌病(hypertrophic cardiomyopathy,HCM)和擴張型心肌病(dilated cardiomyopathy,DCM)。HCM是年輕人心源性猝死的主要原因,而DCM是心力衰竭的第三常見病因,因此明確不同心肌病心臟自動分割的準(zhǔn)確性有重要意義。本研究中旨在比較人工智能和手動方法在分析不同心肌病患者LV功能方面的差異,指出人工智能應(yīng)用于不同心肌病診斷的優(yōu)缺點。
1.1 一般資料 收集2014年3月至2019年11月在復(fù)旦大學(xué)附屬中山醫(yī)院接受CMRI檢查的393例心肌病患者及體檢者的臨床資料。本研究經(jīng)倫理委員會批準(zhǔn)(B2018-286);研究對象均簽署知情同意書。
其中HCM患者125例(HCM組),納入標(biāo)準(zhǔn)[9-12]:(1)有排除其他導(dǎo)致左心室肥厚的疾病后,CMRI顯示左心室肥厚(成人患者最大壁厚≥15 mm,有肥厚型心肌病家族史的患者最大壁厚≥13 mm);(2)心房、心室正常大小,射血分?jǐn)?shù)(EF)>50%。排除標(biāo)準(zhǔn):(1)有心肌梗死或心肌炎病史;(2)有間隔肌切除術(shù)或酒精性間隔消融史;(3)有心房顫動史。
DCM患者133例(DCM組),納入標(biāo)準(zhǔn):(1)心超提示EF≤50%;(2)冠狀動脈造影、正壓超聲心動圖或心肌灌注掃描未提示明顯的梗阻性狹窄(排除缺血性心臟病);(3)在接受CMRI之前癥狀持續(xù)時間超過6周(排除急性心肌炎患者)。排除標(biāo)準(zhǔn):結(jié)節(jié)病,HCM,致心律失常性右室發(fā)育不良和浸潤性心臟病的特異性診斷(如淀粉樣變性和淋巴瘤)[13-14]。
健康體檢者135例(對照組),均無導(dǎo)致胸悶、胸痛等癥狀的器質(zhì)性疾病,同時無代謝或心血管疾病史,體格檢查、心電圖及超聲心動圖正常。
1.2 CMRI圖像采集 所有病例均采用1.5T磁共振掃描儀(MAGNETOMAera,西門子)完成檢查,并使用心電圖門控和8通道心臟線圈。采用穩(wěn)態(tài)自由進(jìn)動(SSFP)序列,覆蓋整個左心室的短軸切面和長軸切面(包括雙腔心和四腔心層面)后獲得屏氣掃描圖像。其中Cine序列參數(shù)為重復(fù)時間/回波時間(TR/TE)3.2/1.6 ms,翻轉(zhuǎn)角度50°,矩陣256×230,視野(FOV)370 mm×278 mm,采集時間為每層12 s,層厚8 mm。
1.3 CMRI圖像分析 應(yīng)用人工智能軟件CVI425.3.4 進(jìn)行自動分析。CVI軟件自動選定左心室舒張末(ED)和收縮末(ES)時相,并在縱向和短軸Cine圖像上自動繪制心內(nèi)膜和心外膜輪廓。記錄自動分析結(jié)果后,由兩名具有5年以上CMRI評估經(jīng)驗的醫(yī)師再次以手動方式完成上述步驟[15]。體積計算采用Simpson方法[16]。以手動勾畫的結(jié)果為標(biāo)準(zhǔn),評價自動分割方法的準(zhǔn)確性。兩位醫(yī)師不被告知受試者情況,若意見出現(xiàn)分歧,通過協(xié)商達(dá)成一致。
1.4 統(tǒng)計學(xué)處理 采用SPSS 26.0及MedCalc軟件進(jìn)行統(tǒng)計分析。符合正態(tài)分布的計量資料用t檢驗,非正態(tài)分布的資料用Mann-WhitneyU檢驗。用Bland-Altman分析對各組的4個LV功能參數(shù)[EDV、ESV、EF和每搏輸出量(SV)]進(jìn)行自動與手動分析一致性檢驗。符合正態(tài)分布的變量采用Pearson檢驗,以相關(guān)系數(shù)(r2)評價變量之間的相關(guān)性;不符合正態(tài)分布的變量進(jìn)行Spearman檢驗。
2.1 人口學(xué)資料 結(jié)果(表1)顯示:3組間年齡、身高、體質(zhì)量兩兩比較差異均無統(tǒng)計學(xué)意義。
表1 3組研究對象的人口學(xué)資料比較
2.2 自動LV分割精度 結(jié)果(表2)顯示:DCM組LV自動分割錯誤率最高(24.8%)。圖1顯示自動LV分割常見情況。
表2 人工智能自動LV分割常見問題
圖1 自動LV分割常見問題
2.3 各組間LV功能參數(shù)比較
2.3.1 手動分析與自動分析結(jié)果比較 結(jié)果(表3)顯示:HCM組EDV、ESV、EF和SV自動與手動分析結(jié)果差異均無統(tǒng)計學(xué)意義;DCM組ESV自動分析結(jié)果大于手動分析,SV和EF小于手動分析,差異均有統(tǒng)計學(xué)意義(P<0.01);對照組EF和SV自動分析結(jié)果大于手動分析,差異均有統(tǒng)計學(xué)意義(P<0.01)。
表3 手動分析與自動分析LV功能參數(shù)結(jié)果比較
2.3.2 組間比較 結(jié)果(表4)顯示,與對照組相比,DCM組EDV和ESV手動和自動分析結(jié)果均增大(P<0.01),EF和SV手動和自動分析結(jié)果均減小(P<0.01)。與對照組相比,HCM組ESV手動和自動分析結(jié)果均減小(P=0.02),EF和SV手動和自動分析結(jié)果均增大(P<0.01),而EDV無明顯變化。
表4 各組LV功能參數(shù)結(jié)果比較
2.4 LV各參數(shù)自動分析結(jié)果診斷DCM、HCM的價值 結(jié)果(圖2,表5)顯示:自動分析ESV診斷DCM、EF診斷HCM的曲線下面積(AUC)分別為0.935和0.695。ESV區(qū)分DCM患者的最佳截斷值為111.3 mL,靈敏度和特異度為96.15%和85.19%。EF區(qū)分HCM患者的最佳截斷值為53.8%,靈敏度為78.05%,特異度為54.07%。自動分析各LV參數(shù)對DCM診斷價值大于HCM。
2.5 LV各參數(shù)自動分析與手動分析的相關(guān)性與一致性檢驗 結(jié)果(表6,圖3A)顯示:各組EDV與ESV自動分析結(jié)果均與手動分析結(jié)果高度相關(guān)(r2>0.9,P<0.01);DCM的4個參數(shù)自動與手動分析結(jié)果的相關(guān)性均最低;HCM與對照組EF和SV的自動與手動分析結(jié)果的相關(guān)性均較高。Bland-Altman分析(圖3B)顯示:DCM的EDV和ESV被高估,EF和SV被低估。
圖2 LV各參數(shù)自動分析區(qū)分DCM(A)、HCM(B)的ROC分析
表5 自動分析對DCM和HCM患者的診斷性能
表6 自動與手動分析LV功能的相關(guān)性
3.1 CVI軟件的在心肌病中的應(yīng)用 CVI軟件的CNN算法基于大量CMRI病例(包括HCM與DCM)的學(xué)習(xí)。本研究測量了CNN在健康人和HCM、DCM患者中的通用性,EDV、ESV和SV的自動與手動分析結(jié)果在HCM患者中的相關(guān)性與一致性最高,在DCM患者中最低,提示人工智能可靠性可能與心肌厚度相關(guān)。心室壁增厚有利于識別心內(nèi)膜和心外膜,而DCM患者心腔擴大、室壁變薄,因此增大了識別難度[17]。
本研究中DCM的EF自動分析結(jié)果多分布在Bland-Altman圖軸線上方。因此,在臨床實踐中,如果沒有手動校正,DCM的EF結(jié)果會偏小,甚至為個位數(shù),與相關(guān)研究[15-16]結(jié)果相符。因此,醫(yī)師傾向于校正左心室心內(nèi)膜邊界,有意增加DCM患者EF,這可能是造成人工智能與手動分析間偏差的原因。而且,DCM患者心臟的橫向重建常影響旋轉(zhuǎn)力學(xué),如心尖旋轉(zhuǎn)和環(huán)向扭轉(zhuǎn)減少,這可能導(dǎo)致ES和ED的錯誤定位,從而增加人工智能測量的誤差[18]。
本研究中,人工智能從CMRI中獲得的EDV、ESV和SV對DCM的診斷價值優(yōu)于HCM。這可能是由于HCM的診斷主要由心肌厚度和EF決定,而不是由心室容積的變化決定,而DCM患者EF的顯著下降常伴隨心室容積的變化。本研究發(fā)現(xiàn),對照組EF和SV手動和自動分析結(jié)果差異有統(tǒng)計學(xué)意義,其中CVI軟件對二尖瓣層面的勾畫失誤可能為主要原因,進(jìn)而使EF和SV的基線水平上移。但DCM組EF和SV的自動分析結(jié)果仍小于手動分析結(jié)果,進(jìn)一步說明CVI低估DCM患者的病情程度。
圖3 LV功能參數(shù)的自動與手動相關(guān)性(A)和Bland-Altman一致性(B)
2.2 CVI分析存在的問題及改進(jìn) Liu等[18]首先確定了CVI在三維CMRI應(yīng)變分析中的參考范圍,進(jìn)而發(fā)現(xiàn)心內(nèi)膜的徑向勾勒可能對平面特征缺失非常敏感,這是由于CVI軟件沿著細(xì)微扭曲的心內(nèi)膜邊界進(jìn)行勾勒。當(dāng)二尖瓣環(huán)的原始節(jié)段部分丟失時,醫(yī)師會模擬二尖瓣環(huán)的位置,以便進(jìn)一步分析,但CVI軟件常無法識別這類心肌丟失的層面,從而進(jìn)一步導(dǎo)致評估錯誤[18]。
由于16段心肌在軸向、徑向和環(huán)向上都有位移,而心尖和底部常難以掃描到。雖然擴大掃描范圍和層面可以解決該問題,但同時增加患者反復(fù)屏氣的負(fù)擔(dān)。因此,操作者優(yōu)化解剖定位或糾正錯誤非常重要,如糾正胃或心尖部的誤判,或ES的錯誤識別。CMRI圖像Cine序列被用于進(jìn)行回顧性分析重建時,不同層面可能存在心動周期時相的細(xì)微差異,因此CVI軟件在自動定位ES時需要微調(diào)。而靠近心尖部層面的心室腔縮小,加之肌小梁結(jié)構(gòu)相對豐富,易被認(rèn)作心外結(jié)構(gòu)而被遺漏。此外,工程師可以針對心臟解剖的先驗知識進(jìn)一步改進(jìn)CNN模型。但是,這2種解決方案都有缺點:前者會增加醫(yī)生的負(fù)擔(dān)并降低評估效率;而后者需要建立新的算法,即需要更新CNN算法本身。
目前的研究[19]已經(jīng)證明,訓(xùn)練數(shù)據(jù)有限的CNN具有較低的通用性,而擴大訓(xùn)練數(shù)據(jù)集,包括來自不同數(shù)據(jù)源的足夠數(shù)據(jù)是提高其通用性的簡單方法。因此,增加深度學(xué)習(xí)數(shù)據(jù)庫中各類心肌病患者的數(shù)量可以改進(jìn)CNN對不同心肌病患者的診斷效能[20]。由于心臟運動的連續(xù)性,臨床也可以通過對1個心動周期內(nèi)所有Cine圖像的追蹤,使CVI分析對結(jié)果中突發(fā)的、不現(xiàn)實的心內(nèi)膜運動自動報錯,以此優(yōu)化整個算法[21]。最新研究[22-23]提出新的分割心臟周期中LV內(nèi)膜的方法,將來可以借鑒這些分割方法,提高分割結(jié)果的準(zhǔn)確度。
本研究仍有一些局限性:(1)為回顧性研究,前瞻性臨床應(yīng)用仍有待評估;(2)為單中心試驗,尚需多中心研究驗證結(jié)論;(3)限制性心肌病、瓣膜性心肌病等其他心肌病未被納入;(4)未分析心室壁解剖結(jié)構(gòu)的判斷錯誤及部分層面的遺漏與掃描前訓(xùn)練的相關(guān)性。
綜上所述,本研究表明,對于不同心肌病,基于深度學(xué)習(xí)的CNN心功能分析可能具有不同的性能,在HCM中的表現(xiàn)優(yōu)于DCM。盡管人工智能易低估DCM患者的心功能,但對EDV、ESV等的分析結(jié)果對診斷DCM較HCM更有幫助。在診斷HCM時,不能依賴人工智能分析。準(zhǔn)確、高效的心功能分析是人工智能的主要優(yōu)勢,因此人工智能未來可以為心肌病的診斷提供更多有價值的信息。
利益沖突:所有作者聲明不存在利益沖突。