季偉敏 唐士敏 何俊德 王學斌 尹微 葛以山 羅顯元
中國心血管病患病率及死亡率仍處于上升階段,截至2018 年,推算心血管病患病人數(shù)2.9 億,其中腦卒中1 300 萬,冠心病1 100 萬,肺源性心臟病500 萬,心力衰竭450 萬,風濕性心臟病250 萬,先天性心臟病200 萬,高血壓2.45 億,且心血管病死亡率居首位[1]。 以心肌梗死為代表的缺血性心臟病,更是成為全球疾病致死的首要原因。 心血管病發(fā)病因素多、病程長、干擾因素多、發(fā)病機制復雜,難以精確構建傳統(tǒng)的數(shù)學模型。 人工智能是研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學,也是在計算機科學、心理學、語言學、統(tǒng)計學、哲學等多個學科研究基礎上發(fā)展而來的綜合性學科,是21 世紀三大尖端科技之一[2]。 人工智能方法可利用各種模糊邏輯理論的分類及回歸算法、人工神經網絡算法、機器學習算法等技術手段,根據輸入的經驗和信息,以及構建概念,完成那些對人類來說容易執(zhí)行但難以形式化描述的任務[3],解決“無師自通”的辨識問題。
心血管病早期篩查對象范圍廣、篩查項目多,應用人工智能的技術與方法也不盡相同。 本文對心血管病早期篩查的相關文獻進行綜述,從危險因素篩查與評估分層,以及體檢篩查的實施這兩個層面對人工智能技術應用進行分析研究。
根據國內外最新的流行病學和心血管病防治的循證醫(yī)學證據,我國制定了《中國心血管病風險評估和管理指南》,并將其作為開展心血管病風險評估和危險因素管理的指導方案,包括心血管病10年風險和終生風險評估的流程、風險分層依據和風險評估工具的使用[4]。 在《中國心血管病預防指南(2017)》《中國成人血脂異常防治指南(2016 年修訂版)》中,將5%和10%的缺血性心血管病風險分別作為劃分心血管病風險低、中、高危的切點值[5-7],再結合個體病史、風險水平等因素進行分層管理。
2016 年逄凱等[8]使用人工智能機器學習的隨機森林算法,提出了僅包含年齡、性別、職業(yè)、平均睡眠時間和體格檢查指標等變量的冠心病篩查模型(敏感性80.75%,特異性63.45%)。 該模型能夠在保證精度的前提下減少所需輸入信息,顯著提高疾病篩查的時效性和模型的易用性,顯示出人工智能方法應用于冠心病早期篩查及評估的潛力。 此外,從樣本數(shù)據的變量重要性排序中,還可以獲得疾病影響因素排序,有助于指導心血管疾病的日常監(jiān)督和管理。
2016 年楊學禮團隊基于中國10 年大樣本隊列數(shù)據研究,建立了更符合中國人群特點的中國缺血性心血管病危險預測模型,即China-PAR 模型[9]。該模型以性別、年齡、現(xiàn)居住地、地域、腰圍、總膽固醇(TC)、高密度脂蛋白膽固醇(HDL-C)、血壓、服用降壓藥、糖尿病、吸煙、心血管病家族史等為輸入指標,整合了“中國心血管健康多中心合作研究”(InterASIA)、“中國心血管病流行病學多中心協(xié)作研究”(ChinaMUCA)等4 項最新的中國人群前瞻性隊列隨訪數(shù)據,總樣本量達12 萬,得到了更符合中國人群特點的低、中、高危切點劃分[9]。 預測模型采用綜合區(qū)分度改善指數(shù)、凈再分類改善指數(shù)等統(tǒng)計量和事先確定的納入及排除標準,進行模型自變量的篩選;以統(tǒng)計學及多變量多函數(shù)的邏輯關系為基礎,對新危險因素的增量信息建立數(shù)學模型并進行預測[9]。 在楊學禮團隊的上述定性分層研究中沒有用到人工智能的模糊邏輯理論與方法,但若要對某一群體進行更準確的危險分層,則要以此為基礎進一步細化模型并增加危險因素。
上述研究主要是以普通人群為研究對象,以統(tǒng)計學及多變量多函數(shù)邏輯關系為基礎,通過建立人工智能預測模型,對新風險因素的增量信息建立數(shù)學模型進行預測。 目前的定性分層研究中沒有使用人工智能的模糊邏輯理論方法,但作為后期人工智能方法的應用基礎,可再納入變量及其定義,開展前瞻性隊列分層研究,依托現(xiàn)代計算機技術能力的增強和數(shù)據樣本的增多,利用人工智能技術有望建構實用性較強的預測模型。
體檢篩查的實施是以評估分層原則為基礎,以心血管病危險因素的篩查與評估分層結果為基本參照依據,對低、中、高不同危險層級人群所做的心血管病早期篩查[10-11]。 下面我們針對不同心血管病危險層級的早期篩查中所應用的人工智能方法進行研究分析。
除了常規(guī)體檢項目外,低危及以下體檢篩查人群的常規(guī)必查項目主要包括頸動脈超聲檢查,脈搏波傳導速度、踝臂指數(shù)檢查。 2019 年肖月桐等[12]利用基于深度神經網絡的人工智能技術方法,研究心電圖自動分類診斷技術,通過直接對預處理后的心電信號進行神經網絡圖形識別學習訓練,逐層提取心電圖特征,最終擬合出心電圖自動分類模型;再利用訓練好的分類模型對臨床心電圖進行分類診斷測試,取得了良好的效果。 該研究中運用的人工智能技術主要是針對心電圖圖像進行圖形特征識別,在深度學習訓練中則采用監(jiān)督學習的方法。
李方潔[13]認為,利用心電散點圖技術分析心電信號,突破了過去計算機簡單模仿人工診斷心電圖的局限性;通過對連續(xù)RR 序列進行迭代作圖,可展現(xiàn)心率系統(tǒng)的非線性混沌特征,將人們認識心臟節(jié)律的視野從傳統(tǒng)的心電散點圖二維波形圖,拓展至高維相空間的新的分析模式。 通過對心電動力系統(tǒng)中的序列變量進行大量迭代計算,得到相空間高維幾何構形的吸引子心電散點圖,與心電波形圖進行實時對照分析,能更好地表現(xiàn)出心電系統(tǒng)的混沌特征,更清晰地揭示傳統(tǒng)的動態(tài)心電圖分析方法無法揭示的某些隱含規(guī)律,再通過人工智能深度學習的方法匹配模式識別。
2019 年易力等[14]借鑒了王聰?shù)萚15]研究構建的一種人工智能神經網絡模型,提出對取得的心電信號數(shù)據進行預處理后,利用確定學習理論算法獲得心電動力學數(shù)據,再進行動力學信號的異質度特征提取,即基于心電信號混沌系統(tǒng)量化[16]特征值的計算,并通過大數(shù)據樣本的機器學習訓練,得出疾病的模式識別方法。 由于心電動力學信號比心電信號的敏感性更強,因此,利用這種人工智能技術識別心血管病病理特征的敏感性與特異性也大幅超過心電圖圖形識別,具有應用于低危人群早期篩查的潛力。
目前,低危人群早期篩查的人工智能技術應用主要集中在常規(guī)體檢項目中的心電信號分析領域。由于心電檢查具有無損、快捷、便于普及等優(yōu)勢,心電信號蘊含著反映心臟電過程的敏感信息,加之心電臨床診斷技術日益成熟,因此,隨著心電大數(shù)據的發(fā)展與處理技術的進步,相關研究將更趨于廣泛和深入。 這正是心電信號分析先行得到人工智能技術加持的主要原因。
2.3.1 中危人群體檢篩查內容 中危及以上無癥狀體檢人群應接受專業(yè)推薦項目檢查。 專業(yè)推薦項目主要包括心臟超聲檢查、血管內皮功能檢查、動態(tài)血壓檢查、動態(tài)心電圖檢查、運動心電圖檢查、心血管病相關生物標記物檢查[10-11]。
2.3.2 專業(yè)推薦項目的人工智能技術應用 2017年李嶺海[17]提出,使用人工智能深度學習方法處理超聲心動圖,以解決由于圖像模糊所造成的人工判讀難度大、準確度低的問題。 利用SURF 算法等分別提取患者超聲切面圖像的特征,然后比較測試圖像特征值和訓練圖像特征值的差異,計算識別準確率。 模型的實現(xiàn)則采用Caffe 開放學習維護深度學習框架,訓練出可識別心臟病類型的模型。 深度學習網絡對超聲心動圖的識別準確率最高可達98%。2016 年張鷗[18]建立了動脈粥樣硬化早期診斷的炎癥因子診斷模型:首先,基于Logistic 回歸分析篩選出用于建模的炎癥因子;然后,分別用ROC 曲線、支持向量機、BP 神經網絡建立動脈粥樣硬化早期診斷模型。 該研究為臨床早期發(fā)現(xiàn)動脈粥樣硬化及動脈粥樣硬化斑塊的發(fā)展情況奠定了理論依據。 圍繞專業(yè)推薦項目的人工智能技術應用,主要集中于圖像智能識別領域,即利用神經網絡建模技術替代人工經驗識別。 現(xiàn)階段,針對篩查人群進行大數(shù)據分析的技術應用還不夠成熟,主要是因為數(shù)據量的擴大及數(shù)據的準確標記有賴于調動更多的資源來完成。
2.4.1 高危人群體檢篩查內容 針對發(fā)現(xiàn)明顯異常的高危人群,視情況推薦其接受專業(yè)備選項目檢查。 專業(yè)備選項目為核素心肌灌注顯像(myocardial perfusion imaging,MPI)、冠狀動脈鈣化的電子束計算機斷層掃描檢測、冠狀動脈CT 血管造影(coronary computed tomography angiography,CCTA)[10-11]。
2.4.2 專業(yè)檢查項目的人工智能技術應用 2019年張海濤等[19]采用前瞻性研究、盲法評估、自身對照設計,基于評估冠狀動脈生理功能的新型軟件,利用人工智能技術計算基于CCTA 的血流儲備分數(shù)(fractional flow reserve based on CT imaging,FFRCT);以疑似冠心病患者為研究對象,計算FFRCT診斷功能性心肌缺血的準確性、特異性、敏感性、陽性預測值和陰性預測值。 研究結果表明,該軟件在功能性心肌缺血的評估方面具有較高的準確性及敏感性,實現(xiàn)了FFRCT的無創(chuàng)檢查。 該評估軟件基于圖像的解剖學信息,利用人工智能的深度學習技術取代FFRCT所需的復雜運算過程,計算出了FFRCT,其技術核心是由海量的人工神經元所組成的神經網絡。2020 年胡小麗等[20]采用人工智能技術對CCTA 圖像進行處理與診斷研究,在保證圖像質量及報告診斷效率的前提下,證實了人工智能軟件在處理速度上較人類更有優(yōu)勢(3 minvs.20 min)。 在圖像的自動分割和識別中,則采用深度學習方法,并利用最優(yōu)網絡探尋技術(optimal path detection)和專業(yè)Loss函數(shù),當面對更加復雜的圖像時,仍能進行更完整、更準確、更光滑的血管分割,從而提高識別效率。
對應用于高危人群體檢篩查項目的人工智能技術,在技術集成度和設備精密度上都有更高的要求。 目前,上述人工智能技術在對醫(yī)學圖像的計算模擬和精確處理方面,已經取得了一定的實際應用效果,但仍然只能作為人工診斷的必要補充。
2020 年張勇等[21]評估了目前大學生所穿戴的智能手表、智能手環(huán)等智能設備對體育鍛煉的影響。 該研究中檢測了穿戴設備傳感器所提供的心率變異性(與心臟健康呈正相關)、靜息心率(與健康呈負相關)以及睡眠質量的指標值,并普遍采用統(tǒng)計學算法進行分析。
2019 年 Hannun 等[22]對 91 232 份單導聯(lián)心電圖進行人工智能分析,取得了不低于專業(yè)醫(yī)師人工診斷的心律失常檢測準確率。 該研究通過建立深度神經網絡,利用人工智能技術經驗性地找出輸入數(shù)據(即心電圖)與輸出數(shù)據(即診斷)之間的關系,并據此高敏感性、高準確性地給出診斷。 這項基于單導聯(lián)心電圖的研究成果可作為人體可穿戴設備的基礎技術,對未來心律失常患者的自我監(jiān)測意義重大。
總體來說,普通人群的自我篩查(監(jiān)控)正處于從計算機統(tǒng)計智能逐漸向人工智能過渡的階段,人工智能技術應用方興未艾[23]。 隨著數(shù)據量的擴大和技術的進一步成熟,尤其在解決了隱私與安全保護問題以后,用于自我篩查的可穿戴設備才能真正普及。
當今,隨著國民生活方式的轉變與人口老齡化、城市化進程的加劇,心血管病發(fā)病人數(shù)仍在持續(xù)增加,費用負擔不斷加重,心血管病成為重大公共衛(wèi)生問題。 心血管病的早期篩查成為疾病防治的重要課題。
在危險因素篩查與評估分層方面,目前主要是利用有限的要素進行定性分析,而要實現(xiàn)更多因素的半定量分析,還有很長的路要走。 在體檢篩查中,人工智能技術廣泛應用于圖形(像)的處理。 基于人工智能技術聯(lián)合CTA 獲得FFRCT是近年國內外較流行的技術,可以通過模擬仿真成像進行準確可視的心血管檢測,充分顯示出人工智能技術的強大能力。 基于心電動力學數(shù)據的混沌學特征值,利用人工智能神經網絡建模及動態(tài)算法技術,可在不借助圖形(像)的條件下,實現(xiàn)對心臟疾病的高敏感性和高特異性檢測,在早期篩查中顯示出巨大的應用潛力。
人工智能技術是當前醫(yī)療技術的熱點之一,其在心血管病早期篩查領域的應用尚處在數(shù)據處理的智能化階段,原因是人工智能技術應用對數(shù)據量與標記數(shù)據質量存在高度依賴。 未來隨著網絡技術的進一步深化、可穿戴設備的普及和人機交互的發(fā)展,人工智能技術在個性化檢測轉接系統(tǒng)、評估模型與電子病歷結合等方面,將擁有廣闊的應用前景[24-25]。 應用于心血管病早期篩查的人工智能技術及產品,其研發(fā)周期較長、研究相對獨立、數(shù)據具有敏感性,相對其他行業(yè)的人工智能技術應用有所滯后,但隨著研究和應用的深入,定會在不久的將來呈現(xiàn)爆發(fā)式增長。