范達英,鄧仁麗,繆睿,彭燕,陳偉,李彩,黃浩
近年來,人類生存環境和生活方式發生了重大轉變,腦血管疾病危險因素不斷增多,腦卒中在中國甚至全世界范圍內的發病率逐年上升。腦卒中具有高發病率、高復發率、高致殘率、高死亡率及高經濟負擔等特點,嚴重威脅著人類健康[1]。全球疾病負擔研究顯示,全球有超過8 000萬例腦卒中患者[2],2019年我國40歲以上人群中現患及曾患腦卒中人數超過1 700萬例[3]。大數據指從各種資源中獲取、以高速度創建和處理的海量數據[4],其應用、分析、集成和管理在醫療領域受到重視,且分析大數據可預測疾病的發展趨勢,有助于進行早期干預以改善醫療事件結局,從而產生深刻、長遠的社會意義[5]。本文旨在綜述大數據在腦卒中領域的應用現狀,以期為醫務人員的臨床研究提供參考。
1.1 數據儲存便利 電子病歷取代傳統紙質病歷后,保留電子病歷的技術從基于云存儲技術構建信息共享平臺到基于聯盟區塊鏈技術的電子病歷共享系統,不僅實現了成本低、數據傳輸速度快、易于獲取信息、存儲容量大,而且保證了傳輸過程中電子病歷的完整性和安全性[6]。電子病歷以及信息化時代帶來的各種便利,使得醫療技術與臨床護理水平飛速發展,為腦卒中的研究提供了有價值的信息。
1.2 減少醫療支出 腦卒中是導致居民全球死亡的第二大疾病,是導致患者長期殘疾的首要原因,且腦卒中后治療和護理方面的經濟負擔不斷增加[7]。《中國衛生健康統計年鑒2019》顯示,2018年缺血性腦卒中和出血性腦卒中患者人均住院費用相比2008年分別增長56%和125%[3]。MANE等[8]回顧了5年的數據,并構建了診斷性能儀表板來監控診斷質量,其利用大數據跟蹤診斷錯誤情況及其危害,從而減少誤診的發生。LIBERMAN等[9]使用一種名為“Symptom-Disease Pair Analysis of Diagnostic Error”(診斷誤差的癥狀-疾病配對分析)的工具,并通過患者現有癥狀結合大數據判斷和監測診斷錯誤情況。在臨床上,大數據可以有效降低腦卒中的誤診率,減少醫療支出,滿足社會需要和公共衛生需求。
大數據在腦卒中領域的應用可以分為兩類:基于實踐的分析方法、應用人工智能(artificial intelligence,AI)和機器學習的新興方法[10]。其中基于實踐的分析方法涉及臨床治療和護理,而AI和機器學習的新興方法將腦卒中引領到全新的研究方向和領域。
2.1 基于實踐的分析方法 在臨床治療和護理中收集、評估和分析大量數據,可實現腦卒中的精準醫療[11]。將遺傳學與大數據結合,能提高腦卒中病因識別的準確性,這對尋找干預靶點和改善患者預后具有重要意義[12]。將遺傳學與精準醫學整合,在大數據的基礎上進行多組學數據整合,發現并干預與腦卒中復發和預后相關的遺傳因素[13]。基于大數據進行流行病學調查,可指導公共衛生服務策略的制定。GATTELLARI等[14]計算了新南威爾士州9年間腦卒中患者的入院率和死亡率,總結出該州在腦卒中亞急性期管理、出院后護理和二級預防方面缺乏重視。UNG等[15]使用河南省焦作市的以疾病診斷相關分組(Diagnosis Related Groups,DRG)為基礎的支付系統分析醫療支出大數據探索腦卒中患者治療費用的影響因素。
疾病管理是提高腦卒中患者生活質量的基本手段,張書凡等[16]依托醫院信息服務平臺,利用大數據和云計算創新性地建立了腦卒中區域性管理的新模式,滿足了患者多學科聯合護理的需求,促進了腦卒中單病種質量管理的發展。侯玉梅等[17]為了探究腦卒中的發病規律,利用數據挖掘與Logistic回歸模型構建了預測模型,該預測模型可以讓患者自我監測腦卒中發生風險,使腦卒中預防具有便利性。基于大數據和智慧醫療構建新的疾病管理模式,可能是疾病管理的發展趨勢,其有望在提高患者依從性的同時減少人力資源消耗,更好地提升臨床管理效能。
2.2 應用AI和機器學習的新興方法 AI是研究和開發用于模擬、延伸和擴展人類邏輯思維的技術科學,其可通過復雜的算法而優化、提取大數據的價值[18]。使用AI分析大數據可輔助醫生做出臨床決策,進而改變當前的臨床護理模式。GUAN等[19]使用機器學習從顱腦CT圖像中提取并學習腦卒中的影像學特征,這證實了通過顱腦CT圖像識別腦卒中的可行性。為減少腦卒中并發癥的發生,有研究者利用AI分析大數據并建立了腦卒中并發癥風險預測模型,其相較于傳統的風險預測模型有更好的預測效果[20-21]。
機器學習是AI的分支,可通過識別變量之間的交互模式而解決大數據的復雜問題[22]。其在識別影像學特征方面有更好的靈敏度和特異度,是神經系統疾病影像學診斷的重要輔助手段[23]。LEE等[24]應用自動圖像處理方法分析腦卒中患者的影像學特征,并開發了3個機器學習模型以預測腦卒中的發病時間,提高了靜脈溶栓治療率。MIN等[25]將腦卒中患者的臨床數據和影像學特征融入機器學習,進而能準確預測患者的預后情況,從而有助于臨床醫生制定更好的治療和護理方案。WU等[26]運用卷積神經網絡(convolutional neural networks,CNN)自動分割算法,在多中心彌散加權成像數據集中對缺血性腦卒中的影像學特征進行識別及分割,結果顯示,其對腦卒中分型具有重要作用。
3.1 腦卒中人群數據庫 中國國家衛生健康委員會和科技部在2007年創建了中國國家卒中登記中心(China National Stroke Registry,CNSR)數據庫,第三次中國國家卒中登記中心(the Third China National Stroke Registry,CNSR-Ⅲ)[27]納入了15 474例腦卒中患者,CNSR-Ⅲ前瞻性地分析了腦卒中的病因、影像學特征和生物標志物,其結果提供了大量決定腦卒中患者預后的因素。2015年中國卒中學會為建立基于國家三級醫院的腦卒中護理平臺,發起了中國腦卒中中心聯盟(China Stroke Center Alliance,CSCA)(https://csca.chinastroke.net),其數據可提供給研究人員進行腦卒中護理研究,以期改善腦卒中患者的生存質量和預后。
國外數據庫有澳大利亞卒中臨床注冊中心(Australian Stroke Clinical Registry,AuSCR),其收集腦卒中或短暫性腦缺血發作(transient ischemic attack,TIA)患者的護理及康復情況。DALLI等[28]回顧了AuSCR登記的17 980例腦卒中/TIA患者的資料,評估患者出院后1年藥物治療依從性與3年生存率之間的關系。此外,美國國家神經系統疾病和腦卒中研究所及美國國立衛生研究院開發的StrokeNet,涵蓋了美國27個區域中心,涉及約500家醫院,為腦卒中患者提供了新的潛在治療方法[29]。總之,國家大型卒中中心的建立和應用,可對國家腦卒中群體進行總體評價,為國家衛生保健政策的制定提供循證證據,為臨床實踐提供指導。
3.2 全國人口數據庫 美國醫療保健成本和利用項目(Healthcare Cost and Utilization Project,HCUP)是美國最大的行政、縱向醫療保健和住院護理數據庫,集合了1988年至今所有入院患者的付款信息[30]。有研究利用HCUP計算腦卒中危險因素的患病率,發現2004—2014年美國腦卒中患者傳統危險因素的患病率不斷增加[31]。英國SEMINOG等[32]分析了全國因腦卒中死亡的795 869例患者的臨床信息,推斷出急性腦卒中死亡率下降的相關因素。以色列最大的健康維護組織(Health Maintenance Organization,HMO)數據庫覆蓋了該國一半以上的人口,SALIBA等[33]分析HMO數據庫中超過43 000例心房顫動患者的臨床資料發現,導管消融術可明顯降低心房顫動患者腦卒中發生風險和死亡率。LEE等[34]對韓國國家健康信息數據庫(Korea National Health Information Database,NHID)中80多萬女性進行為期10年的隨訪,證實血紅蛋白水平變化可影響年輕女性腦卒中發病率及其全因死亡率。此外LEE等[35]利用NHID開展全國性縱向隨訪研究,確定了血清抗體陽性的類風濕性關節炎與缺血性腦卒中存在相關性。總之,全國人口數據庫覆蓋范圍更廣、信息更全面,可以利用其進行更有深度的全國性腦卒中研究,從而改善腦卒中治療現狀和提高腦卒中護理質量。
總之,大數據在腦卒中領域的應用從醫院數據的探索到國家大型數據庫的成熟運作,從基于傳統統計學分析的實踐應用到靈活使用AI和機器學習,醫務人員在信息化背景下不斷挖掘臨床積累的醫療數據,使得腦卒中的臨床治療技術和護理質量不斷提升及優化。大型數據庫實現了數據集成、儲存、共享,研究人員可以基于國家相關大型數據庫發掘腦卒中的疾病特征,形成全國性和區域性的循證證據和腦卒中指南,早日實現全面精準醫學、全民參與防治。未來,國家數據庫更應加強與地方醫院的交互,以幫助地方醫院形成更具有針對性的治療和護理模式。在目前的大數據研究中,影像學的應用逐漸成為腦卒中研究的新趨勢,而影像學資料比較復雜,故更加需要借助AI和機器學習來尋找特異性、敏感性的影像學特征。建議臨床醫護人員基于腦卒中影像組學及其他組學資料開展全面研究。同時,醫療專家需與計算機專家合作,形成多學科交叉互補,充分發揮大數據的潛在作用。
作者貢獻:范達英進行文章的構思與設計,論文撰寫及修訂;繆睿負責研究的實施與可行性分析;范達英、李彩進行文獻檢索及篩選;鄧仁麗、彭燕、陳偉進行文獻整理和分析;黃浩負責文章的質量控制及審校,對文章整體負責、監督管理。
本文無利益沖突。