孟雨
器官損傷總是不易察覺,往往會因此錯過最佳治療時機。基于人工智能的新方法能持續監測病人的健康數據并及時預測即將發生的腎臟損傷。
在美國的醫院中,急性腎功能損傷的發病率高達20 %,包括異常血壓和血容量等多種因素都會誘發這種十分普遍的病癥。但目前醫療界卻缺乏有效的手段來預測病人是否會發生以及何時會發生急性腎損傷。目前,對于高危病人的臨床處理手段是每天檢測血液中的肌酸酐濃度,濃度過高就意味著腎功能出現了問題。
近日,來自DeepMind等多個機構的研究人員提出了一種基于人工智能的新方法,能夠有效預測病人即將發生的腎功能損傷。相較于傳統方法,這種新方法可以提前一到兩天檢測出大部分病人腎臟損傷的發生風險。由于腎臟損傷往往在最后階段才被察覺,此時腎臟已經發生不可逆的損害,嚴重時將會留下需要暫時或長期透析的后遺癥,甚至引起病人死亡。對于腎臟損傷的早期檢測方法將為有效的臨床治療贏得寶貴的時間。
深度學習作為近年來發展最快的人工智能方法,可以有效識別出數據中隱含的與特定結果相關的模式。在這一研究中,研究人員利用深度學習的方法來檢測急性腎損傷。訓練深度學習算法需要大量的數據,研究人員從美國退伍軍人事務部(US Department of Veterans Affairs,為美國退伍軍人及其家屬提供服務)負責運營的172家醫院和1062家門診中,收集了超過70萬例成年病例的數據(2011- 2015年)。這些經過匿名處理的數據為研究人員提供了人口統計信息、電子健康檔案、化驗結果、藥物處方和過往治療記錄等數據。論文的第一作者Tomasev和同事們從數據中整理出了約60億個數據點和60多萬個記錄特征,他們選擇了一種被稱為循環神經網絡的深度學習方法來處理時序數據并對計算機進行訓練,這種方法在深度學習領域被證明非常適合處理時序數據。

在訓練完成后,研究人員利用事先分離出的獨立數據集對算法的有效性進行了測試。基于測試數據,計算機將生成接下來48小時內連續的概率值來追蹤每個病人隨時間推移發生急性腎損傷的可能性。如果預測的概率值超過一定閾值,這個預測結果將被標記為陽性(如圖一所示)。病人后續是否被檢查出病情則會驗證算法的預測精度。該模型同時還提供了預測概率值的不確定性,為醫生提供了評估預測信號的強度指標。
Tomasev團隊提出的方法可以給出急性腎損傷的預警信號。研究人員利用人工智能中的深度學習方法來訓練計算機從數據中檢測與后續腎損傷相關的模式。研究人員利用這種算法來分析過往的醫療數據,包括電子健康檔案和化驗結果等等。計算機分析某個病人的歷史數據后,將生成接下來48小時內的連續概率值,對應病人發生急性腎功能損傷的可能性。如果概率超過一定閾值,預測結果將被標記為陽性,并向醫生發出警報。
在此假設場景下,Tomasev團隊的研究方法將提供比傳統方法更早的預警信號,為醫生和病人贏得了寶貴的治療時間。
Tomasev和同事們提出的新方法比其他基于統計或機器學習的方法更為精確地預測了即將要發生的腎損傷,而且對于醫院內病人的預測精度最高———醫院內病人發生急性腎損傷的比門診診所更為頻繁,同時時間窗口也更為短暫。對于所有病人和所有類別的腎損傷,包括較為輕微的損傷,這一系統的平均預測精度達到了56 %;而針對更為嚴重的腎損傷預測,對于后續30天和后續90天內需要透析的病人預測精度則分別達到了84 %和90 %。該模型在不同的醫療場所和不同時間周期內具有相似的預測精度。
此外,研究人員使用了消融性分析方法來鑒別與腎損傷發生風險相關的因素,結果發現有很多,這也許解釋了為何過去讓研究人員分析這種風險是一件棘手的事。
假設病例顯示了研究人員所開發的新方法的重大應用潛力。如果利用傳統方法檢測,醫生將在第四天才能獲悉腎損傷的發生,而新方法則可以提前兩天預測出來,為醫務人員提供了更多寶貴的時間和更多干預治療的手段,包括增加病人的液體攝取,或者避免使用可能造成腎毒性的藥物。
然而這一系統也存在一定問題:生成一系列假陽性的預測結果,即誤報一些沒有發生的腎損傷。每個精確的預測會對應兩個假陽性結果。假陽性絕大多數來源于患有慢性腎病的病人,疾病的癥狀會與急性腎損傷疊加,造成結果難以預測。
本研究的另一局限在于這是一項回顧性研究,利用回顧性研究構建的人工智能方法將在前瞻性研究中發生一定程度的退化,這可能是因為臨床中的真實數據會比預先存在的經過清洗的“干凈”數據要復雜得多。
前瞻性研究是檢測預測系統的真實臨床價值的根本所在,而預測成功與否不是唯一應加以評估的因素。要確定計算機生成的預警信號是否在臨床中減少了急性腎損傷的發生率,一種方法是開展隨機設計的臨床試驗,只將其中一半的預測傳遞給醫生。此外,作者的模型也應該在其他人群身上進行有效性的測試。作者的研究只包含了不到7 %的女性病例,那么,模型對于不同性別的病人是否具有相同的預測精度,也值得在未來進行深入地研究。
雖然這一研究包含了不同種類的數據,但還有其他數據源也值得納入進來,例如病歷上的手寫內容,來自可穿戴傳感器的連續生命監測信號,如心率等,這些都有可能提供有價值的相關信息。
對于非重癥病人來說,常規監測方法是每天測量一次生命體征,但病人經常會突然出現病情急轉直下的情況。Tomasev和同事的研究對于這樣的病人來說十分有用,可以在病人發生嚴重的器官衰竭之前發出預警,為病人贏得寶貴的救治時機。先前,很多臨床背景下基于人工智能的預測性研究主要著重于研究疾病轉歸,包括死亡、再入院或住院時間等,而Tomasev等人的研究結果則提供了獨特的視角,為臨床干預提供了有效的預測信號。
深度學習有望為醫生提供針對任何器官狀況的有力預警手段,它的廣泛應用也許需要醫療界改變思維方式。但是從非經常的一次性測試轉向系統性的連續監測,或將為醫務人員提供更有效的手段來預測病人的病情變化。