李昊旻
(浙江大學醫學院附屬兒童醫院 杭州 310052)
臨床技術的不斷進步和醫學知識的爆炸式增長推動臨床實踐中解決臨床問題能力的提升,但同時帶來更為復雜的臨床決策環境。單純依靠個人學習能力和知識技能較難應對日益復雜的臨床決策需求,這一現狀嚴重制約醫療服務質量提升[1]。醫療大數據的積累為醫學大數據分析和人工智能技術應用提供新的基礎[2],促使醫療服務從基于熟練技藝轉向數據驅動的科學發展[3]。
目前醫療人工智能范式快速發展,包括符號主義、貝葉斯主義、聯結主義、類比主義等多種范式,應用場景逐漸多樣化。其中患者相似性分析是基于大量已知案例通過衡量患者之間的距離建立患者相似組,并通過相似組特征獲取傳統僅能通過醫學實踐才能獲得的臨床經驗知識,以此定量化評估患者狀態、推薦治療方案和預測患者預后[4-8]。具體來說患者相似性分析是指在特定醫療環境下,選取臨床概念(如診斷、癥狀、檢查檢驗、家族史、既往史、暴露環境、藥物、手術、基因等)作為患者的特征項,定量化分析即計算復雜概念語義空間中概念間的距離,通過某種模型融合多維度特征,從而度量患者間的距離,篩選出與索引患者相似的患者相似組并以此模擬臨床類比推理的思維模式,同時可通過患者相似組的其他多維特征開展各類評估、推薦和預測。其相較針對特定目標的基于機器學習的人工智能模型具有更好的普適性、臨床可解釋性等優勢。
共有3個核心步驟[9]:首先計算復雜概念語義空間中概念間的距離;其次利用多維臨床概念度量進一步評估患者間的距離;最后建立合適的患者相似組。上述過程依賴于一套臨床概念相似性和患者相似性的可計算體系。本文將介紹本課題組近年來進行的臨床概念的可計算范圍擴展情況以及利用這些可計算性服務于構建患者相似性分析計算體系的方法、路徑,同時探討當前患者相似性分析技術面臨的機遇和挑戰。
醫學分析哲學專家Sadegh-Zadeh在其專著中細致分析了臨床推理的原理:臨床推理的對象是患者“p”,醫生面對患者時,患者提供一個非空的數據D1={δ1,…,δm}其中m≥1,每個δi代表一個關于患者問題、主訴、癥狀等的聲明。通常認為臨床推理是臨床醫生尋求一個診斷能夠解釋為什么D1可以發生的過程,這也是傳統的基于知識工程的臨床決策支持解決方案的理論基礎。然而Sadegh-Zadeh 認為此觀點是對于臨床實踐本質和意圖的誤解。臨床實踐以D1作為一個臨床問題,臨床推理是解決這個問題的過程,解決方案瞄準的不是診斷而是采取什么措施。在尋找和優化治療措施時往往需要從患者身上獲取更多信息,其中包括診斷。因此臨床實踐可以看作是一個在臨床醫生控制下通過問答、生成信息實現路徑尋找以處置好臨床問題的過程。
基于Sadegh-Zadeh的這一理論可以將臨床決策過程抽象為函數F:
F(Di)=Ai
這個推理函數F可在面對一個臨床問題Di時輸出下一步干預的措施Ai,并基于此干預下的新的臨床問題Di+1可以迭代輸出進一步的措施Ai+1。這一過程不等同于直接尋求診斷。在臨床決策過程中最典型的一類知識類型被稱為命題式知識,這類知識簡單描述就是個體心智狀態“knowing that something is the case”(知道這屬于什么類型)即類比推理。具有豐富經驗的醫生可以快速地將一名患者p歸入到某一個案例模式Pi(Pi∈P{P1,P2,…,Pn}),而案例模式P本質上是患者群體的一個聚類,針對每個患者聚類Pi臨床醫生具有確定下一步采取何種干預的知識技能。大多數誤診和不當處置緣于這個匹配過程不準確或者相應知識技能不完善。因此尋找一個具有普適性的函數能夠把患者p映射到特定模式Pi即可實現對于臨床思維過程的計算機化的模擬。患者相似性分析正是基于這樣的理論基礎,從最初的基于少量典型案例的推理逐步發展為面向海量數據的患者相似性分析。
近年來基于患者相似性分析的人工智能研究成為熱門研究領域,涉及精神和行為異常、傳染病、癌癥等[9]。其中所使用數據類型、技術手段各不相同,預測效果也不一致,甚至部分研究對于同一方法的表現優劣存在矛盾性結論。患者相似性分析效果優劣的關鍵在于構建的相似性分析計算體系是否能夠真實評估患者臨床意義的相似性。本文將對這些關鍵問題和挑戰進行闡述。
臨床信息中包含了不同語義空間的概念,如診斷、藥物、表型、檢查檢驗以及遺傳分子信息等,患者相似性分析首先需要建立各特定語義空間相似性計算方法。但是很多臨床概念(如診斷、藥物、表型等)通常是以文字符號表征的抽象概念而不具有定量細化的可計算性。早期相似性分析計算體系中往往簡化計算通過某個特征是否存在來構建二值化的特征空間。這種方式忽略了概念在語義層面的相似性,往往并不能很好地反映臨床意義上的概念距離,而擴展不同語義空間概念的可計算性是相似性分析的重要研究內容。
通過分層的方式逐步細化概念是組織領域知識的通常做法。在臨床領域同樣存在較多此類具有層級結構的語義空間,最典型的是服務于診斷的疾病與有關健康問題的國際疾病分類(International Classification of Diseases,ICD),目前廣泛使用的ICD-10版本中,疾病和健康問題被分為22章、262節、2 051個類目、9 505個亞目以及22 908個具體概念編碼。顯然同一個類目下的疾病比不同類目下的疾病更相似,因此借由此類具有良好空間層次定義的概念編碼可以更精細評估概念之間的距離。在這一體系中,評估概念相似性的最優方法是基于信息量(Information Content,IC)的距離計算。目前有多種IC以及概念距離計算方法[10]。基于此開展領域性的本體建設可以服務擴展領域概念的可計算性。
由于體系性的標準術語體系或者概念本體建設依賴大量專家資源建立和維護,并不能在所有臨床概念空間均建立或應用這些層次體系,對于這類概念往往需要通過其他方式完成可計算語義空間的擴展。以臨床藥物為例,雖然化學藥物體系中構建了類似層次結構的概念體系解剖學治療學及化學分類系統(Anatomical Therapeutic Chemical,ATC),但是在國內實際臨床環境中該概念體系并不覆蓋臨床大量使用的復合藥物、生物制劑、中成藥以及中草藥等。針對這類缺乏統一層次化概念語義空間的情況,需要探索利用大數據資源中的關聯信息構建全新、廣覆蓋的可計算語義空間。本課題組針對臨床藥物的層次分類語義空間構建問題,利用臨床用藥記錄和患者診斷信息的關聯信息,采用統計檢驗獲取藥物和診斷的顯著關聯關系,通過診斷空間的特征向量構建臨床藥物的可計算方法[11]。通過驗證,利用臨床數據構建的語義空間和傳統專家定義的ATC具有很好的相關性,同時覆蓋更多的臨床常用藥物,為開展臨床藥物處方的相似性分析提供了計算基礎。這種臨床藥物距離評估方法除服務于定量評估藥物距離外,還可以通過非監督聚類形成藥物分類,服務于特定群體用藥評估[12]。
3.4.1 體系構建方法 許多概念描述是數值型,然而計算臨床概念間的距離不能忽視實際的臨床意義。更特殊的情況是由于年齡、性別甚至人種差異,不同數值在不同群體中具有不同的臨床意義。因此對于此類存在人群分布差異的概念需要構建標志值參考體系,然后將原始數值轉換為Z值(標準分數)。Z值代表原始分數中減去群體的平均值,再依照群體的標準差分割成不同差距。對于分布不對稱或者單邊異常的臨床概念,通常需要結合臨床意義矯正Z值,對于正常范圍的數值,定義為0,低于下限或高于上限則處理為該值與下/上限的差值與群體標準差的比值。
3.4.2 基于研究人群數據構建特定標準值體系 由于臨床實踐中還有大量臨床數值型概念缺乏公開廣泛接受的標準值體系,在實際應用中可以基于研究人群的數據構建特定標準值體系,本研究組曾就中國兒童人群中心臟的超聲心動圖常規測量數值和髖關節發育不良評估的測量值構建并評估相關標準值參考體系[13-14],這也從側面說明基于臨床大數據可以有效地構建標準參考體系,并服務于相關概念的相似性分析計算。
3.5.1 多值概念集相似性計算 許多臨床概念空間可以給一名患者賦值一組概念值,如一名患者可以診斷多個疾病同時使用多組藥物,因此同一概念空間中還存在不同大小概念集上如何計算相似性的問題。由于涉及不同長度的集合概念之間的匹配和距離計算,不同匹配策略會帶來不同效果,在實際測試[10]中發現最小加權二分匹配(Minimum Weighted Bipartite Matching,MWBM)的算法對于不同長度概念集的匹配效果更佳。
3.5.2 時序分析方法 除這類多值概念集情況外,還有一些概念是由時間序列數據組成的,如術中監護的血壓數據,這些序列數據的長度通常偏差更大,從幾十到上百,而且具有明確時間特性。傳統的相似性計算僅通過統計特性,如均值、方差、斜率變化等反映動態數據特征,但是在這一過程中丟失了序列本身較多變化特征,因此需要引入更多時序分析方法。如可利用soft-DTW計算序列血壓數據之間的相似性作為人工智能模型的輸入來獲得更多動態數據相似性[15],同時一些針對時序數據的聚類方法如kml等也可以方便應用于此類數據的聚類分析,并基于聚類信息提供動態相似性。
醫療大數據背景下的所有醫療數據,如診斷、癥狀、檢查檢驗、家族史、既往史、暴露環境、藥物、手術等,可以作為相似性計算的輸入。如何融合不同概念空間到統一的體系中獲得最終患者層面的相似性是最核心的挑戰。
4.2.1 方法1 傳統方法中,多通過簡單的映射不同概念空間將患者描述為一個多維空間中的特征向量,然后利用數學方法定量地度量多維概念語義空間中特征向量之間的距離,基于排序或聚類分析篩選出患者相似組。這種方法的局限在于為所有特征都構建獨立維度,容易導致維度災難,同時所有特征都享有統一權重可能帶來大量無效特征稀釋空間有效特征分布的問題,最終影響患者相似性分析效果。
4.2.2 方法2 針對特定臨床場景和臨床問題,利用專家知識挑選特征和構建特征權重可以解決一部分問題,基于領域知識數字模型的患者相似性分析通常可以取得更好效果。但是這樣的融合模式喪失了患者相似性分析技術路線的普適性,必須依賴專家資源,同時在復雜臨床場景下構建此類可計算領域模型的可行性較差。因此需要探索一種能夠從臨床數據中自學習的融合機制。
4.3.1 步驟 本研究團隊受心理學領域關于類比推理的結構映射理論(structure-mapping theory)啟發,將計算機化的類比推理分為兩步:第1步是計算屬性相似度,在此過程中僅就特定概念空間中對應項的屬性之間進行比較和計算相似距離,通常是邏輯和計算清晰的過程。第2步是計算關系相似度,通常是高級神經活動和專業知識發揮作用的過程,在計算上引入機器學習模型,通過大量案例學習訓練完成不同概念空間屬性距離的融合[16],這類似于人類醫生的經驗訓練過程,不同在于機器訓練過程可以更快速地完成并獲得人類醫生通常需要數年訓練才能取得的經驗。
4.3.2 存在的問題 目前此框架的主要問題在于學習目標的特異性有可能會減弱患者相似性分析的通用性,需要進一步探索人類經驗學習機制。
類似于基因組、蛋白組用來描述某個層次上的全部信息,患者相似組[8]用來描述一個大規模患者群體中具有相似特征的患者群體。該相似組中蘊含了臨床實踐的各種知識,為計算機獲取醫學知識提供基礎。患者相似組本質上代表的是一個群體特性,這個群體特性是否具有針對特定個體、特定任務的特異性的表征能力,是最終決定相關智能任務效果的關鍵。
5.2.1 方法1 通常在獲取患者層面的定量相似距離評估結果后,可以直接通過篩選距離最近的N個患者構建患者相似組,但是對于N如何定義缺少理論的支持,同時在不同的空間分布下N所代表的距離關系也會有很大的變異。另外一個策略是通過一個距離域值來過濾患者獲得一個患者相似組,但同時面臨閾值過高相似組的構成太少不具備群體特性,或者閾值過低相似組構成不夠單一的問題。在實際操作中通常采用兩種策略補充的方式,在適度放松N和閾值的情況下,通過滿足兩個條件來構建患者相似組。
5.2.2 方法2 通過非監督的聚類方法來自動完成群體的分組,根據群體的分布特征完成相關聚類分組,通過某些分組之間距離的評估來評價當前分組的優劣,一些具有層次聚類的方法還可以進一步豐富構建患者相似組的顆粒度,相似組內部可進一步劃分為多個不同的子群體,稱為子相似組。
5.2.3 相似組質量控制 無論何種策略構建的相似組,在群體數量不足或者目標患者異質性很高的背景下,很難構建真正意義的相似組,因此基于相似組獲取的知識、給出的建議有可能是錯誤的或者存在偏差的,因此在利用患者相似組開展各類智能任務之前需要對于相似組進行質量控制,一方面可以通過患者相似組中的各類屬性的統計分布來檢驗這個群體中相關特征是否具有很好的一致性,例如要預測的指標為住院時間,那么在這個相似群體中住院時間是否比較集中在一個特定取值范圍,和非相似組或者全部群體相比是否有更小的分布方差,在均值分布上是否具有統計意義的偏差等。
對于通用場景下的患者相似組,可以探索一些可視化的方式綜合展現個體、相似組和群體的關系[17],從而更好地理解3者之間的關系并基于相似組信息進行臨床決策,或者擴展人工智能模型的可解釋性。
患者相似性分析提供一種通用的計算機輔助臨床決策支持的理論框架,在醫療大數據不斷積累的背景下其潛力將會逐步被認識、發現和利用。患者相似性分析也是今后醫療大數據產業的一項關鍵基礎技術。目前在開展的一個針對罕見病診斷的項目中[18],以表型相似性分析為基礎,借助可視化方法,試圖為臨床罕見病患者特別是新生兒提供一種快速的鑒別診斷方法,彌補相關分子診斷周期過長的問題,從而為需要快速診斷和處置的危重新生兒提供決策支持。同時針對先天性心臟病領域,正在探索基于領域知識的相似性分析。未來患者相似性分析利用領域相關研究尚待進一步深入開展。
6.2.1 概述 數字孿生(Digital Twins)是一個工業領域的概念,通常用來評估復雜系統,如航空發動機。其核心是為一個真實的實體構建一個可計算的數字孿生模型,可以滿足一些具有不可重復和侵害性的測試需求。近年來有學者將此概念應用于醫療健康領域,希望構建數字孿生患者以提高診斷和治療能力[19]。
6.2.2 面臨的挑戰 數字孿生和患者相似性在理論本質上具有同源一致性,因此患者相似性分析可以用來生成數字孿生模型。但是其中最大的挑戰是構建動態模型,患者是一個生物動態系統,其生命體征是隨時間變化的,干預效果也是動態波動的,目前大多數研究僅利用靜態時間點的各種數據或者單一維度下的時序數據進行相似性分析,還不能完整地反映患者動態的相似性。
6.2.3 應對措施 針對這一問題,有研究者將時間信息納入到患者相似性分析中以尋求突破。動態數據的相似性搜索要求子序列匹配、趨勢分析,雖然在統計學和信號處理中,對時間序列分析已有大量研究,但是對于一個高緯度模型來說,動態所帶來的往往是災難性的計算需求。如何在一個時間多分辨率的情況下開展高緯度模型的相似性分析依然是挑戰。
在患者相似性分析實踐過程中需要處理好精準醫學強調的個性化與患者相似性分析的群體特征之間的對立統一,以及基于專家知識和大數據的對立統一。精準醫學強調患者的個性化,認為需要針對性地給予個性化治療,但是患者相似性假設患者在一個特定相似組中具有共性,能夠根據共性特征來開展診療,從字面上理解兩者是對立的,但是本質上患者相似性分析也是在多樣的群體中尋求具有個性化特征的群體,當群體足夠大時個性化就變成一個小群體的個性化;同時引入領域專家知識能夠提高患者相似性分析的準確度,但是大數據中同樣蘊含很多未知或者沒有系統總結過的新知識,相似性分析可以為知識發現提供支持。
對于醫療問題,模型的性能和可解釋性同等重要。盡管應用深度學習模型在特定影像處理領域取得很多成果,但是在通用臨床領域如何解釋其輸出結果以及邏輯還缺乏成熟的機制。患者相似性分析相比黑盒的預測模型具有更好的可解釋性,但在復雜多維環境中,這種相似性表現得較抽象,通常需要借助數據可視化工具將聚類、分布、排列、比較、關聯等信息以可視化的方式呈現給醫生[17],直接提升對信息認知的效率,引導醫生從可視化的結果中分析和推理出有效信息。利用可視化的患者相似性分析其實是在綜合人腦對于數據模式的認知以及電腦對于數據計算的高效處理,通過一種互動模式構建人機交互的知識轉化框架,因此開展個體和群體多維臨床特征的可視化研究對于推動患者相似性分析具有重要意義。
本文從患者相似性的理論基礎以及構建患者相似性分析計算體系中的若干核心問題出發,結合項目團隊近年來的工作實踐,系統介紹在臨床概念層面構建可計算體系、融合多維特征、構建患者相似組以及評估患者相似組等技術的路徑和方法,分析該領域需要重點突破的難點所在。患者相似性分析是醫學人工智能綜合展現的一個核心領域,該技術的突破能夠破解很多長期困擾醫療體系的問題,推動醫學人工智能發展到新的層次。