鄭 毅,胡祥培
大連理工大學 經濟管理學院,遼寧 大連 116023
醫療信息技術的飛速發展及其在醫療健康領域的普及給醫療服務行業的運營模式帶來重大變革,特別是疾病診斷決策支持領域首當其沖[1]。診療大數據的多源性、動態實時更新性和高度醫學專業性等特征給智能臨床決策支持(特別是疾病預測分析)帶來前所未有的機遇和挑戰,使實現個性化和精準化醫療成為可能[2]。而如何充分利用診療數據,化解其內在的復雜性和數據規模并提供臨床診斷決策支持,是未來該領域研究的關鍵問題[3]。因此,智能臨床決策支持中診療數據融合方法的研究是當前學術界和產業界共同關注的熱點和難點問題[4-5]。
大量已有診療數據分析方法往往只使用單一數據源進行分析建模[6],由于慢性病患者診療周期長,患者電子病歷中檢查項目的測量值隨時間推移數據不斷更新[7],利用單一階段的數據源進行疾病預測分析難以刻畫指標的動態變化特征,致使分析方法準確性降低[8]。目前,多階段的診療數據融合研究中關于不同階段診療數據源時間關聯性的刻畫缺少科學、有效的方法,使疾病預測滯后、診斷準確性和實時性受到限制。因此,如何實現序列診療數據有效融合和分析、提高診療大數據分析能力、實現準確的疾病診斷是亟待解決的問題。
綜上所述,已有的序列診療數據融合方法難以刻畫不同階段診療數據的時間關聯性,使疾病診斷準確性和實時性降低。為了有效解決疾病診斷中序列診療數據融合這一挑戰性問題,本研究利用稀疏正則化原理,提出基于時間光滑正則化的序列診療數據融合(time smoothing regularization for sequential clinical data fusion,TSRSCDF)方法。該方法針對序列診療數據構建回歸模型,利用稀疏正則化方法使特征級具有對指標的選擇特性、數據源級能夠保持不同階段數據源具有時間連續性,最終實現對序列診療數據的融合,提高疾病診斷的準確性,增強疾病管理的有效性和科學性。
疾病預測分析是指利用模型、算法和系統等信息技術對豐富的、大量的診療數據進行分析,得出未來與健康相關的結果或疾病風險信息,以提高診療決策水平[9-10]。關于疾病預測分析的研究主要包括疾病診斷和疾病預警[11]、再入院率預測[12]、醫療結果預測[13]和患者死亡率預測[14]等。
電子病歷系統中患者的診療數據包含數值數據、文本數據、影像學數據等大量結構化和非結構化數據[15],數據的非結構化特性給數據融合過程帶來巨大困難,采用特征級融合能夠很好地克服數據異構性障礙[16]。但不同階段診療數據包含的海量特征信息使模型構建和參數求解更加復雜,因此,本研究將詳細介紹特征級融合方法的相關研究以及保持不同階段數據源的時間連續性對于序列診療數據融合建模帶來的挑戰。
基于特征的融合方法[17]過程為:首先,對各數據源數據進行預處理,將其轉換為特征向量;其次,將各數據源數據對應的特征向量按次序串聯,構成合成特征向量;最后,通過數據融合算法實現多數據源的融合。由于診療數據的高度復雜性,合成特征向量具有高維特征[18],為了避免診療數據融合過程中過擬合,國內外學者對診療數據融合中的特征高維問題開展了大量研究,主要分為兩類。一類方法采用先降維再融合的思路,CORREA et al.[19]采用奇異值分解降維法對數據源特征向量分別進行降維,再利用多集合典型相關分析將醫療影像學中兩類影像數據與一類數值數據進行融合,并很好地關聯三類數據的空間分辨率和時間分辨率,進而提高數據分析的準確性。另一類是在構建目標函數時采用稀疏正則化約束改進學習模型,其本質是在構建模型中進行特征選擇,以降低模型相關特征維度,代表方法有Lasso正則化方法[20]、組Lasso正則化方法[21]等。ADHIKARI et al.[22]研究高維縱向數據分類問題,將其方法應用于心血管健康認知研究中,利用縱向數據診斷患者阿爾茨海默病的病情,實驗結果證明了該方法的有效性,并得出與病情相關的重要影響要素;LI et al.[23]使用稀疏逆協方差估計對348名受試者的多模態診療數據進行分析,預測患者阿爾茨海默病的病情,得到的模型在診斷準確性上高于僅使用單一診療數據源進行疾病診斷的方法。利用基于稀疏正則化理論構建的數據融合模型,具有靈活刻畫數據源間與特征間關系的優勢,同時模型具有特征選擇的特性,使模型具有更好的可解釋性[24]。
由于序列診療數據源具有時間關聯性,考慮不同階段數據源具有的時間關聯特性,實現采用基于稀疏正則化的序列診療數據有效融合、提高診療數據分析的準確性是一個具有挑戰性的研究方向。針對具有多階段的診療數據融合問題,其中有代表性的方法有:XIE et al.[25]提出利用疾病不同階段的序列檢查信息和診斷信息,將不同階段的診療數據按照時間順序串聯構成合成向量,利用合成向量構建回歸模型,預測疾病狀態的序列數據建模方法;CHEN et al.[26]提出在數據預處理過程中利用時間光滑核函數,對不同階段數據賦予不同權重值,刻畫不同階段指標的時間重要性,將多階段數據轉換為點模型表示的方法;安瑩等[27]針對心血管疾病的準確預測問題,提出利用循環神經網絡等技術融合多種類型的臨床數據,并有效捕獲電子病歷數據中的時序特征,最終提高心血管疾病風險預測的性能。但是上述方法仍難以科學準確地描述多階段的診療數據融合研究中關于不同階段診療數據源的時間關聯,且存在實際使用中診斷準確性較低的問題,因此需要使用準確性更高的方法刻畫多階段診療數據融合中的時間關聯性。
基于稀疏正則化的序列診療數據融合過程存在以下困難。①對于序列診療數據融合中不同階段診療數據源時間關聯性的刻畫。建立相應的稀疏正則化模型,使不同階段數據源具有的權重因子隨時間變化,診療數據中相同特征的權重因子隨時間的變化具有連續性和一致性。②對于序列診療數據融合中合成特征向量的處理。序列診療數據合成特征向量具有高維性,因此需要在構建序列數據融合模型時對模型進行降維處理,并在不同階段數據源中選擇相同特征,以提高模型泛化能力和可解釋性。③高效的數值優化算法設計。由于引入稀疏正則化項,使模型參數的優化求解問題不具有解析解,因此需要針對模型特征設計高效的數值求解算法[28]。為了有效解決上述困難,本研究構建基于時間光滑正則化的序列診療數據融合模型以及設計高效求解算法,并利用阿爾茨海默神經影像學計劃[29]中序列磁共振成像檢查數據,針對阿爾茨海默病進行疾病診斷,以驗證方法的有效性。
針對目前關于序列診療數據融合問題研究存在的不足和挑戰,本研究提出基于時間光滑正則化的序列診療數據融合方法。先介紹采用回歸分析構建的序列診療數據融合模型,在此基礎上在模型訓練過程中構建時間光滑正則化罰函數,刻畫不同階段診療數據源的時間關聯性,建立基于時間光滑正則化的序列診療數據融合模型。由于提出的模型難以數值求解,本研究采用近端加速梯度下降優化算法[30]對模型進行求解。
假設診療數據為具有n個階段的序列數據x1,x2,…,xt,…,xn,xt為第t階段的檢查特征,為m維實數向量,xt∈Rm,R為實數向量集,m為各階段檢查特征的維度,第(n+1)階段對應的診斷結果為y,y∈{+1,-1}。本研究采用回歸模型構建疾病診斷模型,假設當前階段為n,記X為特征矩陣,X=[x1;x2;…;xn]T∈Rn×m,T為矩陣的轉置。患者第(n+1)階段診斷結果的患病預測模型為

(1)
其中,wt為對于xt的權重向量;c為截距,c∈R;wt和c皆為需要求解的參數。針對(1)式最直接的求解方法為利用邏輯損失函數[31]進行參數擬合,即

(2)

利用(2)式進行的參數擬合未能考慮不同階段特征的時間關聯性,導致針對序列診療數據融合分析的精確性難以提升。
為了刻畫序列診療數據融合中不同階段特征的時間關聯性,在(2)式擬合參數模型的基礎上,采用結構化稀疏的方法構建時間光滑正則化罰函數,使同一特征相鄰階段的權重系數差別較小,進而保證預測結果的連續性和一致性,提高方法對于疾病診斷的準確性。具體模型為

(3)

由于序列診療數據合成特征向量具有高維性,使通過(3)式擬合的預測模型難以處理“維度災難”問題,致使模型泛化能力降低,處理高維特征的預測問題一般采用降維方法。為了使模型具有可解釋性,采用結構化稀疏的方法對合成特征向量進行降維處理,模型學習過程中構建基于l2,1范數的組Lasso正則化罰函數[32],使預測模型能夠利用不同階段序列診療數據中的相同特征進行疾病診斷。結合時間光滑正則化罰函數,得出具有時間光滑正則化罰函數的序列診療數據融合模型,即

(4)


圖1 TSRSCDF模型進行疾病診斷流程
由于TSRSCDF模型中包含組Lasso和融合Lasso兩類正則化罰函數,使模型不可微,求解光滑優化問題的經典算法難以適用;同時,由于邏輯損失函數具有的復雜形式,使模型難以解析求解。
針對TSRSCDF模型的求解,一種思路是采用對偶原理構建輔助變量和約束條件,將(4)式等價地轉換為帶約束的光滑優化問題,然后利用凸優化算法進行數值求解[34]。TIBSHIRANI et al.[33]針對具有融合Lasso罰函數的最小平方誤差優化問題,引入輔助變量將模型重構為具有線性約束和非負約束、目標函數為光滑函數的約束優化問題,然后針對等價優化問題采用SQOPT軟件包進行求解。AHMED et al.[35]針對具有融合Lasso罰函數的邏輯回歸問題,引入輔助變量構建等價優化問題,并對等價問題采用CVX優化軟件包求解。然而此種方法求解效率較低,TIBSHIRANI et al.[33]認為,當樣本量大于200、樣本維度高于2 000時,此算法不能有效求解問題。因此,提出近端加速梯度下降法對TSRSCDF模型進行高效求解。
由于加速梯度下降算法是針對求解非光滑優化問題具有收斂階最高的二階梯度下降求解方法[36],本研究采用加速梯度下降算法框架設計優化算法。記

(5)
其中,Loss(·)為訓練數據的經驗誤差損失函數,則TSRSCDF模型可化為

(6)
首先,構建目標函數f(·)在點(W,c)的近似為

(7)
其中,U為具有n×m維變量矩陣,U=[u1;u2;…;ut;…;un]T∈Rn×m,ut為權重向量wt的近似,t=1,2,…,n;d為截距,d∈R,R為實數集;L為Loss(·,·)二階導數的近似值,L>0;‖U-W‖F為矩陣U-W的F-范數。由于(7)式是關于(6)式的近似,因此目標函數(7)式的最優解可作為目標函數(6)式的最優解的近似,導出針對(6)式的梯度下降迭代求解算法,即

(8)
其中,k為迭代次數,Wk為n×m維變量矩陣,Wk∈Rn×m;ck為常量,ck∈R;Lk為搜索步長。
加速梯度下降算法迭代過程中產生兩組序列:{(Wk,ck)}為解近似值,{(SWk,sck)}為搜索方向,{(SWk,sck)}為(Wk-1,ck-1)和(Wk,ck)的線性組合,即
(SWk,sck)=(Wk,ck)+βk(Wk-1,ck-1)
(9)
其中,SWk為n×m維變量矩陣,SWk∈Rn×m;sck為常量,sck∈R;βk為組合參數。因此,加速梯度下降算法的近似值更新算法為

(10)
基于Armijo-Goldstein規則[37]計算Lk,優化問題(10)式是求解TSRSCDF模型(6)式的關鍵,下面給出利用近端算子[38]對該問題的求解方法。
記(6)式的近端算子為

μ‖W‖2,1}
(11)
(11)式可視為(6)式中的Loss(W,c)為平方誤差的特殊形式。為了利用(11)式求解TSRSCDF模型,下面推導出優化問題(10)式與優化問題(11)式最優解的聯系,見定理1。
定理1 優化問題(10)式的最優解(Wk+1,ck+1)可由優化問題(11)式導出,即

(12)
證明:首先,將等式右側的算式按照定義展開;其次,將優化函數中的2-范數展開并合并同類項;最后,分別按照fLk,(SWk,sck)(W,c)和(Wk+1,ck+1)定義推導出左側表達式。具體推導過程省略,如有需要可與作者聯系。
由定理1可得,優化問題(10)式的最優解可由求解優化(13)式問題得出,即

(13)
利用LIU et al.[39]提出的融合Lasso信號近似優化算法對優化問題(13)式進行求解。具體地,由于(13)式是具有融合Lasso和組Lasso兩項罰函數的投影算子,可將計算分為兩步,第一步利用FLSA優化算法對子優化問題進行求解,有



(14)
則上述優化問題的最優解即為(13)式的最優解。
至此,本研究給出求解TSRSCDF模型的近端加速梯度下降優化算法,具體如下:
輸入:W0,c0,L0>0,λ>0,μ>0
輸出:W,c
初始化:k=1,W1=W0,c1=c0,α-1=0,α0=1,L=L0(α為算法內部變量計算的特定參數)
重復

查找最小L=2pLk-1,p為任意實數,p=0,1,…,使f(Wk+1,ck+1)≤fL,(SWk,sck)(Wk+1,ck+1)成立,其中,


直至|f(Wk+1,ck+1)-f(Wk,ck)|? TOLERANCE*|f(Wk,ck)|成立
首先初始化各參數的值,然后逐步迭代求解W和c的值。每一次循環中按照加速下降策略確定搜索方向(SWk,sck),逐漸增大搜索步長L的值,并利用f(Wk+1,ck+1)≤fL,(SWk,sck)(Wk+1,ck+1)條件確定搜索步長,逐步更新參數,直至相鄰循環中目標函數值差值的絕對值滿足精度,終止循環,并輸出最優解。
本研究選取阿爾茨海默病進行疾病診斷,驗證基于序列診療數據融合的疾病診斷方法實際效用。本研究數據來源于阿爾茨海默神經影像學計劃數據庫[29]中837名患者的核磁共振檢查數據,每個核磁共振檢查數據樣本包括患者的白質分解體積、皮層分割體積、表面積、皮質厚度平均值和皮質厚度標準差5類檢查特征指標[40],共350項檢查指標及患者的病理診斷結果。將患者第一次檢查的時間點稱為基線(baesline,BL),其后不同階段的檢查數據按照相對于基線的時間間隔進行標注。例如,M06表示該檢查對應的時間階段是第一次檢查后的6個月。患者的序列檢查數據時間間隔為{BL,M06,M12,M18,M24,M36,…… }。
實驗中本研究將利用TSRSCDF模型融合序列診療數據,對下一階段患者病情進行預測,從而達到診斷疾病的目的。患者的病理診斷結果分為癡呆-正類和正常-負類共兩類,采用受試者工作特征(receiver operating characteristic,ROC)曲線測量預測的性能[41]。ROC曲線是以假陽性概率為橫軸、真陽性概率為縱軸組成的坐標圖,有

(15)
(16)
其中,FPR為假陽性概率,FP為假正的樣本數目,TN為真負的樣本數目,TPR為真陽性概率,TP為真正的樣本數目,FN為假負的樣本數目。由于ROC曲線并不能直觀比較模型的預測性能,需根據ROC曲線下的面積(AUC)作為標量指標測量模型的預測性能以及量化模型均衡Ⅰ類錯誤與Ⅱ類錯誤的能力[42]。
實驗共分為3部分,第1部分對比TSRSCDF方法與單階段診療數據分析方法的預測性能,說明基于序列數據融合的疾病診斷方法預測性能上的優勢;第2部分比較TSRSCDF方法與相關序列診療數據分析方法的預測性能;第3部分比較利用相同序列診療數據針對未來不同階段疾病診斷的預測性能,分析預測時間窗長度對于模型預測性能的影響。
首先用本研究提出的TSRSCDF方法融合3個階段診療數據,對患者第4階段的病情進行預測,通過利用TSRSCDF方法對診療序列{BL,M06,M12}進行分析,對患者下一階段即M18的病情進行預測。為了實際驗證疾病預測模型的有效性,對初始數據集進行篩選,選擇診療序列{BL,M06,M12}中各階段診斷結果為健康的患者數據,預測M18階段患者患病狀況。最終得到223名患者的序列診療數據,其中M18階段健康人數為191人,患病人數為32人。
單階段診療數據分析方法為:①采用具有Lasso正則化罰函數的線性回歸方法,利用M12階段的診療數據預測M18階段患者患病狀況;②基于多任務學習的疾病預測方法[8],利用BL階段的診療數據,構建M18階段患者患病預測子任務。TSRSCDF方法中的正則化參數λ∈{10-7,10-6,10-5,10-4,10-3},μ∈{2-9,2-8,2-7,2-6,2-5};具有Lasso正則化罰函數的線性回歸方法中的正則化參數μ∈{2-9,2-8,2-7,2-6,2-5},基于多任務學習的疾病預測方法中的融合Lasso正則化參數μ∈{2-9,2-8,2-7,2-6,2-5}。各方法中正則化參數的取值通過交叉驗證確定[43]。隨機選擇80%的數據作為訓練數據集合,利用學習模型對余下的測試數據進行分類。重復實驗并計算ROC曲線下面積的平均值,當試驗重復50次后,預測結果平均值對于逐步增加的試驗次數趨于穩定,因此采用將試驗重復50次并計算ROC曲線下面積的平均值的做法,TSRSCDF方法與單階段診療數據分析方法的預測性能見表1,黑體數據表示ROC曲線下面積的最高值。各方法對應的ROC曲線見圖2。

表1 TSRSCDF方法與單階段診療數據分析方法的預測性能對比

圖2 TSRSCDF方法與單階段診療數據分析方法對應的ROC曲線
由表1可知,由于TSRSCDF方法利用檢查指標對應不同階段的更多特征構建疾病診斷模型,因此具有較高的預測性能。利用單階段診療數據的疾病診斷方法中,相對于基于多任務學習的疾病預測方法,利用具有Lasso正則化罰函數的線性回歸方法具有較高的預測性能,因為基于多任務學習的疾病預測方法利用BL階段的診療數據,對M18階段患者患病狀況進行預測,而采用具有Lasso正則化罰函數的線性回歸方法利用M12階段的診療數據進行病情預測,由于預測時間窗較長,利用BL階段的診療數據進行的病情預測難以準確刻畫疾病的進展狀況導致預測準確性降低。圖2中TSRSCDF方法對應的ROC曲線整體高于其他方法,也說明TSRSCDF方法具有較高的預測性能。實驗1的結果表明,與利用單階段診療數據的病情預測方法相比,本研究提出的利用序列診療數據融合的疾病診斷TSRSCDF方法,在構建疾病診斷模型時將不同檢查指標對應的不同階段檢查值同時進行分析,選擇相關指標的不同階段特征值進行融合,這一數據融合機理使TSRSCDF方法具有綜合各檢查指標中信息變化的優勢,最終提升了疾病診斷的準確性。
TSRSCDF方法具有的突出特性是模型學習過程中使同一特征相鄰階段的權重系數差別較小,進而保證預測結果的連續性和一致性。為了驗證利用TSRSCDF方法對提升疾病診斷準確性的作用,對比的相關序列診療數據分析方法為:①采用具有組Lasso正則化罰函數的線性回歸方法;②將多階段診療數據轉換為點模型表示[26],對轉換特征利用具有Lasso正則化罰函數的線性回歸方法。利用與實驗1相同的樣本數據,3類方法利用診療序列{BL,M06,M12}數據對患者M18階段患者患病狀況預測結果進行對比。TSRSCDF方法中的正則化參數λ∈{10-7,10-6,10-5,10-4,10-3},μ∈{2-9,2-8,2-7,2-6,2-5};具有組Lasso正則化罰函數的線性回歸方法中的正則化參數μ∈{2-9,2-8,2-7,2-6,2-5};將多階段數據轉換為點模型表示方法,并對轉換特征利用具有Lasso正則化罰函數的線性回歸方法中的正則化參數μ∈{2-9,2-8,2-7,2-6,2-5}。各方法中正則化參數的取值通過交叉驗證確定。隨機選擇80%的數據作為訓練數據集合,利用學習模型對余下的測試數據進行分類。重復實驗50次并計算ROC曲線下面積的平均值,TSRSCDF方法和相關序列診療數據分析方法的預測性能見表2,黑體數據為ROC曲線下面積的最高值。各方法對應的ROC曲線見圖3。
由表2可知,TSRSCDF方法比相關序列診療數據分析方法具有較高的預測性能。圖3中TSRSCDF方法對應的ROC曲線高于其他方法,也說明TSRSCDF方法具有較高的預測性能。由于TSRSCDF方法中檢查指標對應不同階段特征的權重值由機器學習確定,選取的權重值更加準確地刻畫指標變化的規律,且時間光滑正則化罰函數使相同指標不同階段權重值具有一致性,因此相對于對點模型表示特征[26]利用具有Lasso正則化罰函數線性回歸的疾病預測方法具有較高的預測性能。3類方法中,具有組Lasso正則化罰函數的線性回歸方法具有最低的預測性能,因為該方法在分析序列診療數據時未能考慮不同階段診療數據源的時間關聯性,進而難以準確刻畫指標隨時間變化的特征。

表2 TSRSCDF方法與相關序列診療數據分析方法的預測性能對比

圖3 TSRSCDF方法與相關序列診療數據分析方法對應的ROC曲線
實驗3旨在探討預測時間窗長度w對TSRSCDF方法和相關序列診療數據分析方法疾病預測準確性的影響。分別利用各方法融合診療序列{BL,M06,M12}數據,預測患者M18階段、M24階段、M36階段、M48階段和M60階段患病狀況。針對不同階段的患病狀況預測,由于患者的檢查序列具有不同的長度,需將實驗1使用的樣本數據進行篩選,得到針對不同階段病情預測實驗利用的數據,詳見表3。

表3 針對不同階段患病狀況預測實驗利用的數據
預測不同階段患者患病狀況的實驗中,TSRSCDF方法中的正則化參數λ∈{10-7,10-6,10-5,10-4,10-3},μ∈{2-9,2-8,2-7,2-6,2-5},正則化參數的取值通過交叉驗證確定。隨機選擇80%的數據作為訓練數據集合,利用學習模型對余下的測試數據進行分類。重復實驗50次并計算ROC曲線下面積的平均值,不同階段患病狀況的預測性能見表4。
由表4可知,①預測時間窗越長,模型的預測性能越低。TSRSCDF方法對患者M18階段和M24階段的患病狀況預測具有較高的預測性能,對于具有較長時間窗的疾病預測性能有所降低,但是整體上TSRSCDF方法針對各個階段患者的患病狀況預測具有相對穩定的預測性能。②針對M18階段和M24階段患病狀況預測實驗,對比兩組實驗中類標簽的分布和分類的結果,說明TSRSCDF針對M18階段處理分類結果具有類不均衡特征的預測問題具有較好的預測性能。③與相關序列診療數據分析方法的預測性能相比,TSRSCDF方法針對不同階段患病狀況預測的ROC曲線下面積值的標準差(σ=0.030)最小。結果表明,采用序列數據融合的TSRSCDF方法的疾病診斷結果具有穩定性。

表4 TSRSCDF方法與相關序列診療數據分析方法針對不同階段患病狀況的預測性能對比
本研究探討疾病診斷中序列診療數據融合問題,針對序列診療數據融合中多個階段的診療數據時間關聯性刻畫難、合成特征向量降維難和序列診療數據融合模型求解難等問題,提出將結構稀疏性與不同階段診療數據源的時間關聯性有機結合,采用序列診療數據融合思想的疾病預測分析研究思路,構建基于時間光滑正則化的序列診療數據融合方法。
針對阿爾茨海默病進行疾病診斷實驗,利用真實診療數據進行實驗分析,將本研究提出的TSRSCDF方法與傳統單階段診療數據分析方法相比,表明本研究構建的TSRSCDF方法在疾病診斷上具有優越性;與相關序列診療數據分析方法的預測性能對比結果表明,TSRSCDF方法構建的時間光滑正則化罰函數保證了模型具有刻畫不同階段診療數據源的時間關聯性特征,同時采用結構化稀疏,使該方法具有較高的預測性能和可解釋性;實驗結果進一步表明,預測時間窗長度對于疾病診斷性能的影響及TSRSCDF方法疾病診斷性能具有魯棒性。
該方法可以推廣到實際阿爾茨海默病的早期診斷中,提高了智能臨床決策支持系統識別高風險患者的能力,為科學地實施慢性病患者疾病管理提供決策支持,進而提高患者生命質量;同時彌補了傳統診療數據分析未能科學、準確地刻畫指標變化趨勢導致診斷準確率較低的不足,為開展個性化和精準醫療提供決策支持。
慢性病患者診療數據對應于每個階段檢查數據具有多源的特征,在未來研究中將進一步針對多源診療數據的融合方法進行深入研究,完善診療數據融合分析方法,豐富智能臨床決策支持系統研究體系,并將研究結果應用于腦卒中和腦血管疾病等相關慢性疾病的診斷,進一步驗證本研究提出的方法在慢性疾病診斷中的普適性和實用價值,并拓展相關應用研究。