山西醫科大學衛生統計學教研室(030001) 孔盼盼 張慧敏 孫倩倩 余紅梅
基于分段常數強度Markov模型的阿爾茨海默病進程研究*
山西醫科大學衛生統計學教研室(030001) 孔盼盼 張慧敏 孫倩倩 余紅梅△
目的將分段常數強度Markov模型應用于輕度認知損害(mild cognitive impairment,MCI)向阿爾茨海默?。ˋlzheimer′s disease,AD)轉歸過程中,深入研究影響轉歸過程的因素,為制定不同發展階段的預防措施提供理論依據,為其他多狀態慢性病不同發展階段影響因素的探討提供方法學借鑒。方法應用太原市600名社區老年人的4次隨訪資料,以MCI為狀態1,中重度認知損害為狀態2,AD為狀態3,擬合分段常數強度Markov模型,分析MCI向AD轉歸不同發展階段的影響因素,并根據模型計算3年轉移概率矩陣。結果經假設檢驗,數據滿足Markov性(P=0.89),不滿足時齊性(P<0.001),應用分段常數強度Markov模型擬合,經多因素篩選,女性、年齡、吸煙、高血壓和糖尿病是MCI向AD轉歸的危險因素,高文化程度和從事腦力勞動是MCI向AD轉歸的保護因素。由中重度認知損害向AD的轉移概率隨著隨訪時間的增加而增加。結論在數據滿足Markov性,不滿足時齊性時,分段常數強度Markov模型是對疾病轉歸過程的相關影響因素及其變化規律的有效分析方法。
多狀態模型 非齊次Markov模型 分段常數強度Markov模型 輕度認知損害 阿爾茨海默病
阿爾茨海默?。ˋlzheimer′s disease,AD)是以近期記憶障礙為主要臨床表現的神經變性疾病,常具有慢性進行性特征,是老年期癡呆的一個主要類型,約占老年期癡呆總數的2/3。輕度認知損害(mild cognitive impairment,MCI)是指個體存在輕微的認知障礙,但未達到癡呆標準且社會功能基本保持正常的認知損害狀態,是介于正常老化和癡呆之間的一種中間過渡狀態,是AD的高危人群。
多狀態Markov模型(multi-state Markov model)是處理多狀態資料的有效工具,可同時考慮所有的狀態、結局、狀態間轉移的時間信息以及可能的影響因素,可連續性動態研究隨機過程,分析影響疾病進展的因素,是迄今研究疾病進程的最佳模型[1]。與多狀態Cox回歸模型相比,多狀態Markov模型最大的優勢在于它能夠處理無法觀察到精確狀態轉移時間的資料。
許多研究AD的文獻表明疾病進展率對時間的依賴性是增加的,因此AD各狀態間的轉移概率在時間上不是常量,即不滿足時齊性的假設。本研究采用分段常數強度Markov模型分析不滿足時齊性的多狀態面板數據,研究阿爾茨海默病進程的影響因素,為今后類似研究提供方法學借鑒。
1.研究對象
本研究沿用項目組前期隨訪的老年人群,共納入60歲及以上社區輕度認知損害老年人600名,構成隊列人群,分別于2010年11月、2011年5月、2011年11月和2012年5月共完成4次隨訪,進行問卷調查。
2.調查內容
(1)基本情況調查表由項目組自行設計,包括:①社會人口學指標:年齡、性別、受教育程度、婚姻狀況、職業、經濟收入、居住狀況;②生活方式:吸煙、飲酒、社會活動、讀書看報、體育活動、做家務、夫妻及子女關系;③健康狀況:現患病、曾患病、家族遺傳史及視力、聽力、血壓、體質指數。
(2)認知功能評定采用蒙特利爾認知評估量表(Montreal cognitive assessment,MoCA),它由加拿大CharlesLeMoyne醫院神經科臨床研究中心Nasreddine ZS根據臨床經驗并參考簡易精神狀況量表(MMSE)制訂[2],是快速篩查癡呆高危人群——MCI的有效工具。
(3)狀態劃分
考慮到AD的發生和發展呈現進行性加重和不可逆性特點,結合本次研究流行病學調查的實際狀況,將AD進程劃分為三個狀態:MCI(狀態1),中重度認知損害(狀態2),AD(狀態3)。其中狀態1和狀態2為暫態,狀態3為吸收態。根據王煒等[3]的研究結果,將19分作為MCI與中重度認知損害狀態的截斷值;根據張立秀[4]的研究結果,將15分作為中重度認知損害狀態與AD的截斷值。AD進程狀態結構圖見圖1。

圖1 AD進程狀態結構圖
1.Markov性檢驗與時齊性檢驗
Markov性假設是指未來的演變只取決于當前狀態,而與個體過去的歷史無關。
對于三個狀態的模型,我們需證明在MCI狀態(過去)上的逗留時間不影響中重度認知損害狀態(當前)到AD狀態(未來)的轉移。
時齊性假設是假設Markov模型的轉移概率矩陣不隨時間變化。如果滿足該假設,說明轉移強度隨著時間是不變的,則過程為齊次Markov過程(homogeneous Markov process);如果不滿足該假設,說明轉移強度隨著時間是變化的,則過程為非齊次Markov過程(non-homogeneous Markov process)。
2.分段常數強度Markov模型
在數據滿足Markov性,不滿足時齊性時,應用分段常數強度Markov模型估計非齊次Markov過程:
假定隊列有N個個體,對于每一個體c,狀態間的mc次轉移發生在時點

如果對每個個體觀察到了mc次轉移,那么就有最大值個時間點從一個狀態到另一個狀態的轉移。將這些時間點排序,通過r個不同的截斷點分成時間分區,保證在每個時間分區內至少能觀察到一次狀態間轉移,形成一個時間分割序列{s1,…,sr}。因此,將隨訪時間分成r-1區間,每個區間內的轉移強度矩陣假定為常數,即

其中Qk為每個區間內的常數矩陣。對每個區間用齊次Markov轉移強度的最大似然法估計Qk[5]。對于兩個連續的區間si≤t<si+1和si+1≤t<si+2,如果Qi=Qi+1,則認為滿足齊性,從序列中刪除時點si+1,將這兩個區間合并,合并后繼續與下一個鄰近區間的轉移強度進行比較;若不滿足齊性則應視為分割點,如此反復,直至任意兩個連續區間都不滿足齊性為止。
設該模型的轉移強度矩陣為Q,共有3個需要估計的轉移強度:q12、q13、q23。

3.軟件實現
資料的描述性分析使用SPSS13.0完成,Markov模型的擬合采用R(2.14.0)軟件中的“msm”軟件包和R(1.9.1)軟件中的“tdc.msm”軟件包完成,報告風險比及其95%置信區間。
1.研究對象基本特征
2007年篩選出的600例MCI老年人在3年后的2010年11月,經過四次隨訪到2012年5月,有二次及二次以上隨訪的有效數據為486例,失訪25例,失訪率為5.1%。其中12例搬遷、8例退出研究、5例死亡。
最終擁有完全數據的461例老年人中,男性150例(32.5%),女性311例(67.5%)。年齡最大者89歲,年齡最小者65歲,平均70.44歲(70.44±6.55),其中65歲至70歲者207人(44.9%),71歲至74歲者131人(28.4%),75歲及以上者123人(26.7%)。
2.Markov性檢驗與時齊性檢驗
根據R(1.9.1)軟件tdc.msm軟件運行結果,似然比檢驗統計量為0.02,自由度為1,P=0.89,說明該過程滿足Markov性,可對該數據擬合Markov模型。
根據軟件R(2.14.0)運行結果,似然比檢驗統計量為47.74,自由度為3,P<0.001,說明轉移強度矩陣是隨時間變化的,過程為非齊次Markov過程。
3.分段常數強度Markov模型擬合結果
由于數據滿足Markov性,不滿足時齊性,選擇分段常數強度Markov模型進行擬合。根據選定各截斷點后似然函數的比較及確保各個時間區間內都有合適的或足夠的轉移次數,該模型選擇第三次調查的時間即12個月為截斷點。
(1)分段常數強度Markov模型多因素分析
在第一個時間區間[0,12)月內,性別、年齡、文化程度、職業和高血壓對狀態1到狀態2的轉移有統計學意義;年齡、文化程度、職業、高血壓和糖尿病對狀態1到狀態3的轉移有統計學意義;性別、年齡、文化程度、高血壓和糖尿病對狀態2到狀態3的轉移有統計學意義。具體結果見表1。

表1 分段常數強度Markov模型[0,12)月及[12,18]月多因素擬合結果
在第二個時間區間[12,18]月內,性別、年齡、文化程度、職業、吸煙和高血壓對狀態1到狀態2的轉移有統計學意義;文化程度、職業、吸煙、高血壓和糖尿病對狀態1到狀態3的轉移有統計學意義;年齡、文化程度、職業、吸煙、高血壓和糖尿病對狀態2到狀態3的轉移有統計學意義。具體結果見表1。
(2)模型評價
圖2為危險因素作用下四個隨訪時點各狀態的實際發生率曲線(實線)和利用模型擬合的理論發生率曲線(虛線),橫軸代表觀察時間,縱軸代表發生率。由圖2可以看出,模型擬合情況較好。

圖2 分段常數強度Markov模型擬合情況
(3)轉歸預測
兩個時間區間分段常數強度Markov模型3年后轉移概率矩陣分別見表2。結果顯示,對于第一個時間區間,處于MCI狀態的個體,3年后仍處于MCI狀態的概率為35.5%,轉移到中重度認知損害狀態的概率為60.2%,轉移到AD狀態的概率為4.3%;對于處于中重度認知損害狀態的個體,3年后仍處于中重度認知損害狀態的概率為95.9%,轉移到AD狀態的概率為4.1%。

表2 分段常數強度Markov模型[0,12)月及[12,18]月3年后轉移概率矩陣
對于第二時間區間,處于MCI狀態的個體,3年后仍處于MCI狀態的概率為12.8%,轉移到中重度認知損害狀態的概率為66.0%,轉移到AD狀態的概率為21.2%;對于處于中重度認知損害狀態的個體,3年后仍處于中重度認知損害狀態的概率為65.0%,轉移到AD狀態的概率為35.0%。
1.非齊次Markov模型的優勢
大多數研究在應用Markov模型時都假定其為齊次過程,即轉移概率僅依賴于觀察間經過的時間。時間齊次模型通常用于慢性病發展過程的研究,但是很明顯這個模型在疾病自然史研究中有很嚴重的限制,這是由于轉移概率在相當長的觀察時間內始終保持恒定似乎是不太可能的,因此就需要使用一些非齊次模型。
估計非齊次Markov過程有兩種常用的方法,除上述介紹的分段常數強度Markov模型外,還有一種是時間轉換模型。非齊次強度矩陣是基線齊次強度矩陣和一個時間函數的乘積[6]。時間經函數變換后,非齊次過程就轉化為齊次過程。此方法需要估計轉移強度矩陣和時間函數的參數。與分段齊次模型相比,它需要估計的參數較少而且需要觀察的轉移較少。另外,它不需要假設離散時間間隔內的齊次性。Hubbard等(2008)[7]提出兩種時間轉換方法,指數時間轉換和非參數時間轉換。盡管這種方法看似比較巧妙,但它的限制性很強,因為所有的轉移強度都按照一種形式建模,其中時間函數對所有的轉移強度都是固定的。然而,實際上,通常發現的隨機過程是轉移強度隨著時間有不同的趨勢的,即每一個轉移強度通過不同的函數來建模[8]。當認為所有轉移強度隨著時間連續變化不現實時,分段常數強度模型為首選。
2.應用分段常數強度Markov模型時需注意的問題
應用分段常數強度Markov模型時要注意的一個問題就是考慮分多少個區間。本研究采用的方法是考慮了兩個區間,然而隨訪時間可以分成三個、四個甚至更多的區間來定義常數轉移矩陣,每個研究者選擇的區間數可能不同。因此需根據選定各截斷點后似然函數的比較及確保各個時間區間內都有合適的或足夠的轉移次數等原則,選擇合適的區間數和截斷點。
3.本研究的不足之處
軟件R(1.9.1)中的軟件包tdc.msm[9]是目前唯一可用的進行Markov性檢驗的軟件工具,由于其不允許數據有缺失的情況,所以隨訪人群中有缺失數據的25例患者并未納入分析中,有可能會導致偏倚。
1.Andersen PK,Perme MP.Inference for outcome probabilities in multi-state models.Lifetime Data Analysis,2008,14(4):405-431.
2.Nasreddine ZS,Phillips NA,Bedirian V,et a1.The Montreal Cognitive Assessment,MoCA:a brief screening tool for mild cognitive impairment.Journal of the American Geriatrics Society,2005,53(4):695-699.
3.王煒,劉丹丹,解恒革,等.蒙特利爾認知評估量表(中文版)在駐京軍隊離退休干部中界值劃分的初步研究.中華保健醫學雜志,2010,12(4):271-273.
4.張立秀,劉雪琴.蒙特利爾認知評估量表中文版廣州市老人院人群劃界分探討.中國心理衛生雜志,2008,22(2):123-125,151.
5.楊珊珊,李新毅,周立業,等.基于多狀態Markov模型的老年人認知損害轉歸研究.中國衛生統計,2012,29(4):516-519.
6.Kalbfleisch JD,Law less JF.The analysis of panel data under a Markov assumption.Journal of the American Statistical Association,1985,80(392):863-871.
7.Hubbard RA,Inoue LYT,Fann JR.Modeling nonhomogeneous Markov processes via time transformation.Biometrics,2008,64(3):843-850.
8.Ricardo OR.Non-homogeneous Markov processes for biomedical data analysis.Biometrical journal,2005,47(3):369-376.
9.Meira-Machado L,Cadarso-Suárez C,deJ.tdc msm:an R library for the analysis of multi-state survival data.Computer methods and programs in biomedicine,2007,86(2):131-140.
(責任編輯:郭海強)
Piecewise Constant Intensities Markov Model in Outcome of Mild Cognitive Impairment to Alzheimer′s Disease
Kong Panpan,Zhang Huimin,Sun Qianqian,et al(Department of Health Statistics,Shanxi Medical University(030001),Taiyuan)
ObjectiveThe aim of this study was to introduce piecewise constant intensities Markov model in outcome prediction from mild cognitive impairment(MCI)to Alzheimer′s disease(AD)and to find out related factors in order to provide theory basis for AD prevention among various progressive stages.The suggested method for exploring influencing factors for various progressive stages of other chronic disease was also provided.MethodsOur data came from four waves of cohort study of 600 community dwelling older people in Taiyuan.MCI,moderate/severe cognitive impairment,and AD were defined as state 1,2 and 3,respectively.Piecewise constant intensities Markov model was applied to explore factors for various progressive stages from MCI to AD.According to the fitted model,three years transition probabilities among states were also estimated.ResultsBased on hypothesis testing,the Markov assumption was satisfied(P=0.89)and the time-homogeneous assumption was not(P<0.001),so piecewise constant intensities Markov model was applied.Multivariate analysis showed that women,older,smoking,hypertension and diabetes were risk factors for progression from MCI to AD while high education and intellectual work were protecting factors.The transition probability from moderate/severe cognitive impairment to AD may increase as follow-up time extending.ConclusionPiecewise constant intensities Markov model is an effective analysis method to the data when the Markov assumption was satisfied and the time-homogeneous assumption was not for related factors analysis and variation pattern during disease progressive process.
Multistate model;Non-homogeneous Markov model;Piecewise constant intensities Markov model;Mild cognitive impairment;Alzheimer′s disease
國家自然科學基金資助項目(81373106)
△通信作者:余紅梅,Email:yu_hongmei@hotmail.com