王定坤 楊杉



摘要:文章用Cox比例風(fēng)險(xiǎn)模型對(duì)心力衰竭的影響因素進(jìn)行了數(shù)據(jù)分析,研究結(jié)論顯示,影響心力衰竭的主要因素是年齡、射血分?jǐn)?shù)、高血壓情況、血清肌酐濃度。根據(jù)模型我們可以幫助醫(yī)療專(zhuān)業(yè)人員了解患者存在的潛在風(fēng)險(xiǎn),以便專(zhuān)業(yè)人員能夠更早地采取行動(dòng)。
關(guān)鍵詞:Cox比例風(fēng)險(xiǎn)模型;Schoenfeld殘差分析;心力衰竭影響因素
心力衰竭是指人體心臟的收縮功能的減退以及舒張功能受阻,不能很好地將靜脈回心血量排到心臟外,造成靜脈系統(tǒng)血液堆積,動(dòng)脈系統(tǒng)血液不夠,從而引起肺瘀血、腔靜脈瘀血等疾病。心力衰竭是心臟方面的疾病,并且發(fā)病大多是從左心衰竭開(kāi)始的。隨著時(shí)間的推移,心臟逐漸不能提供全身的供血進(jìn)而引起下半身腫脹、心跳加快或不規(guī)則、突然嚴(yán)重的呼吸急促和咳嗽等癥狀。心力衰竭已成為全球的最大死因,我國(guó)心衰患病率估計(jì)已達(dá)1.3%,保守估計(jì)至少有1000萬(wàn)人患有心力衰竭,特別是老年人占據(jù)大部分比例。如今中國(guó)已成為全球擁有最多心衰患者群的國(guó)家之一。本研究將死亡事件設(shè)置為結(jié)局,探究可能引起病人死亡的主要因素,由于每一個(gè)研究對(duì)象都有其各自的生存時(shí)間(從隨訪開(kāi)始的時(shí)間一直到死亡、失訪或隨訪結(jié)束的時(shí)間),由于這一特性所以選用Cox比例風(fēng)險(xiǎn)模型(Cox proportional-hazards model,也稱(chēng)為Cox回歸)進(jìn)行分析處理。數(shù)據(jù)由13個(gè)變量組成,對(duì)此13個(gè)變量進(jìn)行Cox生存分析以評(píng)估影響患者死亡最大因素進(jìn)而盡最大的可能提升患者的生存幾率。
1 相關(guān)知識(shí)
1.1 Cox回歸原理分析
Cox回歸模型又被人們稱(chēng)為比例風(fēng)險(xiǎn)回歸模型。由于生存時(shí)間與生存結(jié)果作為該回歸模型的因變量,并且多個(gè)變量也可被同時(shí)分析進(jìn)而分析出對(duì)生存期的影響。因?yàn)樵撃P蜕鲜龅奶匦裕詮哪P捅谎邪l(fā)以來(lái),大量運(yùn)用在了醫(yī)學(xué)分析領(lǐng)域。并且該模型能分析帶有截尾生存時(shí)間的資料,且不要求估計(jì)資料的生存分布類(lèi)型。由于其上述顯著的優(yōu)勢(shì),該模型已被大量的學(xué)者所使用。
2 模型建立及實(shí)例分析
2.1數(shù)據(jù)集簡(jiǎn)介
本數(shù)據(jù)集為從R公司檢索到的心力衰竭預(yù)測(cè)數(shù)據(jù)集。該數(shù)據(jù)集由13個(gè)變量組成分別描述了患者的基本狀況。年齡:用于描述患者患病年齡的定量數(shù)據(jù)、是否貧血(1/0):為一個(gè)二進(jìn)制變量、肌酐磷酸激酶、是否患有糖尿病(1/0):為一個(gè)二進(jìn)制變量、射血分?jǐn)?shù)百分?jǐn)?shù):用于顯示每次收縮時(shí)離開(kāi)心臟的血液百分比、是否高血壓(1/0)、血小板:發(fā)揮的主要作用,是生理性止血以及維持血管內(nèi)皮完整性。血清肌酐:一種定量數(shù)據(jù),用于描述腎臟功能的好壞、血清鈉:一種定量變量,顯示患者血液中的血清鈉水平,以mmol/L為單位、性別男性1女性0、是否吸煙(1/0):為一個(gè)二進(jìn)制變量、到訪時(shí)間:一個(gè)定量數(shù)據(jù)顯示患者死亡前幾天的到訪時(shí)間、是否死亡(1/0):為一個(gè)二進(jìn)制變量。
2.2模型構(gòu)建
本次研究方法使用的軟件為IBM SPSS Statistics 26統(tǒng)計(jì)分析軟件,在進(jìn)行Cox回歸分析之前,先利用單變量分析的方法例如KM法繪制生存曲線或者Logrank檢驗(yàn)等方法檢測(cè)所有因變量與自變量之間存在的關(guān)系,篩選掉一些可能不存在實(shí)際意義的變量,之后再通過(guò)多因素分析的方法,以保證其結(jié)果更加精確可靠。納入的變量主要包括單因素分析差異有統(tǒng)計(jì)學(xué)意義的變量,為避免漏掉一些重要因素,作為探索性分析,此時(shí)將P值小于0.1,均作為具備統(tǒng)計(jì)學(xué)差異。在進(jìn)行單因素分析時(shí),并沒(méi)有發(fā)現(xiàn)差異有統(tǒng)計(jì)學(xué)意義,但是在實(shí)驗(yàn)中認(rèn)為與因變量關(guān)系密切的自變量。
在創(chuàng)建Cox回歸分析時(shí),我們將時(shí)間選取為到訪時(shí)間,狀態(tài)選取為是否死亡,協(xié)變量選取為是否貧血、肌酐磷酸激酶、是否患有糖尿病、射血分?jǐn)?shù)百分?jǐn)?shù)、是否高血壓、血小板、血清肌酐、性別、是否吸煙,對(duì)于變量的篩選選取的方法為最大似然估計(jì)的向前逐步回歸法(Forward LR)。
最終得到的模型如表1所示:
由表1可發(fā)現(xiàn),血清肌酐、年齡、射血分?jǐn)?shù)(百分?jǐn)?shù))、高血壓的回歸系數(shù)均為0,其次Score統(tǒng)計(jì)量為77.352, P<0.01;對(duì)數(shù)似然比檢驗(yàn)x2=70.522, P<0.01,由以上數(shù)據(jù)可說(shuō)明模型中至少有一個(gè)自變量的HR值不為1,模型整體檢驗(yàn)有統(tǒng)計(jì)學(xué)意義,而且隨著變量的加入,-2log likelihood的值逐漸變小,說(shuō)明引入新的自變量后模型效果更加優(yōu)秀,新納入的變量是有效的。
2.3 數(shù)據(jù)分析
由表2的數(shù)據(jù)可得出參數(shù)估計(jì)的結(jié)果,從表格中可看出通過(guò)最后篩選后的模型僅包含通過(guò)變量篩選最終納入模型的變量存在4個(gè),包括年齡/射血分?jǐn)?shù)/高血壓情況/血清肌酐濃度。表達(dá)式為h(t)=h0(t)exp(0.044*年齡+(-0.049)*射血分?jǐn)?shù)(百分?jǐn)?shù))+0.466*高血壓+0.338*血清肌酐)。
1)其中由年齡P<0.001,具有統(tǒng)計(jì)學(xué)意義,相對(duì)危險(xiǎn)度HR=Exp(B)=1.045,95%可信區(qū)間為(1.027,1.064),說(shuō)明年齡為影響患者生存的獨(dú)立危險(xiǎn)因素。患者每增加一歲,引起將來(lái)死亡風(fēng)險(xiǎn)為原來(lái)的1.045倍。
2)射血分?jǐn)?shù):P<0.001,具有統(tǒng)計(jì)學(xué)意義,相對(duì)危險(xiǎn)度HR=Exp(B)=0.952, 95%可信區(qū)間為(0.933,0.971),說(shuō)明射血分?jǐn)?shù)值為影響患者生存的獨(dú)立保護(hù)因素。患者射血分?jǐn)?shù)每增加一個(gè)單位,引起將來(lái)死亡風(fēng)險(xiǎn)為原來(lái)的0.952倍。
3)高血壓情況:P=0.027,具有統(tǒng)計(jì)學(xué)差異,相對(duì)危險(xiǎn)度HR=Exp(B)=1.594, 95%可信區(qū)間為(1.053,2.414),說(shuō)明高血壓為影響患者生存的獨(dú)立危險(xiǎn)因素。患者患有高血壓引起將來(lái)死亡風(fēng)險(xiǎn)為不患有高血壓的1.594倍。
4)血清肌酐濃度:P<0.001,具有統(tǒng)計(jì)學(xué)意義,相對(duì)危險(xiǎn)度HR=Exp(B)=1.402, 95%可信區(qū)間為(1.231,1.596),說(shuō)明血清肌酐濃度值為影響患者生存的獨(dú)立危險(xiǎn)因素。患者血清肌酐每增加一個(gè)單位,引起將來(lái)死亡風(fēng)險(xiǎn)為原來(lái)的1.402倍。
為更好地解釋危險(xiǎn)因素風(fēng)險(xiǎn),將連續(xù)變量年齡按照四分位數(shù)進(jìn)行四等分轉(zhuǎn)化為等級(jí)資料,其結(jié)果如下:
其余變量解釋如前,將年齡四分位之后,其解釋如下,年齡每增加一個(gè)等級(jí),其發(fā)病風(fēng)險(xiǎn)為原有的1.401倍。
2.4 模型驗(yàn)證
而在實(shí)際的生存分析過(guò)程中,一些自變量對(duì)風(fēng)險(xiǎn)函數(shù)的影響會(huì)發(fā)生改變,而Cox回歸模型在應(yīng)用之前的前提為進(jìn)行比例風(fēng)險(xiǎn)假定,該比例風(fēng)險(xiǎn)假定也被稱(chēng)為PH假定,只有當(dāng)PH假定條件成立時(shí),
Cox回歸模型的結(jié)果有意義。考慮到年齡和死亡發(fā)生事件一般不呈線性關(guān)系,即對(duì)此假設(shè)進(jìn)行假設(shè)檢驗(yàn)。采用的方法為Schoenfeld殘差法進(jìn)行檢驗(yàn)。
由圖1可知,年齡與死亡發(fā)生存在正相關(guān)性,即隨著年齡的增大,死亡發(fā)生的風(fēng)險(xiǎn)也在增大。即不滿足該P(yáng)H假定:年齡與死亡發(fā)生事件無(wú)關(guān)。即采用Cox時(shí)間依存協(xié)變量進(jìn)行分段Cox回歸分析。
由圖易得實(shí)驗(yàn)結(jié)果與前方實(shí)驗(yàn)結(jié)果一致,得出結(jié)論時(shí)間協(xié)變量并無(wú)意義。
3 結(jié)語(yǔ)
對(duì)于患有心血管疾病或者有患心血管疾病隱患的病人,我們應(yīng)該采取的手段是早發(fā)現(xiàn)早治療。通過(guò)我們的模型,我們可以分析出例如患者每增加一歲,引起將來(lái)死亡風(fēng)險(xiǎn)為原來(lái)的1.045倍。患者患有高血壓引起將來(lái)死亡風(fēng)險(xiǎn)為不患有高血壓的1.594倍。
患者血清肌酐每增加一個(gè)單位,引起將來(lái)死亡風(fēng)險(xiǎn)為原來(lái)的1.402倍。從我們的模型中可以發(fā)現(xiàn)對(duì)于年齡較大,有高血壓且血清肌酐較大的患者,我們更應(yīng)該重點(diǎn)關(guān)注其患者的各項(xiàng)體征進(jìn)而最大限度地提高患者的生存機(jī)率。因此,我們模型的最終目的是幫助醫(yī)療專(zhuān)業(yè)人員了解患者存在的潛在風(fēng)險(xiǎn),以便專(zhuān)業(yè)人員能夠更早地采取行動(dòng)。畢竟對(duì)于預(yù)測(cè)一個(gè)疾病的發(fā)生再采取行動(dòng)總比當(dāng)疾病發(fā)生了再去阻止更加有效。
參考文獻(xiàn):
[1] 張旭.基于COX比例風(fēng)險(xiǎn)模型的高職單招生行為影響因素與管理對(duì)策分析[J].無(wú)線互聯(lián)科技,2020,17(19):86-87,92.
【通聯(lián)編輯:唐一東】