濰坊醫學院公共衛生學院(261053)
毛 倩 管佩霞 劉玉潔 王 喆 肖宇飛 楊 毅 叢慧文 王廉源 石福艷△ 王素珍△
【提 要】 目的 基于多變量縱向數據聯合模型,探討人群血脂異常對腦卒中發病風險的影響,為腦卒中的有效預防提供科學依據。方法 以陜西省西安市某醫院2008-2015年234例健康體檢數據為例,通過R 3.6.2軟件,利用Cox比例風險模型,分析基線水平下TC、TG、HDL-C、LDL-C與腦卒中發病的關聯,利用多變量聯合模型,分析縱向數據下四項指標的動態變化對腦卒中發病的影響。結果 本研究納入的234例受試者中,其中有70例(29.9%)發生結局事件(腦卒中)。Cox比例風險模型結果顯示:基線年齡每降低一個單位,發病風險將增加0.9437倍(95%CI=0.9140~0.9733),sqrt(TG)每增加1mmol/L,發病風險隨之增加2.3020倍(95%CI=1.6217~2.9824),sqrt(HDL-C)每降低1mmol/L,發生腦卒中的危險性增加0.2115倍(95%CI=0.0071~0.8257)。多變量縱向數據聯合模型結果顯示:受試者年齡每縱向增加一個單位,發病風險將升高2.8548倍(95%CI=2.7670~2.9426),sqrt(TG)每縱向增加1mmol/L,發病風險將升高9.7865倍(95%CI=3.7934~15.7796)。結論 個體年齡、TG水平隨著時間的縱向增長,會增加腦卒中的發病風險。
腦卒中(stroke),常稱為中風,它是由多種致病因素共同作用導致腦血管阻滯出現短時間內血液不能流入腦部或腦部血管急性破裂引起的腦功能損傷的一組急性腦血管疾病[1]。腦卒中發作具有不可逆性,且救治困難,發病所致的高死亡率、高致殘率及高復發率等特點將給社會帶來極大疾病負擔,已成為世界范圍內重大的公共衛生問題之一。然而,腦卒中是可以預防的,研究顯示,全球90.7%的腦卒中與高血壓、糖尿病、血脂異常、吸煙飲酒、腹型肥胖等10項可糾正風險因素相關[2]。因此,對腦卒中進行一級預防是降低發病風險的根本措施。
國內外部分研究顯示,總膽固醇(total cholesterol,TC)、甘油三酯(triglyceride,TG)、低密度脂蛋白膽固醇(low density lipoprotein-cholesterol,LDL-C)、高密度脂蛋白膽固醇(high density lipoprotein-cholesterol,HDL-C)等血脂水平的異常與腦卒中發病之間具有相關性[3-5]。然而目前,研究結論尚不完全統一,仍需進一步探索。近年來,多數學者均局限于研究血脂指標的靜態水平與腦卒中發病的關聯,模型選擇多為logistic回歸、Cox比例風險模型、隨機森林和競爭風險模型等[6-7],缺乏考慮縱向指標動態變化會出現擬合效果差、誤差大等結果,而聯合模型(joint model)可為其提供新的方法借鑒[8]。
由于腦卒中發病機制牽涉的復雜因素和作用機制眾多,通常由遺傳因素和環境因素等共同作用[9],本研究采用多變量縱向數據聯合模型(joint model for multivariate longitudinal data)[10]探索血脂異常對腦卒中發病的影響,為腦卒中的有效防控提供科學依據。
1.數據來源
本研究使用陜西省西安市某醫院2008-2015年健康人群體檢的縱向數據。其中,包括個人基本信息(姓名、性別、出生日期、年齡、婚姻狀況、文化程度),基本體格檢查指標(身高、體重、體重指數、血壓、空腹血糖、TC、TG、HDL-C、LDL-C)等。
研究對象納入標準:①體檢次數≥3次;②基線無糖尿病、心腦血管疾病、肝臟疾病及腎臟疾病等患者;③基線相關診斷信息無缺失者。排除標準:①體檢次數<3次;②基線已患腦卒中者。經整理,根據年齡、性別等指標,按照1:2的配對設計,本研究共納入234例研究對象,其中70例在隨訪期間發生腦卒中。
2.研究方法
(1)Cox比例風險模型
Cox比例風險模型(Cox proportional hazards model)[11],又稱Cox回歸,其一般形式如下:
h(t,X)=h0(t)exp(β1x1+β2x2+…+βnxn)
h(t,X)表示t時刻暴露于危險因素狀態(x1,x2,…,xn)的風險函數,其中h0(t)表示危險因素狀態處于(0,0,…,0)時的基線風險函數,(β1,β2,…,βn)為回歸系數。本研究以生存時間、結局狀態為因變量,年齡、sqrt(TC)、sqrt(TG)、sqrt(HDL-C)與sqrt(LDL-C)為自變量,構建Cox比例風險模型。
(2)多變量縱向數據聯合模型
多變量縱向數據聯合模型[12]包括縱向子模型與生存子模型,本研究中縱向子模型選擇線性混合效應模型,生存子模型選用Cox比例風險回歸模型。
①縱向數據子模型
假設縱向監測變量有k個(k=1,2,…,k),縱向子模型要分別以每個縱向監測變量為因變量,以相關時變協變量為自變量,擬合k個線性混合效應模型。
μik(t)=xikT(t)βk
其中,xik(t)是具有相應固定效應項βk的時變協變量,zik(t)是具有相應隨機效應項bik的時變協變量,其遵循具協方差矩陣的零均值多元正態分布,而εik(t)是模型誤差項,假設服從(0,σk2)的獨立正態分布。
②生存分析子模型
λi(t)=λ0(t)exp{viT(t)γv+W2i(t)}

根據縱向觀測變量分布要求,需對四項指標進行平方根轉換方可滿足正態分布,故本研究以sqrt(TC)、sqrt(TG)、sqrt(HDL-C)和sqrt(LDL-C)為縱向子模型因變量,以觀測時間為時變協變量。生存子模型中以年齡為基線變量,以sqrt(TC)、sqrt(TG)、sqrt(HDL-C)和sqrt(LDL-C)為時變協變量進行擬合。
③參數估計算法

a.E步(求期望):根據觀測數據和參數的當前估計值,計算完整數據的期望對數似然。
b.M步(求最值):最大化期望,更新參數估計值。本研究除γv和γy之外所有參數估計的最大化以封閉形式計算,參數γ=(γvT,γyT)T使用牛頓-拉夫森算法(Newton-Raphson algorithm)[15]聯合更新:

此外,MCEM算法制定了更嚴格的收斂標準,在這種情況下,會由于隨機性而過早停止收斂,因此本研究的迭代次數初步設置為N=100K(K為縱向觀測變量的數量)[13]。檢驗縱向數據子模型與生存分析子模型的收斂軌跡可知,模型最終完成了423次迭代,且在增加至400次迭代后,兩個子模型參數的變化均呈漸趨平穩的趨勢,說明迭代次數的設置較為合適,模型擬合達到了較為理想的效果。
3.統計學分析
本研究采用Excel 2016整理腦卒中發病數據集。Cox比例風險模型survival包與多變量縱向數據聯合模型通過R 3.6.2軟件的joineRML包實現。本研究中的統計學分析均以P<0.05為差異有統計學意義。
1.研究對象一般情況
本研究納入234名研究對象,共1581條觀測記錄。其中,男性167名,女性67名,基線年齡在23~69歲之間,中位年齡為50歲,隨訪年限在3~8年之間,中位隨訪年限為7年。在研究期間共有70例(29.9%)受試者發生腦卒中。每個受試對象的收集指標見表1。

表1 234例研究對象變量說明
本研究中,受試對象的四項血脂指標與觀測時間的縱向軌跡如圖1所示。由圖1可知,在各個觀測時間點上,血脂指標的變化軌跡與觀測時間無明顯規律。

圖1 四項血脂指標的縱向軌跡圖
2.Cox比例風險模型分析結果
Cox比例風險模型結果如表2所示,基線年齡、sqrt(TG)和sqrt(HDL-C)對腦卒中發病影響的差異有統計學意義(P<0.05)。受試者年齡每降低一個單位,發病風險將增加0.9437倍(95%CI=0.9140~0.9733);sqrt(TG)每增加1mmol/L,發病風險也隨之增加2.3020倍(95%CI=1.6217~2.9824);sqrt(HDL-C)每降低1mmol/L,發生腦卒中的危險性增加0.2115倍(95%CI=0.0071~0.8257)。

表2 Cox比例風險模型結果
3.多變量縱向數據聯合模型分析結果
多變量縱向數據聯合模型擬合結果見表3。由表3可知,年齡、sqrt(TG)的關聯參數γ有統計學意義(P<0.05),即受試者年齡每縱向增加一個單位,發病風險將升高2.8548倍(95%CI=2.7670~2.9426);受試者sqrt(TG)每縱向增加1mmol/L,發病風險將升高9.7865倍(95%CI=3.7934~15.7796);sqrt(TC)、sqrt(HDL-C)與sqrt(LDL-C)的關聯參數無統計學意義(P>0.05)。

表3 多變量縱向數據聯合模型參數估計結果
腦卒中作為全球第二大死亡原因和致殘因素,近年來,其發病率在全球范圍內均呈上升趨勢,然而引發腦卒中發病的風險因素仍不明確[16-17]。目前,年齡、性別、高血壓、糖尿病、血脂異常、心臟疾病、不健康飲食等因素被公認為腦卒中發病的主要危險因素,且不同危險因素對腦卒中發病的作用大小不同。本研究對血脂異常與腦卒中發病之間的關聯性進行了初步探討分析,進而為腦卒中發病風險因素探索提供參考依據。
Cox比例風險模型結果顯示,基線水平的低年齡、高TG水平、低HDL-C水平與腦卒中發病風險有關聯,這與國內外其他研究結果不完全一致[18-21]。閆麗等[18]通過Cox回歸分析發現高齡是腦卒中發病的風險因素之一;余慧等[19]認為高TG水平可能通過影響腦血流動力學指標,致使腦卒中發生風險升高;Shahar E等[20]對腦卒中危險因素進行多變量校正后并未發現HDL-C水平與發病具有關聯性,然而已有大量研究表明,HDL-C與腦卒中發病風險相關[21]。造成結果不一致的原因很多,其中傳統的靜態模型并未考慮個體指標隨時間的動態變化以及其他協變量的影響,可能導致結果存在偏差。多變量縱向數據聯合模型,通過連接函數可將縱向指標與結局事件關聯起來,可提高信息估計的精確性。
本研究采用多變量縱向數據聯合模型對年齡、TC、TG、HDL-C、LDL-C與腦卒中的發病關聯進行了動態分析,研究結果與國內外部分研究結果一致[3,22-23]。李志強[3]基于2008-2016年隊列人群研究發現,TG降低,發生腦卒中的風險明顯降低(HR=0.59,95%CI=0.42~0.84);王毅[22]將中國腦卒中一級預防人群進行分層,并在各層之間比較血脂水平與腦卒中發生率的相關性,認為腦卒中的發生率隨年齡分位升高而增加,隨TG水平的增加而增加,且在年齡最高分位人群中,腦卒中發病風險與血清TG水平相關性更大;Lee J等人[23]針對美國一項中位隨訪17.7年的前瞻性隊列研究發現,高TG和低HDL-C的成年人,發生腦卒中的風險更高(HR=1.32,95%CI=1.06~1.64)。
綜上所述,年齡、TG指標的縱向增長變化是影響腦卒中發病的關鍵因素。人群應定期參加體格檢查,密切關注各項血脂指標的變化趨勢,不可輕易忽視指標在正常范圍內的增長,同時保持健康的生活方式,如健康膳食與積極鍛煉等。臨床醫生也應重視高年齡段人群的血脂指標水平,針對TG指標浮動的患者及時給予治療措施與生活建議,降低腦卒中的發病風險。本研究也有一定的局限性:隨訪時間有限,腦卒中發病是長期動態化發展的結果,因此本文中隨訪年限尚短,可能導致模型擬合出現偏差;數據僅來自于一家醫院,不具有顯著代表性,可能會產生選擇偏倚。