姚 爽,謝夢婷,鄒迪莎,黃 芳,馬小珺,江仁美,于 健
空腹血糖受損(impaired fasting glucose,IFG)最早是在1997年由美國糖尿病協會(ADA)引入概念,IFG和糖耐量異常(impaired glucose tolerance,IGT)都是一種處于正常和糖尿病血糖水平之間的狀態,IFG患者雖然僅是空腹血糖(fasting plasma glucose,FPG)輕度增高,但卻具有同IGT人群一樣向糖尿病發展的高危傾向,同時也存在發生大血管并發癥的危險[1]。因此,及早識別發現IFG患者,控制IFG的危險因素,并積極進行早期干預,對減少糖尿病以及其并發癥,降低死亡率具有重要意義。Logistic回歸是常被應用于預測結果為二分類變量的傳統方法,其對單獨危險因素的分析較為明確,但當多因素之間存在復雜相互關系時,會使分析誤差增加。而分類樹模型作為一種新的統計方法,彌補了傳統統計方法的不足,對數據的類型沒有嚴格的限制,目前被廣泛應用于疾病發病風險的預測[2-3],但其在對IFG危險因素的分析,目前國內研究并不多見。該研究對5 952例體檢者的臨床資料進行分析,并構建Logistic回歸模型及分類樹模型,并比較分析兩模型的準確性,為IFG的預防和治療提供科學依據。
1.1研究對象選擇2012年7~11月在桂林醫學院附屬醫院體檢中心體檢的5 952例漢族人群為研究對象,進行橫斷面調查,研究對象均來自桂林市七星區、疊彩區、秀峰區、雁山區及象山區等,并獲得知情同意,該研究由桂林醫學院倫理委員會批準。其中,排除年齡小于20歲、孕婦、以及已確診的糖尿病患者、患有惡性腫瘤等重大疾病以及嚴重肝腎功能不全者,共5 952例資料完整者納入研究。研究對象年齡20~70(45.82±11.69)歲。其中男3 074例(51.65%),平均年齡(46.22±12.04)歲;女2 878例(48.35%),平均年齡(45.39±11.29)歲。本研究共檢出IFG患者404例,平均年齡(53.04±9.55)歲,其中男244例(60.4%),女160例(39.6%)。成人IFG的粗患病率為6.79%(男:7.94%;女:5.56%)。
1.2問卷調查在研究對象進行體檢時,采用問卷調查和體檢的方法,并通過專業人員進行記錄,獲取其基本資料,包括個人基本情況(姓名、性別、年齡、民族、婚姻狀況、職業、文化程度);既往史:高血壓、非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)、糖尿病等;生活習慣(飲食、吸煙史、飲酒等)、家族史及運動情況等。
1.3體格測量及測量方法經過專業培訓和考核的體檢中心專業人員,采用統一標準,使用經校準的SK-CK超聲波人體秤,時間為早晨7:30~9:00,被測量者免冠、赤腳、空腹、排空膀胱、著輕單衣、以“立正”姿勢站立,身高測量精確至0.1 cm,體質量測量精確至0.1 kg。計算體重指數(body mass index,BMI),BMI=體重(kg) /身高(m2)。研究者要避免飲酒、吸煙、喝茶和咖啡,避免劇烈運動,安靜休息5~10 min,呈坐位,使用水銀血壓計測量右臂肱動脈血壓,手臂與心臟在同一水平,測量3次,每次間隔30 s,取3次測量的平均值進行分析,數值精確到1 mmHg。
1.4實驗室檢查及測量方法所有受檢者至少禁食10 h,清晨空腹采集肘靜脈血(5 ml),在口服75 g葡萄糖負荷后120 min再次采集血液樣本。生化指標:使用羅氏Cobas C501 全自動生化分析儀檢測: FPG、口服葡萄糖耐量實驗(oral glucose tolerance test,OGTT)、2 h血糖(2-h plasma glucose,2 hPG)、尿酸(uric acid,UA)、三酰甘油(triacylglycerol,TG)、總膽固醇(total cholesterol,TC)、低密度脂蛋白膽固醇(low-density lipoprotein cholesterol,LDL-C)及高密度脂蛋白膽固醇(high-density lipoprotein cholesterol,HDL-C)。所有研究對象由固定的超聲專科醫師行肝膽B超檢查。
1.5診斷標準NAFLD 的診斷參照中華醫學會肝病分會脂肪肝及酒精性肝病學會組制定的非酒精性脂肪性肝病診斷標準[4]。高血壓的診斷標準按《中國高血壓防治指南2010》定義[5]:3次測量平均值收縮壓(SBP)≥140 mmHg(1 mmHg=0.133 kPa)和(或)舒張壓(DBP)≥90 mmHg為高血壓或近2周內服降壓藥血壓正常者,排除繼發性高血壓者。血脂異常診斷標準:參照2007年中國成人血脂異常防治指南的標準[6]:TC≥6.22 mmol/L;TG≥2.26 mmol/L;LDL-C≥4.14 mmol/L;HDL-C<1.04 mmol/L,出現以上任何一項即診斷為血脂異常。參照中國2型糖尿病防治指南[7],IFG組診斷標準為6.1 mmol/L≤FPG<7.0 mmol/L且OGTT 2 h血糖<7.8 mmol/L。將24.0 kg/m2≤BMI<28 kg/m2診斷為超重,BMI≥28 kg/m2診斷為肥胖[8]。高尿酸血癥診斷標準[9]:男性血尿酸≥420 μmol/L或女性血尿酸≥360 μmol/L者為高尿酸血癥者。
1.6統計學處理采用SPSS 20.0軟件和Medcalc(版本15.2.2)軟件進行分析,分別建立Logistic回歸模型和分類樹模型,比較分析兩種方法結果的差異,以P<0.05為差異有統計學意義。
2.1Logistic回歸分析IFG影響因素中,年齡取平均值45.8為分界點,其余因素結合專業知識進行賦值,見表1。以IFG有無作為因變量,各影響因素作為自變量進行單因素Logistic回歸,結果顯示:高齡、男性、高TG、高TC、高LDL-C、高BMI、高尿酸血癥、NAFLD、高血壓是IFG的危險因素,高HDL-C是IFG患者的保護因素(P<0.05),見表2。將單因素Logistic分析中有意義的因素作為自變量,進行多因素Logistic回歸分析,控制混雜因素后,結果顯示:高齡、NAFLD、高血壓、高TG、高BMI是IFG患者的危險因素,高HDL-C是IFG患者的保護因素(P<0.05),見表3。

表1 IFG患者影響因素主要變量及賦值

表2 IFG影響因素的單因素Logistic回歸分析結果
OR:比值比

表3 IFG影響因素的多因素Logistic回歸分析結果

圖1 IFG患者的分類樹模型
2.2構建分類樹模型利用分類樹模型分析IFG的危險因素,將IFG患者賦值為1,將正常組賦值為0。將性別、年齡、TG、TC、HDL-C、LDL-C、BMI、UA、NAFLD、高血壓作為IFG患者的影響因素構建分類樹模型。基于根節點和子節點的最小樣本大小的限制后的增長和修剪后,得出分類樹模型包括4層,19個節點,以及10個終末節點。樹模型提示NAFLD、高齡、高血壓、高TG和高LDL-C 5個變量是IFG的危險因素。見圖1。
2.3Logistic回歸與分類樹模型的受試者工作特征曲線(receiveroperatorcharacteristiccurve,ROC)比較根據Logistic回歸和分類樹模型所得的預測變量作為測試變量,IFG組作為狀態變量進行繪制ROC曲線。Logistic回歸模型的ROC曲線Youden指數為41.90%,敏感性為75.00%,特異性為66.90%,曲線下面積(area under curve,AUC)值為0.775。分類樹模型的ROC曲線的Youden指數為43.96%,敏感性為73.27%,特異性為70.69%,AUC值為0.775,兩種模型均具有中等準確性,兩種模型AUC比較差異無統計學意義(P=0.9610),說明兩模型沒有明顯差異性,見圖2、表4。

圖2 Logistic回歸模型與分類樹模型的ROC曲線比較

表4 Logistic回歸模型與分類樹模型的ROC曲線參數比較
糖尿病的發展是一個緩慢的過程,從血糖升高到出現一系列的臨床癥狀,需要數年時間。IFG是正常糖代謝與糖尿病之間的中間狀態,是糖尿病和心血管疾病的危險因子之一[10]。探討IFG危險因素,加強預防和保健工作,對于避免和減少糖尿病的發生具有重要意義。
控制混雜因素后,多因素Logistic回歸結果顯示:高齡、NAFLD、高血壓、高TG、高BMI是IFG患者的危險因素,高HDL-C是IFG患者的保護因素,與之前研究[11-12]結果一致。高齡人群IFG發病率高,有以下兩點原因:第一,隨著年齡的增長,肌肉組織逐漸老化、減少,機體儲存和利用葡萄糖的能力下降;第二,隨著年齡增長,β細胞對內源性胰島素刺激因子的反應性降低,胰島素分泌減少,引起血糖升高[13]。我國已進入老齡化社會,據有關統計,2012年我國60歲及以上老年人口數量為1.94億,老齡化水平已達到14.3%。因此,加強對高齡人群血糖的篩查,對改善其生活質量有著不可忽視的作用。NAFLD是一種無過量飲酒史肝實質細胞脂肪變性和脂肪貯積為特征的臨床病理綜合征。NAFLD的細胞脂肪堆積,會引發并加劇胰島素抵抗,同時NAFLD患者的血液和肝臟中的游離脂肪酸(FFA)、腫瘤壞死因子-α(TNF-α)、纖溶酶原激活物抑制物-1(PAI-1)、瘦素[14-15]等表達增加,都可促進胰島分泌胰島素,形成高胰島素血癥和胰島素抵抗,繼而導致血糖升高。
近年來,諸多針對IFG研究主要集中在危險因素的調查上,通常采用的是Logistic 回歸模型對影響因素進行篩選。本文中應用Logistic 回歸計算出各危險因素的OR值:高齡人群發病風險是低齡人群的2.796倍,NAFLD患者發病風險是無NAFLD者的2.297倍,高TG患者發病風險是TG正常者的2.222倍,高血壓患者發病風險是血壓正常者的1.983倍,高BMI人群發病風險是BMI正常人群的1.343倍。這些結果可幫助研究者更直觀地了解各影響因素的作用及大小,但是,此方法易受到共線性的影響,無法估計各個自變量間可能存在的相互作用。
分類樹分析是一種非參數回歸模型,利用遞歸分型將人群分為不同的亞群,近年來在國外大量應用。分類樹模型在處理變量之間的相互作用中,可有效的處理數據中自變量缺失的問題,不僅能把缺失值歸到眾數的范疇,還可以將其設置為單獨的一個分類,使結果可以不受變量的共線性的影響,并以樹形圖的形式顯示結果,模型直觀、明確、清晰、有層次。本研究應用分類樹模型對IFG患者影響因素的信息進行深入挖掘,共篩選出5個IFG危險因素,包括NAFLD、高齡、高血壓、TG和 LDL-C,與Logistic回歸模型分析的結果基本相符,另外,樹形圖還可顯示各因素之間的交互作用,本模型提示,高齡和有NAFLD人群患病率為25.5%,高于低齡和有NAFLD人群的患病率(11.6%)。但是,與其他統計分析方法一樣,分類樹自身也存在缺點:第一,分類樹對各因素的單獨效應的定量解釋不如Logistic模型明確,在本研究中使用Logistic模型得出OR值,可明確的判斷出影響IFG患者的危險因素和保護因素。第二,在樣本容量小的情況下模型穩定性差,因本研究數據量大,因此分類樹模型穩定性良好。
最后,應用ROC曲線來評估兩模型的準確度,結果顯示:兩模型曲線均位于參考線上方,分類樹模型的ROC曲線更為平滑,說明分類樹模型在穩健性上更有優勢,兩者曲線下面積差異無統計學意義(P>0.05)。但因兩種分類方法各有利弊,具體結論要因實際情況和具體的數據情況來表現與判定。提示在臨床研究上,可結合實際應用情況,進行優勢互補,綜合比較。
然而,目前本研究也有一些局限性:首先,所有包括成人受試者來自一個體檢中心,因此并不能代表所有桂北地區人群。其次,需要進一步的前瞻性研究來調查危險因素和IFG患者的因果關系。