王曉晨,張彩鳳,宋婷婷,崔楠,崔靜,孫健平
(1 濰坊醫學院公共衛生學院,山東 濰坊 261053; 2 陽光融和醫院; 3 萊西市中醫醫院; 4 青島大學附屬青島市中心醫院;5 青島大學附屬醫院; 6 青島市疾病預防控制中心青島市預防醫學研究院)
高尿酸血癥(HUA)是人體嘌呤代謝紊亂引起尿酸產生過多或(和)排泄減少,進而導致尿酸水平升高而超出正常范圍的一類疾病,已經成為威脅全球居民健康的重要公共衛生問題。流行病學研究結果顯示,發達國家與發展中國家HUA的患病率均較高[1-2],在我國HUA的患病率亦高達13.3%[3]。HUA受年齡、性別、行為習慣及慢性病等多種因素影響[4-6]。既往對疾病危險因素的研究多采用Logisitic回歸模型,但Logisitic回歸模型不利于數據本身信息的充分反映;而決策樹卻可以通過樹形圖模式按照結局概率進行正確分類或精確預測[7]。本研究擬以青島地區中老年社區居民為研究對象,采用決策樹模型探討青島地區HUA患病的影響因素,為有效實施HUA健康管理提供參考。
研究對象來源于2006—2009年青島市糖尿病項目的橫斷面調查。調查采用4階段分層隨機抽樣的方法,分別于2006、2009年抽取了青島市3個城區(市南、原市北、原四方)中的30個社區(村)和3個農村(膠南、即墨、黃島)的30個街道(鄉鎮),抽取在當地居住5年以上、年齡35~74歲中老年社區居民12 100名(2006年6 100名,2009年6 000名)為研究對象,實際調查10 465名(2006年5 355名,2009年5 110名)研究對象,應答率分別為87.79%和85.17%,2006年和2009年抽樣無重復研究對象。排除尿酸及體質指數(BMI)信息缺失者,最終9 675名(2006年4 615名,2009年5 060名)研究對象納入本研究。
由經統一培訓的調查員對研究對象進行問卷調查、體格檢查和實驗室檢測。問卷調查內容主要包括社會人口學信息及行為習慣等,包括:性別、年齡、文化程度、婚姻狀況、城鄉分布、個人月收入、職業體力活動、吸煙、飲酒等。體格檢查內容主要是身高、體質量等,并計算體質量指數(BMI(kg/m2)=體質量(kg)/身高(m)2)。肥胖程度的分組依據BMI水平[8]:BMI<28 kg/m2為非肥胖,BMI≥28 kg/m2為肥胖。研究對象均于晚餐后禁食8~12 h,于次日清晨7:00~9:30采集靜脈血,分別進行血糖、尿酸水平檢測。空腹血漿血糖(FPG)和餐后2 h血糖(2hPG)檢測采用葡萄糖氧化酶法,尿酸檢測采用尿酸酶法。糖尿病的診斷根據FPG和2hPG水平[9],FPG≥7.0 mmol/L和(或)2hPG≥11.1 mmol/L。HUA的診斷根據非同日2次空腹血尿酸水平[10]:男性>420 μmol/L,女性>350 μmol/L。
將HUA患病的相關因素進行卡方自動交叉檢驗(CHAID)算法分析,分類規則如下:樹的生長“枝條”分割顯著性水平αmerge=αsplit=0.05;樹的修剪采用預修剪法。將決策樹生長層數設為3層,父節點最小樣本量為100,子節點最小樣本量為50,總正確率的識別采用10層交叉驗證模型,以α=0.05為模型停止標準。
采用SPSS 22.0軟件進行統計學分析。分類資料采用例數(%)描述,率的比較采用χ2檢驗。采用決策樹CHAID算法對HUA患病的影響因素進行分析。相關變量賦值見表1。
本研究共納入9 675例研究對象,其中HUA病人為1 430例(14.8%)。HUA病人中男性(χ2=122.05)、年齡≥55歲(χ2=26.11)、受教育時間>9年(χ2=25.72)、城市居民(χ2=30.94)、個人的月收入≥600元/月(χ2=47.37)、輕中度職業體力活動(χ2=23.63)、吸煙(χ2=7.92)、飲酒(χ2=85.74)、糖尿病(χ2=19.59)、肥胖(χ2=164.77)等比例均高于NUA者,差異均有統計學意義(P<0.05)。HUA病人未婚或失婚的比例雖高于NUA者,但差異無統計學意義(P>0.05)。見表2。

表1 相關變量賦值
決策樹模型生長3層,從上自下節點劃分的因素依次是肥胖、性別、城鄉分布、年齡和受教育程度。決策樹模型第一層是肥胖對HUA患病影響最顯著,肥胖者HUA患病率高于同層的非肥胖者;第二層是性別對HUA患病影響顯著,肥胖者與非肥胖者男性的HUA患病率均高于女性;第三層是城鄉分布、年齡、文化程度均對HUA患病影響顯著,城鄉分布、年齡對非肥胖者影響顯著,而文化程度、年齡對肥胖者影響顯著,城市非肥胖男性的HUA患病率高于農村,文化程度>9年肥胖者的HUA患病率高于同層≤9年的肥胖者,年齡55~74歲非肥胖者與肥胖者HUA患病率均高于年齡35~54歲者(χ2=15.61~164.77,P<0.001)。見圖1。
決策樹模型中婚姻狀況、個人月收入、職業體力活動情況、吸煙、飲酒、是否患糖尿病被剔除,決策樹模型識別總正確率為85.2%,風險統計量為0.148±0.004。
決策樹模型作為一種非參數回歸模型,具有以下優勢:首先,決策樹模型對納入模型中的變量無特殊要求,分類變量與連續變量均可納入模型;其次,決策樹模型作為一種機器學習模型,可以有效將變量中缺失值歸為某個眾數,且結果不受變量共線性影響;再次,決策樹可以有效、直觀、分層顯示各危險因素及它們之間的交互關系[7]。近年來,有研究成功地應用決策樹模型預測內外科疾病相關影響因素[11],也有部分關于HUA的決策樹研究,但其中HUA的研究對象均是體檢人群,而且年齡范圍較大[5-6]。本研究采用決策樹模型CHAID法對35~74歲中老年社區居民的HUA患病影響因素進行分析,結果顯示肥胖是HUA患病的最顯著影響因素,性別、城鄉分布、文化程度及年齡均是HUA患病的影響因素。

表2 研究對象的人口學特征(例(χ/%))

圖1 CHAID方法研究HUA患病影響因素風險的分類樹型圖
肥胖是影響多種臨床疾病并能帶來不良健康的危險因素,而HUA便是這些臨床疾病之一。橫斷面研究與隊列研究結果均顯示,肥胖與血尿酸呈正相關[12-13]。還有研究應用決策樹和Logistic回歸分析進行研究,結果均顯示,肥胖是HUA的危險因素[5]。本文研究結果與其一致。另外遺傳學研究顯示,肥胖相關的遺傳基因與我國男性HUA患病風險相關[14],且肥胖個體由于高的尿酸生成和低的尿酸清除率導致尿酸水平升高[15]。此外,還有研究顯示,肥胖個體體質量降低常常伴隨著尿酸水平和黃嘌呤氧化還原酶活性的降低,而黃嘌呤氧化還原酶能夠使次黃嘌呤和黃嘌呤分解成尿酸[16]。動物實驗亦表明,脂肪細胞因子調節失調和慢性低度炎癥能夠導致肥胖者脂肪組織中尿酸水平升高[17]。
流行學研究顯示,HUA患病率隨著年齡的增長而增長[18];決策樹分析顯示年齡是HUA患病的危險因素[5]。本文研究結果與其相一致。然而,隨著年齡的增長,性激素水平呈現明顯的下降趨勢,這可能是年齡對男性和女性代謝性疾病發生發展產生不同影響的原因。中國幅員遼闊,不同區域HUA患病率差異很大。青島為東部沿海地區,HUA患病率較高,且本研究與以往研究結果均顯示城市非肥胖男性的HUA患病率明顯高于農村非肥胖男性[18]。原因可能為:城市地區經濟較發達,因此海鮮、肉類和酒類等的攝入量明顯高于農村。此外,本研究還顯示,文化水平較高的肥胖男性HUA患病率較高,這與以往的研究結果一致[18]。可能原因是:文化水平較高者生活水平較高,攝入海鮮、肉類、加工食品等高能量食物的機會更多,這就增加了攝入各種高嘌呤食物的機會。此外,隨著我國居民生活水平的提高,其飲食結構也發生了變化,但我國居民尤其是中老年男性的營養知識卻依然匱乏,這也是文化水平與HUA患病率正相關的原因。
本次研究采用決策樹分析HUA患病的影響因素,決策樹分析能夠通過分割法深入數據細節,挖掘在各影響因素節點層面下局部信息;其次,本研究采用決策樹模型得出的危險因素均為非侵入性的易得信息,這非常適合大量人群的篩查。本研究存在以下局限性:首先本研究的數據來源于東部沿海地區,無法確認是否適合其他地區人群;其次,本研究的數據來源于青島糖尿病調查項目數據,體育鍛煉、膳食營養等重要變量在調查時未收集,但采用職業體力活動代替了體育鍛煉,而膳食營養卻無合適的變量代替;最后,由于本研究是橫斷面研究,無法判斷肥胖、性別、城鄉分布、文化程度、年齡等與HUA的因果關系,因此下一步有必要進行隊列研究來確認。
綜上所述,本文決策樹分析結果顯示肥胖、性別、城鄉分布、文化程度及年齡等與HUA患病風險相關聯。這為今后HUA等慢性病的篩查與防控提供理論依據。在HUA防治中,應提倡健康的生活方式,并積極控制體質量進而降低HUA患病風險。