宿榮榮,徐 嘉
肥胖是一種常見的慢性代謝性疾病,2000年世界衛生組織已經將肥胖列為嚴重危害人類健康的流行病[1],大量研究證明,慢性疾病的發生與吸煙、大量飲酒、不科學合理膳食、缺乏身體鍛煉以及精神因素等不良生活方式密切相關[2-3]。肥胖是糖尿病、高血壓、冠心病與慢性疾病的主要危險因子,預防和控制肥胖已成為當今流行病學研究的熱點問題[4]。隨著我國經濟的快速發展和社會進步,人民生活方式水平不斷得到提高,膳食結構、生活方式發生了很大變化,大學生群體作為未來社會發展的時代先鋒,他們的生活方式的變化反映著時代精神的變革。文明、健康、科學的生活方式是大學生走向成功的基本素質。肥胖作為慢性疾病的危險因子完全可以通過健康生活方式來控制。
采用隨機分層抽樣方法,抽取甘肅省5所大學 (蘭州大學、西北師范大學、蘭州交通大學、蘭州理工大學、蘭州城市學院),每所學校隨機抽取500人,要求學生不記名、真實、獨立填寫問卷,回收問卷后剔除16份無效問卷。有效回收問卷2 480份,有效回收率為99.2%,問卷的有效回收率符合統計學樣本量的要求。
參考有關資料,自行設計甘肅省高校學生人群超重/肥胖情況與生活方式關系問卷,隨機抽取甘肅省5所高校2 500名大學生,要求填寫2次問卷,間隔時間為2周,對2次得分進行相關性分析,相關系數為0.81(P<0.05)表明該問卷有較高信度。該問卷通過因子分析和專家評價后也獲得到較高效度。問卷的調查內容包括5大部分:①基本信息、②體育鍛煉生活方式、③飲食生活方式、④吸煙飲酒生活方式、⑤其他生活方式。
2.3.1 文獻資料法
根據本文研究內容和任務的需要,閱讀了大量關于社會學、心理學、體育統計學、問卷統計分析、肥胖癥等書籍,通過計算機中文數據庫檢索查閱了有關大學生超重/肥胖、大學生生活方式、生活方式與肥胖相關文獻,為本文研究提供翔實理論依據。通過中國知網期刊數據庫檢索1990-2012年發表的中文文獻,未見有將大學生生活方式與超重/肥胖關系進行模型預測的相關報道,在中國知網高級檢索上利用“生活方式”、“大學生肥胖”、“肥胖模型預測”進行檢索,未檢索到1篇關于大學生超重/肥胖模型預測的相關文獻。
2.3.2 超重/肥胖的診斷標準
采用體質指數(body mass index,BMI)由體重(kg)除以身高(m)的平方得出。根據美國CDC標準建議用第85百分位數和第95百分位數作為判定甘肅省高校學生人群超重/肥胖的標準。依照此標準甘肅省高校學生人群BMI≥22.86為超重,BMI≥24.61為肥胖[5]。本次研究將超重和肥胖合在一組進行分析[6]。
2.3.3 統計學方法
應用SPSS20.0社會學統計軟件進行分析,組間比較用卡方檢驗,將差異有統計學意義的生活方式指標運用二分類變量Logistic回歸模型(Binary Logistic)進行分析,以找出影響甘肅省高校學生人群肥胖生活方式的危險因子和保護因子,利用ROC曲線對這些指標的診斷值進行分析,對樣本進行預測,并以實際結果進行對比分析,以評估預測的準確度。兩曲線下面積的比較采用Z檢驗[7-8]。
單因素分析顯示性別(X2=13.976,P=0.000)、年齡(X2=15.786,P=0.000)、運動時間(X2=23.488,P=0.000)、是否吃早餐 (X2=12.362,P=0.009)、 是否經常吃夜宵 (X2=34.718,P=0.000)、是否經常吃零食(X2=48.664,P=0.000)、吃飯速度(X2=13.976,P=0.000)、幾天至少喝過一杯酒(X2=9.423,P=0.024)、靜坐時間(X2=12.109,P=0.007)與甘肅省高校學生人群超重/肥胖有統計學上顯著的相關性。(P<0.05)。
經多因素Logistic回歸分析,共有5個指標進入最終模型,是否經常吃零食和吃飯速度是甘肅省高校學生人群超重/肥胖的保護性因素,而年齡、否吃夜宵和每天靜坐時間是甘肅省高校學生人群超重/肥胖的危險性因素。具體結果見表1:

表1 甘肅省高校學生人群超重/肥胖的多元Logistic分析結果
以甘肅省高校學生人群非肥胖組為對照組,對年齡、是否經常吃零食、吃飯速度、是否吃夜宵、每天靜坐時間5個指標繪制ROC曲線并檢測每個指標的靈敏度和特異度,具體結果見表2:

表2 5個檢測指標的曲線下面積
對5個指標曲線下的面積采用Z檢驗進行兩兩比較,結果顯示差異均無統計學意義(P>0.05),利用5個指標組成的Logistic 回歸模型 P=1/[1+e-(1.393+0.703×年齡-0.940×是否經常吃零食-2.636×吃飯速度+0.709×是否經常吃夜宵+0.555×每天靜坐時間)]對樣本進行回代,若P≥0.5則判斷為肥胖,若P<0.5則判斷為非肥胖,得到的綜合預測模型的靈敏度為84.07%,特異度為75.9%,診斷符合率為81.18%。
肥胖已在全球范圍內廣泛流行,1999年WHO已正式宣布肥胖是一種疾病[9]。近年來研究表明,超重以及后期肥胖的發生會帶來許多負性的健康效應[10]。隨著我國居民生活水平提高,生活方式行為的改變,慢性疾病已成為嚴重影響人群健康,制約社會發展的主要社會問題。肥胖作為這些慢性疾病的危險因素是完全可以通過健康的生活方式來控制的。
在醫學領域中,“機器學習”是近年來興起的重要數據挖掘工具,通過對大量數據的分析尋找有價值的信息,利用這些診斷信息資料建立預測系統為實踐操作提供決策依據,如圖像識別、疾病輔助診斷、疾病風險預測[11-12]。根據這一理論依據,探討機器學習用于大學生超重/肥胖篩查和輔助診斷,對于促進大學生超重/肥胖預防措施制定提供參考,提高大學生自覺形成健康、科學生活方式,減少大學生超重/肥胖的漏診和誤診都具有十分積極的現實意義。
本研究采用卡方檢驗對大學生生活方式因素進行篩選,得到9個指標(性別、年齡、運動時間、是否吃早餐、是否經常吃夜宵、是否經常吃零食、吃飯速度、幾天至少喝過一杯酒、每天靜坐時間)對甘肅省高校學生人群超重/肥胖發生影響并且在統計學上有顯著意義的指標。采用多元Logistic回歸對這9個指標再進行篩選,得到“年齡、是否經常吃零食、吃飯速度、是否經常吃夜宵、每天靜坐時間”5個指標對甘肅省高校學生人群超重/肥胖發生影響并且在統計學上有顯著意義的指標。5個指標的曲線下面積均在0.66以上[13],說明用于篩查甘肅省高校學生人群超重/肥胖的診斷性較好,從繪制的ROC曲線可以看出,代表是否經常吃零食和吃飯速度的兩條曲線位于對角線的下方,而代表年齡、是否經常吃夜宵和每天靜坐時間的三條曲線位于對角線上方,這說明前兩項指標與后三項指標對甘肅省高校學生人群超重/肥胖的影響作用是相反的,這也與所建立的Logistic回歸模型中變量系數的正負號相一致。從OR值得大小可以看出,是否經常吃零食和吃飯速度的OR值均小于1,表明二者是甘肅省高校學生人群超重/肥胖的的保護因子,年齡、是否經常吃夜宵和每天靜坐時間的OR值均大于1,說明三者是甘肅省高校學生人群超重/肥胖的的危險因子。根據這5個指標可以獨立對大學生發生超重/肥胖風險進行評估,但是診斷分析結果顯示4個獨立生活方式指標預測均存在特異度偏低情況,即4(年齡、是否經常吃零食、是否經常吃夜宵、每天靜坐時間)個獨立生活指標對排除超重/肥胖大學生的能力較低。5個綜合生活方式指標組成的Logistic回歸模型預測有較高靈敏度(84.07%)、特異度(75.90%)和診斷符合率(81.18%),這說明5個綜合生活方式指標對發現大學生超重/肥胖合排除大學生超重/肥胖的能力均較高,預測結果也較為理想。大學生通過日常生活行為方式進行超重/肥胖的預測,這樣不僅降低了學校醫務人員的工作量,同時也提高了每位大學生自覺積極干預降低自身超重/肥胖發生風險的能力。在不增加每位大學生經濟負擔的情況下,提高了大學生超重/肥胖人群的檢出率。
利用統計學方法建立的預測模型是根據每位大學生日常生活方式指標得分多少對診斷結果進行概率推斷,是近年來醫學界興起的一種重要的輔助診斷工具,符合現代循證醫學理念且操作非常簡便,有利于大規模推廣。其計算原理是建立在概率論的基礎上,因此結論只是概率性的,只是作為診斷大學生超重/肥胖發生的輔助工具,并不能代替必要的醫學確診性檢查。但是大學生超重/肥胖模型預測不僅可以提高大學生自覺形成科學健康生活方式,而且可以提高每位大學生自覺積極干預降低自身超重/肥胖發生風險的能力。隨著健康營養醫學研究的不斷深入,所建立的預測模型不斷完善,預測結果的準確性將越來越高,對大學生通過日常生活方式自覺干預降低自身超重/肥胖發生風險的指導意義將更大。
[1]劉學哲.肥胖的研究現狀及展望[J].體育科技文獻通報,2009,17(2):113.
[2]胡祥炬,林曙光,鐘文玲,等.福建省5個國家疾病監測點成人超重肥胖的影響因素分析[J].中華疾病控制雜志,2013,17(1):20-23.
[3]邵永強,王 建,錢合笑,等.溫州市35歲以上居民超重肥胖癥及其影響因素調查[J].疾病監測,2010,25(11):900-903.
[4]姜 勇,張 梅,李溢沖,等.中國慢性病及危險因素監測報告[M].北京:人民衛生出版社,2007.
[5]宿榮榮,徐 嘉.甘肅省高校學生人群超重/肥胖不同判定標準的比較研究[J].南京體育學院學報(自然科學版),2013,12(5):152-156.
[6]熊憶菲,李 平.鐵轆櫨把社區居民超重肥胖與疾病關系調查分析[J].中國社區醫師,2006,8(10):97.
[7]Hanley JA,McNeil B J.A method of comparing the are as under receiver operating characteristic curves derived from the same cases[J].Radiology,1983,148(3):839-843.
[8]張建國.ROC曲線分析的基本原理以及在體質與健康促進研究中的應用[J].體育科學,2008,28(6):62-66.
[9]ALL SON DB,FAITH MS,HEOM.Meta analysis of the effect of exduding early deaths on the estimated relationship between Body mass index and mortality[J].ObesRes,1999,7(7):342-354.
[10]HANK-KHAN RIWSE RA,FLEG JL.The effect of gender on the relationship between body fat distribution and lung function JC lin Epidemiol[J].ObesRes,2001,54(4):399-406.
[11]于長春,曾邵成,金鑫玲,等,Logistic回歸與ROC曲線在兒童巨細胞病毒性肺炎臨床篩查中的應用[J].解放軍醫藥雜志,2013,25(8):97-100.
[12]徐繼承,李 磊,劉桂紅.等.人工神經網絡建立食管癌發病預測模型的比較研究[J].現代預防醫學,2011,38(17):3408-3410.
[13]朱文斌,陳涵強,周進福,等.SPSS中的ROC分析用于CH篩查方法的評價[J].現代預防醫學,2008,35(6):3077-3018.