嚴若華,王楊,王文,李衛
隨著我國經濟的發展和人口的老齡化,慢性非傳染性疾病日趨流行,對人群健康的影響日益凸顯。高血壓作為以心腦血管疾病為主的慢性非遺傳性疾病的主要危險因素之一,是威脅人群健康的重要公共衛生問題[1-3]。及時準確地了解人群的高血壓患病情況并適時調整政策及早做出干預,對心血管疾病的預防和治療工作意義重大。
我國自1958年來共進行過四次大規模的高血壓抽樣調查。1959年、1979年、1991年分別開展過三次全國高血壓抽樣調查,2002年“中國居民營養與健康狀況調查”中也收集了參與者的血壓信息[1]。然而,由于全國性的高血壓調查面臨著范圍廣、周期長等困難,實施耗費大,難以頻繁進行,估計第五次的全國高血壓調查將于2015年完成,而最近獲悉的數據已是十年前通過大樣本抽樣調查得到的結果;我們并不能及時掌握如今的高血壓流行狀況。
以往中國心血管病報告借鑒美國心臟協會(AHA)給出的慢病估計方法,采用外推法(extrapolation)預測高血壓的患病情況[4]。它假設人群的患病率自前一次調查后保持不變,而患病人數的增加僅依賴于人口基數的增長。這種方法所需數據量較少,且估計較為保守,預測值由調查直接得到,未經后期處理,較具說服力。但它依賴于過強的假設,一旦患病率有所波動,就會引起較大程度的誤差。因此,為了使預測結果更為可靠,我們不妨假設患病率的年均增長率保持不變,即采用幾何級數法(geometric progression)進行估計。這種方法在沿用外推法基本思路的同時,加入了對過去患病率變化趨勢的考量,可能更符合實際,預測結果也與此前高血壓患病率的上升趨勢契合。本研究旨在估計2012年我國15歲以上人群高血壓患病率和患病人數,為中國心血管病報告提供數據。
研究資料:自1958年來,我國曾四次在全國范圍內進行高血壓的抽樣調查,調查對象為在我國有常住戶口的15歲及以上人口,后三次抽樣方法采用多階段不等比例整群抽樣,抽樣人數根據預期分析指標和實際經費條件在省市自治區內調整。調查所得的患病率結果分別為:1959年為5.11%、1979年為7.73%、1991年為13.58%和2002年為17.65%[5]。從歷次調查的結果可以看出,我國高血壓的患病率呈明顯上升趨勢,在短短43年間,患病率增長了近2.5倍。
由此可以大致推測,高血壓患病率在最近十年內仍處于逐漸上升的狀態,但上升幅度難以判斷。為了了解如今的高血壓流行狀況,我們將通過這四個數據點,預測近幾年的高血壓患病率。
模型與方法:本研究主要采用幾何級數法:記恒定的增長率為r,若最近一次調查(2002年)得到的患病率為P0,則2003年的患病率P1可以表示為P1=P0(1+r),2004 年P2=P1(1+r)=P0(1+r)2,依此類推,(2002+t)年的患病率即為Pt=P0(1+r)t。
同時我們還嘗試以時間為自變量、患病率為因變量,建立二次函數、指數函數、冪函數等擬合模型,并采用GM(1,1)灰色模型[6]預測患病率,以期對幾何級數法所得的結果進行驗證。這類方法依賴于高血壓流行狀況的歷史信息,比較注重模型的數學意義,我們用決定系數R2評價它們的擬合效果:

其中Yi和Y分別代表各方法預估的多個患病率值及其均值,ei為預測誤差。
通過上述公式,可以計算出任意一年高血壓患病率的預測值,結果如圖1所示。2012年的高血壓患病率約為23.96%。

圖1 幾何級數法估測我國15歲以上人群的高血壓患病率
在患病率估計結果的基礎上,通過相應年齡段的人口總數,可以估計高血壓患病人數。目前,中國統計年鑒中提供的最新人口信息為,2011年全國15歲以上人群的人口數為11.2571億人,假設2012年保持2011年的人口數和年齡結構不變,通過公式:患病人數=總人口×患病率,可以給出2012年我國患病人口的一個大致估計。
2012年的患病人數=2011年15歲以上人群的人口數×2012患病率=11.2571×23.96%=2.6972(億)
這種方法在相比于外推法更加符合實際,預測結果也與此前高血壓患病率的上升趨勢契合,在中短期預測中具有更高的精度。
同時,其它方法得出的結果(表1)都說明,2012年的患病人數保持在2.55億~2.85億之間。這些模型的擬合效果很好(R2> 0.97),而結果又足以佐證幾何級數法給出的預測值,可見幾何級數法的估計結果相對可靠。
但我們在實際預測中并不采用表1給出的主要結果,是因為這些模型僅從數學的角度出發進行估計,并沒有考慮數據的臨床意義。相比之下,幾何級數法基于既往數據和一個簡單的假設,比較符合高血壓的患病率變化趨勢,因此可以認為是一種較好的預測手段。

表1 幾種方法預測結果的比較
目前用于疾病預測的主要方法包括時間序列模型、多元回歸分析模型等[7]。但前一種方法依賴于大量、密集的樣本數據,需要對疾病隨時間的發展趨勢有全面的了解,顯然本研究的數據量不足以滿足分析的需求;而后一種方法則需考慮相關因素對疾病的影響。雖然人們對影響高血壓的主要因素已經有了一定了解,但這些危險因素(如肥胖、過量吸煙或飲酒、精神緊張等)缺乏可靠的年患病率數據,因此難以用于建模。此外,起源于黑箱理論的BP(Back Propagation)神經網絡模型[7]和隨機過程理論提出的Markov狀態轉移模型[8]也被用于疾病的預測,但在學習樣本較少時,兩者均無法取得良好的預測效果。對于后者,在建模時要將總體人群的年齡增長納入考量,世界銀行的中國慢病報告也認為,人口老齡化會使中國疾病負擔迅速增加,但由于前兩次全國大規模調查的時間較早,并沒有完整的分年齡段的高血壓患病率數據資料,故而在預測時難以加入老齡化對疾病發展的影響。
因此,本文從另外的角度,采用幾何級數法對疾病進行了預測。可以得到,按照近五十年來的發展趨勢,我國患病率的年均增長率應保持在3.1%左右,患病率平穩增長,2012年全國15歲以上人群的高血壓患病率將達到24%,患病人數約為2.7億。
本研究為近年來高血壓的流行狀況提供了一些可參考的依據,還改進了之前廣泛采用的外推法,將以往疾病的患病率變化規律納入到模型當中,更加符合實際,預測結果也與此前高血壓患病率的上升趨勢契合,更具臨床意義。同時,由2011年《中國心血管病報告》報告的各省市高血壓患病率數據[5]可以看出,黑龍江?。挲g≥15歲,患病率30.48%)、云南省八州縣(年齡15~69歲,患病率24.8%)、河南省新安縣(年齡≥18歲,患病率30.77%)、江蘇省徐州市(年齡20~75歲,患病率20.87%)、浙江省杭州市(年齡≥20歲,患病率27.49%)在2007~2009年調查得到的主要成年人群高血壓患病率都處在20%到31%之間;而2007~2008年中國糖尿病與代謝疾病研究[9]也指出,我國20歲以上男性和女性的高血壓患病率分別為30.09%和24.79%,雖然調查結果略高于本研究給出的預測值,但考慮到調查時間、試驗設計和診斷標準等因素造成的誤差,二者的結果總體差異不大,可見預測相對可靠。
然而,由中國疾病預防控制中心(CDC)發布的2010年我國疾病監測點成年人高血壓患病率為33.5%[10,11],較大程度地超出了本研究的估計值。我們認為,造成該狀況的原因主要在于:首先,以往全國大樣本抽樣調查的診斷標準傾向于低估實際患病率(1959年和1979年的高血壓診斷標準與現行的國際標準并不一致,漏算了一部分應被診斷為高血壓的患者,使調查所得的高血壓患病人數比實際更低),而文章采用的預測方法又較為保守,因此本研究得到的結果略低;其次,2010年抽樣調查的樣本量計算依賴于一些參數的選擇,同時調查過程中監測點的位置也會給結果帶來一定偏性。但是不可否認,本研究的預測值仍有可能低估我國實際的高血壓患病率及患病人數,結果較為保守,因此只作為參考。
另外,幾何級數法在預測中也具有一定局限性:它依賴于患病率增速恒定的假設,也就是說,增長率的任何波動都會導致預測精度的下降;同時,圖1中給出的四次高血壓大規模調查的診斷標準并不完全一致,尤其是1959年對高血壓的定義與之后相差較大,這可能導致錯估當年的實際患病率,間接引起模型的不準確;另外在建立模型的過程中,一般我們會采用70%~80%的數據建模,留下30%左右的數據做驗證,以評價模型的準確性和可靠性,但由于高血壓全國調查的次數較少,剔除數據用于驗證會較大地影響模型的精確度,因此暫時還無法通過預測誤差來評判模型的好壞。
此外,預測模型也有進一步調整和修改的空間:如在擬合曲線時,自變量除了選擇年份之外,還可以考慮將我國高血壓主要危險因素水平對患病率的影響納入考量,進行多元回歸分析,給出較精確的預測結果;或采用符合疾病發展規律的Logistic回歸函數建模,它所描述的“S型”生存曲線會在經歷過一段時間的快速上升后逐漸趨于平緩,最終無限接近但永不超越一個界值k。這些方法除了具有數學意義外還考慮了疾病的影響因素或增長規律,也是可能給出較好估計結果的預測手段。如何實現這些方法并給出合理的解釋應是我們進一步研究的方向。
[1] 李立明. 中國居民營養與健康狀況調查報告之四 2002高血壓. 北京 : 人民衛生出版社 . 2008: 1-2.
[2] 王文, 朱曼璐, 王擁軍, 等. 心血管病已成為我國重要的公共衛生問題——《中國心血管病報告2011》概要. 中國循環雜志, 2012,27: 409-411.
[3] 王文 . 我國高血壓流行趨勢與防治狀況 . 中國循環雜志 , 2012, 26:407-409.
[4] The American Heart Association Statistics Committee and Stroke Statistics Subcommittee. Heart Disease and Stroke Statistics—2012 Update. Circulation, 2012, 125: e3-e5; e88-e96.
[5] 衛生部心血管病防治研究中心. 中國心血管病報告 2011. 北京 : 中國大百科全書出版社 , 2012: 13-31.
[6] 金光楠, 蔡振群. GM(1, 1)灰色模型在預測麻風病患病率中的應用 . 數理醫藥學雜志 , 2007, 20: 720, 727.
[7] 王瑋, 許偉, 鄭亞軍, 等. 基于BP神經網絡的圍產兒出生缺陷患病率預測 . 中國流行病學雜志 , 2007, 28: 507-509.
[8] Andrew Moran, Dongfeng Gu, Dong Zhao, et al. Future cardiovascular disease in China: markov model and risk factor scenario projections from the coronary heart disease policy model—China. Circ Cardiovasc Qual Outcomes, 2010, 3: 243-252.
[9] Zhao-Jun Yang, Jie Liu, Jia-Pu Ge, et al. Prevalence of cardiovascular disease risk factor in the Chinese population: the 2007-2008 China National Diabetes and Metabolic Disorders Study. European Heart Journal, 2012, 33: 213-220.
[10] 李鎰沖 , 王麗敏 , 姜勇 , 等 . 2010 年中國成年人高血壓患病情況 .中國預防醫學雜志 , 2012, 46: 409-413.
[11] 趙文華, 寧光. 2010年中國慢性病監測項目的內容與方法. 中國預防醫學雜志 , 2012, 46: 477-479.