楊永利 毛賽彩 薛 源 田翔宇 施學忠△
艾滋病是當今世界各國共同關注的一個公共衛生問題,根據2012年第十九屆國際艾滋病大會的疫情公告,全世界共有3400萬人感染了艾滋病毒或艾滋病,絕大多數在低收入和中等收入國家;艾滋病已成為全世界頭號傳染病殺手,迄今已造成3000多萬人死亡[1]。在我國,艾滋病疫情已波及全國31個省,且其疫情有不斷擴大的趨勢。艾滋病在我國流行廣、發病率和病死率高,嚴重危害人民的生命和健康,屬于重點防治的傳染病之一。監測和預測是艾滋病流行病學研究中重要組成部分,它對了解人群中艾滋病發病和死亡情況,制定艾滋病防控措施有重要意義。目前,用于艾滋病疫情預測的模型有GM(1,1)、神經網絡模型和時間序列模型[2-3]等。但由于艾滋病流行因素的復雜性,加上不同的預測模型有不同的預測思想和預測理論,不同的預測模型用于同一艾滋病疫情數據時,效果也不相同,因此需綜合比較多種模型的擬合和預測效果[4]。該研究采用GM(1,1)和趨勢外推模型進行擬合2000-2011年期間我國艾滋病發病率,探討GM(1,1)和趨勢外推模型在我國艾滋病發病率預測中的可行性,選擇最優模型預測我國未來艾滋病的發病趨勢并用2012年的數據進行回代驗證,為艾滋病防控工作提供科學依據。
2000-2011年我國艾滋病發病率資料來自中華人民共和國衛生部網站http://www.moh.gov.cn的中國衛生統計年鑒,2012年艾滋病發病率資料來自中國性病艾滋病協會網站http://www.aids.org.cn。
GM(1,1)由一個單變量的一階微分方程構成,其方程為:
式中,xt為原始時間序列,α為發展系數,u為灰色作用量。
模型的預測精度分為4個等級,見表1。模型最后的精度級別為C和P兩個指標中較低的級別。當模型的精度級別達到3級或更高,方能用于外推預測。

表1 GM(1,1)預測精度等級判定



趨勢外推的基本假設是未來系過去和現在連續發展的結果,它通過一個合適的函數曲線反映它們之間的規律性聯系,作為預測未來的依據。趨勢外推模型有一次、二次、三次回歸模型、指數曲線預測模型、對數曲線預測模型、生長曲線預測模型以及復合曲線預測模型等[5]。實際應用中,可依據圖形識別法進行模型的初篩,最后依據決定系數越大,標準誤差越小的原則來確定選用哪種趨勢外推模型。
采用平均誤差率(mean error rate,MER)及決定系數(R2)兩個指標來評價GM(1,1)模型和趨勢外推模型對我國艾滋病發病率資料的擬合精度[6]。MER越小,R2越大,說明模型擬合精度越高;選擇擬合精度高的模型用于預測。
MER=平均誤差絕對值/實際值的均值×100%
R2=(SS實-SS殘)/SS實
式中,SS實表示實際的方差,SS殘表示殘差的方差。
采用相對預測誤差[7]評價模型的預測效果,相對預測誤差越小說明預測結果越準確。
采用SPSS 13.0進行趨勢外推法,采用excel擬合GM(1,1)模型。

表2 我國艾滋病發病率的GM(1,1)計算過程
后驗差比值C=0.271,小誤差概率P=0.818,綜合起來該模型精度處于合格等級,可以用于我國艾滋病發病率的預測。
D=429.599,α=-0.247,u=0.143

GM(1,1)和二次曲線回歸模型的MER分別為28.6%和7.6%,決定系數分別為0.800和 0.990,說明二次曲線回歸模型對我國艾滋病發病率的擬合效果優于GM(1,1)。

圖1 我國艾滋病實際發病率和二次曲線回歸模型預測的發病率
根據歷年艾滋病疫情數據,采用合適的數學模型預測艾滋病的發病水平,一方面可以為制定有效的防制措施提供科學依據,從而使艾滋病預防控制工作更具針對性、預見性和主動性,達到防止暴發或流行的目的;另一方面,也可以將實時疫情信息與同期歷史資料比較,對于發病率超出所確定可信限范圍者作為異常來處理,以此發出暴發或流行的警示,從而實現疾病的早期預警的作用等。該研究比較了GM(1,1)和趨勢外推模型在我國艾滋病發病率擬合中的效果,篩選出擬合效果較好的模型進行預測。
GM(1,1)是一種單變量一階微分方程,因其計算簡單,對樣本含量和概率的分布沒有嚴格要求,對數據的分布沒有特殊要求[8]而具有較強的實用性,已經被用于多種傳染病的預測中[9]。趨勢外推模型屬于因果關系模型,它從一個指標與其他指標的歷史和現實變化的相互關系中,探索它們之間的規律性,通過擬合回歸方程,來對事物未來的發展趨勢進行預測。該研究采用GM(1,1)和趨勢外推模型,分別擬合了我國艾滋病發病率,結果顯示,GM(1,1)后驗差比值為0.271,小誤差概率為0.818,擬合精度為合格等級,說明GM(1,1)可以用于我國艾滋病發病率的擬合中。趨勢外推模型中的二次曲線回歸模型也可用于我國艾滋病發病率的擬合中。但是對比這兩種模型的擬合結果,二次曲線回歸模型的擬合精度更高,其平均誤差率為7.6%,決定系數為0.990。決定系數高,一方面意味著二次曲線回歸模型在揭示過去我國艾滋病發病率變化規律方面與實際情況高度吻合,理論上可以較準確地預測我國艾滋病發病率;另一方面也反映了影響我國艾滋病發病的生物因素、社會因素、政策因素等比較平穩,因此艾滋病的發病規律容易被揭示和預測。根據二次曲線回歸模型,預測2012,2013和2014年,我國艾滋病發病率分別為1.68/10萬,1.95/10萬和2.24/10萬,2012年發病率數據的回代驗證顯示二次曲線回歸模型預測效果理想,預測的相對誤差僅6.14%,說明二次曲線回歸模型不僅可用于我國艾滋病發病率的擬合,也可用于艾滋病疫情的預測。該研究顯示,未來幾年,我國艾滋病的發病水平仍將呈現上升趨勢,艾滋病的流行對中國仍將是個持續性的挑戰,為了阻止艾滋病的流行,亟需將HIV/AIDS防治納入到衛生保健和公共衛生規劃的常規工作,加強多部門之間的合作[10]。
該研究顯示趨勢外推模型中的二次曲線回歸模型更適合我國艾滋病發病率的擬合和預測,這對正確指導公共衛生人員依據疫情預測提前做好防控工作,制定有效防控策略有重大意義。但我們還應意識到,艾滋病疫情演變過程中會受到諸多因素的影響,使得原有模型的預測效能降低,因此建立的預測模型并不是固定不變的,需不斷補充最新的數據后再探討最合適的模型。
參 考 文 獻
1.Flaskerud JH.AIDS 2012: Goals and accomplishments,the XIX international conference .Issues Ment Health Nurs,2013,34(5):380-382.
2.Liu Q, Liu X, Jiang B, et al.Forecasting incidence of hemorrhagic fever with renal syndrome in China using ARIMA model .BMC Infect Dis,2011,11(8):218-224.
3.謝妮.深圳市HIV/AIDS疫情分布特征與預測模型比較D.中南大學博士學位論文,2011:60-61.
4.范引光,呂金偉,戴色鶯,等.ARIMA模型和灰色預測模型GM(1,1)在HIV感染人數預測中的應用.中華疾病控制雜志,2012,16(12):1100-1103.
5.薛薇.SPSS統計分析方法與應用(第2版).北京:電子工業出版社,2010:276.
6.梁會營,李雪蓮,郭軍巧,等.3 種模型在腎綜合征出血熱發病率擬合預測中的比較研究.中國醫科大學學報,2008,37(6):843-846.
7.朱奕奕,趙琦,馮瑋,等.應用指數平滑法預測上海市甲型病毒性肝炎發病趨勢.中國衛生統計,2013,30(1):31-33,36.
8.Geskus RB.Cause-specific cumulative incidence estimation and the fine and gray model under both left truncation and right censoring .Biometrics,2011,67(1):39-49.
9.王平,路金星.應用灰色模型預測甲乙類腸道傳染病發病趨勢.浙江預防醫學,2010,22(8):24-26.
10.Zhang KL, Detels R, Liao St, et al.China’s HIV/AIDS epidemic:continuing challenges .Lancet,2008,372(9652):1791-1793.