六安市金安區衛生局衛生監督所(237006) 鄒奇志
曲線模型在細菌性痢疾發病趨勢預測中的應用及評價
六安市金安區衛生局衛生監督所(237006) 鄒奇志
每一種疾病不論發生、發展及轉歸,都有各自的演變規律,如果能很好地了解和掌握這些規律,勢必對各種疾病的預防起到干預和調控作用。近年來很多學者運用數學模型對特定人群的死亡率、發病率等進行了預測。目前預測疾病發病趨勢的方法有很多,如定性預測的控制圖、Bayes概率法、定量分析的多元逐步分析法、回歸分析預測法等[1]。
回歸分析預測法是分析自變量和因變量之間關系建立回歸方程作為預測模型。常見的回歸方程有線性趨勢回歸方程、多項式趨勢回歸方程、指數趨勢回歸方程等,篩選一個合適的回歸方程尤為重要。
細菌性痢疾是一種嚴重危害健康的腸道傳染病,是全球的公共衛生問題,每年發病人次估計達1.65億,約110萬病例死亡,死亡率居感染性腹瀉之首[2],因此該病防治仍然是傳染病控制工作中的重點。現對六安市細菌性痢疾流行概況進行分析并根據回歸方程對疫情趨勢進行短期預測。
1.數據來源 疫情資料來源于“中國疾病預防控制信息系統”六安市2005-2011年疾病監測信息報告;當年人口資料依據安徽省人口統計年鑒。
2.模型的篩選與評價
(1)模型的篩選
回歸方程選擇方法,除觀察散點圖外,通過計算一階差分、二階差分、三階差分和百分比差分來篩選。當時間序列的一階差分完全相同時,即(Y2-Y1)=(Y3-Y2)=(Y4-Y3)=…=(Yn-Yn-1),可認為線性趨勢方程能完全擬合該時間序列[3]。當時間序列的二階差分完全相同時,即[(Y3-Y2)-(Y2-Y1)]=[(Y4-Y3)-(Y3-Y2)]=…=[(Yn-Yn-1)-(Yn-1-Yn-2)],可認為二次曲線趨勢方程能完全擬合該時間序列。當時間序列的三階差分完全相同時,即[(Y4-Y3)-(Y3-Y2)-(Y2-Y1))]=[(Y5-Y4)-(Y4-Y3)-(Y3-Y2)]=…=[(Yn-Yn-1)-(Yn-1-Yn-2)-(Yn-2-Yn-3)],可認為三次曲線趨勢方程能完全擬合該時間序列。當時間序列的百分比差分完全相同時,即((Y2-Y1)/Y1)×100%=((Y3-Y2)/Y2)×100%=…=((Yn-Yn-1)/Yn-1)×100%,則可以認為指數曲線趨勢方程能完全擬合該時間序列。
(2)模型的評價
根據篩選的結果,建立一個相對較好的曲線模型,對數據進行擬合,最后利用回歸預測模型計算預測值,并對預測值進行綜合分析,確定最后的預測值。
3.資料分析
所有數據用SPSS 16.0和excel 2007進行分析統計。
1.流行情況
(1)流行強度和時間分布
2005-2011年六安市累計報告細菌性痢疾5422例,發病率8.93~17.74/10萬,年均發病率為12.73/10萬之間,差異有統計學意義(χ2=371.87,P<0.001),其中2005年處于前部高端(17.74/10萬),此后逐年下降,2009年到底點(8.93/10萬),此后又逐年上升至2011年后期高端(16.34/10萬),總體呈扁“U”型分布,2005年至2009年呈下降趨勢;2009年至2011年呈上升。每月均有病例發生,發病高峰在每年6~9月,占總發病例數的67.83%。
(2)地區分布
從發病率對比可以看出,2005-2010年霍山縣的發病率位于全市前列,2011年發病率高的霍邱縣24.48/10萬、金安區23.81/10萬。從平均發病來看,最高的是霍山縣,平均發病率28.06/10萬,區間為16.24/10萬~42.77/10萬;其次是裕安區,平均發病率19.07/10萬,區間為12.37/10萬~34.23/10萬。
從發病數對比可以看出,2005-2009年裕安區的發病占全市構成比前列,2010年構成比居于前位的是霍邱縣和舒城縣,2011年構成比居前位的是霍邱縣。從歷年發病數合計構成來看,最高的裕安區,占20.84%;第二位的是霍邱縣,占19.77%。
(3)人群分布
病例年齡主要集中在0.5~4歲,占27.96%,5~9歲,占6.75%。男性為主,男女性別比為1.6∶1。從職業來看,病例主要集中在農民、散居兒童和學生,構成比分別是38.64%、28.35%和14.05%。
2.回歸模型的建立與評價
(1)年發病率差分計算
計算一階差分值多大于零,百分比差分值多大于零且波動較大,而三階差分值在零軸上下隨機波動,變異相對較小,因此相對于線性和指數回歸,三次多項式趨勢回歸方程可能更加適合發病數據。

表1 歷年各年齡段發病情況

表2 差分值計算結果
(2)建立和檢驗曲線模型
以序號為自變量,歷年發病率為因變量,分別計算線性和曲線回歸模型的參數,分別建立線性和曲線模型進行擬合,對建立的指數曲線預測模型公式計算相關指數R2。對應用的指數曲線預測模型方程計算相關指數,可見三次曲線R2=0.998最大,有統計學意義(F=521.54,P<0.001),說明三次曲線擬合效果較好(見表3,圖1)。

表3 線性和曲線回歸模型參數估計
3.模型的應用

圖1 實際值與擬合值比較和2012年預測
1.六安市細菌性痢疾發病率先降后升,防控形勢不容樂觀。由于其流行因素復雜,多年來細菌性痢疾是影響居民健康和生活質量的主要傳染病之一[4]。2009年后發病率又呈上升態勢,因此依然是防控重點。當地應根據夏秋季節發病高峰的特點,針對農民、散居兒童、學生等重點人群,進一步采取以切斷傳播途徑為主的綜合性防治措施,加強傳染源的管理,改進基礎衛生設施建設,提高城鄉自來水普及率及增強群眾衛生意識等。
2.ARIMA時序模型、Markov模型、流行控制圖法等都可用于預測細菌性痢疾發病趨勢,但以上方法應用相對繁瑣。回歸分析預測法在實際工作中應用比較廣泛,我們將這一方法應用于傳染病的發病趨勢預測中,能在對既往傳染病發病數據的分析基礎上對今后一定時間內的發病趨勢作出預測。本文應用簡單方法得出擬合方程,擬合效果較好。
3.傳染病的發病情況受很多因素影響,實際情況千變萬化,預測結果與實際結果之間可能存在不同,如何修正,正是預測者對這種主客觀原因及其影響的判斷,也是預測者能力和水平之所在[4],這就要求在運用這一方法開展預測過程中不能機械,應靈活運用,注意了解影響預測結果的偶然情況,及時對預測結果進行適當修正,才能使預測結果更接近實際,為實際防病工作服務。
1.董選軍,賈偉娜.ARIMA時間序列和BP神經網絡在傳染病預測中的比較.現代實用醫學,2010,22(2):142-147.
2.衛生部疾病預防控制局.痢疾防治手冊.北京:人民出版社,2006:11-12.
3.王全意,主編.疾病監測信息報告管理系統數據分析手冊.北京:中國協和醫科大學出版社,2009.
4.蒲柳艷.舟山市細菌性痢疾發病率的指數曲線趨勢預測.浙江預防醫學,2005,17(5):21-22.
(責任編輯:郭海強)