柳巍 曾令城 李煥芝
(西安市疾病預防控制中心結核病防治科 陜西西安 710054)
GM(1,1)模型是灰色動態模型中最基本的模型。由于該模型受樣本含量和概率分布的限制小,適用性強,因此被廣泛應用于疾病預測。當數據序列波動幅度較大時,通常采用殘差GM(1,1)模型提高模型的精度以獲得更好的預測效果。本文利用西安市1996-2005年肺結核發病率的資料建立殘差GM(1,1)預測模型,對西安市肺結核的發病率進行短期預測,為評價2005年西安市全面啟動全球基金結核病控制項目以來肺結核防治效果提供依據。
1.1 一般資料 收集西安市疾病預防控制中心1996-2005年全市肺結核發病情況的監測資料。
1.2 方法
1.2.1 GM(1,1)模型的建立
1.2.1.1 累加數列生成 設原始數列 X={x(1),x(2),…,x(n)}為了弱化原始數列的隨機性,強化數列的規律性,對原始數列X進行一次累加,生成累加數列 Y={y(1),y(2),…,y(n)}。

1.2.1.2 均值生成 對累加數列Y做均值生成,生成數列 Z={z(2),z(3),…,z(n)}。

1.2.1.3 單純GM(1,1)模型的建立 建立y(t)的一階線性微分方程

該方程的解為

其中參數a和u可利用最小二乘法估計得到

其中


1.2.1.4 模型預測效果評價 采用后驗差比值C和小誤差概率P檢驗模型的擬合度評價模型的預測效果。見表1。

表1 后驗差比值和小誤差概率檢驗表
1.2.1.5 外推預測 如果模型的擬合度高,則模型的預測效果好,可按下式進行外推預測。

1.2.2 殘差GM(1,1)模型的建立 當原始時間序列數據波動性較大時,單純GM(1,1)模型的擬合效果往往不理想,模型的預測效果較差。此時可對數列進行殘差修正,建立殘差GM(1,1)模型進行預測。令

設存在k0,使得當時t>k0時,ε(t)>0(或ε(t)<0)且 n -k0>4,則稱{ε(k0),ε(k0+1),…,ε(n)}為可建模的殘差尾段。令

利用GM(1,1)模型對其進行預測得到殘差累加數學的時間相應式為

并對原預測結果進行修正

其中I(A)為示性函數,


1.2.3 統計學處理 采用SAS 8.0建立單純GM(1,1)和殘差 GM(1,1)預測模型[1],比較兩個模型的擬合效果,并對模型的預測效果進行評價,利用擬合度好的模型對肺結核的發病率進行短期外推預測。采用Excel 2003繪制肺結核發病率擬合曲線。
2.1 GM(1,1)預測模型和殘差 GM(1,1)模型的建立 根據發病率資料建立單純GM(1,1)模型如下。

原始數據經殘差修正后,建立殘差GM(1,1)預測模型:

將原始數據回代模型,得到肺結核發病率GM(1,1)模型和殘差GM(1,1)模型的預測值。西安市1996-2005年肺結核發病率實際值和預測值見表2。

表2 西安市1996-2005年肺結核發病率實際值和預測值的比較
2.2 GM(1,1)模型和殘差 GM(1,1)模型擬合優度檢驗 后驗差檢驗顯示,單純GM(1,1)模型擬合等級為“勉強”,殘差 GM(1,1)模型擬合等級為“好”(見表3)。1997-2005年西安市肺結核發病率殘差GM(1,1)模型擬合曲線見圖1。

表3 GM(1,1)與殘差GM(1,1)模型擬合效果比較

圖1 1997-2005年西安市肺結核發病率殘差GM(1,1)模型擬合曲線
2.3 殘差GM(1,1)模型外推預測 模型擬合優度檢驗,殘差GM(1,1)模型的擬合度好,可用于發病率的外推預測。利用殘差GM(1,1)預測模型對西安市2006年和2007年肺結核發病率進行短期外推預測。結果顯示,西安市肺結核發病率實際值與預測值比較,2006年降低72.09%,2007降幅達82.32% 。見表4。

表4 殘差GM(1,1)模型短期預測結果
灰色動態系統是灰色系統理論的核心,常用于時間序列的預測。GM(1,1)模型是灰色動態系統中最基本、應用最廣泛的模型[2]。和傳統的預測模型相比,GM(1,1)模型不受數列概率分布和樣本含量大小的限制,近年來廣泛的應用于傳染病、寄生蟲病和惡性腫瘤流行趨勢的預測中。當模型的擬合程度較為滿意時,模型可用于疾病短期流行趨勢的外推預測[3-5],可為衛生部門調整防治策略和評價防治效果提供依據。當原始數列的波動幅度較大時,模型的精確度往往較差,此時可對原始數列進行殘差修正,建立殘差GM(1,1)模型以提高模型的精確度[6]。本研究對西安市1996-2005年肺結核發病率建立單純GM(1,1)模型,模型擬合度等級為“勉強”,提示模型擬合度不佳,尚不能用于外推預測。對肺結核發病率的原始數據進行殘差修正后,建立殘差GM(1,1)模型,擬合度檢驗顯示模型的擬合度等級為“好”,提示可用于肺結核流行趨勢的短期預測。
利用殘差GM(1,1)模型對西安市肺結核的發病率進行短期預測,結果顯示2006年和2007年肺結核發病率的預測值分別為364.79/10萬和523.20/10萬,和實際發病率比較,降幅分別為72.09%和82.32%。排除自然和社會等環境因素的影響,這可能是由于西安市自2005年全球基金結核病控制項目全面啟動以來,各級衛生部門對結核病防治工作給予了高度的重視,要求各級簽訂《目標責任書》,明確職責,將結核病防治的工作目標作為考核的重要內容。同時,全球基金結核病控制項目的資助,各級疾控部門獨立科室的建立和人員的配備,為結核病控制工作提供了財力和人力的保障。此外,現代結核病控制策略(DOTS)在西安市的實施、涂陽肺結核患者免費治療政策以及患者直接面試下的督導服藥(DOT)的實行也為肺結核防治工作提供了政策上的保障。利用殘差GM(1,1)模型對肺結核的短期流行趨勢進行預測,發現實際發病率要明顯低于預測值。該結果也說明全球基金結核病控制項目的實施在我市已取得初步成效。
利用GM(1,1)模型預測疾病的流行趨勢,其前提是排除自然和社會等環境因素的作用,但疾病的流行往往要受到多種因素綜合作用的影響,因此GM(1,1)模型尚不能全面地反映綜合因素對預測結果的影響[7]。此外,單純 GM(1,1)模型和殘差GM(1,1)模型僅僅適用于疾病流行趨勢的短期預測,若要進行疾病流行趨勢的中長期預測,可采用等維遞補灰數動態模型進行預測[8]。因此,本次研究的預測結果僅可為預測疾病流行趨勢和評價疾病防治效果提供參考。
[1]顏杰,相麗馳,方積乾.灰色預測模型及SAS實現[J].中國衛生統計,2006,23(1):75 -76.
[2]鄧聚龍.灰色系統預測和決策[M].武漢:華中理工大學出版社,1990:2.
[3]歐陽艷昊,劉富強,李戰戰,等.我國狂犬病流行趨勢及灰色預測模型的建立與評價[J].實用預防醫學,2015,22(3):368-370.
[4]董選軍,余運賢,朱列波.義烏市手足口病流行趨勢組合預測模型研究[J].中國衛生統計,2013,30(4):594 -595.
[5]梁燕鮮,王亞菲,翟林,等.江蘇省艾滋病、淋病和梅毒發病率GM(1,1)灰色模型預測研究[J].南通大學學報(醫學版),2013,33(1):21 -24.
[6]段瓊紅,聶紹發,仇成軒,等.灰色系統殘差GM(1,1)模型應用于前列腺癌流行趨勢預測[J].數理醫藥學雜志,2000,13(5):385-386.
[7]金水高.關于GM(1,1)模型在醫學中的誤用[J].中國衛生統計,1992,9(6):42-43.
[8]師應來.經濟預測與決策方法[M].北京:軍事譯文出版社,1996:244-391.