王瑞平 姜永根 郭曉芹 趙根明
基于傳染病自動預警信息系統的“流行標準”最優化選擇分析*
王瑞平1,2姜永根2郭曉芹2趙根明1△
目的 通過納入“流行標準”備選模型,探討各模型對不同傳染病類型預警閾值設定的適用性,進而優選出各傳染病的適宜預警閾值,改善預警效果。方法 按照控制圖預警模型原理,分別計算各重點傳染病2014年周病例數指定的12個百分位數,然后分別應用備選“流行標準”對各重點傳染病2014年相應周的疫情進行預警,通過比較備選模型和控制圖預警模型預警結果,優選出預警閾值,然后依據2015年傳染病聚集性疫情的實際發生情況驗證預警界值預警效果。結果 納入松江區3種重點傳染病,流行性腮腺炎整體疫情呈下降趨勢,定為“TYPE A”,C2、累積和控制圖(CUSUM)和季節趨勢模型(SM)推薦P50,“μ+2σ”推薦P80;流行性感冒整體疫情平穩,定為“TYPE B”,C2、CUSUM和SM推薦P40,“μ+2σ”推薦P75;猩紅熱整體疫情呈上升趨勢,為“TYPE C”,C2和SM推薦P90,CUSUM推薦P75,“μ+2σ”推薦P80。結論 C2、CUSUM和SM適合“TYPE A”型傳染病,推薦預警閾值低,結果保守;4種模型均適合“TYPE B”型傳染病,但μ+2σ的預警的成本效益好;4種模型也均適合“TYPE C”型傳染病,但傾向于推薦大的預警閾值,建議根據傳染病社會影響和現有防治水平對預警閾值進行適當調整。
傳染病自動預警信息系統;流行標準;優化選擇;C2;CUSUM;SM
傳染病預測預警是根據收集到的傳染病疫情報告和疫情監測資料,對疫情發生的區域、規模等進行綜合評估和預測,然后在一定范圍內,采取適當的方式預先發布事件威脅的警告[1],進而及時發現暴發和流行的苗頭,降低發病率和死亡率。目前,傳染病疫情預測預警工作已經成為了疾病監測信息體系的重要內容[2-4]。在應用控制圖法預警技術研究中,“流行”的標準依據是經典流行病學中流行的定義,即將大于“μ+2σ”作為流行標準[5-7],而實際應用中,如果傳染病存在長期趨勢,直接將“μ+2σ”作為“流行”標準可能會低估或者高估暴發苗子,造成預警結果的偏差;同時如果傳染病具有明顯的季節性,僅利用這個“點值”作為“流行”的判斷標準也會造成預測結果的偏差[8-9]。因此,分析在傳染病預警閾值優選過程中,如何確立合適的“流行”標準,可以提高預警閾值設定的合理性,進而改善傳染病早期預警的效果,提高傳染病疫情的控制率和控制及時性。
1.資料來源
資料來源于“中國疾病預防控制信息系統”中“疾病監測信息報告管理系統”模塊的傳染病報告。通過歷史疫情和預警系統分析將流行性腮腺炎、流行性感冒和猩紅熱確定為松江區重點傳染病,利用“疾病監測信息報告管理系統”查詢、下載、篩選、整理出2009-2015年松江區重點傳染病疫情信息資料。
2.數據管理及建模
(1)建立預警模型
按照控制圖預警模型原理,分別以松江區3種重點傳染病觀察“周”既往5年(2009-2013年)該周及其前后各2周的周發病數為基線數據,分別計算指定的百分位數(P40、P45、P50、P55、P60、P65、P70、P75、P80、P85、P90、P95)作為預警閾值,建立預警模型。
(2)備選流行標準介紹
通過文獻檢索,將C2法、累積和控制圖法(cumulative sum control chart,CUSUM)和季節趨勢模型法(seasonal trend model,SM)納入為備選標準,與預警系統使用的“ 流行標準”進行比較分析。
C2法基于美國早期異常探測系統(early abreation reporting system,EARS),依據監測數據為距離當前日向前推算3至9天的數據為基線,利用統計模型計算當前日的期望值,并設定預警閾值,當實際觀測值超過預警閾值時即發出預警信號。具體計算公式如下:
其中yt是第t天監測病例數,μ2t為第t-3天至t-9天病例數的均值,σ2t是第t-3天至t-9天病例數的標準差,k為修正系數,參考EARS的設置,k=1。本文中,將h設定為預警閾值,當C2t>2時,認為當前監測病例數為潛在“流行”,否則為一般“散發”。
累積和控制圖法模型(CUSUM),假定每天監測病例數yi服從泊松分布,將監測序列正態化處理后,可計算得到標準正態離差表示當前值與預期值之間的差異,該模型的具體計算公式如下:
其中yt是第t天監測病例數,μi為過去i天病例數的平均值,σi為過去i天病例數的標準差,k值為該模型的重要參數,稱為修正系統,本研究中i=7,k=1,初始設置為S0=0,當St>0時,即產生預警信號,認為當前監測病例數為潛在“流行”,否則為“散發”。
季節趨勢模型(SM)是將線性回歸和殘差分析結合起來的一個預測模型,該模型同時兼顧了趨勢性和季節性的影響,同時剔除了長期趨勢對預測效果的影響,能夠得到較為接近實際的預測結果,反映了該類數據的變化規律,短期的預測效果好。該模型的具體計算公式如下:

(3)備選流行標準對應的預警閾值的優選
按照控制圖預警模型原理,分別以松江區2009-2013年重點傳染病的“周”發病數為基線數據,帶入建立的預警模型,分別用12個預警閾值對2014年52個周的傳染病發病數進行預測,依據(實際發生數-預測發病數>0,即為流行)標準判定各預警閾值的預警結果,同時應用各備選流行標準對2014年52個周的傳染病發病數是否“流行”進行預測判定,通過分別計算各備選流行標準與12個預警閾值的預警靈敏度、特異度、陽性預測值、陰性預測值等指標,繪制ROC曲線進行預測功效的比較,確定各備選流行標準對應的預警閾值。
(4)各備選流行標準預警效果的驗證
按照傳染病自動預警信息系統運作原理,分別以松江區2010-2014年重點傳染病的“日”發病數為基線數據,根據控制圖預警模型原理,應用各備選“流行標準”對應的預警閾值進行每日預警,同時根據2015年各重點傳染病聚集性疫情的實際發生情況,對各備選“流行標準”的預警效果進行評價,驗證預警效果。
3.統計分析
應用EXCEL 2013和SPSS 16.0統計軟件進行統計分析。統計方法包括模型建立,靈敏度(sensitivity,Se)、特異度(specificity,Sp)、陽性預測值(positive predictive value,PPV)、陰性預測值(negtive predictive value,NPV)、一致率(consistency rate,CR)、Kappa值、約登指數(Youden's Index,YI)等指標的計算,ROC曲線繪制等。
1.松江區重點傳染病整體疫情趨勢
2009-2014年,松江區流行性腮腺炎疫情呈“夏季高發”特點,每年第13周~30周夏季的周報告病例數明顯高于37周~52周秋冬季節的周報告病例數,而2015年全年疫情平穩,僅在25周~40周期間流行性腮腺炎的周報告病例數有所升高;從長期流行趨勢看,2009-2015年,松江區流行性腮腺炎呈下降趨勢。2009-2015年,松江區流行性感冒疫情呈“冬春季和秋季兩個發病高峰”特點,每年冬季和次年春季出現一個發病高峰,然后疫情回落,并于秋季出現第二個小高峰;從長期流行趨勢看,松江區流行性感冒的疫情整體平穩。2009-2015年,松江區猩紅熱疫情呈現“夏季秋冬季雙高峰”的特點。每年16周~28周出現一個大高峰后疫情逐漸回落,進入43周后出現第二個小高峰。從長期流行趨勢看,2009-2015年,松江區猩紅熱整體疫情輕微上升。
如圖1所示,2009-2015年流行性腮腺炎疫情呈“緩慢下降”趨勢,本文將其歸為“TYPE A”型;2009-2015年,流行性感冒的疫情整體平穩,每年有相對穩定的高發季節,本文將其歸為“TYPE B”;而2009-2015年松江區猩紅熱整體上呈“緩慢上升”的趨勢,本研究將其歸為“TYPE C”型。

圖1 松江區2009-2015年3種重點傳染病周報告病例數及長期疫情趨勢
2.“流行標準”備選模型推薦的重點傳染病預警閾值
以C2模型、累積和控制圖(CUSUM)、季節趨勢模型(SM)和μ+2σ為流行標準預警松江區3種重點傳染病,然后分別與該病種對應的控制圖法預警模型得到的12個備選預警閾值對應的2014年該病種的預警結果進行逐一對比分析,計算該病種對應的12個預警閾值的靈敏度、特異度、陽性預測值、一致率和Kappa值,綜合平衡各評價指標后,優選出基于C2模型、累積和控制圖(CUSUM)、季節趨勢模型(SM)和μ+2σ的最佳預警閾值。
如表1所示,C2、累積和控制圖(CUSUM)和季節趨勢模型(SM)對流行性腮腺炎推薦的預警閾值為P50,而現用流行標準“μ+2σ”推薦的預警閾值為P80;對于流行性感冒,C2、CUSUM和SM推薦的預警閾值為P40,而“μ+2σ”推薦的預警閾值為P75;對于猩紅熱,C2和SM推薦的預警閾值為P90,累積和控制圖(CUSUM)推薦的預警閾值為P75,而“μ+2σ”推薦的預警閾值為P80。

表1 備選“流行標準”對重點傳染病推薦的預警閾值和相應指標值
3 “流行標準”備選模型推薦的預警閾值預警效果驗證
根據國家傳染病自動預警信息系統的運作原理,計算預警“日”所在“周”的周報告病例數,以及既往5年(2010-2014年)該周前后各2周的周發病數,應用各備選“流行標準”優選出的預警閾值對2015年各病種的“日”疫情進行預警,同時根據2015年各重點傳染病聚集性疫情的實際發生情況,對各備選“流行標準”的預警效果進行評價,計算各備選“流行標準”優選出的預警閾值對各重點傳染病預警的靈敏度、特異度、陽性預測值、陰性預測值、約登指數、一致率等指標,驗證預警效果。
如表2所示,流行性腮腺炎為“TYPE A型”傳染病,表現為緩慢下降的長期趨勢,各備選“流行標準”中,C2模型、累積和控制圖法和季節趨勢模型推薦的預警閾值適用性好,推薦的預警閾值較低,結果比較保守;而μ+2σ標準推薦的預警閾值偏高,預警的靈敏度低,不適用。流行性感冒為“TYPE B型”傳染病,疫情表現為無明顯上升或下降的長期趨勢,各備選“流行標準”推薦的預警閾值均適用,C2模型、累積和控制圖法和季節趨勢模型推薦的預警閾值較低,結果比較保守;而μ+2σ法推薦的預警閾值偏高,預警的成本效益好,在實際應用中有較好的效果。猩紅熱為“TYPE C型”傳染病,疫情表現為緩慢上升的長期趨勢,各備選“流行標準”推薦的預警閾值適用性均較好,同時傾向于推薦較高的預警閾值。

表2 備選“流行標準”推薦的重點傳染病的預警閾值預警效果
盡早發現傳染病暴發苗子,及時采取有效的控制措施,可有效降低傳染病造成的發病和死亡,具有重要的公共衛生意義[7]。因此,開展傳染病預警預測,早期探測發現暴發事件始終是公共衛生領域關注的一個熱點問題[10]。2008年,國家傳染病自動預警信息系統的建立為我國傳染病預警預測工作的開展奠定了技術基礎,并提供了工作平臺。目前,我國在傳染病預警領域已開展了有益的探索和實踐,初步取得了一些成效,但圍繞傳染病預警還有許多值得深入探討和研究的問題[11-12]。本文從預警信息系統“流行標準”優化選擇入手,通過模型擬合,應用4種“流行標準”分別對松江區3種重點傳染病的預警結果進行了擬合,初步優選出各“流行標準”對應的預警閾值,同時對各“流行標準”對應的預警閾值的預警效果進行了評價,取得了較好的效果。
本研究結果提示,對于不同的傳染病類型,各備選“流行標準”所推薦的預警閾值不盡相同,但仍有規律可循。“TYPE A型”傳染病,C2模型、累積和控制圖法和季節趨勢模型推薦的預警閾值適用性好,同時3種方法推薦的預警閾值較低,結果比較保守;而μ+2σ推薦的預警閾值的預警靈敏度不高,不適用。“TYPE B型”傳染病,4個備選“流行標準”推薦的預警閾值均適用,C2模型、累積和控制圖法和季節趨勢模型推薦的預警閾值較低,結果比較保守;而μ+2σ推薦的預警閾值偏高,預警的成本效益好。“TYPE C型”傳染病,C2模型、累積和控制圖法推薦的預警閾值適用性好,但4個備選“流行標準”均傾向于推薦較高的預警閾值。因此,對于有長期趨勢的傳染病,無論是“上升”趨勢還是“下降”趨勢,C2模型、累積和控制圖法推薦的預警閾值適用性好,但“上升”長期趨勢傳染病的預警閾值普遍偏高,實際應用時需適當調整;對于無長期趨勢的傳染病,4個備選“流行標準”推薦的預警閾值均適用,預警閾值普遍較低,μ+2σ推薦的預警閾值相對較高,預警的成本效益好。
在實際工作中,由于傳染病預警閾值是根據發病前5年的數據通過控制圖法擬合得出的[10],因此合適預警閾值需要每年進行及時調整[11,13]。同時預警閾值的選擇還要看傳染病的特點,如果傳染病的危害較大,漏掉疫情可能會帶來嚴重后果,且目前有可靠的預防控制措施方法,此時的預警閾值可以考慮提高靈敏度,盡可能多的發現暴發苗子,及時采取控制措施。如果傳染病的危害較小,調查處置費用高,此時的預警閾值設定可以考慮提高特異度,盡可能多的剔除假預警,提高傳染病疫情處置的效率。
本研究具有一定的局限性。首先,本文僅納入3種傳染病,在歸納總結各模型的適用性時在一定程度上會影響研究結論的外推性;其次,“流行標準”備選模型納入了C2、CUSUM和SM,備選模型的數量偏少;最后,以松江區的傳染病周疫情為基礎開展研究,由于地域范圍的影響,個別傳染病的周報告病例數為0,一定程度上影響了備選模型的運行,對研究結果有影響。因此,今后需開展延展性研究,選擇更大的地域范圍,納入更多的傳染病病種和更優化的“流行標準”模型,進而完善我國傳染病自動預警信息系統。
[1]馬芬,王麗,李輝.傳染病預警方法研究進展.衛生研究,2008,37(2):249-251.
[2]楊維中,邢慧嫻,王漢章,等.七種傳染病控制圖法預警技術研究.中華流行病學雜志,2004,25(12):1039-1041.
[3]孟軍.突發公共衛生事件預警現狀與模式探討.廣西醫學,2006,28(11):1742-1743.
[4]葛利輝,徐斌,梁紅慧.利用電子地圖實行傳染病預警預測的探討.實用預防醫學,2006,13(1):37-38.
[5]Najera J,Kouznetasov R,Dilacollette C.Malaria epidemics.Detection and control.Forecasting and prevention.Geneva,World Health Organization,1998.
[6]Early warning syetems.Communicable disease surveillance and response(CSR).2004.http://www.who.int/csr/labepidemiology/projects/earlywarnsystem.
[7]楊維中,蘭亞佳,李中杰,等.國家傳染病自動預警系統的設計與應用.中華流行病學雜志,2010,31(11):1240-1244.
[8]王瑞平,陳立凌,劉成,等.蘇州市重點傳染病移動百分位數法預警界值優選分析.中國衛生統計,2014,31(4):598-601.
[9]Yang W,Li Z,Lan Y,et al.A nationwide web based automated system for early outbreak detection and rapid response in China.WPSAR,2011,2(1):1-6.
[10]楊維中,李中杰,賴圣杰,等.國家傳染病自動預警系統運行狀況分析.中華流行病學雜志,2011,32(5):431-435.
[11]梁萬年.加強我國傳染病預警的研究和應用.中華流行病學雜志,2011,32(5):429-430.
[12]劉文東,胡建利,艾靜,等.CUSUM模型在流行性腮腺炎早期預警中的應用研究.中國衛生統計,2014,31(4):563-565.
[13]徐旭卿,魯琴寶,王臻,等.浙江省傳染病自動預警系統暴發預警效果評價.中華流行病學雜志,2011,32(5):442-445.
(責任編輯:劉 壯)
Optimized Outbreak Standard Selection based on China Infectious Disease Automated-alert and Response System(CIDARS)
Wang Ruiping,Jiang Yonggen,Guo Xiaoqin,et al
(SongjiangCenterforDiseaseControlandPrevention(200032),Shanghai)
Objective To explore the adaptability of 4 outbreak detection algorithms to provide optimized early warning thresholds(OEWT)for different infectious diseases,and then recommend proper OEWT for each infectious disease to improve early warning effect.Methods According to principle of early warning control graph model(EWCGM),outbreak signals of the 12 alternative Px were calculated in 2014,and ‘μ+2σ’,C2,seasonal model(SM),and cumulative sum(CUSUM)were applied.When outbreak signals generated by algorithm were consistent with a Px,this Px was then ascertained as the optimized threshold by this algorithm,finally all ascertained Px of different infectious diseases were verified in CIDARS by real outbreak events in 2015.Results Three key infectious diseases were finally ascertained,mumps showed a declining trend which was set as TYPE A,C2,CUSUM and SM recommendedP50for mumps,and ‘μ+2σ’ recommendedP80;influenza showed no increasing or decreasing trend which was set as TYPE B,C2,CUSUM and SM recommendedP40for mumps,and ‘μ+2σ’ recommendedP75;scarlet fever showed an slightly ascending trend which was set as TYPE C,C2,SM recommenedP90,CUSUM recommenedP75,and ‘μ+2σ’ recommendedP80.Conclusion C2,CUSUM,and SM were suitable for TYPE A with lower thresholds,all 4 algorithms(OGS)were suitable for TYPE B,and were all also suitable for TYPE C but with higher thresholds.The selection of optimized thresholds should also consider the social and economical influence of infectious diseases as well as the response capacity of local CDCs.
China infectious disease automated-alert and response system;Outbreak standard;Optimized selection;C2;Cumulative sum;Seasonal model
公共衛生安全教育部重點實驗室開放基金(GW2015-1)
1 復旦大學公共衛生學院 (200032 )
2 松江區疾病預防控制中心
△通信作者:趙根明,E-mail:gmzhao@shmu.edu.cn