江蘇省疾病預防控制中心,南京(210009)
劉文東 胡建利 艾 靜 吳 瑩 戴啟剛 梁 祁 李 媛 湯奮揚△ 朱葉飛△
近年來,早期預警已成為傳染病防制領域的研究熱點,許多國家廣泛開展了相應的理論及應用研究,引進了一系列預警模型,進而建立了早期預警應用系統[1-2]。2003年SARS發生后,我國也積極開展傳染病預警應用研究[3],2004年實現傳染病網絡直報之后相繼開發了國家傳染病自動預警系統(China infectious diseases automated alert and response system,CIDARS),并在全國范圍內推廣運行[4]。但幾年的實踐表明,該系統應用的預警方法過于簡單和單一,預警分析的靈敏度、特異度及時效性均不夠理想,有必要引入新的方法技術,改善預警效果,從而提高該系統在傳染病應急防制中的應用價值[5-6]。
在我國,流行性腮腺炎(以下簡稱腮腺炎)是引發傳染病突發公共衛生事件最多的病種之一,因此,研究腮腺炎的早期預警具有典型意義。本文以江蘇省腮腺炎疫情資料為基礎,探討累積和控制圖模型(cumulative sum control chart,CUSUM)在腮腺炎早期預警中的應用價值,同時也為其他傳染病的預警研究提供參考和借鑒。
1.資料來源
2004-2012年江蘇省腮腺炎疫情數據來自“中國疾病預防控制信息系統”子系統——“疾病監測信息報告管理系統”(即傳染病網絡直報系統),2012腮腺炎突發公共衛生事件數據來自子系統“突發公共衛生事件報告管理系統”;從另一個子系統“國家傳染病自動預警系統(CIDARS)”中下載2012年 全省腮腺炎自動預警數據。
2.CUSUM模型及國家傳染病自動預警系統(CIDARS)簡介
(1) CUSUM模型
CUSUM模型是英國劍橋大學Page于1954年提出的一種控制圖模型,其原理是通過不斷累積觀察值與基線水平的差值,放大觀察數據出現的波動,從而可以更加迅速、靈敏地探測到微小的異常情況。預警統計量S計算公式如下:
S0=0
Si=max[0,Si-1+zi-k]
其中,k為參考值,是CUMSUM模型的兩個待定參數之一;Si表示當前期的預警統計量,Si-1為上一期的預警統計量,zi為當前期觀察值相對于歷史基線的偏移量,其計算公式如下:

預警分析時,首先判斷Si>h是否成立(h為預警閾值,是CUSUM模型中另一個待定參數),即當前預警統計量是否超過預警閾值h,如果超過則發出預警信號。
(2) CIDARS
CIDARS是中國疾控中心在傳染病網絡直報系統基礎上開發的傳染病早期預警應用系統,并于2008年4月開始在全國范圍內正式投入運行。該系統對于鼠疫、霍亂、傳染性非典型肺炎、脊髓灰質炎、人感染高致病性禽流感、肺炭疽、白喉、絲蟲病、不明原因肺炎等9個低發或罕見病種采用單病例預警,即發現一例即產生預警;對于包括流行性腮腺炎在內的19個常見多發的病種采用移動百分位數法進行預警,其中腮腺炎預警閾值為P80(第80百分位數)。
3.預警分析與效果評價
以江蘇省2012年報告的腮腺炎突發公共衛生事件作為目標事件。CUSUM模型統計量的計算采用短基線法,為了消除周末效應的影響,根據當前日是工作日或周末建立不同的歷史基線:如果是工作日則向后回溯14個工作日作為歷史基線;如果是周末,則向后回溯14個休息日(周六或周日)作為歷史基線。
分析CUSUM模型及CIDARS的預警信號,如果一條預警信號落在某一起突發共衛生事件起止時間范圍內,則視為對該事件的有效預警,反之則為錯誤預警;對于同一個事件的時間區間內產生的多次預警計為1次有效預警。用靈敏度、特異度、及時性等3個指標對CUSUM模型以及CIDARS的預警效果進行評價和比較:
靈敏度=有效預警事件數/報告的事件總數×100%
特異度=無預警信號產生的天數/無突發公共衛生事件發生的天數×100%
及時性(天)=某事件有效預警日期-該事件的起始日期
本研究中原始數據的整理在Excel 2007中完成,CUSUM模型預警試驗在Matlab2011b中完成,CUSUM模型與自動預警系統之間預警效果的假設檢驗在SAS8.1中完成。
1.江蘇省腮腺炎流行概況
我省自2004年開始腮腺炎疫情網絡直報,近10年間全省腮腺炎流行起伏波動較大,有一定的周期性流行的傾向,但由于數據積累年份太少無法進行檢驗;2010年報告病例數最低,全省僅有553例;2012年則是高發年份,全省報告發病19104例,較2011年增加115.50%。見圖1。

圖1 2004-2012年江蘇省流行性腮腺炎流行趨勢
我省腮腺炎流行有明顯的季節性,全年呈雙峰型分布,發病最高峰出現在5-6月,次高峰出現在11-12月。各地區發病數差異較大,2012年報告發病數前3位的地區依次是蘇州市(3208例)、徐州市(2751例)、連云港市(2207例),計占全省發病總數的42.75%;發病數后3位依次是鹽城市(400例)、泰州市(471例)、揚州市(705例)。
2012年全省報告腮腺炎突發公共衛生事件14起,其中13起發生在3-6月,1起在12月;14起事件均為某一個區縣范圍內的局部暴發疫情,發生場所均在學校,發病數最多262例、最少12例。所有事件中,從首例病例發生日期到該事件確認報告日期之間的間隔時間(即事件報告及時性)最短為1天,最長達29天,中位數為8天。另外值得注意的是,有4起事件的所有病例均集中在同一天報告,占事件總數的28.57%。
2.CUSUM模型預警分析與評價
(1) 模型參數選擇
以2011年11月1日-2012年12月31日全省110個區縣每日發病數為實驗數據,從2012年1月1日起以CUSUM模型進行前瞻性試驗。模型中的兩個待定參數h(h=1,2,3,4)、k(k=0.5,1.0,1.5,2.0,2.5)依次選擇不同數值進行組合試驗,計算每一種組合下的預警靈敏度、特異度,以靈敏度為縱坐標、1-特異度為橫坐標繪制ROC曲線,最終確定模型參數為h=3,k=0.5,見圖2。

圖2 ROC曲線
(2) CUSUM模型預警分析及效果評價
CUSUM模型全年共產生1688條預警信號,每天信號數最少0條,最多22條,平均每天4.62條;各區縣全年產生信號數最少0條,最多24條,平均15.35條。CIDARS全年發出預警信號2609條,每天信號數最少1條,最多38條,平均每天7.15條;各區縣全年預警信號最少0條,最多達67條,平均23.72條。
對于14起目標事件,CUSUM模型均發出了有效預警,靈敏度為100%,CIDARS對9起事件發出了有效預警,靈敏度為64.29%,CUSUM模型預警靈敏度顯著高于CIDARS(χ2=6.09,P=0.0136)。CUSUM模型和CIDARS特異度分別為95.84%、94.35%,前者高于后者,差異有統計學意義(χ2=602.48,P<0.0001)。從事件開始日期到發出預警日期之間的時間間隔(即預警及時性),CUSUM模型最短0天,最長29天,中位數為3.5天;CIDARS最短2天,最長23天,中位數為6天;CUSUM模型與CIDARS預警及時性無統計學差異(Z=0.9173,P=0.359)。CUSUM模型及CIDARS對目標事件的預警分析結果見表1。
CUSUM模型是常見的傳染病突發公共衛生事件早期預警方法之一,是當前國外一些傳染病預警應用系統的核心方法[7-9]。國內也有學者開展CUSUM模型的應用研究[10-11]。本文研究中,CUSUM模型對于腮腺炎局部暴發疫情的早期探測效果良好,預警分析的靈敏度、特異度均明顯高于CIDARS的移動百分位數法,并且預警信號數比CIDARS減少35.30%,可以極大地降低基層預警信號核實的工作量,減少傳染病預警的運行成本,提高可接受性。

表1 CUSUM模型與自動預警系統預警結果統計
本研究中同時也存在一些有待改進和完善之處:
(1)CUSUM模型對于腮腺炎預警分析的及時性不夠理想,其原因主要在于數據質量較差。14起目標事件中,普遍存在病例報告延遲的現象,其中近1/3的事件所有病例均在事件確認后在某一天集中進行網絡直報,致使模型無法在事件萌芽階段及時做出預警。本研究的所有目標事件均發生在各級各類學校,因此加強學校公共衛生管理,建立晨檢制度和傳染病零報告制度,提高學校傳染病報告及時性,可以從根本上解決這一問題。
(2)本研究中以區縣為單位進行預警分析,但當前的傳染病突發公共衛生事件多是局部暴發疫情,疫情波及范圍多局限于某區縣的一個或幾個鄉鎮,由于暴發規模小,發生病例少,必須累積到一定數量才能在區縣水平上發現異常。因此可以考慮將預警分析的空間尺度進一步縮小,以鄉鎮為單位進行實時預警將進一步提高模型的靈敏度和特異度、及時性。
(3)當前,包括CUSUM模型在內的各種控制圖模型在傳染病監測預警中的應用都是以現行的行政區劃為基礎[3,11]。有研究表明,我國傳染病突發公共衛生事件主要發生在學校[12-13],如果以學校為單位開展預警分析將極大提高模型的預警效能。但在傳染病網絡直報系統中學生所在學校多填在“患者工作單位一欄”,而且不是必填字段,因此學生所在學校信息大多缺失,不能用于學校突發事件的早期探測,因此建議在網絡直報系統中盡量完善所在學校信息。
(4)當前以控制圖模型為基礎的預警方法多是對各個空間單位獨立進行預警探測[7,9,11],忽略了空間相關性的存在,對于跨區域的局部暴發事件(即同時波及幾個相鄰空間單位)探測能力降低。因此,如果在CUSUM模型算法中引入空間相關性將具有突破性意義??梢钥紤]建立空間鄰接矩陣,以此明確各空間單位之間的(一階或多階)鄰接關系,進而通過不同的權重將具有鄰接關系的空間單位合成一個新的空間單位,再對其進行預警分析。
(5)不同的預警模型在預警分析時具有各自的優勢,在實際運用中可以考慮將定性方法與定量方法相結合、將時間預警技術與空間預警技術相結合,通過多種預警技術的聯合應用提高預警分析的能力[14]。
參 考 文 獻
1.Tsui FC,Espino JU,Dato VM,et al.Technical description of RODS:a real-time public health surveillance system.Journal of the American informatics association,2003,10(5):399-408.
2.Desenclos JC.RAISIN-a national programme for early warning,investigation and surveillance of healthcare-associated infection in France.Euro surveill,2009,14(46):1-8.
3.楊維中,郉慧嫻,王漢章,等.七種傳染病控制圖法預警技術研究.中華流行病學雜志,2004,25(12):1039-1041.
4.楊維中,蘭亞佳,李中杰,等.國家傳染病自動預警系統的設計與應用.中華流行病學雜志,2010,31(11):1240-1244.
5.楊維中,李中杰,賴圣杰,等.國家傳染病自動預警系統運行狀況分析.中流行病學雜志,2011,3(5):431-435.
6.梁萬年.加強我國傳染病預警的研究與應用.中華流行病學雜志,2011,32(5):429-430.
7.Watkins RE,Eagleson S,Bert V,et al.Applying cusum-based methods for the detection of outbreaks of Ross River virus disease in Western Australia.BMC medical informatics and decision making,2008,8:37.
8.Boyle JR,Sparks RS,Keijzers GB,et al.Prediction and surveillance of influenza epidemics.MJA,2011,194(4):S28-S33.
9.Fricker RD,Hegler BL,Dunfee DA.Comparing syndromic surveillance detection methods:EARS’ versus a CUSUM-based methodology.Statist Med,2008,27:3407-3429.
10.張洪龍,賴圣杰,李中杰,等.累積和控制圖法在傳染病暴發探測中的應用.中華流行病學雜志,2010,31(12):1406-1409.
11.竇相峰,王全意,賈蕾,等.累積和模型在細菌性痢疾早期預警中的應用.首都公共衛生,2010,4(5):201-204.
12.魯琴寶,龔震宇,林君芬.浙江省2004-2007年學校突發公共衛生事件流行病學分析.中國學校衛生,2008,29(8):718-719.
13.劉文東,吳瑩,梁祁,等.江蘇省2006-2009年突發公共衛生事件流行特征分析.現代預防醫學,2012,39(5):1071-1074.
14.楊維中.傳染病預警理論與實踐.北京:人民衛生出版社,2012.