江蘇省疾病預防控制中心(210009) 戴啟剛
圓分布的平均角及其區間估計方法在傳染病發病高峰評估中的應用探討*
江蘇省疾病預防控制中心(210009) 戴啟剛
目的探討圓分布在傳染病發病高峰研究中的應用策略。方法以四類傳染病數據為基礎,圓分布方法分析各病種流行規律,采用兩種區間估計方法計算發病高峰期。結果圓分布方法適用于單峰分布或略呈現雙峰分布的傳染病,對于雙峰分布傳染病,圓分布的雷氏檢驗并不能給出合理的結果;采用bootstrap計算發病高峰期區間過窄,標準差法結果較為合理。結論利用圓分布方法研究傳染病的流行規律時,應當先作折線圖以便對該病種流行規律有宏觀了解,流行高峰應當結合折線圖和雷氏檢驗結果觀察,對傳染病發病高峰期的計算,采用加減標準差法比bootstrap法更具優勢。
傳染病 圓分布 可信區間 bootstrap
圓分布分析適用于在規定時期內周期性變化的數據,檢驗數據在一個周期內是均勻分布的,還是有集中的傾向,如果有集中于某個時間發生的傾向,則可以通過平均角來表示[1]。近年來,有較多的研究將圓分布方法引入到傳染病發病時間的規律分析中,以探索傳染病的發病高峰和流行期[2-5]。本文以不同流行特征的傳染病數據為基礎,探討圓分布的適用情況,比較兩種發病高峰期計算方法(加減標準差法和bootstrap法)的合理性。
1.資料來源
為探討圓分布在傳染病發病高峰中的適用情況,本文選取幾種不同類型的流行特征傳染病:細菌性痢疾(單峰分布)、手足口病(雙峰分布,兩峰值水平相差較多)、水痘(雙峰分布,兩峰值水平相近)、丙型肝炎(均勻分布)。發病資料來源于中國疾控中心傳染病報告信息管理系統。
2.資料整理
從傳染病報告信息管理系統中導出江蘇省2012年目標傳染病報告卡,整理該傳染病的每日發病數。
3.分析方法
(1)采用圓分布方法,求得該病種的發病高峰日。
采用雷氏檢驗(Rayleigh′s test)判斷平均角有無統計學意義,以確認該傳染病總體分布是否有集中于該高峰日的傾向。
(2)分別采用加減標準差法[5]和bootstrap法[6]估計發病高峰日的可信區間。
加減標準差法:將角度轉化為日期,即為發病高峰期。
Bootstrap法:從現有的傳染病發病數據中,等比例、有放回地重復抽樣[7](考慮到計算結果的穩定性和計算機運算效率,將抽樣次數定為1000),計算每一個抽樣樣本的平均角,取1000個平均角的Q2.5和Q97.5作為95%可信區間的上下限[8],并將其轉化為相應的日期作為發病高峰期。
(3)評價方法
本文目標將傳染病按日作發病數折線圖,以全年日均發病數為界值,當某段時期日發病數超出全年日均發病數且整體發病趨勢持續向上時,則初步判斷該傳染病發病可能進入高發,并試通過圓分布的統計量結合上述直觀的方式,探討圓分布方法以及兩種區間估計方法的的適用情況。
本文數據整理與分析借助SAS 9.2完成,作圖采用Office 2010軟件。
通過目標傳染病的日發病情況折線圖,以日均發病數為輔助線,判斷傳染病進入高峰的時間(僅作為輔助判斷,不作為判定依據)。見圖1。
對四類傳染病的圓分布分析及兩種可信區間估計結果見表1。
丙型肝炎發病無季節性,全年發病呈均勻分布,此時利用雷氏檢驗可以較敏感地得到圓分布平均角無統計學意義的結論;水痘發病在一個自然年內,呈明顯的雙峰分布,但采用雷氏檢驗得到P值有意義的結論(下文將進一步探討);手足口病在夏季出現高峰后下行,至年末又出現流行小高峰,平均角所對應的高峰日與實際情況較為吻合,經雷氏檢驗有統計學意義;細菌性痢疾是夏秋季節高發的腸道傳染病,呈嚴格的單峰分布,平均角所對應的發病高峰日符合實際發病情況。
傳染病發病高峰期的計算,本文分別采用了非參數bootstrap再抽樣百分位數法和加減標準差法,結合發病折線圖顯示bootstrap的方法得到的可信區間過窄,無實際意義,而加減標準差法得到的結果較為客觀:手足口病和細菌性痢疾作為腸道傳染病,其發病具有明顯的季節特征,發病數一般隨著氣候轉暖(3月份左右)而升高,4月至7月為發病高峰期[9]。這與本文所得到的的結果一致,因此采用圓分布法時,利用加減標準差法估計發病高峰期更具有流行病學的指導意義。

圖1 四類傳染病日發病折線圖

表1 四類傳染病圓分布分析及發病高峰期結果
上文討論了圓分布方法在四種傳染病發病集中性以及發病高峰期中的應用,其中對水痘的平均角檢驗具有統計學意義,然而從發病折線圖看,呈典型雙峰分布,觀察加減標準差法得到的高峰期可見,該傳染病的發病高峰期跨越了一個自然年,考慮到該現象可能是由于2011年下半年的發病高峰與2012年上半年的發病高峰相延續而產生,結合表1中的結果,嘗試以2011/08/01-2012/07/31作為一個觀察周期,重新計算平均角及其對應高峰期(采用加減標準差法),計算得到發病高峰日為2012/02/15,雷氏檢驗P<0.05,高峰期為2011/10/16-2012/6/17,結合發病折線圖(圖2)可知在該周期內該傳染病仍呈雙峰分布,且計算所得的發病高峰與實際發病情況不符,發病高峰出現跨年度的現象并非上文所假設的原因。

圖2 水痘2011/08/01-2012/07/31日發病折線圖
圓分布方法被廣泛應用于傳染病發病高峰期的計算和比較,本文通過對四種不同流行特征的傳染病的研究證實:圓分布方法適用于單峰分布傳染病(如細菌性痢疾)或略呈現雙峰分布的傳染病(手足口病);若發病趨勢平穩(如丙型肝炎),雷氏檢驗能夠得到無集中時點發病的結論;而對于一個觀察周期出現兩個發病高峰且兩高峰水平相當的傳染病(如水痘),圓分布的雷氏檢驗并不能給出合理的結果。因此,本文建議,利用圓分布方法計算某傳染病的發病高峰、比較不同觀察周期和(或)不同類型傳染病發病高峰時,應當遵循如下步驟:(1)初步用折線圖觀察傳染病的發病趨勢;(2)利用圓分布方法分析,采用雷氏檢驗分析是否存在平均角;(3)將雷氏檢驗統計量與發病折線圖相結合,給出相關結論。
對于傳染病高峰期的計算,因為傳染病年發病例數較多,若采用非參數bootstrap抽樣的百分位數法,計算耗時且得到的可信區間較窄,本文建議使用將轉化為日期的方法,可以簡便、可靠地得到具有流行病學意義的結果。
1.金丕煥,陳峰主編.醫用統計方法(第3版).上海:復旦大學出版社,2009:327-334.
2.石長勝,邵峰,王篤寶.應用圓形分布分析泰安市不同時期麻疹發病的時間分布特征.中國衛生統計,2006,23(2):155-156.
3.徐紅梅,朱渭萍,費怡,等.應用圓形分布法分析浦東新區2005-2010年細菌性痢疾季節性分布特征.中華疾病控制雜志,2012,16(5):446-448.
4.甘仰本,廖征.集中度和圓形分布法分析南昌市1985-2007年麻疹季節性分布.現代預防醫學,2009,36(12):2229-2230.
5.聶軼飛.應用集中度和圓形分布法探討河南省2010年手足口病流行規律.中國衛生統計,2013,30(3):410-411.
6.朱凱.圓形分布資料平均角置信區間的Bootstrap方法實現.中國衛生統計,2011,28(4):412-413.
7.閆宇翔.Bootstrap再抽樣方法的SAS程序設計.中國衛生統計,2003,20(5):320.
8.Carpenter J,Bithell J.Bootstrap confidence intervals:when,which,what?A practicalguide for medical statisticians.Statisticsin Medicine,2000,19:1141-64.
9.嵇紅,李亮,吳斌,等.江蘇省2008至2010年手足口病流行病學及病原學特征分析.中華兒科雜志,2012,50(4):261-266.
(責任編輯:丁海龍)
江蘇省“十二·五”科教興衛工程(ZX201109)