孫建偉 王大江 許汴利 黃學勇△
衛生相關事件數據時間聚集性的綜合分析與判定*
孫建偉1王大江2許汴利1黃學勇1△
目的 探討衛生相關事件數據時間聚集性的綜合分析與判定。方法 應用集中度、負二項分布、聚類分析、圓分布四種方法對河南省某縣狂犬病門診就診人群月分布數據進行分析。結果 集中度法M=0.54,說明就診人群具有較強季節性;負二項分布P=0.3119,可認為就診人群時間分布以天為單位具有時間聚集性;聚類分析顯示春夏季是就診人群集中季節,3-6月為就診高峰,5月就診人數最多;圓分布法計算結果顯示日就診高峰在5月8日。結論 集中度、負二項分布、聚類分析、圓分布等方法可用于衛生相關事件數據時間聚集性的綜合分析與判定。
時間聚集性 集中度 負二項分布 聚類分析 圓分布
衛生相關事件年度數據,如某種疾病發病時間分布、門診就診人群時間分布、病媒數量的月分布等,其有無時間聚集性及時間聚集性綜合分析與判定是相關科學研究的重要內容之一。通過衛生相關事件年度數據時間聚集性分析,既可為疾病病因研究提供線索,又可為疾病暴露時間或潛伏期研究提供支持,還可以用于評價不同時期某種疾病防控效果,為制定有效防制措施和衛生決策提供科學依據。本文以河南省某縣2015年狂犬病暴露預防處置門診就診人數月分布數據的綜合分析為例,介紹集中度、負二項分布、聚類分析、圓分布四種方法在數據時間聚集性分析與判定中的應用,并對結果進行比較,探討適用范圍和價值。
1.資料
來自2015年河南省某縣狂犬病暴露預防處置門診監測數據報表門診就診人群分日、分月數據。
2.方法
(1)集中度[1]表示發病時間季節性強弱的指標,由各月發病數與全年發病總數之比通過下式計算:
M表示集中度,R表示離散度,ri表示月發病數與全年發病總數之比。M為1時說明病例集中在一個月內;在0.9以上說明發病有嚴格季節性;在0.7~0.9之間,說明發病有很強的季節性;在0.5~0.7之間說明發病有較強季節性;在0.3~0.5之間說明發病有一定季節性;在0.3以下說明發病時間分布比較均勻; 為0表示病例均勻分布在12個月內。

(1)

(2)

再根據

(3)聚類分析[4]聚類分析是研究事物分類的一種統計方法,是在所關注對象分類面貌尚不清楚情況下,通過彼此之間的比較而將性質相近的歸為一類,性質差別較大的歸為不同類。在Q型聚類(對樣品的聚類)中衡量對象性質相近程度的距離指標常用歐式距離,其計算公式如下:
式中:Xik表示第i對象的第k個指標的觀察值,Xjk表示第j個對象的第k個指標觀察值;m是觀察指標的總數。dij表示第i個對象與第j個對象間的距離,dij越小,對象“性質”越接近。在實例分析中,對象為月份,指標是不同年份,觀察值是發病數。
(4)圓分布法[5]是將具有周期性變化的資料通過三角函數的變換使原始數據成線性資料的一種統計學方法。一組圓分布資料如果有集中分布的傾向,這一傾向性可用平均角表示。將1年365天轉化為360°,1天則對應0.9863°,以每月中間一天為組中值,換算成對應的角度,如1月16日對應16×0.9863°=15.78°,2月14日對應(31+14)×0.9863°=44.38°,余類推。通過以下公式求得平均角 ,換算成對應的月日即為發病高峰期時間。


1.門診就診人群時間分布概況 該縣狂犬病暴露預防處置門診2015年共接診9800例,就診時間多在2-8月,占全年病例的92.27%,其中5月發病數最多為1782例。

圖1 河南省某狂犬病門診就診人數月分布
2.集中度法M=0.54,表明該狂犬病門診人群就診時間有較強季節性。


表1 門診人群就診時間(日)分布的負二項分布擬合
*:χ2=2.33,P=0.3119。
4.聚類分析 若聚為兩類,則2-8月為一類,1月、9-12月為一類;2-8月又可分為兩類,3-6月為一類,2月、7-8月為一類;3-6月又可分為5月及3、4、6月兩類。結果見圖2。

圖2 河南省某狂犬病門診就診人群分月聚類分析

表2 門診人群就診時間聚集性的圓分布法統計
在該狂犬病門診就診人群時間聚集性分析中,四種分析方法得出了相一致的結論,即發病具有時間聚集性,但結論側重點各不相同。集中度分析認為發病具有較強季節性[6];負二項分布以某一時間或空間單位為觀察對象,得出事件數據在該時間或空間單元層面具有聚集性[7];聚類分析側重于按某一事件數據對月份進行不同層次的歸類[8];圓分布法除得出具有聚集性外還推算出具體的發病高峰[9]。從方法的繁易程度看,聚類分析可通過SPSS、SAS等快速實現,最為簡便,其次是集中度分析,而圓分布法和負二項分布的計算相對繁瑣。從適用的時間范圍看,集中度分析最為局限,其余三種方法適用時間范圍則廣泛、靈活[10]。負二項分布常用于傳染病空間與時間聚集性的分析[11],有文獻曾用于釘螺分布的擬合[12],這種方法關注的時間單位可以為時、日、周、年等,關注的空間單位可以是縣、鄉、村、街道等,可得出在所關注的時間或空間單位層面發病是否具有聚集性,若有2組以上結果,可以通過聚集參數 的大小比較聚集程度。聚類分析更適宜于某一事件連續多年數據時間分布特征的分析,得出所關注時間單位的不同聚類結果。圓分布法適宜的時間范圍更廣、更靈活,關鍵是所關注的單位時間與角度的互算,同時需要進行平均角的雷氏檢驗,這種方法最大的優點是能推算出發病高峰的時間點及不同置信度可信區間所在。
綜上所述,在衛生相關事件時間聚集性分析和判定中,根據事件特點不同、關注時間范圍不同、分析研究目的不同,可以靈活采取不同方法。若是以月份為單位進行年度分析,如對于流行性乙型腦炎、細菌性痢疾等具有顯著發病高峰季節的傳染病,用圖示法或者聚類分析即可,對于事件或疾病無顯著高峰期的,首選集中度法判定發病季節性的強弱;若研究關注的是不同年代或不同地區某事件某一數據高峰期的比較及動態變化,則首選圓分布法;若要比較前后不同時期數據聚集性強弱則可由負二項分布擬合實現。同時,應以動態變化的觀點看待衛生相關事件數據時間聚集性,其分析和判定的主要目的是為該事件存在、發生、流行等相關影響因素分析提供線索,為疾病潛伏期或者暴露時間等事件關鍵點研究提供支持,為有效控制事件發展或者疾病防制措施的制訂和完善提供科學依據。
[1]聶軼飛,王海峰,李孟磊,等.應用集中度和圓形分布法探討河南省2010年手足口病流行規律.中國衛生統計,2013,30(3):410-411.
[2]索瑞鑫,仇玉蘭,王彤.基于負二項分布的確切推斷在微核試驗數據分析中的模擬研究.中國衛生統計,2012,29(1):2-5.
[3]金丕煥.醫用統計方法.第2版.上海:復旦大學出版社,2008.
[4]張英杰,王超,曹凱,等.中國大陸2008-2010年手足口病流行特征聚類分析.中國公共衛生,2015,31(5):541-544.
[5]梁筱露,白海濤,蘇喆,等.圓形分布法分析北海市流行性感冒的季節性和長期趨勢.現代預防醫學,2015,42(8):1383-1385.
[6]雷靜,李霞,楊浩,等.應用集中度分析銀川市2004-2010年細菌性痢疾的發病季節和年齡分布特征.寧夏醫學雜志,2012,34(1):60-62.
[7]孫建偉,陳豪敏,許汴利.河南省2010年縣區層面狂犬病病例空間聚集性的Poisson分布與負二項分布擬合.鄭州大學學報(醫學版), 2012, 47(1):98-100.
[8]李亮,梁祁,祁賢.江蘇省2009年手足口病流行特征的聚類分析.江蘇預防醫學,2010,21(6):4-6.
[9]張世勇,高秋菊.圓形分布法分析石家莊市2004-2010年布魯桿菌病的高發季節.中國人獸共患病學報,2012,28(3):312-314.
[10]李凱杰,林文,范志誠,等.湖北省間日瘧發病與傳瘧按蚊關系的圓形分布法分析.中華疾病控制雜志,2015,19(10):983-985.
[11]韓新煥.負二項分布的性質特征及在流行病學研究中的應用.數理醫藥學雜志,2009,22(2):138-140.
[12]張志杰,彭文祥,Ong Senghuat,等.廣義負二項分布對釘螺分布的擬合.中國衛生統計,2008,25(1):2-6.
(責任編輯:張 悅)
河南省醫學科技攻關計劃項目(201503193)
1.河南省疾病預防控制中心傳染病預防控制所(450016)
2.河南省桐柏縣疾病預防控制中心
△ 通信作者:黃學勇,E-mail:hxyzzu@163.com