武漢理工大學統計學系(430070) 王仲君 鄒亞娟 趙華玲
基于空間自相關的肺結核擴散的機理分析*
武漢理工大學統計學系(430070) 王仲君 鄒亞娟 趙華玲
目的 肺結核是我國重大傳染病之一,研究其分布特征與擴散機理對預防和控制肺結核的傳播具有非常重要的意義。方法 本文以中國大陸31個省級行政區的肺結核擴散為研究對象,采用空間統計學中單變量的全局和局部空間自相關分析、雙變量的全局空間自相關分析方法研究肺結核擴散的機理。結果 研究結果表明,在時-空關系方面,肺結核的擴散在總體上呈地區間的顯著正相關性,且相關性有增強趨勢;聚集狀況方面得到了肺結核的聚集區域和離散區域的分布狀態;社會人文因素影響方面,肺結核的擴散與個人的受教育程度、衛生技術人員數、居民存款、地區GDP、城市綠化率、清掃保潔面積以及人均食品支出呈顯著的負相關關系,相關性依次遞減。結論 空間自相關分析方法很好地研究了肺結核的時空分布特征及其擴散相關因素的影響。本文的研究為有關部門提供了預防和控制疫情擴散的科學依據。
肺結核擴散 機理分析 空間自相關 Moran's I
隨著空間統計學的產生以及在各個研究領域的廣泛應用,空間統計學近年來得到了飛速發展。在流行病的研究中,除了不斷創新改進傳統的SIS和SIR〔1-3〕模型外,利用各種空間統計分析方法進行疾病的空間聚集性、影響因素的探討也逐漸發展起來〔4〕,如楊國靜等人曾利用Moran's I統計量對血吸蟲病患者與釘螺分布的空間自相關性進行了研究〔5〕,成月佳等人曾進行基于GIS技術的江蘇省傷寒、副傷寒疫情的空間分析〔6〕等。但目前空間統計分析在傳染病研究中的應用主要集中于血吸蟲病、瘧疾、鼠疫等疾病,其他方面尚未深入〔4〕。
肺結核是由結核分枝桿菌引發的肺部感染性疾病,是嚴重危害人民群眾健康的呼吸道傳染病,被列為我國重大傳染病之一,是一種比較常見的慢性流行病。本文選取中國肺結核的擴散為研究對象,利用空間自相關的研究方法和GeoDa0.95i軟件,對2005-2009年中國內陸31個省市自治區的肺結核發病情況進行研究,探討肺結核擴散的規律和相關影響因素,并提出有針對性的建議。
因香港、澳門、臺灣的數據很難獲取,本文只采用了中國大陸31個省市自治區的肺結核發病率、死亡率和病死率數據進行研究,包括2005-2009年各地區的肺結核數據,及1997-2009年全國的肺結核數據。另外,本文還選取了可能與肺結核擴散相關的12項指標數據:地區生產總值(GDP)、地區流動人口數、地區每千人口衛生技術人員數、城市人口密度、各地區城市清掃保潔面積、城市建成區綠化覆蓋率、各地區人均受教育年限、城鄉居民人民幣儲蓄存款、人均日生活用水量等。這些數據均從《中國衛生統計年鑒》網站中獲取。
從我國1997-2009年各年肺結核發病率、死亡率和病死率統計結果可知,我國肺結核的發病率在2002年之前呈現比較平穩的狀態,此后,發病率呈線性遞增,2005年達到高峰,此后有所下降,從2006年以后又出現比較平穩的狀態并有下降的趨勢。而在2004年之前,肺結核死亡率、病死率比較平穩,2004-2007年,數據增加得比較快,2008年有所下降,2009年又呈現上升趨勢。從肺結核在各地區的發病情況來看,新疆維吾爾自治區的發病率最高,貴州省次之,海南省、廣東省、重慶市、甘肅省的發病率也較高。
空間統計學的主要思想在于空間中距離較近的數據通常比距離較遠的數據具有更高的相似性〔7〕。空間自相關是指一些變量在同一個分布區內的觀測數據之間潛在的相互依賴性。本文利用全局空間自相關分析研究肺結核發病率的總體空間差異。空間自相關分析首先需引入一個n×n的空間權重矩陣W,以表達各個位置之間的空間鄰近關系,最常用的為二進制鄰接空間權重矩陣,其定義是以地區之間的鄰接關系為基礎的,具體定義為:

全局空間自相關分析即用來研究對象的某一種屬性值在整個研究區域上的空間分布狀態,最常用的統計量為Moran's I。Moran's I指數的數學表達式為:


本研究根據各地區之間的鄰接關系,建立了二進制鄰接空間權重矩陣W,使用Moran's I指數研究中國內陸31個省市的肺結核發病率的總體空間差異。利用GeoDa0.95i軟件,對2005-2009年我國的肺結核發病率數據進行研究,得到全局空間自相關分析結果如表1和圖1所示。
表1給出了我國2005-2009年肺結核發病率的Moran's I系數,由此可以看出,Moran's I指數始終為正值,且均具有統計學意義,指數值總體呈增加趨勢。表明我國各省市肺結核的空間分布并不是完全隨機的,而是具有地區間的正相關性,即肺結核發病率較高的省市相對地趨于與發病率較高的省市相鄰,或發病率較低的省市相對地趨于與發病率較低的省市相鄰,且總體相關性呈增加趨勢。

表1 中國2005-2009年肺結核發病率Moran's I系數及統計學差異檢驗統計表
圖1為2005-2009年肺結核發病率的Moran散點圖,由圖可以看出,從2005-2009年圖中散點的總體分布情況變化不大,各年分布在第四象限的點很少,第二象限次之,大部分的點都集中分布在坐標軸附近和第一、三象限。2005年處于第一象限的地區有:黑龍江省、陜西省、湖北省、重慶市、四川省、貴州省、江西省、廣西壯族自治區、廣東省。處于第三象限的地區有:北京市、天津市、河北省、遼寧省、山東省、江蘇省。處于第二象限的地區有:甘肅省、寧夏省、青海省、云南省。處于第四象限的地區有:內蒙古自治區、河南省。而到2009年,處于第一象限的地區為:新疆維吾爾自治區、西藏自治區、青海省、甘肅省、湖北省、湖南省、重慶市、貴州省、廣西壯族自治區、廣東省。處于第三象限的地區為:遼寧省、河北省、北京市、天津市、山東省、山西省、江蘇省、浙江省、安徽省。處于第二象限的地區有:寧夏回族自治區、云南省、福建省。處于第四象限的地區有:吉林省。其他的省基本處于坐標軸附近。從2005年至2009年,第一象限和第三象限的點分別增加了1個、3個,而第二、四象限的點則都相應減少。到2009年,低-低型地區仍然集中在以北京、江蘇等為中心的省市,并且新增了浙江、安徽、山西三個省。高-高型地區由2005年分布比較分散的幾個省市逐漸變為集中分布在西北地區的新疆、青海、甘肅省,華中地區的湖北、湖南省,西南地區的西藏、重慶、貴州省,以及華南地區的廣東和廣西這幾個地區。由此說明地區之間的影響越來越明顯,相鄰地區的值越來越趨于相近,導致地區整體的相關性越來越顯著,與全局Moran's I值的變化趨勢是一致的。
局域空間自相關是對地理屬性值在某一個部分區域上的空間特征描述〔9〕,較常用的方法是空間聯系的局部指標(LISA)和Moran散點圖分析。對于第i個空間單元,局域Moran's I指數(LISA)的計算公式為:

本研究采用單變量的局部自相關分析方法研究我國各省市肺結核發病率的聚集狀況。表2為進行中國各省市自治區肺結核發病率的局部Moran's I分析得到的圖形結果。表2中左邊的圖形為局部空間自相關的聚類圖,地圖上不同的顏色分別代表了具有空間自相關有統計學差異的地區所屬的區域類型(高-高、低-低、低-高、高-低)。右邊的圖形為局部空間自相關有統計學差異地圖,不同的顏色代表不同程度的差異。
從表2中可以很直觀地看出不同地區肺結核流行的特征和統計學差異程度,2005年全國各地區的肺結核發病率均較低,僅有幾個低-低型和低-高型區域具有統計學差異。從2006年開始,開始有高-高型區域顯著,表明肺結核發病率較高的某幾個省市已經逐漸開始影響到周圍的省市。從圖中還可以很直觀地看出聚集區域(即高-高型、低-低型集中的區域)及離散區域(高-低型、低-高型集中的區域)分別集中的省市。以2009年為例,存在兩個空間聚集區,即分別以湖南省和青海省為中心的高-高型聚集區域,和分別以北京市、天津市、河北省、江蘇省為中心的低-低型聚集區域。而云南省、海南省則為低-高型離散區域,這幾個省市周圍的地區的屬性值明顯不表現為與該地區屬性值的相似性。而從2005至2009年,低-低聚集區域所包含的省市及數量沒有太大變化,但是高-高型地區數目從0個逐漸增加為2個。

圖1 2005-2009年肺結核發病率的Moran散點圖
本文利用雙變量空間自相關分析研究肺結核擴散與其他因素的相關關系。雙變量空間自相關分析所產生的Moran's I值是用所有相鄰位置的加權平均值評估一個位置的x變量值與其他變量的相關程度。在點陣數據中的兩個標準隨機變量zk和zl之間的空間自相關系數〔10〕的計算公式為:


本文選取幾個可能與肺結核的擴散有關的社會經濟等指標,利用GeoDa0.95i軟件提供的雙變量空間自相關分析方法,研究肺結核發病率與這些因素之間的相關性。分別從社會、環境、個人三個層面選取可能相關的指標,以2009年的數據為研究對象。社會方面選取地區GDP、地區財政人均社會保障和就業支出、地區財政人均醫療衛生支出、地區流動人口數、地區每千人口衛生技術人員數、城市人口密度這6項指標。環境方面選取各地區城市清掃保潔面積、城市建成區綠化覆蓋率兩項指標。個人方面選取各地區人均受教育年限、城鎮居民平均每人全年食品支出、城鄉居民人民幣儲蓄存款、人均日生活用水量這4項指標。
所選取的12項指標分別與肺結核發病率的全局自相關系數及統計學差異程度檢驗結果進行匯總后如表3所示。從表3中12個變量分別與肺結核發病率的雙變量全局空間自相關分析結果可以看出,除了社會保障支出、醫療衛生支出、流動人口數、城市人口密度、人均日生活用水量這幾個變量沒有通過統計學差異檢驗外,其他的變量與肺結核發病率之間都具有統計學意義上的相關性(P值均小于0.05),并且都呈較強的負相關性。且從表3中的負相關系數大小及統計學差異強弱可以看出,個人的受教育程度、衛生技術人員數、居民存款、地區GDP、城市綠化率、清掃保潔面積以及人均食品支出與肺結核的相關性和統計學差異依次遞減。
本文對中國2005-2009年肺結核擴散的機理進行了探索性研究,分別從時-空關系、聚集狀況、相關因素影響這三個方面進行研究,得到肺結核擴散機理的幾點結論:(1)我國各地區肺結核的擴散不是完全隨機的,總體上表現為地區之間顯著的正相關影響,即相鄰地區之間有一定的正影響,且有越來越強的影響趨勢。(2)逐漸形成越來越多的聚集性區域(高-高型、低-低型區域)。現階段主要形成了以經濟比較發達的北京、天津、江蘇等為中心的低-低型區域,也形成了以湖南省、青海省為中心的高-高型區域。(3)肺結核的擴散還受到很多其他社會環境等方面因素的影響,與個人的受教育程度、衛生技術人員數、居民存款、地區GDP、城市綠化率、清掃保潔面積以及人均食品支出呈顯著的負相關關系,且相關性和統計學差異依次遞減。

表2 2005-2009年各地區局部空間聚集性示意圖和統計學差異水平圖匯總表

表3 各變量分別與肺結核發病率作雙變量全局空間自相關分析結果
針對以上研究結論,提出以下幾點建議:(1)肺結核發病率比較高的地區尤其要加強對肺結核的控制和預防力度,并對肺結核患者的活動范圍加以適當的限制,減少肺結核在本地區內的擴散,也減輕對周圍地區的影響。(2)加強“科教興國”的戰略觀念,提高居民的受教育程度,并向廣大群眾大力開展肺結核的宣傳教育工作,提高個人的公共衛生素質。(3)在社區或鄉村多設立衛生服務與監測機構,配備專門的衛生技術人員和疫情信息統計人員。應督促居民進行定期體檢,并定期向上級部門反映該地區的疫情統計情況。(4)發展經濟是控制肺結核擴散的關鍵,提高地區GDP、居民個人的存款、居民的生活水平等,同時也能促進教育工作的開展。(5)環保部門抓好環境衛生工作是控制肺結核擴散的根本。增加城鄉的綠化覆蓋率,尤其是在人流量比較多的地方。搞好公共場所的清掃保潔工作,減少病菌寄存的幾率,也利于促進居民個人提高公共衛生的意識。
目前關于流行病的研究采用微分方程和復雜網絡方法的比較多,利用空間統計學的方法進行流行病疫情研究的也在逐漸發展起來,但大多只進行基于探索性空間數據分析的疫情時空聚集性研究。本研究在時空聚集性研究的基礎上,還將可能影響流行病擴散的其他地理、人口、環境、經濟等因素考慮在內,進行雙變量的空間自相關分析,得到各因素與流行病擴散的相關關系程度,以對流行病的預防和控制提出更有針對性的建議。未來的研究將結合更深入的空間統計學方法,如:趨勢面分析、空間自回歸模型、空間誤差模型及參數的估計檢驗等,對流行病的擴散機理進行研究,得到更加全面而精準的結論,并對流行病的擴散起到一定的預測作用。
1.汪魯華,翟麗艷,翟麗杰.傳染病全球化的原因影響及策略.中國健康月刊,2011,(9):352-353.
2.許田,張培培,姜玉梅,等.流行病傳播模型與SARS.自然雜志,26(1):20-25.
3.劉洪濤.艾滋病及狂犬病的數學模型及其動力學分析.蘭州:蘭州大學,2008年5月.
4.馮軍,吳曉華,李石柱,等.空間統計分析方法及相關軟件在傳染病研究中的應用.中國血吸蟲病防治雜志,2011(2):217-220.
5.楊國靜,周曉農,汪天平,等.安徽、江西及江蘇3省血吸蟲病患者與釘螺分布的空間自相關分析.中國寄生蟲學與寄生蟲病雜志,2002(1):6-9.
6.成月佳,丁克琴,鮑昌俊,等.基于GIS技術的江蘇省傷寒、副傷寒疫情空間分析.中國衛生統計,2011(6):632-637.
7.黃信誠.空間統計簡介.自然科學簡訊(臺灣),2000,12(3):101-104.http;//nr.stpi.org.tw/ejournal/NatSciNews/v12n3/101-104.pdf.
8.Carlo Gaetan,Xavier Guyon.Spatial Statistics and Modeling.Springer:2009.
9.龔雙輝.空間統計分析及在區域經濟中的應用.武漢:華中科技大學,2007年5月.
10.Astutik S,Rahayudi B,Iskandar A,et al.Detection of Spatial-Temporal Autocorrelation using Multivariate Moran and Lisa Method on Dengue Hemorrhagic Fever(DHF)Incidence,East Java,Indonesia.European Journal of Scientific Research,2011,49(2):279-285.
Spatial Autocorrelation for Mechanism Analysis of Tuberculo-sis Spreading
Wang Zhongjun,Zou Yajuan,Zhao Hualing.Wuhan University of Technology,Department of Statistics(430070),Hubei
ObjectiveTuberculosis is one of the major infectious diseases in our country.To study the distribution and diffusion mechanism of tuberculosis has very important implications for preventing and controlling its spreading.MethodsThis paper studies the spreading mechanism of tuberculosis using the global and local spatial autocorrelation analysis,bivariate spatial autocorrelation analysis,and with the tuberculosis spreading in 31 provinces in Chinese mainland as an example.ResultsThe results show that,in spatial-temporal relation analysis,the distribution of tuberculosis presents significant positive correlation between regions in general,and the correlation will strengthen in the trend;in aggregation states research,we can find the spatial clusters and outliers.And in social and human factors analysis,personal education degree,the number of health technical personnel,the number of residents'deposits,regional GDP,urban greening rate,the cleaning area,and mean food spending show significant negative correlation with tuberculosis spreading and the correlation and significance with tuberculosis decline one by one.ConclusionSpatial autocorrelation analysis method works well in studying the spatial-temporal distribution characteristics and factors related to its spreading of tuberculosis.These results provide some scientific basis for preventing and controlling the spreading of tuberculosis.Finally,according to the research conclusion,we put forward a few suggestions.
Tuberculosis spreading;Mechanism analysis;Spatial autocorrelation;Moran's I
國家自然科學重點項目(20634030);中央高校基本科研業務費專項資金資助(2011-IV-116);中央高校基本科研業務費專項資金資助(2013-Ia-040)
(責任編輯:丁海龍)