李高明 周 亮 陳虹汝 易大莉 張彥琦 伍亞舟 易 東 劉 嶺
第三軍醫大學衛生統計學教研室(400038)
基于氣象因素的手足口病系統狀態聚類方法研究*
李高明 周 亮 陳虹汝 易大莉 張彥琦 伍亞舟 易 東 劉 嶺△
第三軍醫大學衛生統計學教研室(400038)
目的利用系統狀態評估(state representation methodology,SRM)方法,描述手足口病的流行情況,探索一種新的疾病狀態聚類新方法。方法收集2010-2014年全國各省市手足口病月發病率資料及相應的氣象資料,將發病率和氣象因素視為一個系統,構建SRM模型并求解各省市的狀態分布值,然后使用層次聚類方法對不同省市區域系統進行聚類分析。結果實現了對手足口病的狀態評估,以手足口病發病率及相應的氣象資料建立SRM模型所得到的聚類分析結果,比直接使用發病率數據得到的結果更為合理。結論本文從系統的角度提出了一種疾病描述的新方法,將SRM用于手足口病數據,可以為其分析提供一個新的思路。
手足口病 氣象因素 狀態評估方法 層次聚類
手足口病(hand-food-mouth diease)是由多種腸道病毒引起,并以發熱和手、足、口腔等部位的皮疹或者皰疹為主要特征的常見傳染病[1]。該病具有傳染性強,傳播途徑復雜,地區分布又非常廣泛,且四季均可發病的特點,已成為危害人類健康的主要傳染病之一[2-3]。據2015年全國法定傳染病疫情概況顯示,上報至監測系統的手足口病發病例數接近200萬人,其發病率和死亡率均居丙類傳染病的首位[4]。目前對手足口病的防控仍缺乏相應的疫苗或特異性藥物。因此,基于手足口病發病率和氣象影響因素,劃分手足口病的不同流行區域,對疾病的分片管理和控制具有非常重要的意義。
由于手足口病發病和相關因素的關系具有復雜性、多樣性和系統性,因此,從系統生物學的角度來描述手足口病與其所處的環境狀態、氣象狀態之間的時空關系具有科學性和可行性[5-6]。本研究將引入一種新的疾病狀態分析方法-系統狀態評估(state representation methodology,SRM)[7-8],并結合聚類分析方法,建立一種新的手足口病的聚類模型。
1.資料來源
全國31個省市2010-2014年手足口病月發病率通過公共衛生科學數據中心[9]下載獲得;全國31個省市2010-2014年氣象數據資料通過中國氣象數據網[10]下載獲得,其中包括平均氣溫、平均濕度、降水量、日照時間。
2.SRM模型
系統科學角度認為,系統的數據集是該系統的一個映像,并可用結構參數來對系統進行描述。因此,可將系統的映像看作是系統的響應,或者是對應于結構上的描述。從理論角度來說,系統的結構與系統的響應是一對對偶關系,也就是“系統的響應取決于系統的結構,并可根據系統響應推導出系統結構,這種量化的對偶關系被稱為系統的狀態”。
于是對系統的定量評價是描述系統對這些激發因素的響應。所以系統的狀態是系統對刺激環境的一個響應函數。并可表示為:
ζ=f(λ,x)
(1)
其中ζ是狀態變量,λ是系統結構參數,x是系統特征向量。
3. 計算方法
(1)模型輸入數據
將不同地區手足口病的月發病率及同期的氣象資料數據作為模型的輸入數據,數據結構可以用式(2)表示:
(2)
其中,矩陣中L=1,2,…,31表示不同的省市,M表示月份數,N表示發病率和氣象資料變量數。
(2)數據標準化處理
數據的標準化處理是將數量級差異較大的數據轉換到同一個量綱范圍。在獲取的數據中,由于不同變量之間存在著很大的差異,需將數據進行標準化處理,公式如下:

(3)
本文標準化的變量有:發病率、氣溫、濕度、降水量和日照時間。
(3)狀態函數的非線性逼近

(4)求解支撐向量λ
使用核函數構建G矩陣:


(4)
將G矩陣帶入方程(4)中,使用最小二乘法則求得λ值。
(5)計算狀態值ζ
通過高斯核函數實現對狀態函數的非線性逼近,我們可以得到核函數形式下的狀態函數:
(5)
并在相同的尺度下,計算出每個省市系統的狀態值。
(6)區域分類
通過SRM模型,每個省市可以獲得一個M維的狀態向量,以這個M維的狀態向量為綜合指標,使用系統聚類方法對不同省市區域系統進行聚類分析。
本文SRM模型建立使用MATLAB(7.11.0)編程完成,聚類分析通過R(3.3.2)實現。
1.SRM狀態值計算
對每個省市使用構建的SRM模型計算狀態值,其中σ=2為SRM模型的觀察尺度,觀察尺度越大各省市狀態分布值差異越小,而尺度越小差異越大。以北京市為例SRM模型的輸入數據和求解得到的狀態值如表1所示,最終我們可以計算得到31個省市的SRM狀態值。

表1 北京市2010-2014手足口病月發病率、氣象數據和SRM狀態值
2.區域聚類分析
(1)基于發病率的聚類結果
為探討SRM模型對分類結果的影響,我們分別使用2010-2014年全國31個省市每月手足口病發病資料與各省市狀態變量值進行層次聚類,結果見圖1。
(2)聚類結果的比較
基于發病率的聚類分析中,西藏、青海、黑龍江、甘肅和新疆為一個類別。而基于系統狀態的聚類中,以溫帶季風氣候為主的黑龍江、吉林和遼寧為一個類別;以溫帶大陸性氣候為主的內蒙古、寧夏和甘肅,高山高原氣候的青海和溫帶季風氣候山西為一個類別;而溫帶大陸性氣候的新疆和高山高原氣候的西藏單獨為一類。在以亞熱帶季風氣候為主的四川、重慶、陜西、河南、湖北、安徽、江蘇、浙江、上海、江西、福建、廣東、廣西、云南、貴州和湖南的各省市,經發病率的聚類四川、重慶、河南和江西為一個類別;云南、安徽、江蘇和湖北為一個類別;貴州和陜西為一個類別;福建和湖南為一個類別;上海和浙江為一個類別;廣西和廣東單獨為一個類別。而使用系統狀態進行聚類,重慶和四川為一個類別;河南和陜西為一個類別;湖南和貴州為一個類別;江蘇、上海、浙江、安徽和湖北為一個類別;剩余的廣東、江西、福建、廣西和云南為一個類別。對比結果可以看出,經SRM模型求解狀態分布值得到的聚類結果具有區域性。

圖1 基于2010-2014年全國31個省市手足口病層次聚類圖

圖2 兩種分布地圖的比較
本聚類結果綜合了氣象信息,研究中使用2010-2014年全國31個省市手足口病發病資料以及該地區相應的平均氣溫、平均濕度、降水量和日照時間氣象資料來建立SRM模型,從另一個角度去認識手足口病與其所處的環境狀態、氣象狀態之間的時空關系。該模型可以根據現有的氣象資料來描繪手足口病的發生狀態,并可結合聚類方法對不同地區進行劃分,且聚類地區的連通性更好,為手足口病的分片管理和采取有針對性的公共衛生防御措施提供了依據,盡管如此,手足口病狀態的發生與發展受多種因素的影響,如社會因素中的經濟發展狀況、收入水平和人口流動性,以及人們的健康教育程度、職業和生活習慣等。研究還需納入更多的客觀因素才能使手足口病的狀態更具有可靠性。
系統狀態評估這種新的疾病狀態分析方法,闡述了從整體的角度對系統的狀態進行描述的一般過程。我們認為系統的狀態是系統對刺激環境的一個響應函數。根據系統學理論知識,系統的結構與響應是一對對偶關系,其實質上是一種非參數描述。并使用核函數將原始數據投影到高維空間里面去,實現狀態函數的非線性逼近。
近年來,通過數學模型來研究手足口病的發病過程得到了廣泛的應用[11-12]。本文以手足口病發病及相應的氣象資料構建模型并進行研究分析,從系統的角度描述疾病的過程,實現整體的認識和把握。從分析的結果可以看出SRM模型能夠對不同系統進行描繪,并具有很好的適應性,可以為其他疾病的時空流行情況提供新的研究思路。
[1] 衛生部.手足口病預防控制指南(2008年版).社區醫學雜志,2008,6(10):69-71.
[2] 孫軍玲,張靜.手足口病流行病學研究進展.中華流行病學雜志,2009,30(9):973-976.
[3] Wang Q,Wang ZJ.Epidemiology of hand foot and mouth disease in China,2008..Disease Surveillance,2010,27(5):438-441.
[4] 中華人民共和國國家衛生和計劃生育委員會.http://www.nhfpc.gov.cn/jkj/.
[5] Wang C,Cao K,Zhang Y,et al.Different effects of meteorological factors on hand,foot and mouth disease in various climates:a spatial panel data model analysis.BMC Infectious Diseases,2016,16(1):1-10.
[6] Pei F L,Labadin J,Bin ARS,et al.Quantifying the relationship between the climate and Hand-Foot-Mouth Disease(HFMD)incidences:International Conference on Modeling,Simulation and Applied Optimization,2011.
[7] Miyamoto A,Yabe A.State Representation Methodology(SRM)for Bridge Condition Assessment in SHM.土木工程與建筑:英文版,2012,5(4):433-443.
[8] 肖琴.系統狀態描述方法及其在艾滋病防治效果綜合評價中的應用.重慶理工大學,2013.
[9] 公共衛生科學數據中心.http://www.phsciencedata.cn/.
[10]中國氣象數據網.http://data.cma.cn/site/index.html.
[11]韋懿蕓.向量自回歸模型在手足口病發病與氣象因素的動態分析中的應用.中國衛生統計,2013,30(6):794-797.
[12]郭靜,金水高.基于復雜網絡的手足口病傳播模型研究.中國衛生統計,2009,26(1):14-17.
ClusteringAnalysisofSRMModelofHFMDBasedonMeteorologicalFactors
Li Gaoming,Zhou Liang,Chen Hongru,et al
(DepartmentofHealthStatistics,ThirdMilitaryMedicalUniversity(400038),Chongqing)
ObjectiveTo describe the development process of Hand,foot and mouth disease(HFMD)and to explore a new methodology for assessing diseases from a systematic perspective by using state representation methodology(SRM).MethodsThe monthly morbidity data of HFMD and corresponding meteorological data in the provinces and cities across China during 2010-2014 were collected;an SRM model was built to calculate the state distribution values of each province and city;then cluster analysis was carried out on the regional systems of different provinces and cities by means of hierarchical clustering.ResultsThe state of HFMD was assessed.The results from cluster analysis on the SRM model built based on morbidity data of HFMD and corresponding meteorological data showed more reasonable than the results obtained by using the morbidity data directly.ConclusionThis paper puts forward a new method for describing diseases from a systematic perspective and applies SRM to HFMD data,which provides a new thought for the analysis.
Hand,foot and mouth disease(HFMD);Meteorological factor;State representation methodology;Hierarchical clustering
國家社會科學基金(14BTJ019);國家自然基金(81473068)
△通信作者:劉嶺,E-mail:liuling_505@sina.com
劉 壯)