胡 森,李松廉,蔡忠亮
(1. 武漢大學資源與環境科學學院,湖北 武漢 430079)
疾病、健康和衛生事件等公共衛生數據往往具有空間屬性。通過地理信息系統和空間分析技術,分析公共衛生數據的空間分布規律,探究其影響因素,能為疾病防治、衛生服務等提供優化策略,并輔助公共衛生管理[1]。該領域逐漸形成了空間流行病學,而時空熱點分析作為時空數據挖掘的重要方法,也已廣泛應用于公共衛生領域,用于揭示相關數據的時空聚集性與時空分布規律[2-9]。
急救事件的發生往往存在熱點時段,并具有一定的周期性。如煙臺市開發區“創傷”呼救統計結果顯示,7~9 月高發,且早晨7:00~10:00 和夜間20:00~23:00 為呼救高峰[8]。但傳統流行病學分析框架下急救事件時間分布規律的分析往往為以折線圖、柱狀圖為代表的一維分析。這種分析方式忽略了不同時間周期的交互關系[9-10]。
基礎的熱圖以二維矩陣的形式,通過單元格色彩變化來直觀地顯示數據,常用于顯示不同變量的組合模式、檢測彼此間是否有相關性,可在Excel 軟件中制作。當橫軸與縱軸均取不同的時間周期變量時,熱力圖即為時間熱點分析圖。一般可取橫軸為以小時為單位的時間周期,取縱軸為以天為間隔的星期循環,統計不同時間維度上的急救時間數量。為優化基礎時間熱點分析圖的視覺效果,可采用插值方法將離散網格連續化,形成平滑的時間熱點分布圖,而等值線的加入同樣可以輔助時間熱點分析結果的判讀。
空間熱點分析涉及“熱點識別”和“密度分析”兩個概念,其結果分別對應“熱點圖”和“熱力圖”[10]。二者均用于探測地理事件高發區域,但其內涵有所不同。其中熱點識別的目的是識別具有統計顯著性的熱點和冷點,相對客觀。而密度分析的目的是可視化展現地理事件發生密度,其可視化效果相對主觀。值得注意的是,熱點識別中的“熱點”與密度分析中的高值地帶無必然聯系,其內涵是高值聚集區,要求要素具有高值,且被其他同樣具有高值的要素包圍。
熱點識別的主要方法包括Getis-Ord Gi*和Local Moran’s I,其中前者更為常用,后者除熱點外還能識別異常值。Getis-Ord Gi*的原理為:在引入地理權重矩陣后,計算加權要素值與加權均值之差再除以標準差加權值。其本質是一種z值,計算公式為:

式中,xj為要素j的屬性值;wij為要素i,j的空間權重;n為要素總數;Xˉ為屬性值均值;S則為屬性值標準差。
密度分析是一類點模式分析方法,其目的是獲得要素在空間上分布的密集程度。其中最簡單的方法是“樣方計數”,即將空間劃分為網格,統計網格中要素取值的總和。但是樣方法沒有考慮空間對象間的相互作用,且輸出離散化結果。相對于樣的方法,更為常用的是“核密度估計”。它通過計算要素周圍的密度構建平滑表面,從而實現了從離散對象模型到連續場模型的轉變。具體而言,空間中某點急救事件密度等價于該點鄰域范圍內急救事件核密度函數的貢獻之和。急救事件x的核密度函數可表示為:

式中,h為核函數帶寬;k(?)高斯正態分布形式的核函數;x-xi為兩事件間距離。
本文所使用的武漢市核心城區行政區劃、水系數據等空間基礎數據來源于“武漢市第一次地理國情普查”,2014年疾病總覽數據和詳細數據來源于武漢市急救中心,其中2014年疾病總覽數據包括呼救病種、總人數、男性人數、女性人數、性別不詳人數、老年人數、中年人數、青年人數、少年人數、嬰兒人數等屬性,共103 965 條數據,其中醉酒數據5 236 條。2014 年詳細數據包括執行時間、搶救地點、診斷、出車結果等屬性,對其進行篩選可得到醉酒詳細數據,跑空率為13.4%。為執行時空熱點分析,還需要獲得醉酒呼救記錄的空間坐標。該過程共涉及三步。其一,調用百度逆地理編碼API獲得基本坐標;其二,對解析坐標與實際位置的匹配度進行人工核查,修正其中的偏差;其三,通過編程實現BD09坐標到WGS84坐標的轉換。
對篩選得到的醉酒數據分別按人口特征、空間位置、時間進行分析,可得出以下結論:從人口特征來看,男女醉酒比例約為8∶1,中年人所占比例最大,約為38%;青年人和老年人次之,約為36%和24%;從空間位置來看,41.5%的醉酒事件發生在餐廳,酒吧,KTV等地,21.7%發生在居所,36.8%發生在途中或者其他場所;從時間特點上來看,1 月為高發月,而4 月和7 月是兩個明顯低谷月。另外,節假日醉酒頻次明顯高于全年均值與工作日均值。
將武漢市2014 年醉酒呼救按其呼救時間進行劃分,用于劃分的2個時間維度分別為以1 h為間隔的日循環和以1 h 為間隔的周循環。利用Surfer 15 軟件中的等值線工具對劃分結果進一步處理生成時間熱點分析結果如圖1所示。

圖1 醉酒時間熱點分析圖
結果顯示,每晚20:00~22:00 點是醉酒高發時段,其中周五為最高峰,而周二為低谷,且周三晚醉酒高發時段跨度相對周二、周四要大。另一方面,周六、周日下午15:00左右為醉酒高發時段。
受中國酒文化影響,中國飲酒以中青年男性為主,時間集中于晚上。周五作為工作日的最后一天,與公休日相接。一方面當晚各方脫離日常工作學習,各類宴飲活動更易組織;另一方面由于后顧之憂相對較少,因此晚宴持續時間較長飲酒量較大。這兩方面的綜合作用促成了周五的醉酒高峰。周三晚醉酒高峰時段的反向延長則可能與人們周期性的工作狀態有關,而周六、周日中午醉酒高峰的出現則可能是朋友、家人間聚餐增多所導致的。
將醉酒事件空間數據導入ArcGIS,并按季節進行劃分。分別對春季(3~5 月)、夏季(6~8 月)、秋季(9~11月)、冬季(本年12月至來年2月)和全年醉酒事件執行核密度分析,參考ArcGIS官方文檔,核函數帶寬計算公式為:

式中,Dm是(加權)平均中心的(加權)中值距離;n是點的數目;SD是加權標準距離。按照上述公式計算得到核函數帶寬為1 800 m。輸出像元大小取值為實際坐標大小的1/250,計算得到輸出像元大小為25 m。核密度分析結果如圖2所示。

圖2 醉酒核密度分析圖
結果顯示春季時漢口古田四路、江漢路、西北湖、菱角湖,武昌曬湖、中南路-中北路、徐東、武鋼四十九中附近醉酒密度明顯高于其他區域;夏季時,漢口火車站、江漢路、菱角湖、武勝路,武昌螃蟹岬、光谷廣場;漢陽王家灣、蓮花湖公園以西地帶醉酒密度明顯高于其他區域;秋季時漢口長青花園、西北湖及以江漢路為核心的沿江地帶,武昌和平公園、徐東、中南路、復興路、光谷廣場醉酒密度明顯高于其他區域;冬季時漢口西北湖、武勝路、江漢路、武漢天地,漢陽王家灣、鐘家村,武昌和平公園、楊家灣、光谷廣場、中南路、黃家湖醉酒密度明顯高于其他區域。全年來看,漢口火車站-以江漢路為核心的沿江地帶、古田四路、武漢天地,漢陽王家灣、鐘家村,武昌中南路、徐東、和平公園附近、光谷廣場、黃家湖醉酒密度明顯高于其他區域。綜合來看,醉酒密度漢口>武昌>漢陽,除有漢口火車站-江漢路,漢陽王家灣、鐘家村、武昌中南路、光谷廣場、黃家湖等穩定的醉酒密度高值區域外,還有大量隨季節變化的醉酒密度高值區域。
按社區統計醉酒事件數量后,在ArcGIS中執行熱點分析(Getis-Ord Gi*),其中選用歐氏距離生成空間權重矩陣,且帶寬設置為1 800 m。熱點識別結果如圖3所示。在0.05置信水平上,漢口火車站-西北湖區域、武昌以中南路為核心的連片區域、以光谷廣場為核心的連片區域及黃家湖附近是醉酒熱點。

圖3 醉酒熱點識別圖
不論是核密度分析還是熱點識別,其指出的醉酒高密度、熱點區域均處于商業繁華地段。考慮到國內外研究均指出酒精出售點能顯著影響飲酒行為,結合熱點識別和核密度分析結果,認為醉酒事件多發于餐廳、酒店、KTV、酒吧聚集區[11-12]。而醉酒高密度區域的季節性變化可能是由于人口周期性遷徙造成的,如春節務工人員返鄉、寒暑假大學生歸家。
時空熱點分析能有效挖掘急救事件的時空聚集規律,其結論能加深對急救工作的理解,并為院前急救資源調度提供決策支持。本文中的案例研究,一方面可以作為院前急救工作人員的知識儲備,另一方面提醒急救中心在醉酒高峰時段、熱點地區調整包括人員、車輛、急救設備與對應藥物的配備。
院前急救呼救數據相對于其他公共衛生數據具有更精確和更多維度的時空屬性,因此可以使用現有空間流行病學相關方法對其時空屬性進行挖掘,也可以針對其特殊性引入新的方法和理論。