999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的兩個代表城市上呼吸道感染與氣象要素關系及其發病風險預測研究

2023-09-07 02:07:46鄭甲煒王式功吳千鵬張祥健黃開龍
沙漠與綠洲氣象 2023年4期
關鍵詞:模型

鄭甲煒,王式功,尹 立,吳千鵬,張祥健,楊 燕,黃開龍

(1.成都信息工程大學大氣科學學院/環境氣象與健康研究院,四川 成都 610225;2.中國氣象局蘭州干旱氣象研究所,甘肅 蘭州 730020;3.中國氣象局—成都信息工程大學氣象環境與健康聯合實驗室,四川 成都 610225;4.攀枝花市中心醫院氣象醫學研究中心,四川 攀枝花 617000;5.汕頭市氣象局,廣東 汕頭 515000)

全球氣候變暖及其對人類健康的影響是當今社會的熱點之一。政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)的第五次評估報告(Assessment Report 5,AR5)明確指出:全球氣候變暖已成為不爭的事實,并且正在影響和改變每個人的生活。據報道,氣候變暖每年可在全球范圍內導致超過10 萬人死亡。若依然不能有效改善全球氣候變暖,到2030 年這個數字將變成30萬[1]。因此,將氣象學和醫學結合,探索氣象條件對人體健康的直接影響,進而對相關疾病的發病風險進行預測,助力疾病防控能力提升,具有重要的科學價值和現實意義。

以往諸多研究表明,多種疾病的誘發因素和傳播過程都和氣象條件有著密切的聯系。氣溫的變化直接影響到上呼吸道感染疾病的發病、傳播以及心血管疾病的發作[2-4]。溫度和濕度呈現典型的季節性變化特征,而一些慢性病,譬如消化系統疾病、泌尿生殖系統疾病等,它們的發病也呈現季節性變化特征[5-6]。一項針對接受住院治療和醫院看護的老人群體身體健康情況的研究表明,晝夜溫差變化會直接影響到這些老人的心血管、呼吸系統、消化系統以及泌尿生殖系統的健康狀況,甚至有可能導致老人在夜間死亡[7]。一項針對高溫對人體消化系統疾病影響的研究表明,高溫會直接影響人體消化系統,高溫情況下,尤其是當氣溫>25 ℃時,人體罹患消化系統疾病的風險驟增[8]。而濕度變化對人體健康的影響則更為直接和迅速[9]。無論是在高溫高濕還是低溫干燥的氣象條件下,人體都會感到不舒適。因此,氣象條件和人體健康必然存在著或多或少的聯系,這種聯系可用氣候舒適度表征[10]。

以往研究氣象條件對人體健康的影響,尤其是對上呼吸道感染疾病(以下簡稱“上感”)的影響主要以我國北方城市為典例,這些城市上感發病的峰值往往出現在冬季和春季。本研究選取南部沿海深圳市和西南地區攀枝花市,在地理位置和氣候特征上都與北方城市有較大區別。因此,選取這兩座城市進行研究與比較,可以部分地彌補我國以往同類研究的不足。

此外,現有研究中分析不同氣象要素與某種疾病的關系多采用逐步回歸和最優子集回歸[11]。考慮到氣象要素變化和人體疾病發病存在著一定的滯后響應效應,過去常采用廣義相加模型和分布滯后非線性模型[11-12]。這類模型的顯著優點是便于考慮滯后性,能夠很好地體現氣象要素和患病人數變化的時間序列關系,有利于結果的分析和檢驗。但缺點是預報能力不足,并且依賴數據間的回歸關系。近年來,機器學習模型憑借其強大的計算機科學方法的支撐,能有效地利用大數據建立可靠模型[13-14]。同時,機器學習模型尤其是深度學習模型不需要數據間有強回歸關系,模型便可通過學習搭建數據間的聯系,在數據間回歸關系不明顯時依然能夠給出較準確的預報。目前,機器學習模型在氣象學領域內主要被應用在對雷暴大風、短時強降雨和暴雪等極端天氣現象的短臨預報中[16-17],在大氣污染物濃度預報和大氣主要污染物類型預報等相關方向也有應用[15]。深度學習則被應用于對閃電的預報和對雷達回波圖的處理等更具挑戰性的領域[18-19]。但其在氣象醫學這一新興交叉學科領域應用的甚少。因此,本文擬在探明上呼吸道感染發病與氣象條件關系的基礎上,重點選取兩種機器學習模型(經典隨機森林模型和RNN 深度學習模型),利用兩地疾病數據和氣象數據進行訓練,并考慮了氣象數據所反映的天氣過程及其周期性特征以及與醫院就診人數的滯后響應關系。基于對試預報結果的分析和檢驗,又對兩種機器學習模型進行優選,旨在好中選優、最大限度提高預測效果、提升預測能力。

1 資料和方法

1.1 資料

資料選取深圳市某三甲醫院2014 年8 月20日—2017 年8 月16 日的到院上呼吸道感染(ICD編碼J39.900)掛號就診的病例數據,共計1 093 組238 607 例。選取四川省攀枝花市某三甲醫院2015年1 月1 日—2019 年12 月31 日到院上呼吸道感染掛號就診的病例數據,共計1 825 組629 605 例。病例數據來自國家人口與健康科學數據共享平臺(http://www.bmicc.cn/web/share/home)。在質量控制過程中已去除錄入錯誤、重復和復診。

氣象資料選取深圳市與疾病數據同期的2014年8 月20 日—2017 年8 月16 日的常規地面氣象觀測資料。選取攀枝花市與疾病數據同期的2015 年1 月1 日—2019 年12 月31 日的常規地面氣象觀測資料。數據來源于中國氣象科學數據共享服務網。包括日平均(最高、最低)氣溫、日平均(最高、最低)氣壓、日平均相對濕度、日降水量、日平均風速、日照時數等氣象要素。

借鑒前人關于氣象要素和呼吸系統疾病關系的研究,本文主要選取當地的氣溫、濕度和風速3 種與呼吸系統疾病發病密切相關的氣象要素作為分析和預報因子。

1.2 研究方法

1.2.1 線性相關性分析

不同氣象要素和當地醫院的上呼吸道感染發病的就診人數通常有可通過檢驗的明確的線性相關性,可用Pearson 相關系數來衡量。根據它們的Pearson 相關系數可以直觀快速地確定不同氣象要素與當地醫院就診人數的相關程度。

Pearson 相關系數計算公式:

式中:r 表示相關系數,Xi表示氣象要素,Yi表示當地醫院就診人數,n 表示樣本容量分別表示Xi、Yi的平均值。

1.2.2 平滑處理

一般天氣過程通常持續3~5 d,往往伴隨大風、降溫或降雨等天氣現象,各種氣象要素會有較大幅度的變化。為了更好地反映整個天氣過程對上感發病可能產生的影響,需對原始數據進行必要的平滑處理。平滑處理可以在濾除原始數據中小擾動的同時反映數據中天氣過程的整體效應,在一定程度上會提高數據的有效性。本研究選取了3 和5 d 兩種情況作為時間步長計算滑動平均。

1.2.3 隨機森林(Random Forest)模型

隨機森林(Random Forest,以下簡稱“RF”)模型是一種基于決策樹的經典機器學習模型(圖1)。一個完整的隨機森林模型通常包含了大量的決策樹,這些決策樹會形成一個整體,對輸入數據進行訓練和學習并生成輸出數據[20]。在一次完整的隨機森林學習過程中,模型首先會對輸入數據進行套袋,即將完整的數據按照一定的方式(隨機或按序列)進行分裝。數據完成套袋后統一進行分配,在每個決策樹中進行訓練[21]。這樣的分配方式可以保證每個決策樹都盡量得到相同數量的訓練數據。每個決策樹單獨完成訓練之后,所有訓練結果被匯總并統計,隨后給出一個預測結果。該預測結果可用于和實際數據進行比較,來檢驗模型的預報能力。隨機森林模型的優勢在于可以調整模型的訓練細節,通過對決策樹的適當限定和修正來防止模型過擬合[22-24]。

圖1 隨機森林模型訓練和測試過程

1.2.4 RNN(Recurrent neural network)模型

遞歸神經網絡模型(RNN 模型)源自前饋神經網絡模型。RNN 模型可以使用其內部狀態(內存)來處理可變長度的輸入序列[25]。RNN 模型能夠利用輸入數據對模型本身完成多次重復性的訓練,最終的訓練結果取決于所有先前的計算和輸入。選取一個恰當的訓練次數,可以防止模型過擬合。RNN 模型在執行具有時間序列性的預測任務時能夠展示出強大的計算和預報能力。

圖2 為基本RNN 模型的結構。xt,st和ot分別是時間t 的輸入、隱藏狀態和輸出。U、V、W 是所有步驟/時刻共享的網絡參數,用于計算隱藏狀態和輸出。作為網絡的存儲單元,st是通過上一步的隱藏狀態和當前步驟的輸入獲得:

圖2 基本RNN 模型結構展示

激活函數f 通常是非線性的;初始的隱藏狀態通常會用全零初始化,作為時間t 的輸出。

為避免出現過度擬合現象,本次研究中在常規訓練誤差中加入了Validation 誤差(檢驗誤差)來決定何時終止重復訓練,以保證恰當有效的預報結果。

1.2.5 數據樣本劃分

為保證模型獲取足夠的樣本進行訓練,同時留恰當的樣本對模型給出的試預報結果進行檢驗比較,本文在綜合考慮并試驗了幾種不同的數據樣本劃分方法后,優選了將數據樣本序列按8∶2 的比例進行劃分。即按時間順序選取前80%的數據樣本對模型進行訓練,保留后20%的數據樣本對模型進行試預報檢驗。劃分后的數據樣本集即可直接用于RNN 模型的訓練,但是,基于隨機森林模型的特殊訓練方式,還需將劃分后用于訓練的數據再次進行劃分。依據對深圳市和攀枝花市上呼吸道感染發病年際變化特征的分析,本文對深圳市的氣象要素和患病人數數據分別按9 月—次年2 月、3—8 月進行劃分。將9 月—次年2 月的數據樣本集稱為深圳市就診人數下降趨勢數據樣本集;將3—8 月的數據樣本集稱為深圳市就診人數上升趨勢數據樣本集。同理,對攀枝花市的氣象條件和患病人數數據分別按照1—6 月、7—12 月進行劃分。將1—6 月的數據樣本集稱為攀枝花市就診人數下降趨勢數據樣本集;將7—12 月的數據樣本集稱為攀枝花市就診人數上升趨勢數據樣本集。

2 結果分析

2.1 上呼吸道感染發病的月際變化特征分析

2014 年8 月—2017 年8 月深圳市上感就診人數共計239 293 人次。如圖3 所示,深圳市上感的逐月就診人數呈明顯的年變化特征。2 月出現一個谷值,這可能與中國傳統節日春節有密切關系。此時有大量外地務工人員回家探親。之后,就診人數出現了大幅反彈,3—7 月上感就診人數增幅較大,并在7月達到峰值,反映出深圳市居民受熱不舒適度氣候條件的影響較大。

圖3 2014—2017 年深圳市上呼吸道感染月發病就診人數變化特征

2015 年1 月—2019 年12 月攀枝花市上感就診人數共計629 605 人次。如圖4 所示,攀枝花市上感的逐月就診人數同樣呈明顯的年變化特征。上半年(1—6 月)上感就診人數呈波動式下降,6 月降到谷值;從7 月開始上感就診人數又呈波動式增加,次年1 月達到最大峰值。另外,2018 年12 月當地上感就診人數達到峰值(接近2 000 例)。

圖4 2015 年1 月—2019 年12 月攀枝花市上呼吸道感染逐月發病人數的變化特征

2.2 上呼吸道感染發病人數與氣象要素關系的分析

借鑒以往的研究,直接使用氣象數據與上感就診人數數據間的線性關系進行分析的效果并不理想,但對數據間的線性關系進行分析依然能夠對選取恰當的數據輸入后續模型提供必要的參考。采用線性關系更強的數據對機器學習模型進行訓練可以減少訓練時間,提高訓練結果。因此,本研究首先評估了深圳市和攀枝花市1~6 d 的滯后時段,分別計算了3 和5 d 滑動平均日平均氣溫、日平均相對濕度和日平均風速與上感就診人數的Pearson 相關系數(表1~4)。

表1 深圳市3 d 滑動平均氣象要素在不同滯后時間與上呼吸道感染發病就診人數的Pearson 相關系數

表2 深圳市5 d 滑動平均氣象要素在不同滯后時間與上呼吸道感染發病就診人數的Pearson 相關系數

表3 攀枝花市3 d 滑動平均氣象要素在不同滯后時間與上呼吸道感染發病就診人數的Pearson 相關系數

表4 攀枝花市5 d 滑動平均氣象要素在不同滯后時間與上呼吸道感染發病就診人數的Pearson 相關系數

深圳市溫度和相對濕度與上感發病人數的相關系數絕對值均<0.4,但顯著性檢驗結果表明兩者均與上感發病存在強相關;攀枝花市溫度和風速與上感發病人數的相關系數絕對值均<0.43,但顯著性檢驗結果表明兩者均與上感發病存在強相關。深圳市風速均與上感發病只存在弱相關或不存在相關;攀枝花市則是濕度與上感發病的相關性會隨著滯后時段的增加而減弱,在當天和滯后1 d 時存在強相關,在滯后2 和3 d 時存在弱相關,在滯后超過3 d時則不存在相關。以表中相關系數的強弱和顯著性檢驗結果為依據,綜合考慮三者體現出的不同滯后響應關系,本研究最終選取滯后時間為1 的3 d 滑動平均數據作為深圳市典型數據用于機器學習模型的訓練和試預報;選取滯后時間為當天的5 d 滑動平均數據作為攀枝花市典型數據用于機器學習模型的訓練和試預報。

2.3 基于隨機森林模型訓練和預報的結果分析

對深圳市和攀枝花市按上述數據劃分方法劃分后,采用隨機森林模型進行訓練和檢驗,其結果見圖5,訓練誤差和檢驗結果見表5 和表6。

表5 基于隨機森林模型使用分類數據對深圳市上呼吸道感染發病風險試預報檢驗結果

表6 基于隨機森林模型使用分類數據對攀枝花市上呼吸道感染發病風險試預報檢驗結果

圖5 基于隨機森林模型使用分類數據對上呼吸道感染發病風險試預報檢驗結果(a、b 為深圳市,c、d 為攀枝花市)

結果顯示,基于分類數據構建的隨機森林模型能較好地預報大部分情況下兩地的就診人數變化情況。同時,隨機森林模型能夠較為準確地識別就診人數的變化趨勢,但針對極值的試預報存在極大值預報結果偏低、極小值預報結果偏高的情況,呈現出較大的預報誤差。但從整體結果上來看,隨機森林模型能夠提供具有一定指導意義的試預報結果,但預報結果的準確率還有待進一步提高。

2.4 基于RNN 模型訓練和試預報的結果分析

將深圳市和攀枝花市典型數據按數據劃分方法劃分后,利用RNN 模型進行訓練和檢驗,訓練次數分別設置為50 次(圖6a、6c)和300 次(圖6b、6d),并對試預報結果進行檢驗。訓練誤差和檢驗結果見表7~8。

表7 基于RNN 模型訓練50 次時對上呼吸道感染發病風險試預報檢驗結果

表8 基于RNN 模型訓練300 次時對上呼吸道感染發病風險試預報檢驗結果

圖6 基于RNN 模型對上呼吸道感染發病風險試預報檢驗結果(a、b 為深圳市,c、d 為攀枝花市)

深圳市、攀枝花市上感發病風險RNN 模型試預報檢驗結果顯示,與隨機森林模型試預報結果相比,該模型對上感就診人數有很好的預報效果,試預報就診人數和實際就診人數契合度高,在峰值預報上有較明顯的改進。通過比對訓練誤差和Validation誤差(檢驗誤差),發現兩者相差不大,說明RNN 模型沒有出現過擬合的現象,模型有效。試預報誤差主要分布在上感就診人數的峰值和谷值。同時比較50和300 次訓練所得試預報結果發現,提高RNN 模型訓練次數可以有效提高模型的預報。

通過對比隨機森林模型和RNN 模型(表5~8)的具體訓練誤差和檢驗誤差可知,RNN 模型的試預報能力明顯好于隨機森林模型,大部分情況下RNN模型給出的試預報結果與實際就診人數基本吻合。但是,對于RNN 模型在上感就診人數的峰值和谷值的試預報上仍然存在有誤差,且該誤差無法通過增加訓練次數來完全消除,有待后續工作中增加樣本、改進方法等多措并舉來進一步改進與提高。

3 結論與討論

本文對華南地區深圳市、西南地區攀枝花市2個不同氣候區上呼吸道感染發病特征及其與氣象條件關系分析的基礎上,進而對其發病風險預測進行了探究,主要得出以下結論:

(1)2014 年8 月—2017 年8 月深圳市上感發病集中在3—7 月,8—12 月發病人數相對較少,谷值出現在2 月(可能與深圳市外來人口多,大批人員返鄉過春節有關),以熱不舒適效應為主導。2015 年1 月—2019 年12 月攀枝花市上感發病集中在11月—次年1 月,夏半年(4—9 月)發病人數相對較少,谷值出現在6 月,以冷不舒適效應為主導。

(2)日平均氣溫的變化對兩地上呼吸道感染發病的影響最明顯,當日平均氣溫>25 ℃或者<10 ℃時,兩地上呼吸道感染發病風險明顯上升;影響次之的是日平均風速,風速的大小可側面反映當地的大氣擴散條件和舒適感,進而對上呼吸道感染發病產生影響;日平均相對濕度和日平均氣溫的協同作用對人體舒適度產生影響,同樣也會影響人群上呼吸道感染發病情況。

(3)運用隨機森林機器模型和RNN 深度學習模型對深圳市和攀枝花市兩地上呼吸道感染發病風險進行預測研究。結果表明,兩種方法均能通過所構建的預測模型,有效地運用相關氣象資料預報上感發病人數的變化情況。使用隨機森林模型時需要根據當地氣候特點和上感發病特征對數據進行分類,預報結果雖然存在誤差,但也能夠反映上感發病變化趨勢。使用RNN 模型時無需對數據進行分類,且能給出更為準確的患病人數試預報結果,只在峰值和谷值處存在部分誤差。與隨機森林模型相比,RNN模型在運用氣象資料預報上呼吸道患病人數方面精度更高,表明其在健康氣象領域內將有更好的應用潛力。

與國內外同類研究所表現出的不足之處有相似性,即隨機森林和RNN 兩種方法所構建的預測模型,對峰值和谷值的預測有缺陷,即預測的峰值偏低、而谷值則往往偏高;相比之下RNN 方法比隨機森林方法對峰值和谷值的預報誤差要小得多,但仍需通過多種方法進一步改進提高。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲三级影院| 极品国产一区二区三区| 久青草国产高清在线视频| 亚洲av片在线免费观看| 91精品啪在线观看国产60岁| 亚洲an第二区国产精品| 久久香蕉国产线看观看精品蕉| 中文字幕66页| 国产精品久久久久久久伊一| 国产精品亚欧美一区二区三区| 欧洲日本亚洲中文字幕| 91系列在线观看| 国产真实二区一区在线亚洲| 狠狠干综合| 99热亚洲精品6码| 国产精品无码久久久久久| 亚洲成人网在线播放| AV天堂资源福利在线观看| 午夜免费小视频| 亚洲色图另类| 狠狠色丁香婷婷综合| 精品国产网站| 国产呦精品一区二区三区下载 | 成年网址网站在线观看| 国产人成乱码视频免费观看| 欧美国产在线看| 日本高清在线看免费观看| 国产精品爽爽va在线无码观看| 不卡视频国产| 久久国产毛片| 国产精品熟女亚洲AV麻豆| 99精品久久精品| 国产aⅴ无码专区亚洲av综合网| 亚洲综合色婷婷中文字幕| 制服丝袜国产精品| 久久夜色精品国产嚕嚕亚洲av| 全部无卡免费的毛片在线看| 精品自窥自偷在线看| 人人爽人人爽人人片| 亚洲第一香蕉视频| 91区国产福利在线观看午夜| 免费一级毛片| 久久天天躁狠狠躁夜夜2020一| 午夜欧美理论2019理论| 国产精品爽爽va在线无码观看| 精品乱码久久久久久久| 亚洲乱伦视频| 色综合激情网| 久久精品免费国产大片| 亚洲熟女偷拍| 亚洲丝袜第一页| 久久青青草原亚洲av无码| AV不卡国产在线观看| 色一情一乱一伦一区二区三区小说 | 色综合国产| 极品国产一区二区三区| 亚洲一本大道在线| 在线看片免费人成视久网下载| 2019国产在线| 精品国产自在现线看久久| 国产丝袜无码精品| 国产亚洲精久久久久久无码AV | 国产精品55夜色66夜色| 国产成人精品一区二区三区| 日韩无码视频专区| 青青草原国产一区二区| 色亚洲激情综合精品无码视频| 中文字幕啪啪| 日本午夜网站| 亚洲精品第五页| 国产白浆视频| 午夜毛片免费看| 精品自拍视频在线观看| 亚洲精品成人7777在线观看| 久久久国产精品无码专区| 国产在线日本| 亚洲中文字幕精品| 97国产在线观看| 高清无码一本到东京热| 丁香婷婷在线视频| 日本精品视频一区二区| 亚洲成aⅴ人在线观看|