999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于疾病與環(huán)境科學(xué)數(shù)據(jù)的跨領(lǐng)域關(guān)聯(lián)分析及應(yīng)用

2017-03-21 08:45:32,,
關(guān)鍵詞:顆粒物關(guān)聯(lián)肺癌

,,

環(huán)境健康是醫(yī)學(xué)領(lǐng)域研究發(fā)展的一個(gè)重點(diǎn)交叉領(lǐng)域,環(huán)境對(duì)健康產(chǎn)生的影響近年來已受到國(guó)家重視,環(huán)境健康研究積極持續(xù)開展是實(shí)現(xiàn)“健康中國(guó)2030”的重要保障,尤其一些區(qū)域性高發(fā)疾病與該地區(qū)環(huán)境狀況密不可分。

本文以美國(guó)環(huán)境和健康領(lǐng)域開放科學(xué)數(shù)據(jù)為例,研究一般空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等環(huán)境因素與肺癌、哮喘等疾病的關(guān)聯(lián)關(guān)系,同時(shí)結(jié)合實(shí)際應(yīng)用場(chǎng)景可視化展示環(huán)境與疾病科學(xué)數(shù)據(jù)關(guān)聯(lián)分析結(jié)果,幫助公眾了解環(huán)境條件變化容易引發(fā)某些疾病,有助于提升公眾的疾病預(yù)防意識(shí),為復(fù)雜環(huán)境條件下疾病的預(yù)防控制提供理論依據(jù),對(duì)我國(guó)環(huán)境與健康關(guān)聯(lián)關(guān)系的研究提供借鑒,也是實(shí)現(xiàn)“健康中國(guó)2030”的重要保障。

1 數(shù)據(jù)資源

本文采用來自美國(guó)疾病控制與預(yù)防中心網(wǎng)站[1]、美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站[2]開放獲取的科學(xué)數(shù)據(jù)。數(shù)據(jù)資源分為疾病數(shù)據(jù)和空氣污染數(shù)據(jù)兩部分,疾病數(shù)據(jù)主要涉及呼吸系統(tǒng)疾病(如哮喘、肺癌等)、慢性病(如糖尿病)等,空氣污染數(shù)據(jù)包括一般空氣污染物氣體、細(xì)顆粒物與有毒物質(zhì),此外還有氣象數(shù)據(jù)。其中1999-2013年美國(guó)肺癌發(fā)病率數(shù)據(jù),包括美國(guó)全國(guó)及其各州的全種族肺癌發(fā)病率、白種人肺癌發(fā)病率、黑種人肺癌發(fā)病率、西班牙裔肺癌發(fā)病率,其中2013年數(shù)據(jù)如表1所示。

表1 2013年美國(guó)肺癌發(fā)病率數(shù)據(jù)實(shí)例(每10萬人)

從美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站獲取1990-2016年美國(guó)環(huán)境數(shù)據(jù),分別包括各州按年度、按月份、按天記錄的一般污染物氣體(如臭氧Ozone、二氧化硫SO2、一氧化碳CO、二氧化氮NO2)、細(xì)顆粒物(如PM2.5、PM10)、氣象指標(biāo)(風(fēng)速、溫度、大氣壓等)、有毒物質(zhì)(有毒空氣污染物、揮發(fā)性有機(jī)污染物、氮氧化合物等)。

2016年數(shù)據(jù)如表2所示。

表2 2016年美國(guó)空氣污染物數(shù)據(jù)實(shí)例

2 方法

利用美國(guó)呼吸系統(tǒng)疾病數(shù)據(jù)、慢性病數(shù)據(jù)和環(huán)境記錄科學(xué)數(shù)據(jù)等資源,采用空氣污染與疾病科學(xué)數(shù)據(jù)關(guān)聯(lián)分析與應(yīng)用。首先對(duì)開放獲取得到的美國(guó)疾病和環(huán)境數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,其次把兩個(gè)領(lǐng)域的數(shù)據(jù)資源整合到一起,再對(duì)整合后數(shù)據(jù)資源進(jìn)行關(guān)聯(lián)分析,以及結(jié)果的應(yīng)用場(chǎng)景分析。整個(gè)過程主要包括數(shù)據(jù)資源預(yù)處理、數(shù)據(jù)資源整合、數(shù)據(jù)關(guān)聯(lián)分析和應(yīng)用。

2.1 數(shù)據(jù)資源預(yù)處理

由于分別通過美國(guó)疾病控制與預(yù)防中心網(wǎng)站、美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站開放獲取得到疾病數(shù)據(jù)和環(huán)境數(shù)據(jù)資源,存在數(shù)據(jù)存儲(chǔ)格式多樣、空缺值、數(shù)據(jù)單位不一致等問題,會(huì)給數(shù)據(jù)資源整合及關(guān)聯(lián)分析等帶來一些不便。因此首先對(duì)不同存儲(chǔ)格式的數(shù)據(jù)文件進(jìn)行格式轉(zhuǎn)化,統(tǒng)一存儲(chǔ)格式。然后針對(duì)環(huán)境數(shù)據(jù)中的空缺值采用均值法,進(jìn)行空缺值彌補(bǔ);同時(shí)針對(duì)疾病數(shù)據(jù)資源中確實(shí)缺失的空缺值,進(jìn)行去除空缺值處理。環(huán)境數(shù)據(jù)中針對(duì)同一環(huán)境指標(biāo)單位不統(tǒng)一的問題,進(jìn)行不同單位之間換算,轉(zhuǎn)換成統(tǒng)一單位。

2.2 數(shù)據(jù)資源整合

疾病數(shù)據(jù)資源和環(huán)境數(shù)據(jù)資源是來自兩個(gè)領(lǐng)域的資源,需要對(duì)其進(jìn)行跨領(lǐng)域數(shù)據(jù)資源整合。首先按照區(qū)域把某一地區(qū)的疾病數(shù)據(jù)和該地區(qū)的環(huán)境數(shù)據(jù)對(duì)應(yīng)整合起來,再按時(shí)間(年、月、日)把該地區(qū)對(duì)應(yīng)時(shí)間內(nèi)疾病情況進(jìn)行整合,最終形成時(shí)間、地區(qū)、疾病情況、空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等維度的整合數(shù)據(jù)資源集。

2.3 數(shù)據(jù)關(guān)聯(lián)分析與應(yīng)用

對(duì)整合后的數(shù)據(jù)資源進(jìn)行關(guān)聯(lián)分析,首先采用C4.5分類算法從空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等多種危險(xiǎn)因素中尋找對(duì)疾病發(fā)生影響較大的因素[3-4],進(jìn)而利用關(guān)聯(lián)分析方法構(gòu)建這些危險(xiǎn)因素分別與疾病發(fā)生之間的關(guān)聯(lián)關(guān)系,再把這些關(guān)聯(lián)關(guān)系進(jìn)行可視化形式展示,最后結(jié)合關(guān)聯(lián)結(jié)果進(jìn)行分析,同時(shí)研究成果在中國(guó)工程科技知識(shí)中心醫(yī)藥衛(wèi)生知識(shí)服務(wù)系統(tǒng)中得以應(yīng)用。

本文利用關(guān)聯(lián)分析發(fā)現(xiàn)隱藏在整合后的環(huán)境與疾病數(shù)據(jù)集中眾多危險(xiǎn)因素與疾病發(fā)生之間的聯(lián)系。關(guān)聯(lián)關(guān)系的挖掘主要包括兩步:一是找出所有的頻繁項(xiàng)集,這些項(xiàng)集的每一個(gè)頻繁出現(xiàn)的次數(shù)至少與最小支持計(jì)數(shù)一樣;二是由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小置信度[5]。

Apriori算法是一種常用的頻繁項(xiàng)集挖掘算法。本文采用Apriori算法,使用逐層搜索的迭代方法,其中k項(xiàng)集用于探索(k+1)項(xiàng)集[5]。首先,通過遍歷掃描數(shù)據(jù)庫(kù),累計(jì)每個(gè)項(xiàng)的計(jì)數(shù),并收集滿足最小支持度的項(xiàng),找出頻繁1項(xiàng)集的集合。該集合記為L(zhǎng)1。然后,使用L1找出頻繁2項(xiàng)集的集合L2,使用L2找出L3,如此下去,直到不能再找到頻繁k項(xiàng)集。找到每個(gè)Lk需要一次數(shù)據(jù)庫(kù)的完整掃描。由找出的頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,強(qiáng)關(guān)聯(lián)規(guī)則滿足最小支持度和最小置信度,置信度計(jì)算公式如式(1)。

(1)

用項(xiàng)集的支持度計(jì)數(shù)表示置信度,其中suppport_count(A∪B)是包含項(xiàng)集A∪B的數(shù)目,suppport_count(A)是包含項(xiàng)集A的數(shù)目。由于關(guān)聯(lián)規(guī)則是由頻繁項(xiàng)集產(chǎn)生的,所以每個(gè)規(guī)則都自動(dòng)地滿足最小支持度,本文使用Weka 3.5.8軟件,設(shè)置最小支持度閾值為60%,最小置信度閾值為70%,生成的頻繁項(xiàng)集(如{PM2.5}、{PM2.5,PM10}、{PM10,NO2,SO2}等)和它們的支持度可預(yù)先存放在散列表中,便于它們被快速訪問,具體關(guān)聯(lián)關(guān)系展示見下文。

3 關(guān)聯(lián)分析結(jié)果

本文針對(duì)一般污染物氣體、細(xì)顆粒物、氣象因素、有毒物質(zhì)等環(huán)境因素與肺癌、哮喘等疾病開展關(guān)聯(lián)分析,同時(shí)把分析結(jié)果應(yīng)用到項(xiàng)目實(shí)踐中。

3.1 1999-2013年美國(guó)各州肺癌發(fā)病率與環(huán)境關(guān)聯(lián)關(guān)系

通過分別對(duì)1999-2013年美國(guó)各個(gè)州肺癌發(fā)病率與空氣污染物、細(xì)顆粒物、氣象指標(biāo)、有毒物質(zhì)等進(jìn)行關(guān)聯(lián)分析,得到如下結(jié)果。

關(guān)聯(lián)規(guī)則前件{PM2.5,PM10}、{PM2.5,SO2}、{PM2.5,SO2,NO2}、{PM10,Ozone, CO},可以推導(dǎo)出后件{肺癌},置信度分別為93%、81%、84%、79%,可以看出一般污染物氣體(Ozone、SO2、CO、NO2)和細(xì)顆粒物(PM2.5、PM10)對(duì)肺癌發(fā)病率影響較大,且隨著空氣污染物濃度和細(xì)顆粒物濃度變大,肺癌發(fā)病率也隨之增加,尤其是細(xì)顆粒物濃度對(duì)肺癌發(fā)病率的影響更加明顯,如圖1所示。

從總體趨勢(shì)上看2013年美國(guó)各個(gè)州的PM2.5濃度從低到高遞增,肺癌發(fā)病率隨之升高(但不排除個(gè)別州的PM2.5濃度高而肺癌發(fā)病率偏低的情況出現(xiàn))。與一般污染物氣體和細(xì)顆粒物相比,風(fēng)速、溫度、大氣壓等氣象指標(biāo)對(duì)各州肺癌發(fā)病率的影響不太明顯。

圖1 2013年美國(guó)各州肺癌發(fā)病率與PM2.5濃度關(guān)聯(lián)關(guān)系

3.2 1995-2010年美國(guó)加利福尼亞州哮喘患病率與環(huán)境關(guān)聯(lián)關(guān)系

對(duì)1995-2010年美國(guó)加利福尼亞州哮喘病患病率與空氣污染物、細(xì)顆粒物、氣象指標(biāo)、有毒物質(zhì)等進(jìn)行關(guān)聯(lián)分析,可以看出以下3點(diǎn)。

1995-2010年加州哮喘病患病率總體呈現(xiàn)緩慢上升趨勢(shì),而在這16年間,臭氧濃度基本穩(wěn)定,二氧化硫、一氧化碳、二氧化氮濃度呈現(xiàn)下降趨勢(shì)明顯,尤其是2000年以后二氧化硫、一氧化碳、二氧化氮等一般污染物氣體濃度下降顯著,所以1995-2010年加州哮喘病患病率增加與一般污染物氣體關(guān)聯(lián)不太大。

1995-2010年間細(xì)顆粒物對(duì)加州哮喘病患病率增加有影響,尤其是PM2.5對(duì)患病影響明顯。如圖2所示,1995-2010年加州PM2.5濃度呈上升趨勢(shì),尤其1997-1999年P(guān)M2.5濃度上升明顯,期間哮喘病患病率也在增加;2006-2008年P(guān)M2.5濃度逐年上升,哮喘病患病率也在增加;2000-2004年間哮喘患病率逐年增加,可能與1997-1999年P(guān)M2.5濃度快速上升引發(fā)患病的時(shí)滯性有關(guān)。

1995-2010年氣象指標(biāo)(風(fēng)速、溫度、大氣壓等)和有毒物質(zhì)與加州哮喘病患病率關(guān)聯(lián)不太明顯。

圖2 1995-2010年美國(guó)加州哮喘患病率與PM2.5關(guān)聯(lián)關(guān)系

3.3 可視化展示

本文基于美國(guó)疾病控制與預(yù)防中心和美國(guó)國(guó)家環(huán)境保護(hù)署的開放科學(xué)數(shù)據(jù),開展環(huán)境與疾病關(guān)聯(lián)分析,同時(shí)利用MyEclipse軟件實(shí)現(xiàn)分析結(jié)果的可視化展示,并把涉及的一般空氣污染物氣體、細(xì)顆粒物、氣象因素、有毒物質(zhì)與疾病之間的關(guān)聯(lián)分析結(jié)果已應(yīng)用到中國(guó)工程科技知識(shí)中心醫(yī)藥衛(wèi)生知識(shí)服務(wù)系統(tǒng)中環(huán)境健康板塊,其中2013年美國(guó)各州肺癌發(fā)病率分布、2013年美國(guó)各州NO2濃度排序分別如圖3、圖4所示。

圖3 2013年美國(guó)各州肺癌發(fā)病率分布

圖4 2013年美國(guó)各州NO2濃度排序

4 討論與結(jié)論

本文基于美國(guó)開放科學(xué)數(shù)據(jù),整合處理空氣污染物、細(xì)顆粒物、氣象因素、有毒物質(zhì)等環(huán)境條件與肺癌、哮喘等疾病的跨領(lǐng)域數(shù)據(jù)資源,研究環(huán)境與疾病之間的關(guān)聯(lián)關(guān)系,并結(jié)合實(shí)際應(yīng)用場(chǎng)景可視化展示關(guān)聯(lián)分析結(jié)果,利于增進(jìn)公眾對(duì)環(huán)境條件變化易引發(fā)某些疾病的了解,有助于公眾提升疾病預(yù)防的意識(shí)。為我國(guó)環(huán)境健康領(lǐng)域研究有序開展提供借鑒,為實(shí)現(xiàn)“健康中國(guó)2030”的提供重要保障。近年北美和歐洲在環(huán)境健康領(lǐng)域都已開展了大量的研究[6-8]。美國(guó)國(guó)家疾控中心已成立專門機(jī)構(gòu)長(zhǎng)期開展環(huán)境健康研究,對(duì)環(huán)境與高發(fā)疾病的影響進(jìn)行深入挖掘。歐洲空氣污染與健康項(xiàng)目(Air Pollution and Health:A European Approach)研究溫暖季節(jié)里,臭氧濃度增加與每天新增死亡人數(shù)的關(guān)系[9],以及與心血管疾病、呼吸系統(tǒng)疾病死亡人數(shù)增加之間的關(guān)系[10]。Brooke A.在美國(guó)亞特蘭大、達(dá)拉斯、圣路易斯等多個(gè)城市中,研究環(huán)境空氣污染引起急診門診哮喘病就診量的變化,發(fā)現(xiàn)年齡是哮喘發(fā)病的敏感因素,在學(xué)齡兒童中更加明顯[11]。近年來我國(guó)也逐漸關(guān)注地域、氣象、環(huán)境等與疾病的關(guān)聯(lián)影響[12-14]。殷永文等人研究上海市霧霾期間PM2.5、PM10污染與呼吸科、兒科呼吸科日均門診人數(shù)的相關(guān)性,發(fā)現(xiàn)PM10日均濃度每增加50μg/m3,呼吸科、兒科呼吸科日均門診人數(shù)分別增加3%和0.5%;PM2.5日均濃度每增加34μg/m3,呼吸科、兒科呼吸科日均門診人數(shù)分別增加3.2%和1.9%,而且PM2.5、PM10污染對(duì)門診人數(shù)影響的滯后累積效應(yīng)大于當(dāng)日效應(yīng)[15]。安愛萍等人對(duì)近年來我國(guó)大氣環(huán)境現(xiàn)狀對(duì)人體健康影響進(jìn)行了綜述,涉及大氣污染物對(duì)身體健康的急、慢性作用、氣象要素變化誘發(fā)心腦血管疾病、呼吸系統(tǒng)疾病與免疫系統(tǒng)功能的影響[16]。

與之前研究不同,本文采用基于Apriori算法的關(guān)聯(lián)分析方法,不僅從眾多污染物中提取與疾病關(guān)聯(lián)關(guān)系明顯的污染物,且實(shí)現(xiàn)了結(jié)果的可視化展示,有利于加深公眾對(duì)環(huán)境健康問題更直觀的理解。

由于本文利用開放數(shù)據(jù)開展關(guān)聯(lián)分析,暫沒有獲取到患者的既往病史、家族史、是否吸煙等信息,是目前研究的不足。同時(shí)本文側(cè)重在已有數(shù)據(jù)基礎(chǔ)上,研究分析以往時(shí)間段內(nèi)環(huán)境對(duì)疾病的影響,但如果利用已有數(shù)據(jù)預(yù)測(cè)未來疾病發(fā)生的趨勢(shì),將利于醫(yī)院等衛(wèi)生醫(yī)療機(jī)構(gòu)有序應(yīng)對(duì)環(huán)境變化引起的病患增加,進(jìn)而合理安排布局醫(yī)療資源,因此如何預(yù)測(cè)未來疾病的發(fā)病趨勢(shì)是仍然需要不斷研究的方向。

猜你喜歡
顆粒物關(guān)聯(lián)肺癌
中醫(yī)防治肺癌術(shù)后并發(fā)癥
對(duì)比增強(qiáng)磁敏感加權(quán)成像對(duì)肺癌腦轉(zhuǎn)移瘤檢出的研究
“苦”的關(guān)聯(lián)
奇趣搭配
南平市細(xì)顆粒物潛在來源分析
智趣
讀者(2017年5期)2017-02-15 18:04:18
錯(cuò)流旋轉(zhuǎn)填料床脫除細(xì)顆粒物研究
microRNA-205在人非小細(xì)胞肺癌中的表達(dá)及臨床意義
多層介質(zhì)阻擋放電處理柴油機(jī)尾氣顆粒物
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
主站蜘蛛池模板: 丁香亚洲综合五月天婷婷| 久久永久精品免费视频| 精品少妇人妻无码久久| 99热这里只有精品在线播放| 亚洲国产系列| 亚洲三级影院| 精品国产亚洲人成在线| 婷婷色婷婷| 一级片一区| 亚洲国产成人精品无码区性色| 国产一区二区精品高清在线观看| 伊人福利视频| 性激烈欧美三级在线播放| 91日本在线观看亚洲精品| 欧洲熟妇精品视频| 国产精品专区第1页| 亚洲欧美综合在线观看| 欧美日韩国产成人高清视频| 综合色区亚洲熟妇在线| 免费看a毛片| 亚洲色无码专线精品观看| 国产精品密蕾丝视频| 国产杨幂丝袜av在线播放| 成人午夜福利视频| 一本无码在线观看| 亚洲欧美色中文字幕| 九九热视频在线免费观看| 99在线视频免费观看| 最新国语自产精品视频在| 欧美一区日韩一区中文字幕页| 播五月综合| 色婷婷亚洲十月十月色天| 伊人五月丁香综合AⅤ| 国产乱人伦精品一区二区| 丁香五月婷婷激情基地| 亚洲欧美成人在线视频| 亚洲色婷婷一区二区| 欧美精品在线免费| 四虎国产在线观看| 精品伊人久久久久7777人| 伊人久久综在合线亚洲2019| 在线中文字幕日韩| 日本尹人综合香蕉在线观看 | 国产成人a在线观看视频| 国产精品99久久久久久董美香| 久久久久久午夜精品| 91久久国产综合精品女同我| 欧美一道本| 国产电话自拍伊人| 大学生久久香蕉国产线观看| 国产成人AV男人的天堂| 久久综合干| 国产一区二区三区精品久久呦| 国产亚洲精品自在线| 日本欧美成人免费| 99尹人香蕉国产免费天天拍| 在线另类稀缺国产呦| 激情乱人伦| 国产精品久久久精品三级| 久久77777| 99精品视频在线观看免费播放| 日本亚洲成高清一区二区三区| 国产精品粉嫩| 啪啪永久免费av| 久青草免费在线视频| 香蕉在线视频网站| 精品伊人久久久香线蕉 | 国产精品理论片| 日本高清免费不卡视频| 91区国产福利在线观看午夜| 欧美亚洲国产一区| 18黑白丝水手服自慰喷水网站| 亚洲欧美自拍中文| 91福利国产成人精品导航| 91小视频版在线观看www| 青青草91视频| 国产成人1024精品| 国产在线精品美女观看| 久久大香伊蕉在人线观看热2 | 99精品国产电影| 18禁黄无遮挡网站| 亚洲美女一级毛片|