999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的慢性阻塞性肺病與哮喘-慢性阻塞性肺疾病重疊分類

2019-08-01 08:59:18許飛飛俊2宋亞男2菲3謝惠敏4陳廣飛
中華醫學圖書情報雜志 2019年2期
關鍵詞:分類特征模型

許飛飛,應 俊2,宋亞男2,齊 菲3,謝惠敏4,陳廣飛

慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease,COPD)和哮喘類阻塞性氣道疾病(Obliterative Airway Disease,OAD)是造成嚴重疾病負擔和影響生活質量的常見慢性肺病。盡管COPD和哮喘在炎癥模式、免疫機制和氣流阻塞的可逆性程度不同,但仍有大量COPD和哮喘患者表現出相似的臨床癥狀。哮喘通常表現為間歇性和可逆性的氣道阻塞,而COPD則是進行性和不可逆轉的。COPD和哮喘合并癥稱為哮喘-慢性阻塞性肺疾病重疊(asthma-COPD overlap,ACO),其發病率隨著年齡增長而升高[1]。因此,ACO的診斷和治療變得尤其重要[2]。與單純患有慢性阻塞性肺炎或哮喘的患者相比,哮喘-慢性阻塞性肺疾病重疊患者急性發作更頻繁,生活質量更差,肺功能下降更快,死亡率更高,醫療成本更高[3]。慢阻肺、哮喘及ACO均為異質性疾病,在病因、病理改變及臨床表現存在較多相似之處。Soriano認為[4],COPD和哮喘之所以難以區分,是因為某些癥狀只是疾病發展過程中的一部分,存在較多相似特征,而且沒有判定相應治療措施與預后是否一致的標準,因此如何辨別ACO與單純患有COPD是呼吸科研究的熱點。雖然研究表明,COPD與哮喘-慢性阻塞性肺疾病重疊在肺功能、臨床特征、肺活量測定、胸部CT掃描、6MWD、SGRQ等特征上存在統計學差異,但是以上特征不能單獨作為哮喘-慢性阻塞性肺疾病重疊與COPD患者分類的依據。

本文假設在原有的臨床特征中存在與疾病診斷相關的潛在關聯,這種潛在關聯可以建立一個穩健的模型來提供計算機化的臨床決策支持。深度學習方法可以發現高維數據潛在的相關性,深度信念網絡(Deep Belief Networks,DBNs)是深度學習方法中最成功的一種結構,其良好的特征提取能力在影像和語音識別中均得到很好的體現[5-6]。DBNs是一種高度復雜的非線性特征提取器,其隱藏單元的每一層都能從原始輸入數據中學習并捕獲更高級的特征[7]。因此,本文利用大量的臨床數據樣本,使用DBNs算法和支持向量機算法構建COPD和ACO的鑒別診斷模型,為臨床診斷提供參考。

1 數據與方法

1.1 數據來源

本文研究數據來自美國國家心臟、肺與血液研究機構(NHLBI)建設的COPDGene數據庫。根據給定的數據將研究對象分為單純COPD組(2 919例)和哮喘-慢性阻塞性肺疾病重疊組(1 116例)。參與研究受試者的數據項總計為361項,包括人口信息學、病史、臨床評估量表、檢驗、體格檢查等[8]。

1.2 研究方法

本研究使用的COPDGene數據集包含361項特征,除去數據缺失較大的特征后剩余320項特征。使用10折交叉驗證(10FCV)的方法將數據集隨機分成10份,其中90%作為訓練樣本,10%作為預測樣本。為提高模型對疾病分類的準確性,使用Fisher評分法對特征進行選擇,即計算特征的Fisher評分值來表示特征對分類結果敏感程度[9]。根據評分值由高到低選擇4個特征子集,分別是評分值前320、240、120、80個的特征子集,根據模型的準確率來選擇合適的特征子集。研究方法主要有以下2個數學模型。

一個是支持向量機模型(SVM)。支持向量機是基于不同核的一種機器學習算法。本研究使用了線性核(SVM-linear)、多項式核(SVM-polynomial)、徑向基函數核(SVM-radial basis function)和sigmoid核(SVM-sigmoid)4種核,根據模型分類準確率和ROC曲線2個評價指標選擇適合的核構建支持向量機模型。

另一個是深度信念網絡模型(DBNs)。深度信念網絡是深度學習中最常見的一種架構。對于一個實際問題,為找到合適結構的DBNs,需要確定隱藏層層數和每一隱藏層節點的數量,可見層節點數量等同于輸入特征數量。本文構建了3個結構不同的3層DBNs,隱藏層節點數分別為50-50、100-50及100-100,根據模型分類準確率選擇合適的結構構建DBNs模型。

2 結果與分析

2.1 特征選擇和模型參數選擇

特征選擇后,DBNs模型分類準確率結果如表1所示。使用Fisher評分值的前160個特征作為DBNs模型的輸入所得的準確率最高,因此選用這160個特征作為SVM模型和DBNs模型的輸入特征。圖1是3種隱藏單元結構的DBNs模型在不同迭代次數下2種疾病的分類準確率,顯示不同結構的DBNs模型的分類準確率,50-50隱藏單元結構的DBNs模型準確率高于100-50和100-100,因此選擇50-50隱藏單元結構構建最終的DBNs模型。

表1 特征選擇后DBNs模型的準確率

圖1 不同結構隱藏單元的DBNs模型在不同迭代次數下COPD和ACO分類準確率

2.2 模型構建結果

使用訓練樣本構建支持向量機模型和深度信念網絡模型,通過預測樣本計算模型的準確率、靈敏度(表示預測樣本中COPD被劃分對的比例)和特異度(表示預測樣本中ACO被劃分對的比例),見表2,得到ROC曲線(圖2)。從表2看出,DNBs準確率最高(為93.56%),4種不同核的支持向量機算法準確率均未達到90%。在預測樣本中,COPD識別率(Sensitive)最高為DBNs模型(95.21%),而SVM模型最高為89.73%,ACO識別率(Specificity)最高仍為DBNs模型(89.29%),對應SVM模型最高為74.11%。圖2顯示了5個模型受試者工作特征曲線(ROC),DBNs模型的ROC曲線最靠近左上角并且完全處于4種不同核的支持向量機模型ROC曲線之上,說明DBNs模型分類性能要高于支持向量機模型。

表2 DBNs和4種不同核的SVM的分類準確率、靈敏度和特異度

圖2 DBNs和4種核的SVM的ROC曲線

2.3 特征重要性排序

COPDGene數據庫包含了研究受試者在臨床、生理學、影像學、生物學等多方面的數據。從DBNs模型中計算出敏感度前10的特征,它們來自COPDGene數據庫5個不同的量表,分別是吸煙狀態量表、CT影響結果量表、臨床診斷量表、健康狀態量表和肺功能量表。10個特征包括5類指標,其中1個屬于吸煙狀態(Duration_Smoking),3個屬于CT影像結果(TLC_CT,Slicer_IntensityMean_Ex,Vida_15perc_Exp),2個屬于臨床診斷(BronchDxByDr,SleepApStillHav),2個屬于健康狀態(distwalked,SF36_PF_t_score),還有2個屬于肺功能(pre_FEV1,pre_FVC)。應用統計分析的方法,分類變量用Pearson x2檢驗,數值型變量用t檢驗,10個特征在COPD和ACO中有明顯的統計學差異,p值小于0.05。通過假設檢驗,發現這10個敏感特征存在不同的分布。

表3 COPD與ACO分類前10個相對重要特征的分布

3 討論

本文首次使用DBNs提出了一種ACO與COPD鑒別診斷的新方法,并且與支持向量機模型在準確率、靈敏度、特異度和ROC曲線上進行了比較。結果顯示,DBNs模型的分類性要好于支持向量機模型,證明DBNs模型能從數據集中學習到本質特征。與傳統的危險因素分析臨床意義不同,DBNs模型預測變量的重要性大小反映的是對應指標在區分這2種疾病時對模型的貢獻程度,即排序越靠前的預測變量就越有助于使用模型來區分這2種疾病。

在機器學習和數據挖掘的眾多應用中會遇到高維數據的問題,常見的方法是用降維來選擇最敏感的特征[10-11]。高維增加了數據處理的時間和空間要求,基于存在不相關或冗余的特征,學習方法往往會過度擬合,模型變得難以解釋。選擇本文中的320個特征中Fisher評分較高的特征作為DBNs模型的輸入向量,結果表明,使用Fisher評分篩選特征后建立的DBNs模型能獲得更高的準確率。

高水平的多元特征可能與疾病的某些特點有關,并且可以使用這些特征建立一個復雜的數據驅動模型對疾病進行分類。本文構建的參數最優化的DBNs模型找到的敏感因素與臨床先驗知識保持了一定的一致性。在評價本文的優缺點時,將DBNs與SVM進行了比較。對于這個二分類問題,DBNs的準確率高達93.56%,靈敏度高達95.21%,特異度為89.29%;而4種典型支持向量機模型的最高準確率為85.40%,靈敏度最高為89.73%,特異度為74.11%,說明相比于支持向量機這個傳統機器學習模型,DBNs具有更好的分類能力。

本文利用DBNs模型確定與COPD疾病有關的敏感特征。DBNs模型輸出的預測重要性前10的變量包括受試者的CT影像結果、臨床診斷、健康狀態、吸煙情況以及肺功能,這些特征與COPD和ACO的病因密切相關[12-15],說明DBNs模型發現的敏感特征與目前ACO臨床診斷的主要因素是一致的。此外,描述性分析結果表明,COPD與ACO在前10個敏感特征上存在統計學差異。通過DBNs模型提取的特征可以有效區分這2種癥狀相似的疾病。本文確定的前10個敏感特征指出內科醫生在對COPD或ACO患者進行診斷時,不僅要考慮生化檢查、實驗室檢查和影像數據,還要考慮流行病學因素、健康狀況甚至個人習慣。

4 結語

研究結果表明,使用肺功能、疾病狀況、人口統計學數據和健康狀況數據多種類型的特征建立的深度信念網絡模型可以有效區分COPD和ACO。與COPD和ACO分類相關的敏感特征與臨床診斷策略具有較好的一致性,有助于更好地了解成人慢性阻塞性肺病和哮喘-慢性阻塞性肺疾病重疊的病因和癥狀。由于COPD和ACO在治療方法和發病率及死亡率方面都不同,所以這2種疾病的鑒別診斷十分重要。借助深度學習方法,COPD和ACO的預防及個體化治療可以提高患者的生活質量和潛在生存率。本文建立的DBNs模型能夠實現較高的判斷準確率,表明深度學習模型有望成為診斷決策的輔助工具。

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 中文一区二区视频| 国产制服丝袜91在线| 波多野结衣中文字幕一区二区| 91精品啪在线观看国产60岁 | 亚洲天堂首页| 精品无码国产一区二区三区AV| 国产亚洲视频中文字幕视频| 日韩一级二级三级| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 中文无码精品A∨在线观看不卡| 最新加勒比隔壁人妻| 精品久久久无码专区中文字幕| 人妻丰满熟妇av五码区| 成人字幕网视频在线观看| 日韩小视频在线观看| 亚洲国产成熟视频在线多多| 久久国产精品嫖妓| 日韩精品欧美国产在线| 97久久免费视频| 国产91精品调教在线播放| 欧美中出一区二区| 久久精品人人做人人综合试看| 国产激情无码一区二区免费| 欧美精品三级在线| 九色在线观看视频| 99热最新网址| 99这里精品| 亚洲h视频在线| 91午夜福利在线观看| 在线免费亚洲无码视频| 亚洲无线国产观看| 日韩在线永久免费播放| 国产成人午夜福利免费无码r| 日韩国产一区二区三区无码| 高清无码不卡视频| 国产亚洲欧美在线专区| 蜜臀av性久久久久蜜臀aⅴ麻豆| 欧美黄色a| 亚洲婷婷六月| 亚洲欧洲一区二区三区| 内射人妻无套中出无码| 手机在线免费不卡一区二| 成人亚洲天堂| 国产白浆视频| 中文字幕中文字字幕码一二区| 手机看片1024久久精品你懂的| 黑人巨大精品欧美一区二区区| 伊在人亞洲香蕉精品區| 国产成人啪视频一区二区三区| 免费无码AV片在线观看国产| 在线精品视频成人网| 亚洲综合久久一本伊一区| 激情国产精品一区| 日韩无码黄色| 成年人国产视频| 在线观看亚洲天堂| 久久伊人操| 在线亚洲精品自拍| 日韩精品成人在线| 久久人体视频| 国产乱人伦精品一区二区| www.亚洲一区| 激情爆乳一区二区| 亚洲色欲色欲www在线观看| 久青草国产高清在线视频| 日本在线免费网站| 国产精品99久久久| 国产日韩AV高潮在线| 日韩麻豆小视频| 日韩天堂视频| 欧美成人区| 久久精品国产精品国产一区| 国产免费人成视频网| 日韩福利在线观看| 狠狠操夜夜爽| 成人毛片免费观看| 无码 在线 在线| 国模沟沟一区二区三区| 国产一区三区二区中文在线| 亚洲天堂免费在线视频| 亚洲国产精品无码久久一线| 国产99久久亚洲综合精品西瓜tv|