999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

貝葉斯網絡模型在體檢結果分析中的應用*

2021-01-09 07:03:36王思聰石超珺喬魯燕李贊華王鏡涵曾慶嘉秦亞星
中國衛生統計 2020年6期
關鍵詞:信息

王思聰 石超珺 滕 斌 喬魯燕 李贊華△ 王鏡涵 曾慶嘉 秦亞星 馮 珊

【提 要】 目的 探討貝葉斯網絡在醫務人員健康狀況分析中的應用,為醫務人員健康管理提供方向和思路。方法 通過半樸素貝葉斯(TAN)構建年齡、性別、部門(臨床/非臨床)等基本信息之間的連接,以此為基礎建立貝葉斯網絡表示各體檢指標間的關聯關系。結果 在2014-2017年某三甲醫院醫務人員體檢數據上,貝葉斯網絡以年齡、性別、肝臟為3個中心結點,建立起與其他體檢指標的關聯。以中心結點肝臟為條件的分組異常檢出率統計及貝葉斯網絡推斷結果同時顯示:該院醫務人員肝臟與甲狀腺、膽囊、腎臟、體重指標之間的關聯性差異有統計學意義。結論 貝葉斯網絡對于建立醫務人員體檢管理體系具有可參考價值。

貝葉斯網絡是以概率論和圖論為理論基礎的一種不確定性知識表示和推理模型[1]。傳統的統計方法應用樣本信息和總體信息進行統計推斷,而貝葉斯方法則利用樣本信息、總體信息及先驗信息進行統計推斷。當有先驗信息可以利用時,采用貝葉斯方法可以得到更好的估計結果[2]。尤其是當數據庫中數據屬性的維度增高,屬性之間的關聯性難以直觀發現時,采用貝葉斯方法建模可以快速發現各指標之間隱性的關聯性,從而進行預測性決策。

我國對醫務人員的職業健康研究起步較晚,研究方法比較單一。結合某三甲醫院醫務人員體檢數據記錄進行貝葉斯網絡模型探索,可以為進一步的數據分析提供方法學參考,為健康管理提供方向和思路。

資料與方法

1.資料來源

數據資料來自某三甲醫院體檢中心數據庫,提取出2014-2017年該醫院全體職工體檢報告記錄。提取每份報告中體檢年份、年齡、性別、部門等信息(下文中稱為“基本信息”),以及12項體檢項目診斷結果(下文中稱為“體檢指標”):甲狀腺、卵巢、子宮、腎臟、前列腺、膽囊、肝臟、體重、血壓、胃、食道、十二指腸。各數據字段被整理為類別數據:性別(男、女),年齡(20~39、40~59、60+),部門(臨床、非臨床),體重(偏低、正常、偏高、肥胖),血壓(偏高、正常、偏低),其他指標(正常、異常)。數據的提取與處理以體檢報告中診斷結果為準。由于體檢者選擇的體檢項目不完全相同,所以部分樣本含有空值項。數據集的樣本量為8163,數據缺失率為35.88%。

2.統計方法

將基本信息變量記為I1,…,IM,體檢指標變量記為E1,…,EN。基本信息Im與體檢指標En的分類值分別用im,1,…,im,km和en,1,…,en,kn表示,其中km,kn表示分類數,m=1,…,M,n=1,…,N。

本研究引入貝葉斯網絡表示體檢結果的聯合概率分布。貝葉斯網絡可將聯合概率模型分解為乘積形式:

(1)

其中pa(·)表示變量的父結點集合。由于貝葉斯網絡的結構學習受數據的影響較大,因此需要對網絡結構進行合理約束,并盡量降低網絡的復雜度。結合基本信息與體檢指標之間的邏輯關系,本文設計三步法進行貝葉斯網絡結構學習。

第一步:基本信息變量之間的相關性通過半樸素貝葉斯(tree augmented na?ve Bayes,TAN)學習[3-4],步驟如下:

對每一個體檢指標En,n=1,…,N,分別學習TAN模型結構

(2)

其中TAN假設pa(Im)最多包含一個變量,這稱為“獨依賴估計”(one-dependent estimator,ODE)。

第二步:對貝葉斯網絡中各變量的父結點集合作出如下假設:

①pa(Im)不包含任意體檢指標En,即基本信息不以體檢指標的結果為條件。在這個約束下,貝葉斯網絡將描述醫務人員特征的基本信息作為先驗條件。

②pa(En)不僅可以包含任意其他體檢指標,也可以包含任意基本信息Im。體檢指標異常的概率依賴于基本信息,同時可以依賴于其他可觀測的體檢指標,以此來刻畫不同體檢指標的關聯性。

第三步:在第一步與第二步給定的約束下,考慮到數據本身具有缺失值,采用SEM(structural expectation maximization)算法進行貝葉斯結構學習[5],得到貝葉斯網絡結構。

本研究采用R語言bnlearn package進行數據處理與統計分析。

結 果

1.基本情況

本研究分析某醫院2014-2017年全體醫務人員職工體檢診斷結果,共計8163例。其中,年齡、性別、部門的分布情況見表1。表1中顯示臨床與非臨床部門的年齡、性別構成有較大差異。

按照體檢指標異常檢出率排序,4年間異常檢出率最高的指標依次為:胃(69.9%),體重(46.8%),甲狀腺(28.5%),前列腺(26.3%),肝臟(26.2%)。

表1 該醫院臨床與非臨床醫務人員的年齡與性別構成n(%)

2.半樸素貝葉斯分析

根據統計方法第一步,半樸素貝葉斯模型對基本信息變量之間相關性的分析結果如表2。從表2中看出不同體檢指標的TAN結果比較集中,得到的結構相對穩定。最終的基本信息的拓撲結構為:年齡→性別,年齡→部門,性別與部門無連接。

表2 通過半樸素貝葉斯(TAN)分析基本信息變量之間相關性的結果

3.貝葉斯網絡

在半樸素貝葉斯確定的基本信息的拓撲結構基礎上,根據統計方法第二步限制連接方法,再運用第三步算法學習貝葉斯網絡結構,得到結果如圖1。圖中灰色底的結點表示基本信息變量,白色底結點表示體檢指標變量。觀察圖像發現,貝葉斯網絡中出現了3個中心結點:年齡、性別和肝臟。

(1)年齡 年齡作為明顯的中心結點,分別指向了前列腺、子宮、肝臟、血壓、腎臟、膽囊、十二指腸、食道,這代表這些指標與年齡高度相關。

(2)性別 前列腺直接與性別連接,子宮通過卵巢與性別連接,這兩個指標可以解釋性別信息;前列腺、子宮還與年齡有直接連接,這說明兩個指標還同時包含一定的年齡信息。圖中性別只與卵巢、前列腺、體重3個指標直接連接,而其他與性別相關的屬性可以認為被前列腺和子宮替代,這是貝葉斯網絡的結構優化遵循奧卡姆剃刀定律(即簡單有效原理)的結果。因此,可以將與前列腺、子宮的連接視為性別差異,于是血壓、胃、肝臟、甲狀腺的性別關聯性被識別。

(3)肝臟 肝臟是體檢指標中與其他指標關聯性較強的中心結點。與肝臟的關聯性主要體現在年齡、性別、甲狀腺、膽囊、腎臟和體重。

圖1 該醫院醫務人員體檢結果的貝葉斯網絡模型示意圖

本研究中貝葉斯網絡的建立依賴于體檢結果表現出的概率相關性,各指標之間的連接并非因果關系,不宜將此網絡應用于因果推斷。

4.中心結點與其他非中心結點之間的關聯性分析

為驗證貝葉斯網絡對關聯性刻畫的準確度,首先以年齡、性別和肝臟3個中心結點為條件,通過貝葉斯網絡估計與肝臟相連接的指標(非中心結點)的異常率,與體檢數據統計的真實異常檢出率相比較(結果見表3)。表3顯示,貝葉斯網絡中肝臟及其連接的平均誤差為3.6%,因此本文所構建的貝葉斯網絡具有一定的準確性。對貝葉斯網絡所發現關聯性的分析結果如下:

(1)甲狀腺 甲狀腺與子宮(女性,與性別有關)、肝臟連接。表3結果顯示,女性組的異常檢出率普遍高于男性,其中肝臟異常組表現更為顯著。建議女性醫務人員注意甲狀腺方面的健康,尤其是20~39歲肝臟異常的女性醫務人員。

(2)膽囊 膽囊與年齡、肝臟相連,隨著年齡的增加,膽囊異常檢出率升高。與肝臟正常組相比,肝臟異常組的膽囊異常率相對更高。高齡或肝臟異常的醫務人員需要關注膽囊健康。

(3)腎臟 與膽囊相似,腎臟也與年齡、肝臟關聯,肝臟異常的醫務人員需特別注意腎臟的健康,其腎臟異常率高于肝臟正常的醫務人員。

(4)體重 體重與性別、肝臟相連。體重偏高與肥胖兩項數值均表明:肝臟異常組存在更顯著的體重偏高或肥胖問題。

表3 依據肝臟狀態分類的體檢指標異常檢出率比較(%)

討論與建議

醫務人員在生理健康、心理健康、職業暴露等方面均存在諸多隱患。重慶市某三甲醫院2013年和2015年醫務人員體檢亞健康狀態檢出率分別為89.48%和93.94%[6],柳州市某三甲醫院2018年體檢發現醫務人員亞健康狀況檢出率高達98.75%[7]。國外研究表明,如果在長期奉獻給別人過程中被索取過多,會出現痛惡工作、自卑、喪失同情意識等情緒,產生以極度的心身倦怠和感情衰竭為主的“心身耗竭綜合征”的表現,不利于臨床疑難病例的解決,造成工作滿意度的下降、醫療事故的發生率增加等[8],因此對醫務人員的體檢數據進行合理有效分析,及時根據相關風險因素進行健康管理,可以改善醫務人員的生活質量和服務質量。

貝葉斯網絡在醫療領域已有成功的應用,如Quinteros等運用貝葉斯網絡對急診室數據建立癥狀-疾病網絡[9]。本文提出了一種新的貝葉斯網絡模型的結構學習方法,可用于進行體檢數據的關聯性分析。

在本文中,我們重點關注了與健康管理相關的三個方面:網絡結構的生成,可以輕松地傳達基本信息、體檢指標之間的隱性關系;運用貝葉斯網絡進行個人風險評估的能力;該網絡將來易于轉換成健康管理決策模型。

針對醫療及體檢數據的特點,本文將數據屬性劃分為“基本信息”與“體檢指標”兩類。這兩類屬性具有不同的特征:基本信息是體檢者本人的特征信息,而體檢指標僅表示本次體檢的結果數據,通常基本信息不依賴于體檢指標結果。這是本文設計的三步貝葉斯網絡結構學習方法的出發點,適用于如體檢數據等電子病歷檔案數據。通常健康體檢的完整數據包含的屬性數遠超本文中列出的部分指標。本文以部分基本信息與體檢指標作為實例,較為完整地表述了貝葉斯網絡在體檢數據分析中的應用。貝葉斯網絡建模的意義在于:通過貝葉斯網絡建模,可以清晰地展示各屬性數據間隱含的關聯關系,發現具有多條連接的中心結點,或者研究者所關心的指標與其他指標之間的連接形式。

本文限于所獲取的該醫院職工體檢數據的完整性,未能構建更大規模的(包含更多屬性的)貝葉斯網絡,也因此未能對該院醫務人員整體健康狀況作出完整的結論。其次,單個醫院的數據往往缺乏代表性。鑒于本研究目前只是立足于數據分析的方法學探討,未組織多中心的大樣本研究,也正是因為本文是方法學研究,所以不受樣本量和是否多中心研究的限制[10]。本研究中提出的方法同樣可以應用到不同病種、人群以及其他檢查結果的分析中。該判別模型的實用價值,有待在將來的實際應用中得到更多實證驗證和效果評價。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息超市
大眾創業(2009年10期)2009-10-08 04:52:00
展會信息
展會信息
展會信息
展會信息
展會信息
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 99国产精品国产高清一区二区| 国产微拍精品| 亚洲国产欧美国产综合久久| 精品一区二区三区水蜜桃| jizz国产视频| 自拍偷拍一区| 亚洲人成人无码www| 国产经典免费播放视频| 99久久精品久久久久久婷婷| 一级毛片免费观看久| 99视频精品全国免费品| 国产91线观看| 色天天综合| 午夜福利网址| 精品久久久久无码| 中日无码在线观看| 亚洲欧美日本国产综合在线| av大片在线无码免费| 一本大道香蕉久中文在线播放| 日韩中文无码av超清| 无码一区中文字幕| 亚洲天堂啪啪| 在线观看国产小视频| 自慰网址在线观看| 日韩高清中文字幕| 中文一级毛片| 国产精品99久久久| 国产成人精彩在线视频50| 亚洲国产成人无码AV在线影院L| 亚洲视频一区| 亚洲码一区二区三区| 亚洲伊人电影| 日韩精品一区二区三区视频免费看| 亚洲香蕉久久| 亚洲浓毛av| 欧美三级不卡在线观看视频| 中文字幕不卡免费高清视频| 久久免费成人| 成人av专区精品无码国产| 青青热久麻豆精品视频在线观看| 一区二区在线视频免费观看| 国产av一码二码三码无码| 日韩无码视频专区| 久久久精品久久久久三级| 国产精品第一区| 国产色婷婷| 久久精品免费国产大片| 蜜芽国产尤物av尤物在线看| 国产精品刺激对白在线| 国产一区二区三区在线观看免费| 中文字幕亚洲乱码熟女1区2区| 欧美在线导航| 老色鬼欧美精品| 午夜国产精品视频| 国产三区二区| 狠狠色狠狠色综合久久第一次 | 久久毛片免费基地| 成人免费午间影院在线观看| 伊人国产无码高清视频| 中文字幕在线一区二区在线| 精品国产网站| 一级毛片不卡片免费观看| 成人免费一级片| 精品丝袜美腿国产一区| 91久久偷偷做嫩草影院电| 天堂成人在线视频| 国产综合在线观看视频| 亚洲一区波多野结衣二区三区| 亚洲一区二区三区国产精华液| 国产在线视频导航| 亚洲高清日韩heyzo| 亚洲欧洲日产国产无码AV| 亚洲精品在线91| 2021国产精品自拍| 国产91色在线| 在线观看免费国产| 91青青视频| 五月婷婷丁香综合| 国内精品小视频福利网址| 国产美女丝袜高潮| 九九视频免费看| 日韩欧美国产中文|