王思聰 石超珺 滕 斌 喬魯燕 李贊華△ 王鏡涵 曾慶嘉 秦亞星 馮 珊
【提 要】 目的 探討貝葉斯網絡在醫務人員健康狀況分析中的應用,為醫務人員健康管理提供方向和思路。方法 通過半樸素貝葉斯(TAN)構建年齡、性別、部門(臨床/非臨床)等基本信息之間的連接,以此為基礎建立貝葉斯網絡表示各體檢指標間的關聯關系。結果 在2014-2017年某三甲醫院醫務人員體檢數據上,貝葉斯網絡以年齡、性別、肝臟為3個中心結點,建立起與其他體檢指標的關聯。以中心結點肝臟為條件的分組異常檢出率統計及貝葉斯網絡推斷結果同時顯示:該院醫務人員肝臟與甲狀腺、膽囊、腎臟、體重指標之間的關聯性差異有統計學意義。結論 貝葉斯網絡對于建立醫務人員體檢管理體系具有可參考價值。
貝葉斯網絡是以概率論和圖論為理論基礎的一種不確定性知識表示和推理模型[1]。傳統的統計方法應用樣本信息和總體信息進行統計推斷,而貝葉斯方法則利用樣本信息、總體信息及先驗信息進行統計推斷。當有先驗信息可以利用時,采用貝葉斯方法可以得到更好的估計結果[2]。尤其是當數據庫中數據屬性的維度增高,屬性之間的關聯性難以直觀發現時,采用貝葉斯方法建模可以快速發現各指標之間隱性的關聯性,從而進行預測性決策。
我國對醫務人員的職業健康研究起步較晚,研究方法比較單一。結合某三甲醫院醫務人員體檢數據記錄進行貝葉斯網絡模型探索,可以為進一步的數據分析提供方法學參考,為健康管理提供方向和思路。
1.資料來源
數據資料來自某三甲醫院體檢中心數據庫,提取出2014-2017年該醫院全體職工體檢報告記錄。提取每份報告中體檢年份、年齡、性別、部門等信息(下文中稱為“基本信息”),以及12項體檢項目診斷結果(下文中稱為“體檢指標”):甲狀腺、卵巢、子宮、腎臟、前列腺、膽囊、肝臟、體重、血壓、胃、食道、十二指腸。各數據字段被整理為類別數據:性別(男、女),年齡(20~39、40~59、60+),部門(臨床、非臨床),體重(偏低、正常、偏高、肥胖),血壓(偏高、正常、偏低),其他指標(正常、異常)。數據的提取與處理以體檢報告中診斷結果為準。由于體檢者選擇的體檢項目不完全相同,所以部分樣本含有空值項。數據集的樣本量為8163,數據缺失率為35.88%。
2.統計方法
將基本信息變量記為I1,…,IM,體檢指標變量記為E1,…,EN。基本信息Im與體檢指標En的分類值分別用im,1,…,im,km和en,1,…,en,kn表示,其中km,kn表示分類數,m=1,…,M,n=1,…,N。
本研究引入貝葉斯網絡表示體檢結果的聯合概率分布。貝葉斯網絡可將聯合概率模型分解為乘積形式:
(1)
其中pa(·)表示變量的父結點集合。由于貝葉斯網絡的結構學習受數據的影響較大,因此需要對網絡結構進行合理約束,并盡量降低網絡的復雜度。結合基本信息與體檢指標之間的邏輯關系,本文設計三步法進行貝葉斯網絡結構學習。
第一步:基本信息變量之間的相關性通過半樸素貝葉斯(tree augmented na?ve Bayes,TAN)學習[3-4],步驟如下:
對每一個體檢指標En,n=1,…,N,分別學習TAN模型結構
(2)
其中TAN假設pa(Im)最多包含一個變量,這稱為“獨依賴估計”(one-dependent estimator,ODE)。


第二步:對貝葉斯網絡中各變量的父結點集合作出如下假設:
①pa(Im)不包含任意體檢指標En,即基本信息不以體檢指標的結果為條件。在這個約束下,貝葉斯網絡將描述醫務人員特征的基本信息作為先驗條件。
②pa(En)不僅可以包含任意其他體檢指標,也可以包含任意基本信息Im。體檢指標異常的概率依賴于基本信息,同時可以依賴于其他可觀測的體檢指標,以此來刻畫不同體檢指標的關聯性。
第三步:在第一步與第二步給定的約束下,考慮到數據本身具有缺失值,采用SEM(structural expectation maximization)算法進行貝葉斯結構學習[5],得到貝葉斯網絡結構。
本研究采用R語言bnlearn package進行數據處理與統計分析。
1.基本情況
本研究分析某醫院2014-2017年全體醫務人員職工體檢診斷結果,共計8163例。其中,年齡、性別、部門的分布情況見表1。表1中顯示臨床與非臨床部門的年齡、性別構成有較大差異。
按照體檢指標異常檢出率排序,4年間異常檢出率最高的指標依次為:胃(69.9%),體重(46.8%),甲狀腺(28.5%),前列腺(26.3%),肝臟(26.2%)。

表1 該醫院臨床與非臨床醫務人員的年齡與性別構成n(%)
2.半樸素貝葉斯分析
根據統計方法第一步,半樸素貝葉斯模型對基本信息變量之間相關性的分析結果如表2。從表2中看出不同體檢指標的TAN結果比較集中,得到的結構相對穩定。最終的基本信息的拓撲結構為:年齡→性別,年齡→部門,性別與部門無連接。

表2 通過半樸素貝葉斯(TAN)分析基本信息變量之間相關性的結果
3.貝葉斯網絡
在半樸素貝葉斯確定的基本信息的拓撲結構基礎上,根據統計方法第二步限制連接方法,再運用第三步算法學習貝葉斯網絡結構,得到結果如圖1。圖中灰色底的結點表示基本信息變量,白色底結點表示體檢指標變量。觀察圖像發現,貝葉斯網絡中出現了3個中心結點:年齡、性別和肝臟。
(1)年齡 年齡作為明顯的中心結點,分別指向了前列腺、子宮、肝臟、血壓、腎臟、膽囊、十二指腸、食道,這代表這些指標與年齡高度相關。
(2)性別 前列腺直接與性別連接,子宮通過卵巢與性別連接,這兩個指標可以解釋性別信息;前列腺、子宮還與年齡有直接連接,這說明兩個指標還同時包含一定的年齡信息。圖中性別只與卵巢、前列腺、體重3個指標直接連接,而其他與性別相關的屬性可以認為被前列腺和子宮替代,這是貝葉斯網絡的結構優化遵循奧卡姆剃刀定律(即簡單有效原理)的結果。因此,可以將與前列腺、子宮的連接視為性別差異,于是血壓、胃、肝臟、甲狀腺的性別關聯性被識別。
(3)肝臟 肝臟是體檢指標中與其他指標關聯性較強的中心結點。與肝臟的關聯性主要體現在年齡、性別、甲狀腺、膽囊、腎臟和體重。

圖1 該醫院醫務人員體檢結果的貝葉斯網絡模型示意圖
本研究中貝葉斯網絡的建立依賴于體檢結果表現出的概率相關性,各指標之間的連接并非因果關系,不宜將此網絡應用于因果推斷。
4.中心結點與其他非中心結點之間的關聯性分析
為驗證貝葉斯網絡對關聯性刻畫的準確度,首先以年齡、性別和肝臟3個中心結點為條件,通過貝葉斯網絡估計與肝臟相連接的指標(非中心結點)的異常率,與體檢數據統計的真實異常檢出率相比較(結果見表3)。表3顯示,貝葉斯網絡中肝臟及其連接的平均誤差為3.6%,因此本文所構建的貝葉斯網絡具有一定的準確性。對貝葉斯網絡所發現關聯性的分析結果如下:
(1)甲狀腺 甲狀腺與子宮(女性,與性別有關)、肝臟連接。表3結果顯示,女性組的異常檢出率普遍高于男性,其中肝臟異常組表現更為顯著。建議女性醫務人員注意甲狀腺方面的健康,尤其是20~39歲肝臟異常的女性醫務人員。
(2)膽囊 膽囊與年齡、肝臟相連,隨著年齡的增加,膽囊異常檢出率升高。與肝臟正常組相比,肝臟異常組的膽囊異常率相對更高。高齡或肝臟異常的醫務人員需要關注膽囊健康。
(3)腎臟 與膽囊相似,腎臟也與年齡、肝臟關聯,肝臟異常的醫務人員需特別注意腎臟的健康,其腎臟異常率高于肝臟正常的醫務人員。
(4)體重 體重與性別、肝臟相連。體重偏高與肥胖兩項數值均表明:肝臟異常組存在更顯著的體重偏高或肥胖問題。

表3 依據肝臟狀態分類的體檢指標異常檢出率比較(%)
醫務人員在生理健康、心理健康、職業暴露等方面均存在諸多隱患。重慶市某三甲醫院2013年和2015年醫務人員體檢亞健康狀態檢出率分別為89.48%和93.94%[6],柳州市某三甲醫院2018年體檢發現醫務人員亞健康狀況檢出率高達98.75%[7]。國外研究表明,如果在長期奉獻給別人過程中被索取過多,會出現痛惡工作、自卑、喪失同情意識等情緒,產生以極度的心身倦怠和感情衰竭為主的“心身耗竭綜合征”的表現,不利于臨床疑難病例的解決,造成工作滿意度的下降、醫療事故的發生率增加等[8],因此對醫務人員的體檢數據進行合理有效分析,及時根據相關風險因素進行健康管理,可以改善醫務人員的生活質量和服務質量。
貝葉斯網絡在醫療領域已有成功的應用,如Quinteros等運用貝葉斯網絡對急診室數據建立癥狀-疾病網絡[9]。本文提出了一種新的貝葉斯網絡模型的結構學習方法,可用于進行體檢數據的關聯性分析。
在本文中,我們重點關注了與健康管理相關的三個方面:網絡結構的生成,可以輕松地傳達基本信息、體檢指標之間的隱性關系;運用貝葉斯網絡進行個人風險評估的能力;該網絡將來易于轉換成健康管理決策模型。
針對醫療及體檢數據的特點,本文將數據屬性劃分為“基本信息”與“體檢指標”兩類。這兩類屬性具有不同的特征:基本信息是體檢者本人的特征信息,而體檢指標僅表示本次體檢的結果數據,通常基本信息不依賴于體檢指標結果。這是本文設計的三步貝葉斯網絡結構學習方法的出發點,適用于如體檢數據等電子病歷檔案數據。通常健康體檢的完整數據包含的屬性數遠超本文中列出的部分指標。本文以部分基本信息與體檢指標作為實例,較為完整地表述了貝葉斯網絡在體檢數據分析中的應用。貝葉斯網絡建模的意義在于:通過貝葉斯網絡建模,可以清晰地展示各屬性數據間隱含的關聯關系,發現具有多條連接的中心結點,或者研究者所關心的指標與其他指標之間的連接形式。
本文限于所獲取的該醫院職工體檢數據的完整性,未能構建更大規模的(包含更多屬性的)貝葉斯網絡,也因此未能對該院醫務人員整體健康狀況作出完整的結論。其次,單個醫院的數據往往缺乏代表性。鑒于本研究目前只是立足于數據分析的方法學探討,未組織多中心的大樣本研究,也正是因為本文是方法學研究,所以不受樣本量和是否多中心研究的限制[10]。本研究中提出的方法同樣可以應用到不同病種、人群以及其他檢查結果的分析中。該判別模型的實用價值,有待在將來的實際應用中得到更多實證驗證和效果評價。