繩慧峰 劉 晴 許 蘋 陳春林*
?
人工神經網絡在醫療風險預測中的應用研究*
繩慧峰1劉 晴2許 蘋3陳春林1*
目的 建立基于人工神經網絡的醫療風險預測模型,為有效預防醫療風險提供參考。方法 運用SPSS 21.0統計軟件,以入院方式、住院天數等變量為輸入神經元,以醫療糾紛分組為輸出神經元,用RBF(徑向基函數)建立神經網絡模型,預測醫療風險的發生,評估各因素對醫療風險的作用。結果 訓練樣本和測試樣本的預測準確率分別為83.7%和84.2%,醫療風險影響因素重要性排序前6位分別是住院費用(100.0%)、住院天數(78.2%)、四周內手術次數(61.4%)、感染(60.5%)、傷口愈合不良(54.0%)和手術并發癥(47.8%)等。結論 運用RBF(徑向基函數)神經網絡對醫療風險進行預測,不受樣本分布特點及數據類型的影響,適用性較好。
人工神經網絡;徑向基函數;醫療風險;預測;應用
First-author's address Ministry of Medical Affairs, 105th Hospital of People 's Liberation Army, Hefei, Anhui, 230031, China
人工神經網絡(Artificial Neural Network,ANN)簡稱神經網絡(Neural Network,NN),是模擬生物神經系統結構,由大量處理單元組成的非線性自適應動態系統[1]。神經網絡因其強大性、靈活性和易用性,成為預測數據應用程序的首選工具。徑向基函數 (Radial Basis Function,RBF)是人工神經網絡諸多形式中應用較廣泛的一種,由于其具有能夠逼近任意的非線性函數、學習收斂速度快等優點,目前已經成功應用于非線性函數逼近、模式識別、信息處理等方面[2]。本研究在前期研究基礎上,初步嘗試采用RBF神經網絡建立醫療風險預測模型,篩選醫療風險影響因素,以期為進一步加強風險控制,制定管理決策提供參考。
1.1 資料來源
本研究所使用的數據資料均來源于合肥市某軍隊三甲醫院信息系統。針對該院2010年-2015年發生的60例手術糾紛案例和120例非糾紛案例,通過醫院信息系統調取各案例的16項醫療風險指標。其中,60例糾紛案例為該院6年間發生的全部手術糾紛案例,反映該院實際糾紛情況;120例非糾紛案例則按照常用病例和對照1:2的標準選取。16項指標均由前期通過單因素分析篩選并確定,分別是入院方式、住院天數、住院費用、四周內手術次數、非計劃再次手術等[3]。具體指標及賦值情況見表1。
表1 醫療風險指標變量及其賦值

變量*代碼賦值入院方式X10=門診;1=急診住院天數X20=<20天;1=≥20天住院費用X30=<5萬;1=≥5萬四周內手術次數X40=<2次;1=≥2次非計劃再次手術X50=無;1=有輸血總量X60=<1600ml;1=≥1600ml非正常進入ICU天數X70=<3天;1=≥3天病情危重X80=無;1=有病情突變X90=無;1=有搶救次數X101=0次;2=1次;3=≥2次手術并發癥X110=無;1=有傷口愈合不良X120=無;1=有感染X130=無;1=有休克X140=無;1=有出院病情X150=治愈或好轉;1=死亡出院方式X160=醫囑出院;1=家屬要求分組Y0=非糾紛組;1=糾紛組
注:*16項風險指標是從22個變量中篩選出來的。這些變量是前期經過專家咨詢篩選的相對重要的指標,但不包括所有可能與糾紛事件相關的變量。
1.2 研究方法
所有數據采用Excel 2007整理和匯總,采用SPSS 21.0統計軟件中的徑向基函數神經網絡進行分析。神經網絡模型包含輸入層、隱藏層和輸出層3層結構,將16項醫療風險指標作為輸入神經元,醫療糾紛分組作為輸出神經元。
1.3 操作步驟
神經網絡建模按照以下步驟進行:(1)打開SPSS軟件,導入Excel數據。(2)生成隨機數。選擇菜單欄里的“轉換-隨機數字生成器”,勾選設置起點中的固定值,并輸入數字“9191972”。(3)建立神經網絡模型。選擇菜單欄里的“分析-神經網絡-徑向基函數”,將醫療糾紛分組作為因變量,入院方式、住院天數等16項指標變量作為因子。在輸出選項中勾選“描述→圖表→模型匯總→分類結果→ROC曲線→累積增益圖→增益圖→觀察預測圖→個案處理摘要→自變量重要性分析”。其他選項均采用系統默認,點擊確定進行分析。
2.1 模型預測結果
共有180個有效樣本,按照神經網絡常用7:3比例,123個案例(68.3%)被分配到訓練樣本,57個案例(31.7%)被分配到測試樣本,沒有個案被排除。表2為模型分類結果。訓練樣本中,83個非醫療糾紛樣本有80個(96.4%)被正確分到了非醫療糾紛組,40個醫療糾紛樣本有23個(57.5%)被正確分到了醫療糾紛組,預測正確總百分比為83.7%;測試樣本中,37個非醫療糾紛樣本有35個(94.6%)被正確地分到了非醫療糾紛組,20個醫療糾紛樣本有13個(65.0%)被正確地分到了醫療糾紛組,預測正確總百分比為84.2%。表3模型匯總中,訓練樣本百分比錯誤預測16.3%和測試樣本百分比錯誤預測15.8%相對應。圖1為觀察預測圖,顯示組合的培訓和測試樣本的預測擬概率。最左側箱圖顯示,對于觀察類別no(非醫療糾紛組)的個案,類別no的預測擬概率。在y軸0.5標記之上的箱圖部分代表分類表中顯示的正確預測值,0.5標記以下部分代表不正確的預測值;最右側箱圖顯示,對于觀察類別yes(醫療糾紛組)的個案,類別yes的預測擬概率。在y軸0.5標記之上的部分代表分類表中顯示的正確預測值,0.5標記以下部分代表不正確的預測值。
表3 神經網絡預測模型結果匯總

訓練平方和錯誤16.031百分比錯誤預測(%)16.3培訓時間0:00:00.31測試平方和錯誤8.316a百分比錯誤預測(%)15.8
注:a隱藏單位的數量由檢驗數據標準確定,隱藏單位的“最佳”數量為檢驗數據中產生最小錯誤的單位。

圖1 神經網絡預測模型的預測擬概率
注:0表示非醫療糾紛組,1表示醫療糾紛組。
2.2 ROC曲線擬合結果
圖2為ROC曲線擬合結果,顯示了單個圖中所有界限的敏感度和特異性。ROC曲線下面積為0.821,表明了診斷試驗準確度的大小[4],說明對于每一個類別,該類別中一個隨機選擇的個案高于非該類別中一個隨機選擇的個案的概率。例如,對于隨機選擇的醫療糾紛者與隨機選擇的非醫療糾紛者,就缺省模型預測擬概率而言,前者高于后者的概率為0.821。

圖2 神經網絡預測模型的ROC曲線
表2 神經網絡預測模型分類結果

樣本已觀測已預測01正確百分比(%)訓練080396.41172357.5總計百分比(%)78.921.183.7測試035294.6171365.0總計百分比(%)73.726.384.2
2.3 重要性分析結果
表4為自變量的重要性及標準化的重要性。結果顯示,醫療風險影響因素重要性排序前6位的自變量及其標準化重要性分別為:住院費用(100.0%)、住院天數(78.2%)、四周內手術次數(61.4%)、感染(60.5%)、傷口愈合不良(54.0%)和手術并發癥(47.8%)。對醫療風險的影響作用最小的自變量是入院方式(17.8%)。
表4 醫療風險指標的重要性

指標重要性標準化的重要性(%)入院方式0.02317.8住院天數0.09978.2住院費用0.127100.0四周內手術次數0.07861.4非計劃再次手術0.05543.7輸血總量0.04838.0非正常進入ICU天數0.04535.5病情危重0.04736.8病情突變0.05846.0搶救次數0.05946.3手術并發癥0.06147.8傷口愈合不良0.06854.0感染0.07760.5休克0.04837.6出院病情0.05140.6出院方式0.05845.4
3.1 神經網絡模型效果分析
醫療風險成因復雜,受患者因素、疾病因素、醫院管理因素、醫務人員因素、社會因素等的影響[5]。本研究僅納入了醫療風險的部分影響因素,所選16項指標均是從醫院HIS系統調取的定量指標,不包含醫務人員技術水平、醫患溝通、患者期望值等定性指標。所建立的神經網絡模型對醫療風險總的預測正確率達80%以上,具有較強的預測效能,可以為醫療風險識別提供客觀依據。同時,與多元線性回歸等模型相比,神經網絡模型給出了所有自變量的敏感度,有利于綜合判斷各自變量對醫療風險的重要性。
3.2 建立醫療風險神經網絡預測模型的意義
醫療風險管理是醫療質量管理的重要組成部分,醫療風險將直接影響醫療質量。如何控制醫療風險,降低風險發生率,是醫院管理者持續探索和關注的話題[6-7]。本研究所建立的醫療風險神經網絡預測模型,風險識別率高,對實時監測、篩選醫療風險,從而及時預防醫療風險發生有一定參考價值。同時,為醫院風險管理提供了新的方法和思路,有利于進一步深入挖掘風險成因,建立預警機制,總結歸納經驗,改進管理辦法,從源頭上遏止醫療風險的發生。
3.3 本研究的創新性和局限性
人工神經網絡對資料的分布特征無特殊要求,能夠較好地解決非線性問題等優點,在其他領域得到了廣泛應用[8-9],并取得了良好效果,但在醫療風險預測方面的應用較少。本研究嘗試將神經網絡用于醫療風險預測,并運用SPSS軟件建立神經網絡模型,與MATLAB等軟件相比,省去了復雜的編程麻煩,簡單易操作。同時,建立的神經網絡預測模型效果較好,對醫院管理部門進行醫療風險管理提供了參考。
但是,本研究僅是基于RBF神經網絡對醫療風險進行預測的初步嘗試,結果仍然存在一定局限性。由于僅以合肥市某三甲醫院為例進行分析,所用的數據資料均來自該院實際發生的案例,針對性較強,研究結果是否具有良好推廣性還有待進一步驗證。
[1] 方鵬騫,謝金亮.人工神經網絡在公立醫院監管指標體系中的應用[J].中國醫院,2012,16(9):23-25.
[2] 鄒慧琴,李 碩,陶 歐,等. RBF神經網絡在中醫藥領域中的應用及其在SPSS 17.0 軟件中的實現[J].中華中醫藥學刊,2015,33(2):336-338.
[3] 劉 晴,許 蘋,繩慧峰,等.醫院醫療風險預警預控指標研究[J].中國醫院管理,2016,36(7):43-45.
[4] 賀 佳,尹 平.醫學統計學[M].北京:高等教育出版社,2015.
[5] 劉 晴,許 蘋,繩慧峰,等.軍隊某三甲醫院醫療糾紛發生特點及對策[J].解放軍醫院管理雜志,2016,23(5):415-417.
[6] 連 斌,秦 婷,吳 瓊,等.醫療風險防范調控體系研究[J].中國衛生質量管理,2006,13(1):1-4.
[7] 杜淑英,曹紅英,顧躍靜,等.醫療風險管理的實踐及體會[J].中國衛生質量管理,2013,20(2):43-44.
[8] 江 弋,林永鵬.RBF神經網絡在股價預測中的應用[J].心智與計算,2007,1(4):413-419.
[9] 王 敏,張開金,姜 麗,等. BP神經網絡技術在慢性病患者住院費用研究中的應用[J].中國衛生經濟,2010,29(11):86-88.
修回日期:2016-12-16
責任編輯:吳小紅
Application of Artificial Neural Network in Medical Risk Prediction/
SHENG Huifeng,LIU Qing,XU Ping,et al.//
Objective To establish prediction model of medical risks based on artificial neural network, provide reference for effective prevention of medical risks. Methods With the admission form, length of stay and other variables as the input neurons, medical disputes group as the output neuron, using radial basis function (RBF) to establish neural network model, the occurrence of medical risk was predicted, and the factors on the role of health risk was evaluated. Results The prediction accuracies of the training sample and test sample were 83.7% and 84.2%, respectively. The top six importance of medical risk factors were hospitalization expenses (100.0%), length of stay (78.2%), four weeks’ operation times (61.4%), infection (60.5%), poor wound healing (54.0%) and complications (47.8%). Conclusion It is not affected by sample distribution features and data types to use RBF neural network to forecast the medical risks and has a good applicability.
Artificial Neural Network;Radial Basis Function;Medical Risk;Prediction; Application
10.13912/j.cnki.chqm.2017.24.4.07
國家社會科學基金資助項目(14AGL020)
陳春林 1 中國人民解放軍第105醫院 安徽 合肥 230031
2016-10-12
Chinese Health Quality Management,2017,24(4):15-17
繩慧峰1劉 晴2許 蘋3陳春林1*
2 安徽醫科大學解放軍臨床學院 安徽 合肥 230031 3 第二軍醫大學衛勤系衛生事業管理教研室 上海 200433
陳春林:解放軍105醫院院長
E-mail:shenghuifeng8@163.com