張駿,姬慧(.杭州市第三人民醫院,浙江 杭州;.杭州市中醫院,浙江 杭州)
邏輯回歸模型在醫療設備報廢評估輔助決策系統中的應用
張駿1,姬慧2
(1.杭州市第三人民醫院,浙江杭州;2.杭州市中醫院,浙江杭州)
本文針對目前醫療設備報廢主要依據使用年限和臨床主觀意見的現狀,提出結合目前醫療設備信息化管理系統,基于多參數的報廢評估輔助決策方法。利用邏輯回歸模型,對有內在關聯的多個因素(包括:設備采購價格、使用年限、維修次數、維修費用、售后服務情況、安全記錄等)共同作用下做出的評估。并且將該評估方法應用于醫療設備的報廢評估子系統中。
邏輯回歸模型;醫療設備;報廢評估;輔助決策
醫療器械報廢環節是醫院醫療器械管理中重要的環節,目前醫院設備報廢除滿足規定使用年限外,主要靠使用科室申請和醫工部門的審核,存在較多的主觀因素,缺乏科學合理的評價依據。隨著醫療設備信息化管理的廣泛應用,很多醫院都積累了大量的醫療設備相關數據。雖然人們可以在這些數據之上進行分析和研究工作,但是進行更高層次的處理時,例如從中發現規律和模式,對如此龐大的數據進行人工處理是非常困難。同時,隨著數據在日常決策中的重要性越來越顯著,人們對數據處理技術的要求也不斷提高,例如得到數據的總體特征以及預測發展趨勢等,而這些功能對傳統的管理系統來說是無法做到的。于是,人們希望有一種方法可以幫助處理這些十分繁雜的數據,從中發現有價值的信息或知識為決策服務,同時減輕工作負擔。[1]
數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。[2]是一種利用各種分析工具在海量數據中發現模型和數據間關系的過程,這些模型和關系可以用來做出預測。
醫療設備使用的安全性與有效性跟使用年限、工作環境、使用習慣、維護保養水平等眾多因素均有關聯,而醫療設備的報廢除考慮設備安全性和有效性外,還需要考慮設備使用的經濟效益。這些因素共同作用,決定醫療設備是否繼續使用。鑒于以上原因,本文提出利用邏輯回歸模型尋找其中的關系。
邏輯回歸(logistic Regression, LR)屬于概率型非線性回歸,它是研究二分類觀察結果與一些影響因素之間關系的一種多元統計方法[3],是回歸方法的一種。回歸是通過具有已知值的變量來預測其它變量的值。在最簡單的情況下,回歸采用最簡單的線性回歸這樣的標準統計技術。但是很多問題不是簡單的線性回歸所能預測的,如在用醫療設備什么時候報廢更合理等很難用簡單的線性模型來有效預測。因為描述這類事件的變化所需的變量太多,如產品本身設計制造因素,環境因素,使用因素,后期維修狀況,經濟效益等,且這些變量本身往往是非線性的,故要使用非線性的回歸方法,比如邏輯回歸,決策樹,神經網絡等。在研究過程中,本文通過比較,提出利用邏輯回歸模型作為醫療設備報廢評估模型的設想。

圖1 醫療設備報廢評估系統總體結構圖
3.1數據準備
因醫療設備的報廢與眾多因素有關,本文利用HIS系統中的記錄,調取:醫療設備裝機信息(包含設備類別、采購價格、使用年限等信息)、維修次數、年因故障停機時間、累計維修金額、單次最大維修金額、工資費用、修理用備件、常用消耗材料等信息[4],還需結合該設備是否還有零配件供應、安全事故記錄、售后維修響應情況等。
3.2數據清理與集成
數據清理主要解決樣本的不完整、噪聲和不一致的問題,以優化樣本,提高其后的挖掘過程的精度和性能。由于HIS中的維修記錄并不是根據數據挖掘的要求而記錄的,可能會存在某些數據的缺失,對于這類缺失的記錄,可以根據數據特性可以選用以下方法進行填補:
(1)常量填補;
(2)用所有樣本的均值或同類樣本的均值填補;
(3)根據工作經驗手工填補。[5]
而數據的集成,合并來自多個數據存儲的數據,主要是為來自不同醫院、不同HIS系統的異構數據進行合并處理。使數據集達到有足夠多的樣本分布,同時又有助于減少結果數據集的冗余和不一致,有助于提高其后挖掘過程的準確性和速度。[6]
3.3數據轉換與約簡
在收集到足夠多的可利用的樣本數據后,還需要將這些數據轉換成適合數據挖掘的形式,并將這些數據約簡成一個精簡的數據集合。數據約簡策略包括:維歸約(減少所考慮的隨機變量或屬性的個數)、數量歸約(用替代的、較小的數據表示形式替換原數據)、數據壓縮(使用變換,以便得到原數據的歸約或壓縮表示)。
邏輯回歸模型的數學表達式為:

注:k-維自變量yi-實際觀察到的響應變量;yi=1-事件發生;yi=0-事件未發生;Pi-第 i 個事件發生的概率(取值;在 0 到 1 之間);α-回歸截距;β1,…,βk-回歸系數。[7,8]
隨著多參數變量不斷增大,響應變量Pi也不斷增大,如果選取恰當的多個因素作為自變量,令每一組自變量對應的輸出概率為響應變量,利用歷史數據或者預先定義的數據訓練模型,就可以得到邏輯回歸模型的參數。
醫療設備報廢評估輔助決策具有二值性,即建議正常使用和建議報廢。決定設備是否報廢的因素用:使用年限、風險等級、故障頻率、維修費用、維修響應時間、新設備的價格等因素。因此,本文通過建立模型訓練樣本,利用訓練樣本對模型進行訓練,得到邏輯回歸模型參數,然后利用該參數值來獲取決策信息。
4.1邏輯回歸模型訓練與評估
本文利用已報廢設備的歷史數據,經過降噪、濾波等預處理后,進行特征提取,得到訓練用的初始特征集。然后設計一種搜索策略,來尋找最佳邏輯回歸模型。考慮到醫療設備的相關數據是屬于數據量相對較少,并且具有一定的先驗知識,因此可以選用貝葉斯統計方法評估模型。首先基于先驗知識,給定待估參數一個先驗統計分布,然后根據貝葉斯公式,推算出參數的后驗分布,最后最大化這個后驗概率,獲得對應的參數值。
4.2獲取報廢評估值
在HRP系統或HIS系統中,根據系統中設備的相關參數,預處理后再乘以各自的權重,輸入到訓練好的模型中即可作出是否報廢的建議。
在現有醫療設備信息化管理的條件下,通過利用醫療設備全壽命周期數據進行決策支持,實現醫療設備報廢前進行較為科學、準確的評估,從而解決醫療設備績效、代價、風險等互相制約的難題。對于充分發揮信息化管理的優勢,提高醫工的勞動價值和地位有著積極的作用。但在實施過程中可能也會面臨:數據收集問題、樣本選取問題、數據預處理問題、與其它系統集成問題等,需要在接下來的工作中逐步解決。
在大數據未出現之前,醫院通過對內部HRP、HIS等信息系統的建設,建立了高效的內部統計報表,對醫院業務發展決策起到重要作用。但是,這些數據分析只是反映了冰山一角,是不全面的,更多潛在的有價值信息往往被忽略。在大數據時代,業務部門需要以更新的視角來面對大數據,接受和利用好大數據,以創造出更大的價值。[9]以數據挖掘技術為基礎決策支持系統的研究,將大幅提高醫院的管理水平。[10]
[1]曾小麗,王中生.決策樹算法在評估中的應用研究[J].電腦知識與技術,2009,5(25):7314-7317.
[2]韓家煒,坎伯.數據挖掘:概念與設計[M].北京:機械工業出版社,2007.
[3]王濟川,郭志剛.logistic 回歸模型--方法與應用[M].北京:高等教育出版社,2001.
[4]周明山,袁林.醫療設備運行中的統計與核算[J].中國醫學裝備,2010,7(8):29-31.
[5]楊杰,姚莉秀.數據挖掘技術及其應用[M].上海:上海交通大學出版社,2011.
[6]Jiawei Han, Micheline Kamber, Jian Pei.數據挖掘概念與技術[M].北京:機械工業出版社,2012:61-62.
[7]羅富榮,劉文彬.基于邏輯回歸模型的地鐵工程建設多參數安全評估方法研究[C].Proceedings of 2010 International Conference on Management Science and Engineering (MSE 2010) (Volume 4).
[8]鐘金,劉文彬,楊劍鋒.基于邏輯回歸的滾動軸承性能退化評估[J].科技信息,2010,16:504-505.
[9]深圳國泰安教育技術股份有限公司大數據事業部群.大數據導論――關鍵技術與行業應用最佳實踐[M].北京:清華大學出版社,2015:8.
[10]莊軍,袁梅,劉侃,等.基于HIS下的決策支持系統的開發設想[J].醫學信息,2005,18(3):177-181.
Application of logistic regression model in the assistant decision system of medical equipment
ZHANG Jun1, JI Hui2
(1.Hangzhou Third Hospital, Zhejiang Hangzhou; 2.Hangzhou Hospital of Traditional Chinese Medicine,Zhejiang Hangzhou)
Aiming at the current situation of the medical equipment abandoned mainly according to the service life and the clinical subjective opinion, this paper puts forward the combination of the current medical equipment information management system, based on the multiple parameters of the decision making method. Using the logic regression model, the intrinsic connection of a number of factors (including: the purchase price of the equipment, the use of period, the number of maintenance, maintenance costs, after-sales service, safety record , etc.) together to make the evaluation. And the evaluation method is applied to the evaluation subsystem of medical equipment.
Logistic regression models; Medical equipment; Scrap evaluation; Assistant decision
浙江省醫院協會浙江省康恩貝醫院管理軟科學研究項目
項目名稱: 基于數據挖掘的醫療設備報廢評估研究
項目編號: 2015ZHA-KEB322