袁順星++李章昊++左其群++蔣璐



摘要:目前,由于醫(yī)患糾紛風險管理不足,醫(yī)患關系的發(fā)展日益緊張。為了滿足減少社會醫(yī)患糾紛的迫切需求、最大程度地挖掘醫(yī)患關系數(shù)據(jù)的價值,系統(tǒng)設計了基于C/S架構的醫(yī)患關系管理系統(tǒng),通過建立醫(yī)患糾紛數(shù)據(jù)庫,利用數(shù)據(jù)挖掘技術分析醫(yī)患糾紛數(shù)據(jù),并實現(xiàn)數(shù)據(jù)預處理、數(shù)據(jù)分析、同化反饋等功能。該系統(tǒng)能夠客觀地評估醫(yī)患關系風險,從而助力院方科學決策,促進醫(yī)患關系的和諧發(fā)展。
關鍵詞:醫(yī)患關系;大數(shù)據(jù);數(shù)據(jù)挖掘技術;醫(yī)療數(shù)據(jù)
中圖分類號:R197 文獻標識碼:B 文章編號:1006-1959(2017)19-0011-04 Research and Development of Doctor Patient Relationship Management System Based on Data Mining Technology
YUAN Shun-xing,LI Zhang-hao,ZUO Qi-qun,JIANG Lu
(School of Medical Informatics,Xuzhou Medical University,Xuzhou 221000,Jiangsu,China)
Abstract:At present,due to lack of risk management of medical disputes,the development of the doctor-patient relationship increasingly strained.In order to meet the urgent needs of the community to reduce medical disputes,to maximize the value of the data mining in the doctor-patient relationship,the doctor-patient relationship management system design system based on C/S architecture,through the establishment of medical dispute database,using data mining technology to analyze the data of medical disputes,and the realization of data pretreatment,data analysis,feedback and other functions.The system can objectively evaluate the doctor-patient relationship risk,thereby boosting the scientific decision-making,and promote harmonious doctor-patient relationship development.
Key words:Doctor-patient relationship;Big data;Data mining technology;Medical data
在醫(yī)療衛(wèi)生條件逐漸完善的今天,醫(yī)患糾紛事件卻屢有發(fā)生[1],不僅對醫(yī)院正常診療過程造成極大不便,更嚴重損害了醫(yī)護工作者的身心健康。此外,醫(yī)療體制市場化改革[2]、醫(yī)療保險制度的不完善[3]等因素導致醫(yī)患關系扭曲的結(jié)構性矛盾,嚴重擾亂醫(yī)療秩序,一旦發(fā)生醫(yī)患沖突,現(xiàn)有的糾紛調(diào)解渠道卻很難發(fā)揮出其應有的作用。如何緩解醫(yī)患沖突、構建和諧醫(yī)患關系成為當前醫(yī)療衛(wèi)生領域迫在眉睫的難題。
隨著信息化技術的發(fā)展,各種醫(yī)院信息系統(tǒng)及平臺得到了有效廣泛地使用,然而針對醫(yī)患糾紛管理的信息化[4]應用研究卻很少。醫(yī)患糾紛案件的發(fā)生并非毫無征兆,通過數(shù)據(jù)挖掘技術[5]可以從海量的醫(yī)患數(shù)據(jù)中獲取有價值的信息,從而增強醫(yī)患糾紛風險管理,進而實現(xiàn)對醫(yī)院醫(yī)患糾紛事件的有效防控。為此,本文結(jié)合數(shù)據(jù)挖掘技術、數(shù)據(jù)集成技術和軟件開發(fā)技術,從各式各樣的醫(yī)院信息系統(tǒng)中獲取、集成醫(yī)患糾紛數(shù)據(jù)資源,通過對醫(yī)患關系大數(shù)據(jù)的采集與分析[6],利用數(shù)據(jù)挖掘技術提取出有用的信息,從而評估醫(yī)患關系風險,為醫(yī)患服務管理決策調(diào)整提供有力的參考依據(jù),有效地監(jiān)管并預防醫(yī)患糾紛事件的發(fā)生。
1 數(shù)據(jù)挖掘技術概述
1.1基本概念
所謂數(shù)據(jù)挖掘(Data Mining,DM),指的是借助于人工智能技術、機器學習技術、統(tǒng)計學及模式識別等技術,并依托于此對數(shù)據(jù)庫中所存在的大量不完全、隨機、有噪聲、模糊數(shù)據(jù)的統(tǒng)計、歸納和推理,提取出隱含的、具有潛在價值的信息,從而發(fā)現(xiàn)事件的相互聯(lián)系,為管理者解決實際工作問題提供有效的決策支持[7]。
1.2數(shù)據(jù)挖掘的過程
圖1為數(shù)據(jù)挖掘過程的展示圖。如該圖所示,先對數(shù)據(jù)挖掘的對象進行確定,之后對數(shù)據(jù)進行相應的預處理,以便為挖掘做好準備,然后實施數(shù)據(jù)挖掘并對抽取的信息和挖掘結(jié)果進行分析,最后進行知識的同化,將決策反饋到現(xiàn)有的業(yè)務系統(tǒng)中。
2 系統(tǒng)設計
2.1系統(tǒng)總體設計
系統(tǒng)主要由數(shù)據(jù)預處理模塊、數(shù)據(jù)分析模塊和同化反饋模塊三部分構成,系統(tǒng)的整體架構圖見圖2。數(shù)據(jù)預處理模塊收集醫(yī)療信息系統(tǒng)的原始數(shù)據(jù)并進行字段提取、清洗、裝載和集成,進而形成醫(yī)患糾紛數(shù)據(jù)庫存儲在遠程服務器中。客戶端軟件服務平臺通過訪問醫(yī)患糾紛數(shù)據(jù)庫獲取數(shù)據(jù)源,并進行醫(yī)患數(shù)據(jù)的挖掘分析。同化反饋模塊根據(jù)挖掘分析結(jié)果提出醫(yī)患糾紛處置策略及預防方案建議,從而為醫(yī)療機構及醫(yī)護工作者的醫(yī)患管理工作提供有力支持。
2.2數(shù)據(jù)挖掘應用思路
對于醫(yī)患糾紛管理應用數(shù)據(jù)挖掘技術的過程來說,主要包括四個步驟,即:第一步,明確對象;第二步,進行數(shù)據(jù)準備;第三步,進行數(shù)據(jù)挖掘及結(jié)果分析;第四步,進行知識的同化。醫(yī)患糾紛管理應用數(shù)據(jù)挖掘技術的思路框圖見圖3。endprint
2.3系統(tǒng)功能設計
2.3.1進行數(shù)據(jù)預處理操作 將醫(yī)療機構中的原始數(shù)據(jù)庫進行數(shù)據(jù)的集成、抽取、清洗和裝載。在這一過程中,首先根據(jù)不同數(shù)據(jù)源的數(shù)據(jù)特征進行分析,提取轉(zhuǎn)換集成關鍵字段,如醫(yī)務人員和患者信息字段、科室機構的相關字段、醫(yī)患糾紛事件的相關字段。集成完成后進行數(shù)據(jù)清洗和裝載,清理其中缺少屬性值的殘缺數(shù)據(jù)、包含錯誤屬性值的噪聲數(shù)據(jù)及不一致的數(shù)據(jù),而對于完整的、正確的,以及一致的這些數(shù)據(jù)信息,則把其存入至數(shù)據(jù)倉庫中。
2.3.2數(shù)據(jù)總結(jié)分析 通過多維數(shù)據(jù)分析總結(jié)醫(yī)患糾紛數(shù)據(jù)并對其進行緊湊描述。在此過程中,對規(guī)范化的數(shù)據(jù)進行聚類分析和離散化,獲得醫(yī)患糾紛事件發(fā)生的頻率、時空分布和科室分布規(guī)律,從而分析在時間和空間分布上不同性質(zhì)的醫(yī)患糾紛事件是否具有一定的聚集性。同時,初步獲得醫(yī)患糾紛事件的相關敏感參數(shù),并檢測相關字段屬性的異常數(shù)據(jù)點,異常點的檢測能夠?qū)Ξ惓P袨檫M行預警及醫(yī)患糾紛個案分析等。
2.3.3數(shù)據(jù)相關性分析 根據(jù)挖掘目標和需求選擇相關字段,使用支持度、置信度和提升度來衡量數(shù)據(jù)之間關系緊密的程度,并利用關聯(lián)分析方法分析出數(shù)據(jù)之間的內(nèi)在聯(lián)系。如分析發(fā)生醫(yī)患糾紛事件的發(fā)生與患者的性別、年齡、文化程度等基本信息,所患病癥、病情狀態(tài)、治療狀況、所付費用等就診信息,負責醫(yī)師、所處機構科室等因素之間是否具有實際意義的內(nèi)在聯(lián)系。
2.3.4結(jié)果分析與知識通化反饋 分析關聯(lián)結(jié)果,選擇敏感參數(shù),運用決策樹、支持向量機、粗糙集等分類和歸納方法提取數(shù)據(jù)之間的預測規(guī)則,發(fā)現(xiàn)容易導致醫(yī)患糾紛發(fā)生的相關因素,進而對醫(yī)患糾紛行為進行預測,以減少或避免此類情況的發(fā)生。通過已知的數(shù)據(jù)記錄可以按照醫(yī)患糾紛的相關特征實現(xiàn)對未來數(shù)據(jù)的推廣預測。最后結(jié)合醫(yī)院醫(yī)護工作的實際管理過程,根據(jù)分析的結(jié)果提出有效的醫(yī)患糾紛的處置策略及預防方案建議。
3 系統(tǒng)數(shù)據(jù)準備
3.1醫(yī)患關系數(shù)據(jù)特點
與其他領域的數(shù)據(jù)挖掘相比,醫(yī)患關系數(shù)據(jù)[8]有著自身的特點,即其數(shù)據(jù)的規(guī)模大、數(shù)據(jù)結(jié)構呈多樣性、數(shù)據(jù)增長快速、數(shù)據(jù)價值巨大等典型大數(shù)據(jù)特性,同時也具備其獨有的特點,具體包括:①多態(tài)性:多樣性是醫(yī)療領域數(shù)據(jù)本身具有的顯著特點,也是區(qū)分于其他領域數(shù)據(jù)最為突出的標志。醫(yī)患關系數(shù)據(jù)包含純數(shù)據(jù)、信號、文字、動畫、視頻、語音等多種存儲形式。同時,它使探索醫(yī)患關系數(shù)據(jù)變得較為復雜,也加大了數(shù)據(jù)挖掘的難度。②冗雜性:醫(yī)療數(shù)據(jù)量大且雜,涵蓋內(nèi)容形式多樣,其中還包含重復、有誤以及矛盾的數(shù)據(jù)。為此,在進行數(shù)據(jù)預處理這個階段,需要實施數(shù)據(jù)清理工作,主要對這些數(shù)據(jù)進行清理,具體為:一是殘缺的數(shù)據(jù),包括缺少屬性值的數(shù)據(jù);二是含噪聲的數(shù)據(jù),有錯誤的屬性值也屬于這類數(shù)據(jù);三是不一致的數(shù)據(jù),信息相同但是表示方式不同的也屬于這類數(shù)據(jù)。與此同時,還要對不同來源的數(shù)據(jù)進行數(shù)據(jù)集成,從而統(tǒng)一數(shù)據(jù)字段及格式,建立獨立的醫(yī)患數(shù)據(jù)庫。③隱私性:醫(yī)患關系數(shù)據(jù)一定程度上涉及到患者和醫(yī)生的隱私,對于醫(yī)患關系數(shù)據(jù)的挖掘需要考慮到安全性。因此,需要清除數(shù)據(jù)庫中涉及到患者或醫(yī)生姓名、電話、家庭住址等敏感字段,從而保證醫(yī)患關系數(shù)據(jù)的隱私安全性。④社會性:大眾傳媒對醫(yī)患糾紛事件的關注度持續(xù)升高,部分民眾以偏概全、對醫(yī)療系統(tǒng)的整體性認識不足,醫(yī)患關系數(shù)據(jù)受到的輿論和社會影響與其他數(shù)據(jù)領域截然不同。
3.2數(shù)據(jù)庫設計
醫(yī)患糾紛數(shù)據(jù)庫的建立為數(shù)據(jù)挖掘提供數(shù)據(jù)基礎,其內(nèi)容和結(jié)構直接關系到挖掘結(jié)果,也是應用過程中需要首要解決的問題。基于此,先根據(jù)實際需要查閱相關文獻資料,并分析醫(yī)患糾紛事件發(fā)生的特點、歸納與其相關聯(lián)的各種因素;進而根據(jù)分析結(jié)果制作調(diào)查問卷,并對醫(yī)院各科室的過往糾紛事件進行針對性統(tǒng)計調(diào)查,進一步分析醫(yī)患糾紛事件的特點;然后通過Delphi法[9]進行專家訪談,討論調(diào)查及分析結(jié)果,最終確定數(shù)據(jù)庫的結(jié)構。系統(tǒng)設計的醫(yī)患糾紛數(shù)據(jù)庫主要包括:醫(yī)院科室機構表、醫(yī)務人員信息表、患者信息表、診療情況表、患者認知反饋表、醫(yī)患糾紛事件表等,圖4是關于醫(yī)患糾紛數(shù)據(jù)庫的實體-關系圖。
4 系統(tǒng)軟件設計
4.1數(shù)據(jù)預處理模塊軟件設計
在面向數(shù)據(jù)挖掘的數(shù)據(jù)預處理過程中,主要實現(xiàn)對醫(yī)療機構中的原始數(shù)據(jù)庫進行數(shù)據(jù)的集成、抽取、清洗和裝載等操作,數(shù)據(jù)預處理模塊部分功能界面效果圖見圖5。
為了解決醫(yī)院信息系統(tǒng)數(shù)據(jù)形式多樣、存儲環(huán)境各異、無法直接共享等問題,系統(tǒng)選用中間件模型的數(shù)據(jù)集成技術。數(shù)據(jù)集成是將異構、分布、自治的數(shù)據(jù)在邏輯上或物理上有機地集中,從而提供全面的數(shù)據(jù)共享。而中間件模型是一個成熟的數(shù)據(jù)集成框架,系統(tǒng)通過建立統(tǒng)一的全局醫(yī)患關系數(shù)據(jù)數(shù)據(jù)模型,并提供數(shù)據(jù)訪問的通用接口,從而讓集成醫(yī)療信息系統(tǒng)數(shù)據(jù)源作為統(tǒng)一的整體。
集成完成后進行數(shù)據(jù)集的清洗和裝載,針對其中缺少屬性值的殘缺數(shù)據(jù)、包含錯誤屬性值的噪聲數(shù)據(jù)及不一致的數(shù)據(jù)進行清理,而直接存入完整的、正確的,以及一致的數(shù)據(jù)信息,從而構建醫(yī)患關系數(shù)據(jù)挖掘的數(shù)據(jù)倉庫。
4.2數(shù)據(jù)分析模塊軟件設計
數(shù)據(jù)分析模塊利用開源數(shù)據(jù)挖掘工具WEKA(Waikato Environment for Knowledge Analysis)進行二次開發(fā)。WEKA是是Waikato大學研究的開源數(shù)據(jù)挖掘平臺,該平臺集成了面向數(shù)據(jù)挖掘過程的大量機器學習算法,實現(xiàn)對數(shù)據(jù)預處理、數(shù)據(jù)關聯(lián)性分析、數(shù)據(jù)分類和聚類等功能。系統(tǒng)通過基于WEKA工具的二次開發(fā),實現(xiàn)獲取醫(yī)患關系數(shù)據(jù),對數(shù)據(jù)的聚類分析、對醫(yī)患糾紛事件發(fā)生的頻率、時空分布和科室分布規(guī)律進行分析,檢測相關字段屬性的異常數(shù)據(jù)點及醫(yī)患糾紛個案分析,利用關聯(lián)分析方法分析出數(shù)據(jù)之間的內(nèi)在聯(lián)系等功能。數(shù)據(jù)分析模塊部分功能界面效果圖見圖6。
5 總結(jié)
本文探索并設計了數(shù)據(jù)挖掘技術在醫(yī)患關系的管理中的應用,實現(xiàn)了醫(yī)患關系的數(shù)據(jù)集成、數(shù)據(jù)分析和預測反饋。在將數(shù)據(jù)挖掘技術應用在醫(yī)患關系管理的過程中,充分有效地利用了海量的原始醫(yī)療信息化數(shù)據(jù),并從中發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在關聯(lián)和具有潛在價值的信息,從而輔助醫(yī)患關系管理的決策過程,具有一定的應用價值。然而,在實際應用過程中還存在一些難題,如醫(yī)患關系數(shù)據(jù)數(shù)量不大且質(zhì)量有待提高,醫(yī)患糾紛案件評價指標不夠完善等,尚需進一步解決。
參考文獻:
[1]陳丞,漆小鳳,劉梅英.新時期醫(yī)患糾紛引發(fā)暴力事件原因分析及防范對策[J].大家健康,2015(1):564.
[2]蘆蘭,師幸偉.關于我國醫(yī)患關系現(xiàn)狀的思考[J].醫(yī)學爭鳴,2016(3):66-70.
[3]母玉清.我國醫(yī)療保險制度發(fā)展的歷程、現(xiàn)狀及趨勢[J].中國初級衛(wèi)生保健,2016,30(2):16-17.
[4]劉華.醫(yī)療糾紛的信息化之路-專訪北京協(xié)和醫(yī)院醫(yī)務處副處長劉宇[J].中國數(shù)字醫(yī)學,2014,9(6):118-119.
[5]叢晶,楊波,王乙紅.等.數(shù)據(jù)挖掘在醫(yī)療質(zhì)量安全監(jiān)控系統(tǒng)應用的可行性研究[J].中國醫(yī)院管理,2013,15(2):386-388.
[6]高漢松,肖凌,許德瑋,等.基于云計算的醫(yī)療大數(shù)據(jù)挖掘平臺[J].醫(yī)學信息學雜志,2013,34(5):7-12.
[7]劉小華,胡學鋼.數(shù)據(jù)挖掘的應用綜述[J].信息技術,2009,33(9):149-152.
[8]繆春玉.醫(yī)患糾紛數(shù)據(jù)庫的研制[D].第三軍醫(yī)大學,2012.
[9]繆春玉,張紹蓉,曾琴,等.德爾菲法構建醫(yī)患糾紛數(shù)據(jù)庫的研究[J].重慶醫(yī)學,2012,41(12):1234-1235.
編輯/成森endprint