任月榮
隨著病案信息化的不斷發展,醫院借助信息技術手段從病案實體管理已逐步轉向對病案信息管理和數據挖掘與綜合利用上。大數據發展經歷了由“感知、傳遞、反應”到“模仿、記憶、判斷、反應”,再到“感知、記錄、傳輸、存儲、處理、挖掘”的變化過程[1]。大數據技術的不斷發展,已漸漸滲透到各個領域,醫療行業病案大數據是醫、教、研、管的重要數據支撐。病案信息向智能化評價體系轉換,是實現病案信息價值的綜合利用,將病案信息轉化為標準信息服務的關鍵。從而在未來趨勢預測的基礎上,提高病案的管理水平,提高醫療服務質量,為臨床和管理者提供決策支持。
從數據表現形式看,通常用“4V”來概括大數據的特征[2]。(1)Volume(大量):數據體量巨大。容量由TB量級到EB量級。(2)Variety(多樣):數據類型繁多。分為結構化和非結構化數據。(3)Velocity(高速):處理速度快。這是區分傳統數據挖掘的最本質特征。(4)Value(價值):價值密度低。通過強大的算法,合理利用低密度價值數據對其進行正確分析,迅速完成數據“提純”成為急下待解決的難題。上述特征描述了大數據的普遍特征,然而“運用”才是大數據最終的價值體現。
病案信息是指有關患者健康情況的文件資料[3]。從病案信息的特殊性看,其具有“4C”的特征。(1)Continuity(連續):隨患者就診次數增加而增加。(2)Confidentiality(保密):涉及患者基本信息和病情描述,沒有授權不得隨意公開。(3)Catholicity(普遍):普遍存在于國內外各等級醫療機構。(4)Copy(復制):個體病案信息是可以復制、影印。
習近平在實施國家大數據戰略加快建設數字中國中強調:推動實施國家大數據戰略,推進數據資源整合和開放共享;并指出:善于獲取數據、分析數據、運用數據使大數據在各項工作中發揮更大作用[4]。
大數據挖掘的本質就是通過海量歷史數據,分析和發現一些潛在的規律。他的意義就是利用潛在的規律預測未來可能發生的事。大數據挖掘就是智能統計分析的最終體現,是統計學的升級。
在病案建設發展過程中,信息累積是構建大數據挖掘與決策支持的基礎。在完善和優化信息化功能,建設以患者服務為目標的同時,要突破未來病案管理的瓶頸,亦要“統籌規劃病案信息資源”“建立完善病案信息管理體系”“加快建立病案信息技術體系”和“實現衛生事業的科學化智能化的管理與決策”。
在頂層設計上,統籌建設避免重復;充分利用現有病案資源和基礎設施,統籌醫療數據資源,加強數據的匯聚整合和關聯分析。
推動病案信息資源共享。明確病案信息共享范圍、使用權利和義務,以及使用方式等;建立統一使用接口和交換標準,推動醫療機構間信息資源共享[5]。
建立健全一套完整全面的病案信息管理體系[6],充分發揮病案信息的價值,促進病案管理日趨完善。嚴格執行《醫療機構病案管理規定》和《病歷書寫基本規范》等制度,同時依照相關法律法規,結合本院實際制定一系列具體程序和可行性規章制度,做到有章可循、有法可依。
完善病案信息標準體系。一是病案信息標準化的完善,國際疾病分類標準編碼的擴展與完善和醫學數字成像和通訊標準的完善,打造更加完善的醫療共享標準。二是醫療信息交換格式的標準化,結合衛生信息交換標準的設計思想,選擇制定適合我國實際和當前技術水平的衛生信息標準。
在病案大數據全生命周期管理中,加快建立科學可行的病案信息技術體系。在病案信息管理、挖掘分析以及信息應用等方面,通過研發非結構化和半結構化數據,重點攻關病案信息數據管理(數據采集、數據處理、大數據存儲)、智能分析、挖掘算法和可視化應用,以及建模方法等關鍵技術,利用病案大數據的價值分析,提升病案管理和輔助決策支持能力。
病案數據挖掘與決策支持體系的建立,對醫療衛生管理者意義在于:一是輔助醫療資源的合理分配;二是輔助醫療政策的制定和實施;三是輔助醫療費用的合理制定。在衛生事業管理的關鍵環節萃取病案信息之精華,其價值有助于管理者科學化智能化的管理與決策,有助于醫療政策的制定優化和落實,有助于醫療資源的合理分配,使政策更具活力。
病案數據挖掘與決策支持體系的構建離不開數據中心的建設[7-10],其架構主要包括云平臺環境、病案信息采集與預處理平臺、病案大數據存儲與交換平臺、病案信息挖掘與分析平臺和可視化智能決策支持平臺(BI)五大平臺。通過統一部署云平臺環境,經過數據采集清洗形成標準數據進行存儲,構建數據分析模型用可視化的方法提供給管理者,實現價值數據的共享利用。
云平臺環境:主要包括硬件平臺、網絡環境、操作系統、數據存儲等。
病案信息采集與預處理平臺:包括內部系統數據、醫聯體數據和互聯網數據三方面,尤其依賴于內部系統病案數據的積累。經過數據采集過濾,使分散存在的不同規模不同結構的數據經過過濾清洗、關聯、分析、加工后提供給數據存儲與交換平臺。
病案大數據存儲與交換平臺:構建基于Hadoop技術[11]的大數據存儲與交換平臺是病案大數據的核心,通過構建不同醫療機構間的編碼規范、接口標準、協作標準,共享公共數據、數據字典及分布式數據存儲,實現病案信息結構化、非結構化數據的集中存儲和交換。
病案信息挖掘與分析平臺:用決策樹、聚類算法、人工智能、神經網絡和統計分析等模型,對病案信息挖掘和分析。
可視化智能決策支持平臺(BI):通過數據挖掘分析技術建立多維分析模型、專題分析模型,將價值數據以動態直觀的圖表形式展現給管理者,為其提供依據和輔助決策建議。
基于疾病診斷相關分組的預定額付費方式是指基于疾病診斷相關分組為基礎的預定額付費方式[3]。構建病案信息大數據挖掘與決策分析體系的價值在于提供給管理者相對客觀準確的分析數據和輔助決策,實現多家醫療機構的長期跟蹤建模形成臨床信息數據集。
從廣義上講,醫療衛生資源是人類開展醫療衛生保健活動所使用的社會資源[12]。通過統籌規劃病案信息資源,實現醫院間、省市間、甚至全國范圍內的醫療信息數據共享,從而獲得各種流行病分布情況,達到合理分配醫療資源的目的。
隊列研究方法可直接計算測量疾病危險強度的指標,故在流行病學病因研究中被廣泛應用。利用病案大數據可以獲得隊列研究的大數據源,避免了數據錄入、查閱和隨訪造成的信息偏倚。
大數據技術應用于病案信息管理,對醫療決策和服務發揮巨大的支撐作用。基于病案大數據挖掘與決策支持體系建成后,病案大數據的研究與應用將進入新的階段。通過多渠道對病案信息采集過濾后形成集中存儲的標準數據,經過數據挖掘提取潛在的信息價值,為管理者提供決策支持,為衛生事業的蓬勃發展奠定堅實的基礎。