陳曉妍 孫向東 陸傳統 唐玲 張暉 翁可為 王侃



摘要:本文介紹了基于循證醫學的海量數據挖掘系統設計及應用。該系統利用區域衛生信息平臺中的相關數據,對傳染病、慢性病,及門急診等指標的分析預測,實現了基于循證醫學的醫學數據挖掘分析,較大地提升了區域醫療決策水平。
關鍵詞:數據挖掘;循證醫學;區域衛生信息平臺;分析平臺
1 引言
隨著大數據時代的到來,數據挖掘和模式識別已經逐漸成為新的醫學科學研究范式。而臨床大數據集具有數據格式多樣、復雜且難于統一,使得很大一部分臨床數據得不到有效的利用。因此,如何根據循證醫學特點,合理利用數據挖掘技術,獲取有價值的治療證據是循證醫學的關鍵所在。
寧波市區域衛生信息平臺自2013年建設開始,目前已接入市屬8家醫療機構和鄞州區、海曙區、江東區、江北區、鎮海區、奉化市、余姚市、慈溪市、寧海縣、奉化縣等區市縣級平臺以及市級公共衛生專業機構,實現了醫療服務信息和公共衛生服務信息的采集與交換。
本文從循證醫學視角出發,構建電子健康檔案和電子病歷信息資源整合與挖掘的宏觀模型和數據分析系統,對數據采集、數據挖掘等幾環節進行設計,把紛繁復雜的醫療數據轉變成有價值的信息,初步實現了對醫學數據的交融擴展及挖掘分析的目的,為醫學科學研究、臨床診療、衛生決策、公眾服務制定提供依據,其中包括:①幫助尋找最佳藥物組合及標準化治療方法,提高診療效果;②預測慢性疾病風險,查明罹患疾病幾率;③協助醫院評估、監測和提高患者治療的安全性;④優化醫院資源利用等等。
2 系統的架構及功能
系統采用B/S結構、面向對象的設計,以C#作為開發工具結合MSSQLServer數據庫技術開發而成。系統由數據采集、數據管理、數據應用、平臺訪問、平臺管理五大類模塊組成[1]。
平臺功能可分為智能報表分析、動態表單管理、動態數據庫管理、動態數據庫管理以及動態數據接口管理。系統采用高性能的緩存機制,確保網站訪問速度;采用強大的安全機制,防止各種注入式攻擊等漏洞;系統充分考慮了底層大數據量并發的性能問題。
3 系統的應用
3.1統計分析 統計數據分為傳染病數據、高血壓數據及門急診數據三大類別,各類數據可根據時間、地區、患者年齡、患者淶源、性別、職業、疾病等進行分項統計。數據展示形式可分為曲線圖、柱狀圖、餅圖、漏斗圖等。
3.1.1傳染病統計 系統可將傳染病報告例數按年份、月份、地區、年齡、性別、職業、疾病病種進行分項統計;圖1、圖2中分別顯示了2011年~2014年傳染病報告例數的逐月分析和按病種分析。
3.1.2 高血壓統計 根據系統對已進行登記管理的高血壓人群相應地區、年齡、性別的統計分析,我們可以對高血壓病的易感人群開展重點防控。見圖3。
3.1.3門急診分析 門急診統計可以對寧波市屬各醫療機構及全市總門急診量進行逐月統計。見圖4。
3.2 數據預測
3.2.1 算法介紹 數據預測采用了移動平均算法,移動平均法是用一組最近的實際數據值來預測未來一期或幾期內數據的一種常用方法。移動平均法適用于即期預測、能有效地消除預測中的隨機波動。
移動平均法是一種簡單平滑預測技術,它的基本思想是:根據時間序列資料、逐項推移,依次計算包含一定項數的序時平均值,以反映長期趨勢的方法。因此,當時間序列的數值由于受周期變動和隨機波動的影響,起伏較大,不易顯示出事件的發展趨勢時,使用移動平均法可以消除這些因素的影響,顯示出事件的發展方向與趨勢(即趨勢線),然后依趨勢線分析預測序列的長期趨勢[2-3]。
移動平均法可以分為:簡單移動平均和加權移動平均,系統采用的是簡單移動平均算法。簡單移動平均的各元素的權重都相等。簡單的移動平均的計算公式如下:
Ft=(At-1+At-2+At-3+…+At-n)/n
在此公式中,oFt表示對下一期的預測值;on表示移動平均的時期個數;oAt-1表示前期實際值;oAt-2,At-3和At-n分別表示前兩期、前三期直至前n期的實際值。
3.2.2 預測效果
3.2.2.1傳染病預測 根據2011年1月~2014年12月這一段時間的傳染病數據,運用移動平均算法對數據進行處理,預測2015年度寧波市傳染病發病數量預測,見圖5。
3.2.2.2 門急診預測 在寧波市某醫院2014年門急診量數據的基礎上,運用移動平均算法對2015年該院的門急診量進行預測,圖6為2014年該醫院的門急診量統計,預測結果見圖7。
4 討論
該數據挖掘系統有效地利用了區域衛生信息平臺中的海量數據,采用海量檢索、人工智能和統計學等方法對寧波地區傳染病、慢性病中涉及的循證醫學統計指標進行分析,對醫院門急診量進行預測,有助于寧波地區醫療管理用戶更加合理、有效地配置衛生資源及配套設施,為各項醫療計劃的制定,及決策的實施提供可靠的理論依據。隨著科技的進步,數據挖掘技術在疾病診療、藥物應用,及醫療決策支持中的挖掘應用范圍會越來越廣,數據挖掘分析平臺將衍生出更多面向具體問題的分析子平臺,從而能夠更好的為疾病診療帶來保障。
參考文獻:
[1] 孫向東,黃曉琴,朱春倫,等. 基于循證醫學的海量醫學數據挖掘分析方法研究[J]. 醫學信息學雜志,2015,(3):11-16.
[2]邱宏,陳靜. 移動平均趨勢法在醫院門診量動態分析中的應用[J].寧夏醫學雜志,2012,34(9):932-934.
[3]陳輝,周雄輝,朱燕,等. 移動平均季節指數法在預測門診量和出院人數中的運用[J]. 中國衛生統計,2012,29(2):312.編輯/金昊天