高揚
摘 要 隨著信息技術、網絡技術的發展促進了醫院信息化建設,也將醫療領域推向了“大數據”時代。全面建立醫院信息系統,在臨床工作中產生大量醫療數據,蘊含著極大的社會價值。醫療數據為實現醫院精細化管理,需將它進行整合、挖掘、分析,以此建立既能滿足醫院醫療質量考核需求,又能滿足臨床科研需求的臨床數據。
關鍵詞 醫療大數據 區域醫療 數據采集
中圖分類號:R197.32 文獻標識碼:A
1概述
隨著國家醫療制度改革的深化,國家對醫療衛生系統信息化建設的投資不斷增加,加強信息化建設成為醫療衛生行業的重要目標。醫療信息化的持續發展,產生并不斷積累大量的數據,龐大的數據中匯聚各類信息,只有通過有效的采集及專業化處理,才能為其應用提供有價值的參考和佐證。由于這些數據與生俱來就存在異構、分布式、碎片化等特征,造成數據業務規范符合性不強、上傳數據匹配度低、獲取數據信息不完整、數據存儲不規范等問題。 嚴重影響了區域衛生信息共享和管理質量。本文探討在醫療大數據利用過程中的主要問題和解決技術,從根本上解決大數據應用難題。
2醫療大數據利用問題分析
醫療衛生行業作為信息化建設的典型代表,“積累”了大量異構、分布式、碎片化的醫療大數據。各地相關部門為有效的采集、分析,利用醫療大數據提高衛生管理和決策水平,正積極建設區域衛生信息平臺。但醫療大數據的特征為區域衛生信息平臺的數據采集造成困境,這主要體現在數據復雜性和數據質量參差不齊兩個方面。
2.1數據復雜性問題
由于醫療行業的業務特點,醫療大數據具有體量巨大、數據繁雜、敏感信息少、時效性高的特征。同時,多元化的數據來源使醫療大數據中大量充斥著非結構化和半結構化的復雜數據類型。基于上述醫療行業大數據特點,對復雜類型數據的時效性采集是滿足實時統計分析的需求基礎,是實現從數據中獲取數據特征信息及規律的必要條件。因此,如何實現醫療大數據的高效采集、挖掘出有用的信息,以滿足對復雜類型數據的高效的采集需求,是醫療大數據應用所需解決的問題。
2.2數據質量參差不齊
由于醫療信息化進程的推進,各醫療衛生機構信息化建設的逐步成熟和發展,能夠為區域衛生信息平臺提供豐富的結構化和非結構化的業務數據。大量的業務數據所構成的醫療大數據,為區域衛生信息平臺提供多元的數據資源,同時也帶來數量級不容忽視的“臟”數據,數據質量問題浮出水面。如果沒有有價值的數據,再先進的技術、再新的模式也是無效的,價值難以體現。
綜上,醫療衛生行業需要一種醫療大數據采集技術,該技術是結合醫療衛生行業業務特征能夠解決大數據采集過程中數據復雜性問題,實現低耦合、可復用的醫療數據抽取,完成高效率的數據采集,并可以高效、簡便的進行數據處理,解決數據的標準化處理,實現高效率高質量的為區域衛生信息平臺上報數據。使得業務數據得到穩定高效的處理和發布,從而推動醫療衛生體系的建設和管理,為區域醫療系統的構建提供有力支撐。
3大數據采集技術分析
大數據采集技術結合醫療衛生行業數據及業務特征,構成了適用于其行業的醫療大數據采集技術該技術是結合大數據采集技術、模糊匹配技術以及規范化數據緩存技術,技術之間彼此協作,實現將區域內所屬的醫療衛生機構數據自動、準確、實時、安全、可靠的采集至區域衛生信息平臺,解決醫療衛生大數據采集過程中遇到的數據復雜性和質量低下等核心問題。
3.1數據模板化采集技術
基于異構醫療系統數據映射模板的數據采集技術,實現針對區域衛生平臺業務標準的數據采集,提升業務數據采集的效率。本技術解決了醫療衛生行業業務數據的規范化采集問題,通過數據采集模板的業務約束實現數據的規范化采集,使得數據采集過程更為高效和規范。數據映射模板的設計基于異構醫療數據系統中醫療數據的特點構建,適應醫療行業數據及業務特征。基于數據映射模板的數據采集技術使得醫療衛生行業的業務數據得到穩定、高效、低成本的采集和處理,推動了醫療衛生體系的建立和管理,為區域衛生信息化建設提供了有力的支撐。
3.2模糊匹配技術
模糊匹配是實現數據轉換處理的關鍵性技術,模糊匹配將自動學習策略融合到數據標準編碼映射處理過程中去,實現數據標準化處理的自動化。實現數據的標準化處理是提升數據質量的關鍵技術之一。通過模糊匹配,根據關聯度值的情況完成映射匹配,匹配結果經人工校驗后得到正確的匹配關聯關系,此關系被系統進行記錄和學習。在進行多次固定行業的映射匹配后,匹配的精度和準確性會隨著行業實踐次數的積累而線性提升,在提升數據處理質量的同時,也大大降低了處理成本。
3.3規范化緩存技術
規范化緩存技術實現對醫療業務數據的規范化處理,提升數據質量,使得數據符合業務歸檔要求。規范化緩存技術所依賴的業務模板模型的設立是基于醫療業務的標準規范來創建的,該規范包含醫療行業國家標準、醫院業務規范,同樣包含數據編碼規范和數據存儲格式規范。由于醫療行業對規范依賴的特殊性,使得醫療數據規范化的價值在實際應用中尤為突出。
醫療大數據采集技術所涵蓋的3類關鍵技術彼此協助,通過大數據采集運行引擎的支撐實現數據的標準化采集及處理,實現各醫療衛生機構結構及非結構化數據的采集及向區域衛生信息平臺的上報。
4結語
醫療大數據采集技術,其匯聚統一安全保障以及支持負載均衡與高可用性的技術解決方法,構建出全面支撐面向服務的醫療大數據采集解決方案。可支撐包括各級醫院、基層醫療衛生機構、公共衛生數據的采集和上報業務。醫療大數據采集方案的根本目標是解決醫療大數據采集過程中面臨的數據類型復雜多樣、建設成本高等困境。支持區域衛生信息平臺通過醫療大數據方案提供的各項數據實現對區域內各個醫療機構統一的管理與維護,實現統籌決策、疾病預警、業務協同、醫療機構監管等平臺應用。平臺端利用獲取到的各項數據進行各類醫療業務綜合處理,實現區域內平臺、醫療監管機構與各醫療機構端的數據協同。
高效的數據采集對衛生信息平臺至關重要,大數據在提供醫療決策支持和提高衛生管理水平中發揮著重要作用。醫療數據的采集方案的實施有效的簡化了工作的難度、縮短了實施周期、降低了項目成本、提高了數據質量,為區域衛生信息平臺提供優質數據。實現助力區域衛生信息平臺的建設和發展。