史鳴奇
【摘 要】隨著醫療衛生信息系統和高通量測序等醫學診斷技術的高速發展,醫療健康領域正逐步邁入“大數據時代”。醫療大數據包括居民行為健康等基本數據、電子病歷、診療數據、檢測報告、醫學影像、醫學管理、經濟數據等。醫療大數據具有規模大、增速快、結構多樣、應用價值高等特點。面對海量數據,如何以數據創新探索未來醫學科學,提升人類醫療健康水平,已成為國內外關注熱點。
【關鍵詞】大數據;醫療健康;醫療信息化
1 國際大數據產業在健康醫療領域的應用發展現狀
近年來,英、美、加拿大等國家先后投入巨資開展醫療健康信息化建設,引入大數據信息化技術使得醫療健康信息化系統能夠輔助公民醫療質量和安全,提升整體醫療服務質量,提高醫療服務可及性,降低醫療費用,減少醫療風險。
1.1 美國:推動健康醫療大數據開放共享,重點發展精準醫療
美國在推動大數據研發和應用上最為迅速和積極。在健康醫療大數據方面,2014年6月,FDA公共數據開放項目openFDA正式上線,開放了2004至2013年間的300萬份藥物不良反應和醫療過失記錄(經脫敏處理數據),鼓勵企業和個人對數據價值進行挖掘與分析。2015年1月,美國前總統奧巴馬宣布劃撥2.15億美元作為精準醫療計劃經費,加快基因組研究。同時美國還制定一系列的標準和要求,以保護隱私和跨系統數據交換安全。
1.2 英國:積極發展個性化醫療,注重隱私保護
2013年6月,英國醫療保健當局宣布將建立世界最大的癌癥患者數據庫,收集來自英國各地醫療機構的病例和1100萬份歷史檔案記錄,保存和整理英國每年35萬新確診的腫瘤病例的全部數據。同年,英國啟動了醫療健康大數據旗艦平臺care.data,集中了全英國的家庭醫生和醫院記錄的病歷以及社會服務信息。由于該平臺運作中發生數據被披露,2016年7月6日,為保護患者隱私,care.data計劃被終止。
1.3 加拿大:建設互聯互通平臺,探索衛生經濟和療效研究
近年來,加拿大借助大數據和移動互聯網技術建立了覆蓋全國的電子健康檔案、藥品信息、實驗室信息、影像系統、公共衛生信息和遠程醫療系統,建立統一識別系統以及基礎架構和標準的研究。同時,利用大數據開展基于衛生經濟學和療效研究的定價計劃,開展了基于衛生經濟學和療效的藥品定價試點項目,利用數據分析衡量醫療服務提供方的服務,并依據服務水平進行定價。
綜上所述,國外政府高度重視醫療大數據產業發展,政策著力點主要在三個方面:一是開放數據,提供社會高質量數據資源;二是在前沿及共性基礎技術上增加研發投入;三是積極推動政府和公共部門應用大數據技術。
2 我國醫療大數據應用發展現狀
2.1 前期的醫療信息化建設為醫療大數據產業發展打下了堅實的基礎
2006年開始,我國開始建設區域衛生信息平臺,整合區域范圍內醫院、基層衛生機構、公共衛生的各類數據,形成以個人為中心的電子健康檔案庫。數據主要包括臨床信息——處方、檢驗報告、檢查報告、手術報告、病案首頁、出院小結;公共衛生信息——疾病報告、疾病管理、生命統計、兒童保健、婦女保健、老年人保健等。通過十年多探索,在醫療健康大數據已經初步具備了基礎和規模,并取得了一些標志性的成果:
一是,國家層面的頂層設計和總體框架:建設了人口健康信息化建設的指導意見“46312”工程,發布“全民健康保障信息化”工程一期數據總體架構。
二是,國家衛生標準制定和互聯互通:圍繞互聯互通與信息共享,已研發形成了89個數據集、277項醫療衛生信息標準、3300個數據元。以公民身份證號碼為唯一標識實現了醫療衛生數據與公安、教育、民政、人社等部門的信息協同,共計覆蓋13.6億人口,包含13項信息的國家人口基礎庫。
三是,衛生信息化基礎能力建設:目前,全國有71%的省啟動了省級衛生信息化平臺建設,46%的地市啟動了市級衛生信息化平臺建設,29%的區縣啟動了區縣級平臺建設。2015年國家衛生計生委啟動了十省互聯互通項目,目前已經接入了上海、北京、湖南、湖北、江蘇、浙江、福建、重慶、內蒙古、遼寧十個省級平臺。在醫院層面,目前我國約50%的委屬醫院,42%的省屬醫院和38%的市屬醫院已啟動醫院信息平臺建設。
2.2 國家出臺了一系列政策為醫療大數據產業發展提供了良好的發展環境
2015年起,國務院和國家衛生計生委等有關部門陸續發布了一系列指導性文件,提出加快醫療大數據相關技術和產業發展,推動醫療衛生服務模式和管理模式轉變,提升我國醫療服務水平,從而為醫療大數據發展提供了良好的政策環境,相關政策如表1。
3 上海醫療大數據發展基礎與現狀
3.1 發展基礎與優勢
一是,構建了良好的醫療信息化和大數據基礎。上海率先建設了國內規模最大的三級醫院臨床信息共享工程——上海醫聯工程。醫聯工程接入了全部市級以上38家三級甲等醫院,數據涵蓋醫療中的醫療業務、臨床業務、醫學影像、醫療運營、醫療管理等核心內容。在此基礎上,上海市衛生計生委聯合申康中心建設了覆蓋全市16個區、所有600家公立醫療衛生機構的上海健康信息網。截至2015年底,上海市已累計為7175萬名患者建立了診療檔案,醫囑17.4億條,各類檢驗檢查報告2.3億份;建立了國內最大的醫學影像中心數據庫,實現了醫學影像數據的調閱共享,截至2015年底,累計采集影像資料9.8億幅,數據量413T,月均跨院調閱影像數據約2萬次。
二是,集聚了一批國家級科研院所和創新平臺。包括中科院上海生命科學研究院、藥物所、復旦大學醫學院、上海交通大學醫學院、第二軍醫大學等大批國家級科研院所及相關醫院。建成和在建國家新藥篩選中心、上海蛋白質科學設施、國家肝癌中心、國家轉換醫學中心等國家級科學基礎設施和創新平臺。復旦大學建成“上海市數據科學重點實驗室”,涉及醫療健康、智慧城市等多領域的大數據分析,并在國內率先成立大數據學院。
三是,擁有國際化創新產業集群。上海市已形成生物醫藥和軟件大數據等產業集群,集聚了萬達信息、金士達衛寧等國內醫療信息化領先企業以及上海醫藥、上海聯影、上海微創等一批生物醫藥和醫療器械企業;成立了上海數據交易中心作為大數據“交易機構+創新基地+產業基金+發展聯盟+研究中心”五位一體的重要功能性平臺;匯聚IBM、Intel、微軟、羅氏等跨國公司研發機構超過200家。
四是,具備創新改革多重疊加優勢。上海正在推進張江國家自主創新示范區建設、深化中國(上海)自由貿易試驗區改革開放。在國家的大力支持下,正探索科技金融、國際人才試驗區、海外人才往來、國際合作研究等方面創新改革的先行先試,具備獨特的創新改革優勢。
3.2 存在的不足與瓶頸
上海市醫療健康行業中累積了大量的結構化和非結構化醫療健康數據。但是,由于存在醫療數據互聯互通和標準化程度低等一系列問題,制約了醫療大數據產業發展,具體如下:
(1)缺少標準化規范,數據質量不高:各醫療服務機構在推進信息化建設過程中缺乏通用的數據標準、技術標準、管理標準和業務標準,難以形成標準化的公共服務體系。采集的數據由于缺乏統一標準,數據記錄存在偏差和殘缺等原因,總體數據質量不高。
(2)資源管理分散,大數據利用水平低:從醫聯工程建成至今,上海市積累了近PB級的包括診療記錄、處方、醫囑、出院小結、檢驗檢查報告、醫學影像信息等在內的海量醫療數據,但由于存在數據結構化程度較低,電子病歷標準不一致、大量醫療數據存儲分散等問題,兼容性、可擴展性較差,給信息共享帶來了困難。同時,由于缺乏獲取知識級情報的技術手段、缺乏對醫療大數據資源的深入價值挖掘,還未形成數據驅動的科學研究模式與知識應用服務,實現醫療大數據的深度應用。
(3)醫療隱私保護難度增加:隨著醫療衛生信息共享的開展,隱私保護的難度逐步增加,很大程度上限制了醫療衛生信息資源的利用程度。
(4)缺少醫療大數據專業人才:隨著醫療大數據產業的快速發展,對專業技術人才的需求量激增,權威專家估算,我國未來五年相關專業人才缺口將高達130萬左右,尤其是橫跨生物醫學和信息科學,具備扎實理論基礎,又有業務實踐經驗的大數據人才非常緊缺。
(5)缺乏協同合作機制:醫療大數據關鍵產業環節之間還沒有建立有序的協同合作機制,為技術研發、工程孵化、成果轉化、行業應用、標準評估等關鍵環節提供合作渠道。
4 發展醫療大數據技術突破方向和重點
根據上海市醫療信息化和大數據產業基礎,結合國際大數據在健康醫療應用的發展趨勢,未來幾年,上海市相關機構和部門應主要針對以下核心技術進行研究和突破。
4.1 醫療大數據互聯互通技術
主要包括:互聯互通技術開放架構和配套技術、異質多源數據的整合技術等。通過適合多層級、跨區域醫療信息系統共享協同的互聯互通技術開放架構和配套技術,能夠適應多種醫療信息系統接口,提高互聯互通實施效率;研發支撐組學數據、醫療數據和健康數據等異質多源數據的整合技術,適應數據類型復雜、存儲模式多樣、語義標注體系各異、規模巨大等特點。
4.2 醫療大數據整合管理技術
主要包括:多源醫療大數據的語義關聯技術、醫療數據質量修復技術及基于數據管控的醫療大數據共享利用技術等。建立基于統一患者身份的索引、疾病代碼及藥品代碼規范等,在語義層實現多來源醫療數據與其他行業數據的融合,支持智能學習和語義理解;通過實現數據智能填充和補正,解決系統數據源頭質量低、數據缺失、填寫不規范的問題;在原始數據擁有方可管、可控、可溯源的前提下,允許第三方基于數據沙箱開展分析利用,促進醫療大數據利用水平。
4.3 醫療大數據分析檢索技術
主要包括:醫療知識圖譜智能構建技術、醫療影像分析技術等。基于臨床數據、健康檔案、人群隊列、專病數據庫等,在語義規范化和語義關聯網絡的基礎上,構建出跨知識庫融合的知識圖譜;通過圖像分割、圖像配準、圖像可視化、多時序圖像分析、統計學分析和生理學模型分析等,有效支撐臨床輔助診斷、療效評估等。
4.4 醫療大數據集成應用技術
主要包括:醫療質量控制管理技術、臨床精細診療決策支持技術、疾病經濟負擔分析評價技術、公共衛生決策支持技術、個性化智能健康服務推薦技術等。通過集成應用上述技術,實現相關技術的綜合運用,開發醫療質量監管、臨床輔助診療、衛生經濟分析、公共衛生決策服務、健康管理、醫保醫藥等軟件產品,并進行示范應用。
4.5 醫療大數據隱私保護及安全風控技術
主要包括:隱私保護技術和訪問控制技術,平衡隱私保護和數據挖掘需求的醫療大數據脫敏發布技術,基于訪問行為安全審計的、風險自適應的醫療大數據訪問控制技術等。通過上述技術的應用,實現針對不同數據共享方的數據按需脫敏,加強醫療大數據安全風險防控,構建基于安全多方計算的、醫療大數據隱私縱深保護體系。
5 相關政策建議
在開展技術研究突破的同時,為推進醫療大數據的應用和產業發展,建議從研發支撐平臺、成果轉化和工程應用、人才和能力建設等方面重點突破,創新建設體系與應用模式,全面引領和支撐我國醫療大數據領域的發展,形成完善的產業生態系統。
5.1 建設創新技術研發平臺
通過建立醫療大數據應用技術的創新研發平臺,組織開展醫療大數據互聯互通、醫療大數據整合管理、醫療大數據分析檢索、醫療大數據標準、醫療大數據隱私保護、醫療大數據行業應用等研究,進行關鍵技術的研發、產品化和工程化,快速提高我國醫療大數據應用技術水平。以居民健康檔案、臨床診療數據、生物組學數據、醫保醫藥等數據為基礎,著力探索醫療數據資源的統一標準,形成從區縣、地市級、省級到國家級別的數據資源全面整合共享和規范化,推動醫療數據的互聯互通和融合共享。
5.2 培育醫療大數據行業自主創新能力
通過行業領先企業和科研單位的強強聯合,發揮技術研發的導向作用,建設開放式、包容式技術研發創新平臺和產業聯盟,為國內外優勢力量提供參與協同創新的沃土。面向限制醫療大數據行業應用存在的重大技術瓶頸,以國家的醫療衛生行業需求為導向,承擔國家重大任務和企業提出的攻關研究項目,開展醫療大數據關鍵核心技術和新產品的戰略性、前瞻性研發,發展一批具有創新技術路線的醫療大數據的技術模式。
5.3 構建產學研用協同創新聯盟促進創新成果轉化
聯合醫療衛生管理部門、醫療衛生服務機構、醫療科研機構、互聯網醫療企業和醫保醫藥企業等產業鏈關鍵用戶單位,構建產學研用協同創新聯盟,積極探索醫療大數據應用技術的成果轉化,支撐醫療信息化產業鏈企業開展數據互聯互通、共享協同、分析利用等方面的產業鏈協作。建設技術成果應用示范基地,對接用戶單位產業化應用需求,推進技術成果轉化與實際應用,推動醫療大數據產業快速發展。
5.4 集聚和培育一批國際化優秀創新人才
充分利用上海市高校、研究機構及相關企業基礎及資源,形成跨學科跨領域聯合培養、多形式培訓模式和系統,建立醫療大數據應用技術的人才培養平臺,為醫療大數據創新工作提供源動力。充分發揮上海市建設科創中心的相關政策優勢,集聚和吸引各類優秀人才,形成一支結構合理、緊密協作的專病研究、人群隊列、公共衛生、生物組學、臨床醫學、計算機科學等多學科團隊。
5.5 開展模式創新提升我國醫療全產業鏈服務能力
聚集全國醫療醫藥科研創新資源,通過“眾智、眾包、眾創”的模式促進醫療大數據的價值發現,面向行業共性問題和需求,研發一系列醫療大數據服務產品,形成數據驅動的醫療服務決策能力,提升醫療質量監管、臨床輔助診療、衛生經濟分析、公共衛生政策評價水平,并服務于健康、醫藥、醫保、醫療、大數據多個上下游產業鏈,提升我國醫療相關產業整體水平。
【參考文獻】
[1]張振,周毅,杜守洪,等.醫療大數據及其面臨的機遇與挑戰[J].醫學信息學雜志,2014,35(6):1-8.
[2]周光華,辛英,張雅潔,等.醫療衛生領域大數據應用探討[J].中國衛生信息管理雜志,2013(4):296-300.
[3]張彥瑾,滕悅,宣騰,等.上海市某醫聯預約服務平臺應用效果分析[J].醫學與社會,2015(2):47-48.
[4]母曉莉,徐俊,楊燁,等.基于醫聯平臺的實時數據交換產品的設計與選型[J].中國數字醫學,2016,11(3):64-68.
[責任編輯:朱麗娜]