施樂旻,虞銘明,施利忠
(1.嘉興市衛生健康委宣傳教育中心,浙江 嘉興 314000;2.同濟大學浙江學院經濟與管理系,浙江 嘉興 314051;3.萬達信息股份有限公司,浙江 嘉興 314000)
區域健康信息平臺主要的數據來源是某地區的各級醫院、各級衛生行政管理機構、公共衛生機構等機構對居民的信息進行采集而獲得的,它通過推動不同機構之間的數據共享,能充分利用多源、動態的數據,形成一種完整的健康醫療模式,使政府、醫院、醫生及患者間形成有效的連接[1]。基于平臺的大數據分析和衛生健康信息管理,可以為區域提供有效的疾病監測、預警提醒和預防決策等公共衛生服務[2]。本文以嘉興市人口健康信息平臺大數據為例,探索區域健康信息平臺及醫療大數據的應用,以期為區域醫療管理提供幫助。
近年來,英國、美國、加拿大、澳大利亞等國家先后投入巨資開展了以電子健康檔案和電子病歷數據共享為核心的國家和地方級區域性衛生信息化建設[3]。2002年,澳大利亞國家電子健康檔案工作組推出了一套電子健康檔案系統——MediConnect。根據澳大利亞專家測評,該電子健康檔案系統投入后每年可創造超過50 億澳元收益,其中約23.1 億澳元是避免藥物不良事件(ADE)所節約的費用[4]。2006年,英國政府搭建了全國性的衛生信息網基礎設施,并部署了一系列應用服務。通過該信息網,患者可以選擇并預定醫療服務,獲得自身的電子健康檔案,網上辦理出院手續等;醫生可以通過該信息網可開展電子病歷書寫、網上預約、電子處方、醫學影像共享及遠程醫療咨詢等醫療活動[5]。另外,根據IDC Health Industry Insights 分析,如果將2005/2006年定義為美國區域衛生信息化的“新生兒期”,2007年開始其將進入“青春期”和“成熟期”[6]。美國衛生部于2010年正式公布了“有效使用”區域健康信息平臺的概念,“有效使用”要求實現的功能分為兩個階段。第一階段:電子健康檔案、臨床決策支持、公共衛生監督等;第二階段:臨床記錄、醫患互動平臺、個人健康檔案錄入等,高級附加功能有疾病及慢性病管理、醫保保險范圍審查及跟蹤、公共衛生提醒等[5]。
我國于“十二五”(2011-2015)期間,中央財政資金和各省地方配套資金投入空前巨大,省、市、縣三級健康信息平臺建設初具規模,互聯互通應用效果初步顯現。但是在2021年7 月9 日,中國衛生信息技術/健康醫療大數據應用交流大會(2021CHITEC)中有專家提出目前存在的問題如下:①有數不知:不知數據在哪里,有哪些數據;②求數無源:數據采集過程缺乏標準化自動化工具,成為成本和技術難點;③有數無據:采集到的數據標準不一,無法對數據進行充分利用;④有量無質:缺乏全面快速的數據質控方案,數據質量問題嚴重;⑤治理難持續:數據持續增加,如何對增量數據開展持續治理工作是亟需探索的問題;⑥安全難保障;⑦有數不善用:基于數據的場景化深度應用不足[7]。
智能化健康信息管理最早出現在20 世紀30年代的美國,主要是通過對大規模群體患者在全生命周期產生的大數據分析,來進行疾病的預警和診斷。其以數據-信息-知識管理為主線,運用系統工程和系統科學的思想,現已成為醫療服務管理的熱點[8]。目前國內省市級醫院基本上實現了門診患者基礎信息的電子采集和病歷電子化,在就診過程中產生了大量的數據,但這些數據很多還是處于“沉睡”狀態,僅用于資料和病歷的保存,價值有限[9]。
國內已經有部分探索性的應用研究從相應的區域健康信息平臺獲得數據[10-12]。重慶理工大學研究人員通過在重慶區域健康信息平臺上提取各級醫療機構的成本效益指標數據,利用交叉對比、縱向對比等多種方法評價醫療機構的衛生經濟效果[10]。陳鋒[11]從平臺提供的病案首頁提取每份病例信息,以此核算各組醫師的工作量并評價其醫療服務能力。郭燕青等[13]在平臺篩選糖尿病病例,以其信息為特征來分析容易發生糖尿病視網膜病變的危險因素。另外,張靚等[14]從平臺獲取肝癌相關病案的診斷數據,通過構建疾病相關性網絡得出肝癌的常見伴發疾病、癥狀、并發癥及相關危險因素。上述這些研究都對如何有效利用區域健康信息平臺獲得的數據帶來了啟發。
目前,健康信息管理醫療大數據的研究熱點領域為疾病風險預測、癌癥研究與健康保健等,而研究的熱點方法為模型構建、基因生物信息學、機器學習等[15-17]。
嘉興市于2017年啟動建設市級人口健康信息平臺,并在2019年6 月通過了國家醫療健康信息互聯互通的標準化及成熟度的四級甲等測評[18]。以該平臺為基礎的區域醫療管理數據可視化平臺主要具有以下功能。
3.1 診療數據可視化 該功能可以實現按照月份、醫院可視化嘉興市醫療機構的總體診療人次(圖1);另外,該功能還可以對各大醫院、各級醫療機構的總體診療人次進行對比,從2019年和2020 的對比可以看出分級診療政策的實施取得了一定的效果。

圖1 衛生機構診療數和入院次數
3.2 按照病種分類統計 平臺可顯示年份內疾病的診療人次動態趨勢圖,以嘉興市民發病率和死亡率較高的8 類疾病為例(圖2),其中流行性感冒在2020年1 月份達到最高,之后月份則下降明顯,提示和新冠肺炎期間實行的居家隔離減少了人際傳染有關;另外高血壓性心臟病的診療人次4 月份開始明顯下降,9 月份后逐漸回升,提示該病的發病可能和天氣溫度有關。該平臺可顯示各醫療機構某類疾病診療人次的數據對比;還可顯示某一年份內各類疾病診療人次的分析。

圖2 疾病門診數據分析
3.3 醫院診療水平分析 平臺可呈現醫療機構對具體疾病的診療水平。對于患者而言,就診因素除了醫院的醫療水平,還包括醫院和家庭住址之間的距離等復雜因素,距離越遠說明該醫院對該患者的實際吸引度越大[19,20]。該平臺應用了高德地圖,通過表現距離維度的方式來比較各個醫院對某類疾病的實際吸引度。如從高德地圖的距離維度來看,家庭住址距離第一和第二醫院周邊2000 米內的所有惡性腫瘤住院患者中選擇去該院的患者比例分別是51.35%和21.68%,差距明顯,說明距離第一醫院的實際吸引度更大。
區域健康信息平臺的建設初衷是通過統一管理的平臺能更好的應用和利用醫療大數據。在疾病的風險預測上,現有的疾病預警模型多是以某一時間點的靜態生命體征數據為判斷依據,從統計角度來評估較長時間內某一類人群的發病風險及預測發病率,而區域健康信息平臺不僅能夠提供大量該類人群的動態生命體征和臨床數據,還可以提供諸如醫保、職業、住址、就診習慣、收入等多方面的數據,從而能夠對疾病的發生、診治效果和預后提供綜合考量,這對于全面和正確的評估是非常必要的。正是有了區域健康信息平臺,才可以提供機器學習和人工智能算法所需要的大數據;大數據不僅體現為數量大,還體現為多樣和真實,而這些都是機器學習和人工智能進行醫療大數據挖掘和分析不可缺少的。總之,在我國大力推進區域健康信息平臺建設的必要,而區域健康信息平臺也會進一步推動醫療大數據的應用。