王靈



摘要:城鄉居民醫保信息系統早期大部分采用了單一關系型數據庫存儲數據,該方案擴展難,并發能力小,不適合處理半結構化,非結構化數據。而后隨著分布式技術如Hadoop等平臺的出現,因其具備使用廉價的機器來存儲處理數據的優點,城鄉居民醫保系統也開始使用該平臺。但Hadoop在設計之初是將數據均分給集群中的節點進行存儲和處理的,忽略了集群節點本身在存儲和計算能力存在差異,個別節點的性能甚至影響了整理系統的性能,且是主從節點方式處理數據,存在數據可篡改,系統終端過于單一等問題。本文給出了城鄉居民醫保系統的整體架構和技術路線,提出了異構節點數據流動的優化辦法,能有效節約集群規模和成本,借助區塊鏈技術保證數據安全性和可信性,優化前端集群服務架構,支持多渠道高并發的關鍵信息推送模式,具備很好的推廣性。
關鍵詞:城鄉居民醫保系統優化;Hadoop;區塊鏈;負載均衡
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)27-0102-03
開放科學(資源服務)標識碼(OSID):
1引言
城鄉居民醫保制度[1-2]是由政府支持和引導,城鄉居民積極參加,是城鄉居民個人和政府等共同籌資的一項以大病統籌醫療為目的互助制度。為落實該項制度,國家出臺了關于城鄉居民醫保信息系統等一系列技術規范,主要規定了各省市主管部門應做好城鄉居民醫保系統的發展規劃,本著節約建設成本,結合當地實情,建立和升級符合實際需要的城鄉居民醫保信息系統,便于廣大城鄉居民享受這一政策。在城鄉居民醫保信息系統建設之初,其廣泛采用了單一的關系型數據系統來存儲數據,隨著城鄉居民醫保系統數據不斷增加,數據類型的不斷豐富,該種數據存儲方案擴展困難,軟硬件升級成本越來越高,維護難度也不斷加大,特別是醫療檢查中存儲的圖像、視頻等半結構化、非結構化的數據,存儲和分析異常困難。
由于城鄉居民醫保信息系統中涉及數據規模和復雜度的不斷增加,傳統的單節點數據處理所需的時間變得難以接受。因此,為了提高數據處理效率,許多學者一直在研究大數據的并行處理。過去,由于開發并行處理程序需要豐富的并行知識,開發難度極高,且并行計算框架也是為具有大量內存空間和高網絡帶寬的環境(如超級計算機)而設計的。近十年中,由于Hadoop[3]等分布式框架的出現,如下圖1所示,用戶能夠很容易地開發大規模并行程序。城鄉居民醫保信息系統也開始采用這種分布式并行處理技術,統籌組織分析處理參合、門診、檢查、藥品等數據。但是目前系統中存在集群規模不恰當、建設成本過高、醫療數據易篡改,終端用戶數據推送不及時,系統針對性不強和并發性能較差等問題。 本文將著重優化三個問題:1)搭建適當的集群規模,優化異構節點數據流動,有效節約集群規模和能耗成本,提高MapReduce[4]的執行速度;2)提高系統安全性和數據可信性,高層采用區塊鏈技術確保城鄉居民醫保系統關鍵數據可信,無法篡改,保證城鄉居民,政府,醫療系統利益不被侵害;3)優化系統并發性能,提升前端集群服務架構,擴展終端形式,通過數據挖掘等技術及時推送不同角色的關聯數據,提升城鄉居民醫保系統的用戶體驗。
2相關研究
城鄉居民醫保系統從傳統的關系型數據庫升級到Hadoop平臺,廣大工程師和科研人員主要圍繞三個問題進行探索建設。
(1)數據存儲能力和建設成本,優化Hadoop底層文件存儲系統方面。不同分布式場景,存在著很大的性能差異和不穩定性。究其原因在于城鄉居民醫保系統涉及的服務器性能存在明顯差異,這方面研究主要集中在Hadoop在具有不同性能能力的節點的異構集群[5-6]上運行時,性能會降低。每個節點的吞吐量可能會存在差異,所有計算節點無法對相同數量的塊來執行同樣操作。因此,空閑節點(即已經完成工作的節點)可以通過網絡通信連續地接收未完成任務的數據,從而導致網絡擁塞,嚴重影響整體性能。而在異構環境中,因節點的計算能力與分配給它的塊數之間可能存在不匹配,數據局部性無法保持。國內外相關學者已對這個問題進行了相關研究,例如,Xie[7]等提出了一種基于每個節點性能比的數據放置方案。方案包括兩個步驟:首先,初始數據放置是使用Preduce Application的Normalized Response Time來循環執行,數據被重新分配到與測量的性能度量成比例的自定義數據放置。這是因為刪除或添加塊后,初始數據放置可能會折疊。盡管他們提出的方案解決了一些性能下降的問題,但是該方案不足以評估異構環境中每個節點工作負載,因為它使用了簡單的性能度量。
(2)信息系統數據安全與可信性方面。城鄉居民醫保系統涉及資金、醫療病歷等原始數據,具備很強的嚴謹性,是廣大城鄉居民結算報銷的重要依據,是國家惠民政策的直接體現,也是進行更深層次數據分析的依據。因此,務必確保數據無法修改,可在數據存儲層之上采用“區塊鏈”技術,確保城鄉居民醫保系統關鍵性數據可信無法篡改[8]。對于這方面的研究有很多,“去中心化”的分布式系統和并行計算在很多領域的研究越來越受到廣大學者重視。目前“區塊鏈”研究屬于相對較新的領域,國內外許多研究人員都在研究這一技術,該技術對于互聯網將產生顛覆性的創新,而其去中心化、不可篡改、信息跟蹤等特點可以廣泛地應用于產品供應鏈、證券交易、電子銀行、政務系統、醫療管理等領域。近兩年學術界和工業界對于此技術給予了較高的關注,研究開發區塊鏈在諸多領域的應用場景也取得了進展。綜上,區塊鏈技術主要解決不同領域的數據可信問題,能實現跨時空交易,更加方便快捷。
區塊鏈技術不僅可應用在經濟金融等領域,凡是對交易的真實性、不可篡改性、可回溯性、安全可靠性等有需求的各個領域都可以應用該技術。雖然“去中心化”的分布式系統在其他行業已經逐步開始應用,但目前為止,根據相關文獻檢索結果顯示,對城鄉居民醫保系統進行整體“去中心化”分布式架構與設計還鮮有報道。如果能夠借鑒該種架構設計方案在電子商務中的成功應用經驗,歸納匯總區塊鏈技術在醫療領域的零散應用,將其整合到城鄉居民醫保系統綜合信息系統中,將能大幅度降低系統擴充的軟硬件成本,提升系統的安全可信程度,也可為決策者、醫療工作者及廣大城鄉居民推送智能化信息,提升本區域城鄉居民的醫療服務質量。
(3)信息系統高并發性能,系統友好性,挖掘關鍵信息并主動推送等方面。前端采用Web,App,微信小程序,微信公眾號等方式,多渠道對接城鄉居民醫保信息系統。通過優化數據存儲,相關Web服務功能,采用負載均衡等策略,提高系統的并發性能。同時采用數據挖掘技術,抓取并推送關鍵信息,便于智能化平臺的建立。通過改進傳統數據挖掘算法,挖掘出不同的數據,建立給不同對象使用的智能化信息推送平臺。用戶可以通過微信、短信、郵件等各個平臺獲取相關信息。
3系統總體架構
為了使系統具備很好的擴展性、可信性、安全性、智能性,系統使用分布式存儲技術解決數據擴展性問題,上層采用區塊鏈技術建立可信性認證,應用層將挖掘出相關數據進行高并發推送。具體系統架構如圖2所示。
整個城鄉居民醫保信息系統主要采用了三層總體架構。應用層面向不同對象,處理相應的業務邏輯,同時結合相應的感知設備,例如手機、智能穿戴設備、RFID等獲取相應輔助數據,并特別提醒、推送或預警與城鄉居民息息相關的健康與結報數據;網絡層除了傳輸數據外,對于關鍵性數據,例如住院數據、診斷數據等進行區塊鏈網絡節點共同認證,確保數據可信無法篡改;在數據存儲層,則對不同數據采用不同的數據存儲方式,例如緩存數據進入Redis,涉及金額等數據進入Mysql,其他非結構化,半結構化數據進入Hbase、Mongodb等數據庫中,統籌處理。城鄉居民醫保信息管理系統建設是以衛生部《關于城鄉居民醫保信息系統建設的指導意見》等一系列文件為立項依據,城鄉居民醫保系統應提供費用智能測算、參合經費撥付與收繳、報銷支付補償、監督部門審計、醫療主管部門決策分析和相關政策公告等功能,能有效提高城鄉居民醫保系統資金的運轉效率、有效杜絕資金監管漏洞、大力提升政府部門的服務質量和監管力度。該信息系統建設一般由各省招標建設,其省級管理信息系統基本功能為數據處理與交換、統計報表、會計報表、業務監測、基金監管、轉診管理、分析評價、配置維護、門戶網站等;縣級業務系統基本功能包括參合管理、補償管理、基金管理、會計核算、查詢統計、監測分析、業務公示和配置維護等功能。為節約系統的存儲、系統總體功耗、人員管理成本,首先可對數據存儲層進行優化。
4 區塊鏈技術應用
針對城鄉居民醫保系統的參保信息、住院費用、結算比例等關鍵性數據,確保其是可信無法篡改的,筆者將從技術層面進行保障,建立多部門參與的區塊鏈節點,采用鏈式傳輸和普通傳輸相結合的方式與底層數據存儲層通信,構建城鄉居民醫保系統信息安全管理模型,如圖3所示。
區塊鏈技術主要有公有鏈、私有鏈以及聯盟鏈三種常見方式,公有鏈的特點是所有人均可訪問,主要代表是比特幣、以太坊等應用,其明顯應用范圍超過城鄉居民醫保系統角色的應用范疇;私有鏈主要在企業內部進行使用,其操作的權限一般被單個組織或機構掌握,城鄉居民醫保系統是多方參與的,因此該種方案也不符合城鄉居民醫保系統。而聯盟鏈是非常適合多方參與和共同監督的,采用相關共識算法,加入與退出鏈均需得到相關組織認定,具備去中心化的特點,其代表為Hyperledger。因此,城鄉居民醫保系統具體選擇上可采用聯盟鏈,可選用Hyperledger技術建立城鄉居民醫保系統的聯盟鏈,具備了高可信、隱私信息保護等優勢明顯,既可以使監管部門具備監管權,又能對醫療衛生部門、廣大城鄉居民開放相應級別權限,符合城鄉居民醫保系統的要求。
5總結
城鄉居民醫保信息系統是涉及普通百姓的綜合醫療業務系統,數據增長速度快、涉及業務流程復雜、資金量大。本文主要從數據存儲底層架構優化、可信網絡、多渠道并發訪問、前端服務架構幾個方面做了一些研究,可對城鄉居民醫保信息系統的進一步建設優化提供思路,也可為類似信息系統建設作為技術參考。同時本文所涉及的數據量為模擬器產生,數值較小僅在實驗環境中論證,下一步將繼續關注和優化HDFS的文件塊調度算法及其應用,區塊鏈技術的發展以及前端服務器集群架構技術更新,重點關注并研究分布式底層數據存儲與可信方法領域,以期在實驗室和現實環境中進一步論證,整合并優化相關工程級技術并應用到城鄉居民醫保等系統中。
參考文獻:
[1] 李姝薈,李姝熠,張洋,等.新醫改環境下新型農村合作醫療制度的發展現狀及對策研究[J].中國市場,2020(8):74,79.
[2] 王奧,陳虹,秦立建.我國新型農村合作醫療制度高質量發展研究[J].齊齊哈爾大學學報(哲學社會科學版),2020(1):19-21.
[3] 黃訸,易曉東,李姍姍,等.面向高性能計算機的海量數據處理平臺實現與評測[J].計算機研究與發展,2012,49(S1):357-361.
[4] 林偉偉.一種改進的Hadoop數據放置策略[J].華南理工大學學報(自然科學版),2012,40(1):152-158.
[5] 夏新岳.基于區塊鏈的股權資產購買和轉贈設計與實現[D].呼和浩特:內蒙古大學,2016.
[6] 黃永剛.基于區塊鏈技術的電子健康檔案安全建設[J].中華醫學圖書情報雜志,2016,25(10):38-40,46.
[7] 蔡維德,郁蓮,王榮,等.基于區塊鏈的應用系統開發方法研究[J].軟件學報,2017,28(6):1474-1487.
[8] 薛騰飛,傅群超,王樅,等.基于區塊鏈的醫療數據共享模型研究[J].自動化學報,2017,43(9):1555-1562.
[9] 王海隆.區塊鏈技術在中醫藥領域中的應用展望[J].貴陽中醫學院學報,2017,39(3):1-4.
[10] 倪培昆.區塊鏈技術及其在醫療領域的價值研究[J].醫學信息學雜志,2018,39(2):9-13.
[11] 朱正望,朱平生,苗艷艷,等.基于數據挖掘的含大棗中成藥用藥特點分析[J].中國中藥雜志,2021,46(9):2344-2349.
[12] 譚定國,黃婉飛,貌俊偉,等.某醫院內微信平臺用藥信息推送對提高臨床處方合理用藥的影響[J].抗感染藥學,2020,17(6):827-829.
【通聯編輯:唐一東】