金維(通信作者),王薇,姚正,王漢唐,倪林,吳濤,王金敖,馮向明,嚴東明,談立峰
1 江蘇省衛生監督所 (江蘇南京 210008);2 江蘇東智數據技術股份有限公司(江蘇南京 210008);3 鹽城市衛生監督所 (江蘇鹽城 224000);4 常州市衛生監督所 (江蘇常州 213000)
黨的十八大以來,社會信用體系建設得到高度重視,國家宏觀戰略層面的重要論述和重大部署為體系建設的推進指明了方向[1]。為建立良好的信用秩序,引導和管理社會主體誠實守信,信用監管應運而生。推動衛生健康領域信用體系建設是深化改革、推進國家治理能力現代化的迫切需要[1]。
醫療衛生行業數據量龐大、類別繁多,醫療衛生機構之間關聯度較低、信息技術應用水平及配套參差不齊,但對數據安全性、隱私性和可靠性的要求較高。醫療衛生行業的信用監管信息數據歸集存在歸集不暢、共享不足等問題,制約了信用監管的有效推進[2]。區塊鏈技術具有分布式、開放性、不可篡改和可追溯性等特點,可提升數據安全性和可靠性,優化信息共享方式,構建全局可信的數據網絡,進而為對用戶隱私和信用要求極高的應用提供支持。
江蘇省衛生監督所承接了江蘇省衛生健康委2020 年度醫學科研重點項目,依托信用系統的整體架構,開發建設了江蘇省醫療衛生行業信用信息監管系統(以下簡稱信用系統)。本研究主要探討醫療衛生行業信用監管數據共享中可用的區塊鏈技術。
區塊鏈源自加密技術,通過復雜的加密算法對數據和文件進行加密,只提供可控的訪問。在此基礎上,區塊鏈結合分布式網絡結構和不斷推進的數據結構,形成去中心化、分布式、協作的數據承載網絡,該網絡依賴普遍共識和全局承認的區塊,用于存儲記錄數據的賬簿,賬簿可被全網驗證。密碼技術、分布式技術、全局共識機制和鏈式數據結構共同構成了可持續訪問和保護的加密數據網絡,確保鏈上區塊及賬簿無法被單獨篡改,并被全局承認和接受。
區塊鏈技術在醫療衛生行業數據信用監管方面主要具有如下功能和優勢[3]:一是可進行數據分享,數據所有者擁有對自身數據的訪問和復制權限,可無障礙地進行數據共享傳遞;二是杜絕篡改,信用監管數據或數據摘要存儲于區塊鏈中,除非擁有區塊鏈中51%以上的節點,否則任何節點均無法修改數據;三是可保護隱私,區塊鏈本身的特性是數據全公開,但配合隱私計算方法,如同態加密、函數加密、零知識證明和可信執行環境等技術手段,完全可以實現“數據可用不可見,數據不動模型動”,使數據擁有者精確控制數據使用者獲得的信息量,滿足醫療信用監管數據的安全共享要求[4];四是溯源信息安全可信,采用哈希算法將區塊體存儲的信用評級等關鍵數據加密為不可逆轉的hash 值,通過Merkle 樹、時間戳、版本號、區塊復雜度、數字簽名等措施,確保信用評級全歷史信息難以篡改,確保溯源信息不可偽造、安全可信[5]。
區塊鏈的網絡形式通常分為公有鏈、私有鏈和聯邦鏈等。公有鏈架設于公共網絡之上,對所有公網用戶開放,承載海量用戶,完全去中心化。私有鏈通常架設于機構或企業內部,滿足小范圍區塊鏈的應用需求,屬于小范圍內去中心化或中心化。而聯邦鏈采用半開放模式,主動管理并明確網絡的參與者。聯邦鏈模式適用于廣義的醫療衛生領域,私有鏈適用于單個業務板塊,公有鏈因其巨大的開放性,目前并不適用于醫療衛生行業。醫療衛生區塊鏈網絡結構見圖1,整個醫療衛生公有鏈由若干醫療衛生機構私有鏈組成,單個私有鏈或獨立存在,或聯合區域內其他私有鏈形成聯邦,并根據管理需要確立主要節點。整個區塊鏈網絡基于現有的網絡架構,以P2P 通信方式實現統一的保密體系、共識機制和智能合約,并完成信息共享、計量結算和聯合審計等功能。

圖1 醫療衛生區塊鏈網絡結構
醫療衛生行業區塊鏈網絡早期發起于小規模私有鏈,逐步構建多個私有鏈,再尋求區域聯邦,構建區域公有鏈,最后逐步提升至省級甚至全國醫療衛生(私有)區塊鏈公共網絡。去中心化對于區塊鏈技術本身具有絕對意義,對于醫療衛生行業只是基本屬性,但也要求實現去中心化分布。雖然宏觀層面所有節點受控于政府部門,但從技術方面看,整個區塊鏈私有鏈內部所有信息確實通過所有節點實現了去中心化分布,保證了網內安全,實現了上鏈數據的不可篡改和可追溯。
技術選型需要在加密算法、共識算法、去中心化、防攻擊能力、數據存儲、可用性、研發團隊和延伸開發等方面進行綜合考量,主要考慮以下細節:一是總體技術公開、成熟穩定,屬于主流公有鏈技術;二是基礎設施方面,具備主流區塊鏈的基礎功能,可部署私有鏈,具有典型區塊鏈賬號、賬簿和加密功能,且具備PoW、PoS 共識機制,方便實驗性應用;三是去中心化應用DAPP 開發方面,應易于開發鏈上應用,支持智能合約,實現基礎的合約化數據上鏈,符合ERC 等標準;四是與現有系統集成方面,易于外部集成,支持多語言開發,如JS、Java、PHP、Python 等,接口開發便利;五是針對數據查詢和展示,存在開源的瀏覽器工具,方便開發者和用戶實時查詢并展示鏈上數據。基于以上考慮,從功能定位和服務提供方式看,醫療信息數據交換平臺基礎設施建設采用區塊鏈技術是適合的。
下面從技術棧成熟度、交易吞吐能力和存儲技術等方面,選取主流技術進行研究。目前主流的區塊鏈公有鏈在技術和實際應用方面均與Web 1.0/2.0 主要承載的萬維網存在一定差距,均存在交易量低,存儲成本及能耗高等問題。隨著區塊鏈和Web 3.0 技術的不斷深化,更多的公有鏈技術可滿足可信網絡、永久存儲、匿名訪問等需求,并作為基礎設施部署。雖然一些公有鏈規模較大,且運行效率得到了改善,但對于本研究討論的應用場景和可控性均不適用。因此,對于基礎設施技術的討論,更多的是從技術實現的角度分析細節,明確技術選型后,實施團隊還要具備自建選型公有鏈的能力。
Ethereum[6]是一個去中心化、開源、具有智能合約功能的公共區塊鏈平臺,是目前世界第二大規模的公有鏈網絡,具有完整、可運行的區塊鏈技術棧體系。Ethereum 引入了智能合約,其ERC 標準體系可提升鏈上應用的便利性。Ethereum 支持私有鏈部署,并支持Go、Ruby、Python 和JS 等多種語言實現的節點客戶端,相應的拓展工具也較多,且多為開源。Ethereum 針對交易量和交互性能的優化構建二層網絡L2,通過L2 針對時間和性能優化的共識機制,從根本上擴容交易量,縮短網絡響應和交易時間,提高數據共享效率。
區塊鏈基礎設施的選擇,對于快速實現區塊鏈基礎功能和鏈上應用的敏捷開發尤為重要。Ethereum 作為成熟的主流公有鏈技術,其底層開發棧完全開源,在區塊鏈網絡接入和監控、區塊鏈網絡二層創新和去中心化應用DAPP 開發等多方面,均存在大量成熟技術和工具,易于以私有鏈方式實現區塊鏈基礎設施的快速部署。因此,針對本研究探討的課題,后續將選擇Ethereum 私有鏈作為研究和設計實施的主要載體。
區塊鏈網絡是一種數據存儲網絡,但不具備數據庫大量數據存儲的特性。將大量甚至海量數據提交至區塊鏈網絡是不可取的,可能出現性能問題,還可能破壞區塊鏈網絡結構。簡單的ID 或時間戳等基礎元數據上鏈屬于數據上鏈的初級階段。隨著技術的發展,期待所有的關鍵數據均可存儲于鏈上,以充分利用區塊鏈去中心化、不可篡改等安全、可靠的特性。目前永久存儲公有鏈技術Arweave[7]的總體存儲規模達到數十EB(1 EB=1 024 TB),但就目前對醫療衛生數據的安全性要求而言,還不具備實際應用條件。可控、永久存儲的區塊鏈網絡不僅能解決數據安全、可靠問題,還能從根本上提供穩定的應用服務。從長遠看,如果國家層面規劃發展具有數據安全性、一致性的永久存儲技術網絡,并實現技術的自主可控,屆時可將更多醫療衛生關鍵數據完整存儲于區塊鏈網絡。本研究后續將在永久存儲公有鏈技術方面進行嘗試。
在醫療衛生信息化領域應用區塊鏈的快速路徑如下:首先,確定基于成熟、穩定公有鏈的私有鏈;其次,構建鏈上計量體系,基于私有鏈和計量特性規劃上鏈數據;最后,對接數據服務并封裝內外部接口,形成基本應用,查詢、審計和監控層次需要外部工具,至此應用環境初步成型。具體實施時需要注意以下兩方面問題。一是與現有數據平臺的關系。2013 年以來,各地醫療衛生部門按照國家相關政策要求,已逐步建設所轄區域的全民健康信息平臺(以下簡稱平臺)。平臺作為醫療衛生行業的數據中心,基本覆蓋了所有醫療行業系統交換所需的數據信息。江蘇省平臺基于數據總線和SOA 架構建設,滿足了現有業務和發展需求。目前,區塊鏈作為實驗性質的基礎設施技術,取代現有中心化架構的全民健康平臺是不現實的。本研究考慮將區塊鏈作為新增輔助基礎設施,在平臺現有數據和服務規劃的基礎上,提供基于區塊鏈技術的賬號、加密、鏈上存儲、鏈上查詢和審計等相關功能。二是醫療數據的上鏈。標準的區塊鏈技術是全數據上鏈,每個節點同步存儲全局數據。但如果本研究采用全復制醫療監管數據分布方式,會帶來存儲、計算和網絡資源的極大消耗和浪費,嚴重影響數據共享的交易吞吐量。因為醫療監管數據存儲量巨大,且隱私性和保密性要求極高,所以全數據上鏈方式在醫療衛生信用監管領域不具可行性。
區塊鏈鏈上中心化、難以偽造、難以篡改等特性為信用監管數據共享帶來了新突破,但應對大量數據的存儲與傳輸是區塊鏈技術的短板,也是目前醫療信用監管數據共享存在的核心問題。針對類似場景,有研究提出鏈上共享存證、鏈下數據傳輸的數據共享架構[6],還有研究提出數據平面和控制平面解耦的區塊鏈數據共享平臺設計[7]。以上數據存儲解決方案的基本核心都是數據不上鏈設計。鏈上鏈下區分的方法既充分利用了區塊鏈技術特性,又保證了實際數據存儲和傳輸的可行性。本研究后續也將參照這種方式進行部分數據的嘗試。
目前,主流成熟的公有鏈技術已具備一定規模,雖然在交易量、存儲和能耗方面存在較大改進,但對于局部應用而言,已具備技術實現的可行性。不過通過Ethereum提供簡單、快捷的私有鏈應用部署,幾乎成了醫療衛生信息化領域區塊鏈早期實踐的唯一選擇。Ethereum 具有豐富的智能合約功能,提供基于ERC 標準的通證機制,符合對平臺行為鏈上定義、計量、統計和分析的技術需求。
本研究列舉并分析了區塊鏈技術的架構特點與特性,以尋找解決實際需求與痛點的應用方案。對于醫療衛生行業而言,區塊鏈的去中心化、共識機制、數據一致性、計量體系等可為現有系統或平臺提供基于信息系統的信任、安全及管理新模式。作為典型的聯邦式系統,醫療衛生行業信用監管信息數據交換可利用區塊鏈技術改善網絡特性,借助P2P 增強交互能力,同時提升安全性和可靠性。但目前區塊鏈技術在醫療行業數據交換的執行效率、數據存儲、隱私保護等方面還需更大的突破和改進,后續本研究將通過具體實驗部署和數據進行探究。