周云帆 陳 婁 蔣 沁
(南京醫科大學附屬眼科醫院 南京210029)
眼健康大數據平臺是基于移動互聯網建立的、聯接智能終端與學校、醫療機構的醫學大數據平臺,為區域內不同類型用戶提供眼健康醫療保健數據和應用服務,實現眼健康數據共享和診療過程協同。眼健康醫療大數據是通過醫院、體檢機構、個人采集的眼保健、眼病相關的醫療衛生數據。隨著電子信息技術的發展和普及,移動互聯網智能終端已經可以參與眼科相關的保健與醫療信息的采集與反饋。通過搭建眼健康大數據平臺,各機構間可以互聯互通,成為數據共享的開放式交互平臺,為衛生行政部門管理提供決策依據,為社會公眾便捷就醫實現技術保障。本文對該大數據平臺的系統開發與臨床應用進行簡單介紹。
目前各類醫療信息系統建設較為完善,如醫院信息系統(Hospital Information System,HIS)、影像存儲與傳輸系統(Pictures Archiving and Communication System,PACS)、檢驗信息系統(Laboratory Information System,LIS)、電子病歷(Electronic Medical Records,EMR)、物資采購管理系統、藥房管理系統、臨床路徑管理等。但醫療輔助決策系統、大數據科研分析、大數據臨床預測等更高級的應用系統,即便在發達地區的重點醫院應用率也是極低的。眼科由于??朴跋駥W檢查的特殊性,各醫療機構數據獨立性強,診療信息、電子病歷、健康檔案、醫療影像數據格式不統一,分散存儲,往往導致醫療數據孤島。針對眼科就診人群年齡段和疾病譜的分布特殊性,利用移動互聯網智能終端作為眼健康數據信息源的采集方式,結合醫院移動篩查設備與區域衛生信息系統中的眼科相關醫療信息,共同構成眼健康大數據平臺中以相關眼病為核心的信息閉環。為高效采集與應用眼健康大數據,按照規范的數據交換標準和兼容的數據交換接口,依托移動互聯網,基于Hadoop構建南京市眼健康大數據平臺。
眼健康大數據平臺以Hadoop集群環境、分布式數據庫、分布式計算框架為基礎,智能提取原始信息中的結構化、半結構化和非結構化數據,經過清洗后形成居民眼健康電子檔案庫。運用人工智能神經網絡與機器學習技術自動識別海量眼健康,構建眼病多因素危險模型,實現平臺自動識別用戶輸入、計算匹配模型、深入分析用戶數據,形成眼健康醫學知識庫,從而達到輔助醫療人員診療的目的。平臺分為基礎層、數據庫層、分析層和應用展示層,見圖1。

圖1 眼健康大數據平臺架構
數據庫層為Web Service模式,采用可擴展標記語言(Extensive Markup Language,XML)或基于JavaScript語言的對象簡譜(JavaScript Object Notation,JSON)協議為移動智能終端和平臺Web端提供數據管理服務。數據庫層使用Spark計算框架,聯接區域衛生信息系統對醫療機構間HIS,LIS,PACS,EMR等信息系統中結構化,半結構化,非結構化的原始眼科大數據進行抽取,分類,計算,存儲在分布式數據庫中。建立眼健康大數據平臺,以實現多源異構大數據的融合,為后續大數據的高效挖掘奠定基礎。分析層讀取數據改動和存儲層整理的數據,在某些情況下分析層直接從數據源訪問數據。分析引擎具有支持并行處理的各種不同的工作流、算法和工具。根據已建立的眼健康電子數據庫進行數據分類,采用卷積神經網絡算法訓練人工智能神經網絡分析模型。應用展示層針對不同類型用戶匹配相應的數據信息和功能,通過可視化技術對結構化和半結構化數據進行處理,組合到單個用戶的移動應用平臺界面上進行可視化展示。
針對不同采集對象開發多模式、多端口的采集系統。為保證采集數據的有效性和唯一性,必須建立采集對象身份識別系統。每臺眼健康醫療相關檢查設備都配備身份識別硬件,可通過非接觸式刷卡系統對手機號碼、醫??ā⑸矸葑C、就診卡進行快速識別,自動生成唯一的ID編號,與大數據系統中的相同身份信息相匹配。使居民無論是在家通過智能手機APP自檢還是在體檢機構進行眼科體檢或是在醫療機構的眼科相關儀器檢查都能進行身份識別后的匹配關聯,大大減少患者在不同醫療機構的重復檢查以及不必要的經濟花費,同時節省醫療資源,是一項多贏的舉措。
眼健康醫療大數據存儲系統采用目前最先進的Hadoop技術。Hadoop作為大數據工業中的主引擎,本身是一個分布式運行系統,是基于Java編程語言的計算架構,也是一個可擴展的數據生態系統,包括分布式文件系統(Hadoop Distributed File System,HDFS)和MapReduce兩項最重要的技術,能夠同時分布式處理海量數據。HDFS技術具有高度容錯(即使中途出錯也能繼續運行)、支持多媒體和流媒體數據訪問、高效率訪問大型數據集合、數據保持嚴謹一致、部署成本較低及效率提高等特點。MapReduce是一種面向大規模數據處理的并行計算模型和方法,用于大規模數據集(>1TB)的并行運算。HBase是運行在HDFS架構上的列存儲數據庫,已與Pig/Hive很好地集成。通過Java應用程序接口可以接近無縫地使用HBase。
眼健康醫療大數據分析系統運用A/B測試、關聯規則挖掘、數據聚類、數據融合和集成、遺傳算法、自然語言處理、神經網絡、神經分析、優化、模式識別、預測模型、回歸、情緒分析、信號處理、空間分析、統計、模擬、時間序列分析等多項成熟技術進行數據過濾和整合,通過機器學習Mahout系統幫助快速達成大數據分析,其中已實現部分機器學習的邏輯。
眼健康醫療大數據平臺根據不同服務對象采取多模式的數據交互策略。針對居民,利用眼健康大數據平臺的數據資源開發響應的智能手機APP,使居民方便快捷地實時掌握個人眼健康信息,實現預約掛號、在線咨詢等功能;針對醫療機構,通過整合不同醫療機構和體檢機構的檢查檢驗數據,使患者不同時間段的檢查資料進行關聯,使電子病歷數據更完善,對眼科醫生系統全面地了解患者病史和病情提供幫助;針對衛生行政主管部門,實時監控眼相關的流行病學數據,通過該平臺對醫院進行業務指導和考核,對居民和患者進行眼保健和眼病的健康教育和促進。

圖2 眼健康大數據平臺服務項目
眼健康大數據平臺的手機APP客戶端面向居民開放眼病自查和眼科電子病歷查詢功能。居民通過軟件可進行視力、視敏度、色覺自查,初步判斷自身眼健康情況。居民在區域內各醫療機構就診的既往眼科檢查和電子病歷通過平臺整合構建成眼健康電子檔案,方便隨時查閱。
平臺通過與南京市衛生信息中心平臺的對接、與各醫院眼科就診數據互聯互通,實現全市眼科影像學檢查和眼科電子病歷的數據共享。為確?;颊唠[私和數據安全,所有原始數據都經過南京市衛生信息中心平臺的算法加密后進入大數據平臺。
目前開展的南京市中小學生近視篩查項目通過平臺進行數據的采集和分析,將篩查結果和分析報告及時反饋給學校教師和學生家長。對近視高風險的學生,平臺通過大數據風險模型預測后給予短信提醒,確保潛在的近視學生能夠得到及時有效的醫學矯正。
通過平臺及時對老年人白內障的疾病進展程度給予人工智能風險評估,將智能移動眼科檢查設備采集到的數據反饋給定點醫院眼科,統籌安排預約復診或手術時間,為白內障篩查提供了高效的信息系統保障。
青少年近視及各類眼病的臨床研究依賴眼健康大數據平臺采集的全方位、多維度的臨床數據。眼科醫師標注建立訓練集,經過機器學習訓練各類眼病危險度風險模型,通過篩查輸入青少年眼健康大數據,構建近視眼人工智能預測模型,可對近視進展趨勢進行個體化預測。結合眼科智能移動檢查設備進行白內障篩查,構建白內障分期及危險度人工智能預測模型,為后期精準干預提供個性化診療意見。
南京市眼健康大數據平臺投入使用后各項眼健康篩查服務群體的廣度和深度都得到廣泛擴展,由重點區縣抽樣篩查擴展至所有區縣。較之前的電話隨訪模式,服務效率得到極大提高。居民通過移動互聯網終端可以隨時訪問大數據平臺查詢個人眼健康數據,通過自行補充相關信息完善眼健康電子檔案既往病史和家庭史等信息。
南京市眼科醫聯體和分級診療體系借助眼健康大數據平臺快速推進。居民可以通過移動互聯網終端APP與眼科專家進行互動、預約就診、健康咨詢、術后隨訪等在線咨詢服務。兒童、青少年和老年群體在篩查出異常后相關電子檢查資料會自動分配給相關亞專科專家進行人工甄別。當需要進一步診治時大數據平臺系統會進行專家推薦和在線預約。居民從篩查到最終確診的時間由之前的平均12.7天縮短到2.6天,眼科急重癥患者得到及時診斷和對癥治療。
三甲醫院的優質眼科醫療資源通過眼健康大數據平臺得到合理分配和高效利用。居民通過眼健康大數據平臺進行自我教育和醫患在線溝通,發揮醫聯體分級診療的優勢,提升醫患溝通效果,杜絕患者急病亂投醫和醫患溝通不良情況的發生。眼科專家通過眼健康大數據平臺與日常門診相結合,為更多居民提供優質的眼科專業醫療服務。
大數據挖掘和人工智能技術在移動互聯網眼健康大數據平臺的應用將近視與眼病的防治從醫院眼科關口前移到學校與社區。眼健康大數據平臺提高日常近視與白內障篩查效率,實現醫療數據的互通共享和居民眼健康的自我管理。衛生行政管理部門通過眼健康大數據分析匯總情況實現醫療機構的科學管理以及衛生資源的高效配置,提升醫療衛生服務水平和效率,為形成個性化診療方案提供參考意見。