林強,張文宇,紀凱
(牡丹江醫學院附屬紅旗醫院,黑龍江 牡丹江 157011)
近年來,基于大數據、云計算、人工智能、互聯網技術的智慧醫療和精準醫療快速發展,為醫療信息化提供更多的發展機會[1]。通過醫療信息化的手段,提高了診斷、治療的效率,極大的改進、提高了醫療服務的水平。醫學康復的目的是幫助患者改善生活質量,重歸社會,其途徑為訓練患者運動能力、認知功能與語言功能[2]。在患者醫療康復過程中,產生大量醫療信息數據。應用康復醫療海量信息數據挖掘技術,幫助用戶主動的、精準的、個體化的獲取信息,是當前互聯網時代的發展趨勢[3]。國內外對康復醫療信息化做了大量的研究,并取得了很多的成果,微軟、谷歌、英特爾等國際大公司已分別構建了各自的醫療服務平臺,在康復醫療服務上發揮重大的社會效益。我國在康復醫療服務體系建設中,近些年也取得了一些成果,一些省份已建立了覆蓋全省的康復醫療服務網絡系統[4-7]。隨著醫療信息化的蓬勃發展,我國也由越來越多的機構、家庭、個人加入康復醫療信息化進程中。
本研究目的在于通過構建醫療康復大數據平臺,建立康復醫療的信息化服務,實現個體化、精準化的信息數據挖掘。
基于分布式Hadoop架構的醫療康復系統須滿足個體化的康復信息查詢,實現康復訓練精準化。醫療康復系統的功能模塊為:①系統管理:醫療康復系統后臺設置按不同賬號權限進行區分。即分為普通用戶、管理員用戶兩個等級。管理員具有最高管理權限,可對系統的信息進行增加、修改、發布以及對普通用戶的權限予以管理;②普通用戶個體化信息查詢:康復患者根據自己的病情在系統上進行個體化的定制康復訓練視頻引導信息,按照自己需要進行訓練。普通用戶可進行查詢、記錄,并可以跟康復顧問進行互動,參與康復訓練集體活動、討論等。所有操作信息記錄自動保存到服務器數據庫中,形成結構化的數據,作為系統推薦、指導的依據;③系統自動記錄:系統將普通用戶的使用系統期間產生的就進行存儲,所有記錄可作為患者隨訪數據和醫療信息記錄數據;④系統康復指導功能:系統根據普通用戶使用康復訓練的信息數據進行綜合分析、數據挖掘,網絡爬蟲,最終形成智能化的康復建議。
系統界面應界面簡潔、友好。在界面設計上,盡量避免采用菜單式,尤其是避免出現三級菜單。應突出功能選擇一步到位,讓用戶使用系統時快速、準確的實現功能定位。界面應合理布局,注重用戶體驗,操作流場。
在康復患者使用系統過程中,系統應穩定可靠,尤其是在大量用戶登錄系統時,系統確保無宕機現象,尤其是避免系統出現服務器崩潰。系統應在穩定運行的同時,不出現病毒、網絡攻擊致使系統無效運行,崩潰以及數據丟失。因此,系統存在穩定與安全性的保障機制。
醫療康復系統架構如圖1所示,系統組成分別由客戶端、后臺Web服務器、Hadoop數據處理層等組成。

圖1 系統總體結構
(1)客戶端:醫療康復系統支持用戶使用手機端、PC端。用戶訪問系統HTTP請求發送至服務器,服務器響應請求。
(2)后臺Web服務器:后臺Web服務器采用SSM框架。SSM框架由表1所示。主要包括業務層、持久層。

表1 Web服務器框架
(3)Hadoop數據處理層:Hadoop數據處理層的處理數據機制。即HDFS被用來處理從數據庫中導入的的數據,經清洗與處理后的數據生成矩陣,按照算法規則進行運算。
系統邏輯結構設計應考慮性能因素,降低代碼的耦合度,因此框架分為四個層次,即表示層、控制層、業務邏輯層、數據持久層[8]。關聯不同層,且不同層的功能不同。表示層用于系統界面設計,支持用戶訪問系統時,服務器進行相應,反饋數據信息。控制層用于業務邏輯層相應業務功能,對用戶的請求進行配置文件。客戶端在接到訪問請求后,增加參數方法,調用不同的功能。業務邏輯層用于包裝業務邏輯對象,執行代碼時調用接口展示邏輯對象,降低冗余代碼,并對代碼的可讀性進行調整。本系統的接口由系統中的配置文件進行配置。數據持久層由實體定義系統中得到,實體類由Interface接口形式包裝,在實體類中進行再一次定義。
康復醫療數據海量存儲,需要耗費大量成本,因此,實現不同表的關聯查詢十分必要。康復管理系統按照緩存值進行調整查詢速度,采用二進制索引的方法,即用映射關系來確定列、行鍵之間的關聯[9-12]。并在數據檢索中基于HBase表的查詢功能,限定檢索的范圍,整體提高查詢的性能。在HBase中設置查詢濾波器。應用索引表與數據表查詢,通過查詢、索引建立關聯,根據服務器配置文件進行索引。
康復醫療系統用戶在執行康復信息使用過程中,系統自動產生康復信息數據,并通過數據分析智能化的選擇個體化的康復訓練指導信息。所有康復醫療系統信息為用戶在使用系統時自動保存的數據。系統在獲得客戶端觸發信號后進行響應,以時間、參數值形式存儲到數據庫中。
康復醫療數據需要轉換結構化數據,為此,對用戶的數據信息進行預處理,將數據轉化為因子矩陣和其他數據矩陣。數據預處理過程,須對數據進行清洗、消除、過濾,實現對異常值的排除、篩選等。因子矩陣通過對用戶的康復醫療數據進行必要的處理,包括合并、統計等。
康復訓練用戶在使用系統過程中,系統可通過智能化算法推薦、指導用戶進行個體化的康復訓練。算法模型采用Spark Streaming計算[13],根據用戶使用系統過程中生成的行為結構化的數據,生成匹配用戶的矩陣,并結合用戶的特征數據,進行混合處理、排序等操作。對用戶行為的數據,系統進行向量內積預測整理評分。
大數據、機器學習、數據挖掘、互聯網以及智慧醫療技術愈發成熟,在康復醫療服務中,可以發揮更大的價值。本文在大數據、機器學習、數據挖掘、互聯網、智慧醫療的技術基礎上,構建了基于分布式Hadoop技術的康復醫療系統。系統對用戶的個體化數據進行分析,根據康復患者的需求,制定出針對性的訓練指導建議。康復醫療系統平臺架構、關鍵技術采用主流的技術體系,并對系統的界面、邏輯結構等進行了探討。由于康復醫療系統的復雜性,本文研究也存在一定的不足,在日后中的研究在以下幾方面進行改進:(1)用戶功能方面進行拓展,如康復醫療個體化加入大數據分析策略;(2)在算法上進行多維度的改進,如增加數據挖掘算法中的聚類、神經網絡等;(3)系統在開發過程中采用的測試數據不夠,在后續研究中,應加大試驗樣本量;(4)系統中的穩定與安全等級不足,因此在后續研究中,應提高系統的流暢度、體驗度、安全性等。