李曉峰,李 東
1(黑龍江外國語學院 信息工程系,哈爾濱 150025)
2(哈爾濱工業大學 計算機科學與技術學院,哈爾濱 150001)
隨著大數據信息處理技術的發展,相關領域逐漸采用大數據信息處理和數據挖掘方法,進行醫療信息管理系統設計,以此來提高醫療信息管理的智能性和自動化水平[1,2].在進行醫療數據的信息化管理中,需要對醫療數據進行優化檢索和識別,提取大數據信息庫中的醫療數據特征量,采用統計特征分析和數據聚類挖掘技術,進行醫療數據的大數據挖掘和聚類處理,提高醫療數據的模糊聚類和特征分析能力[3].
目前,已經有相關研究人員對醫療數據的重建方法進行了研究.文獻[4]提出了一種針對多類醫療數據的挖掘算法,在統計方法的基礎上對醫療數據的安全模式和誘因模式進行準確定義,同時,采用分類器對醫療數據進行重建,根據實驗結果可知,該算法可有效對數據進行挖掘,但是沒有考慮到數據冗余度問題,不能實現快速識別.文獻[5]提出了一種基于LLE和MP的空間數據重建方法,首先對空間數據重建中的不確定性進行定量分析,根據分析結果采用多點信息統計方法將非線性數據進行降維,最后采用LLE和MP方法對空間數據進行重建,根據實驗結果可知,該方法可以實現對空間數據的重建,但是由于該方法沒有考慮到對不同類型數據進行分類,因此存在重建速率較低的問題.
根據上述分析可以得出,研究醫療數據的優化檢索應該建立在對醫療數據的表面重建基礎上,通過對醫療數據進行自適應的特征重構,提取醫療數據的統計特征值,結合模糊網格聚類技術,實現醫療數據采樣和特征提取,挖掘醫療數據的譜特征量,根據特征挖掘結果進行數據聚類和表面重建.為解決傳統方法存在的缺陷,本文提出一種基于改進全卷積神經網絡的醫療數據表面重建算法,首先進行醫療數據特征分析和融合處理,然后進行數據統計特征量提取,采用改進全卷積神經網絡分類器對重構數據進行分類識別和重建,最后進行仿真實驗分析,展示了本文方法在提高醫療數據表面重建能力方面的優越性能.
為了實現對醫療數據表面重建,需要首先構建醫療數據的大數據采樣模型,結合RFID技術,挖掘醫療數據譜的關聯規則項,數據采樣系統結構模型如圖1所示.

圖1 數據采樣系統結構模型
根據圖1所示的醫療數據采樣系統結構,采用無線RFID和ZigBee組網技術[6,7],進行醫療數據采樣的網絡節點分布式設計,采用多維傳感跟蹤拾貝方法進行醫療數據采樣后的信息融合和大數據特征分析,提取醫療數據的譜特征量,采用向量量化編碼方法進行醫療數據結構重組,得到醫療數據的信息特征量為:

采用RFID信息融合技術,構建醫療數據分布的標量時間序列為x(t),t=0,1,···,n?1,給定醫療數據信息流的二維統計特征分布模型為x1,x2,···,xn∈Cm(m維復數空間),在醫療數據的大數據分布模型中,采用模糊聚類方法,得到醫療數據關聯規則分布集的簇模型描述為:

其中,ρ1,···,ρn為一組醫療數據的主成分特征,結合多元回(歸分)析方法,構建醫療數據的關聯規則集為O(d)和ON1/d,根據模糊的回歸分析結果,在m→1時,snξ→tanhξ,提取醫療數據統計特征值,在鄰域空間(t,f)內,得到醫療數據采集輸出的統計指數集為:

根據上述對醫療數據的采集結果,對醫療數據進行信息融合處理.
根據醫療數據的主成分特征,獲取醫療數據的特征值,進行信息融合,在融合慣性空間分布矩陣G=[Ek×k|A]中,參數初始值設置為(x1,x2,···,xn),采集的醫療數據包括n個變量,可以用 {y1,y2,···,yn}表示,調整醫療數據的關聯規則項,構建醫療數據的模糊信息融合模型:

在強干擾下醫療數據頻域檢測的邊值收斂條件滿足如下邊界函數為:

在醫療數據分布的最小共享資源分配區域內,采用優先級調度方法進行醫療數據的特征融合,融合方程描述為:

其中,x(t)= φ(t),t∈ [?h,0],醫療數據挖掘采用整體的規劃方法,得到輸出的訓練特征集為:

對于x(t),采用密集型模糊迭代方法,進行醫療數據的融合處理,采用卷積神經網絡學習算法進行醫療數據動態遷移均衡調度[8,9],卷積神經網絡學習函數為:

根據式(10),結合隨機負載均衡分配方法,進行醫療數據動態遷移負載均衡控制[10,11],得到負載量為:

醫療大數據存儲介質OD對w間路徑k上傳遞衰減為 ω,初始化輪詢任務,在模糊約束控制下,醫療數據的融合負載均衡調度模型可以描述為:

其中,多隊列調度任務誤差ξkw(ω)可以表示為:

提取醫療數據的統計特征量,采用相關性融合檢測方法,得到信息融合輸出為各個醫療數據融合作業隊列中的開銷可以表示為:

根據上述分析,結合自適應的反饋調節方法進行醫療數據表面特征的重建,采用多元回歸分析方法提取醫療數據的相關性統計特征量,對提取的特征量進行貫序采樣和信息融合,以此來提高數據挖掘和重建的準確性.
在上述采用無線射頻識別技術進行醫療數據的大數據采樣和信息融合處理的基礎上,進行醫療數據表面重建算法的優化設計,本文提出一種基于改進全卷積神經網絡的醫療數據表面重建算法.構建貫序自適應預測方法進行醫療數據的統計特征預測,得到統計特征量的預測的迭代式為:
設置醫療數據特征構成的數據集合X,采用多元回歸分析方法提取醫療數據的相關性統計特征量,回歸分析模型用下式表述:

在醫療數據的表面分布結構模型中,采用稀疏點表達方法進行醫療數據的相似度特征分析,得到醫療數據表面重建的調度集子序列為:

分別對r1(n)和r2(n)進行 (N?1)/2點傅里葉變換,結合醫療數據的特征編碼方法進行信息采樣,采用分組檢測方法,進行醫療數據的分集調度[12],得到醫療數據重建的遷移狀態量:

其中,ω0為醫療數據的貫序自適應預測誤差,Tp為時間窗口函數,Ak為醫療數據的特征分布幅值,φk為擴展相位.針對醫療數據中的冗余特征采用匹配濾波檢測器進行冗余濾波處理,設置醫療數據的均值為ta,方差為,醫療數據動態遷移最優的接收碼元序列表示為:

構建貫序自適應預測器實現醫療數據的冗余特征預測,在醫療數據的空間分布模型中,對醫療數據進行自適應均衡控制[13],得到醫療數據分布的相位特性負載量為:


計算醫療數據檢測的測度特征量為:

根據特征提取結果,進行醫療數據的表面信息重構,得到特征分布式提取的迭代方程為:

其中,μMCMA代表初始數據采樣頻率,根據上述算法和模型設計,實現醫療數據的動態遷移控制和特征提取,對提取的特征量進行提純處理后進行卷積神經網絡識別,實現數據的表面重建.
根據醫療數據特征構成的數據分布集,求解醫療數據的稀疏表矩陣W的最優解[14,15],即:

對提純后的醫療數據采用相空間重構技術實現醫療數據重構,相空間重構軌跡為:

在重構的醫療數據分布相空間中,采用主成分尺度分解方法,得到醫療數據的關聯規則集為:

考慮不同數據的類間分類性[16],采用改進的全卷積神經網絡進行數據分類,得到改進全卷積神經網絡模型如圖2所示.

圖2 改進全卷積神經網絡模型
在圖2所示的神經網絡模型中,醫療數據的譜特征分類輸出為:

在神經網絡的隱含層,引入自適應加權學習因子,得到醫療數據表面重建的隸屬度迭代更新公式為:

其中,卷積神經網絡學習的迭代步長為 λi.通過對比醫療數據簇分布模型,計算醫療數據特征的主成分尺度,得到統計分布函數為:

根據邊緣樣本點的檢測結果,進行醫療數據的全卷積神經網絡學習,得到深度學習的表達式為:

其中,N=(Δx)2,表示醫療數據的統計特征量,采用多關聯數據回歸分析方法,構建醫療數據表面重建的遞歸圖,輸出為:

式中,d=E(x)=η,在醫療數據三維分布表面重建的稀疏散亂點分布范圍內,采用網格頂點的形變位移重構方法,得到統計特征量:

在醫療數據表面網格模型的匹配點上[17],結合負載均衡控制方法,得到整個數據表面重建網格模型統計特征量為:
式中,G(U|μk,∑k)表示為第i個頂點的采樣頻譜特征量,U表示初始采樣點云數據,uk表示網格模型頂點分布序列.
綜上分析,在改進的全卷積神經網絡分類器中進行分類識別,實現醫療數據的表面重建和自動識別.

為了測試基于改進全卷積神經網絡的醫療數據表面重建算法在進行醫療數據表面重建中的應用性能,以醫療數據冗余特征處理效果、分類精度以及重建誤差、重建耗時做為實驗指標,進行仿真實驗.
實驗以某三級甲等醫院公開性醫療數據為數據基礎,采用Visual Studio 2016軟件平臺實現醫療數據提取,并運用Matlab仿真軟件進行數據模擬分析.具體實驗參數為:數據采樣的離散點為2000,訓練點數為200,全卷積神經網絡的訓練次數為15,數據采樣的時間間隔為2.5 s,相空間重構的延遲為12,嵌入維數為4,根據上述實驗參數,對傳統方法和本文方法進行對比實驗分析.
由2.1小節可知,在對醫療數據進行重建之前,需要對醫療數據中的冗余特征進行濾波處理,以此來提升數據重建的效果與效率.以2.1節中的冗余數據處理結果作為依據,對傳統方法與本文方法的醫療數據冗余特征處理效果進行對比分析.根據冗余度對處理效果進行評判,冗余度數值越低,代表處理效果越好,圖3為不同方法的處理結果.

圖3 不同方法的醫療數據冗余特征處理效果
分析圖3可知,運用文獻[4]方法對醫療數據中的冗余特征進行處理時,隨著實驗時間的變化,冗余度起伏較大,缺乏穩定性,整體處理效果處于較低水平;運用文獻[5]方法對醫療數據中的冗余特征進行處理時,在開始階段時,冗余度較高,隨著時間的增長,冗余度雖然有所降低,但冗余度總體過高,說明該方法也不能實現對冗余數據的有效處理;而運用本文方法進行處理時,采用匹配濾波檢測器進行冗余濾波處理,并根據匹配濾波檢測器模型,實現對醫療數據特征量的提純處理,根據圖3可知,本文方法處理效果數值始終處于0-1之間,說明本文方法具有有效性.
在醫療數據特征提取與處理的基礎上,利用全卷積神經網絡分類器對數據進行分類處理,以便于更好的完成醫療數據重建.以稀疏散亂的醫療數據分類精度為實驗指標,以式(33)和式(34)的分類計算為依據,對本文方法與文獻[4,5]方法進行對比,結果如圖4所示.
分析圖4得知,采用本文方法進行醫療數據分類時,構建了改進全卷積神經網絡模型,利用該模型對醫療數據進行分類處理,分類精度可高達90%以上,而文獻[4]和文獻[5]方法的最高分類精度不超過80%,由此可見,本文所提方法的性能較好,對稀疏散亂數據的分類效果好.

圖4 醫療數據分類精度
醫療數據的準確性關乎患者的健康問題,因此重建結果十分重要,重建誤差過大會對醫療診斷以及治療產生負面影響.為進一步驗證本文方法的實用性能,對不同方法的重建誤差進行測試,得到對比結果如圖5所示.

圖5 不同方法醫療數據表面重建誤差對比
分析圖5得知,文獻[4]方法和文獻[5]方法的表面重建誤差較高,而不論樣本數據為何值,本文方法的表面重建誤差始終低于兩種傳統方法,這是由于運用本文方法對醫療數據的特征進行提取時,考慮到冗余數據的影響,并采用匹配濾波檢測器對冗余數據進行濾波處理,使得本文方法的表面重建誤差較低,對醫療數據的重構和特征辨識能力較強.
選取重建耗時為實驗指標,對本文方法與文獻[4]、文獻[5]方法進行對比,結果如表1所示.

表1 醫療數據重建耗時對比
分析表1得知,在數據重建耗時方面,文獻[4]方法的平均耗時約為本文方法的3倍,文獻[5]方法的平均耗時約為本文方法的3.5倍,由此可以顯著看出,本文方法能夠快速的完成醫療數據重建,說明該方法能夠提高對醫療數據的檢測和統計分析能力.這是因為本文采用多關聯數據回歸分析方法,構建了醫療數據表面重建的遞歸圖,以此為基礎完成了數據重建,大大降低了耗時.
由于采用傳統方法對醫療數據進行重建和識別時,重建誤差較大,因此提出一種基于改進全卷積神經網絡的醫療數據表面重建算法.采用無線RFID和ZigBee組網技術,進行醫療數據采樣的網絡節點分布式設計,采用密集型模糊迭代方法,進行醫療數據的融合處理,采用卷積神經網絡學習算法進行醫療數據動態遷移均衡調度,對提純后的醫療數據采用相空間重構技術實現醫療數據重構,對重構數據采用改進全卷積神經網絡分類器進行分類識別,實現醫療數據的表面重建和自動識別.研究得知,本文方法能有效實現對醫療數據的表面重建,具有較強的實用性,能夠為相關研究提供一定的參考價值.