999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)智能分析與識別系統(tǒng)設(shè)計

2021-06-14 13:02:32谷麗霞劉欣芃
電子設(shè)計工程 2021年10期
關(guān)鍵詞:深度實(shí)驗(yàn)

谷麗霞,劉欣芃

(1.上海市第六人民醫(yī)院,上海 201303;2.鄭州大學(xué)西亞斯學(xué)院,河南新鄭 451150)

第四次工業(yè)革命的到來使得互聯(lián)網(wǎng)中的數(shù)據(jù)量呈現(xiàn)出井噴式的增長。醫(yī)療財務(wù)分析領(lǐng)域同樣面臨著數(shù)據(jù)快速增長帶來的各項(xiàng)挑戰(zhàn),數(shù)據(jù)量的增長需要更先進(jìn)、高效的數(shù)據(jù)處理技術(shù)支持[1-5]??焖偻瓿珊A繑?shù)據(jù)的識別與處理,可以有效提取數(shù)據(jù)中的有用信息進(jìn)行輔助判別,不但能夠提升醫(yī)院財務(wù)系統(tǒng)運(yùn)轉(zhuǎn)效率,還能為戰(zhàn)略決策提供有效的數(shù)據(jù)參考[6-8]。

近年來,計算機(jī)的運(yùn)算能力得到了大幅提高。傳統(tǒng)的機(jī)器學(xué)習(xí)算法在計算效率上的優(yōu)勢已隨著計算量的增長而變得越來越小,深度學(xué)習(xí)網(wǎng)絡(luò)憑借其更優(yōu)秀的算法性能在工業(yè)界有了更廣泛的應(yīng)用,眾多學(xué)者開始研究深度學(xué)習(xí)理論在醫(yī)療數(shù)據(jù)處理中的各項(xiàng)問題。對于醫(yī)療財務(wù)數(shù)據(jù)的處理,通常面臨著數(shù)據(jù)結(jié)構(gòu)化程度低、特征維度大、數(shù)據(jù)缺失等問題。因此,深度學(xué)習(xí)算法較難直接找到契合的應(yīng)用場景。為了提升醫(yī)療數(shù)據(jù)的分析效率,該文建立了一個智能化的醫(yī)療數(shù)據(jù)處理與識別系統(tǒng)。文中對于深度置信網(wǎng)絡(luò)進(jìn)行研究,將其與自編碼網(wǎng)絡(luò)相結(jié)合,實(shí)現(xiàn)快捷化的數(shù)據(jù)特征識別,并以某醫(yī)院的相關(guān)財務(wù)數(shù)據(jù)集為例,對系統(tǒng)的數(shù)據(jù)分析能力進(jìn)行了測試和分析。

1 理論基礎(chǔ)

1.1 深度學(xué)習(xí)

數(shù)據(jù)量的增長使得傳統(tǒng)的機(jī)器學(xué)習(xí)算法無法充分挖掘出數(shù)據(jù)內(nèi)的隱藏價值。深度學(xué)習(xí)并不是一項(xiàng)新興的技術(shù),但是長期以來,由于其結(jié)構(gòu)復(fù)雜,運(yùn)算時間長,無法滿足應(yīng)用需求。近年來,隨著計算機(jī)運(yùn)算性能的提升,深度神經(jīng)網(wǎng)絡(luò)得以在工業(yè)界應(yīng)用。深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)是一種多層次的有監(jiān)督網(wǎng)絡(luò),區(qū)別于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),其引入了多個受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)。RBM 的基本結(jié)構(gòu)如圖1 所示[9-14]。

在DBN 中,其隱藏層多為RBM、DBN,隱藏層的連接方式較為靈活,可以是全連接的也可以是無連接的。DBN 通過堆疊多個RBM 來提升網(wǎng)絡(luò)的分類性能,對當(dāng)前層訓(xùn)練完畢以后,用當(dāng)前層的輸出作為下一層的RBM 輸入,最終通過誤差的反向傳播來訓(xùn)練整個網(wǎng)絡(luò)[15-16]。

DBN 基于能量模型,對于包含m個隱藏單元的DBN,定義其狀態(tài)為h,可見層的能量為v。此時RBM 的能量函數(shù)如式(1)所示。

在式(1)中,i代表可見單元,j代表隱藏單元,ai、bj分別是可見單元與隱藏單元的偏置,Wij是可見層到隱藏層的連接權(quán)重矩陣。通過相關(guān)參數(shù),基于式(1)模型的初始化可以得到核心函數(shù),如式(2)所示。

Z(θ)是P(v,h|θ)的歸一化算子。然后計算兩層間的概率因子,如式(3)所示。

利用式(3)可以得到隱藏層中第j個單元的激活概率,如式(4)所示。

在RBM 訓(xùn)練中,需要確定的最終參數(shù)是E(v,h|θ)中的θ,文中通過Gibbs 抽樣,得到RBM 的近似分布,然后獲得E(v,h|θ)梯度的近似值。

1.2 Autoencoder特征提取方法

對于傳統(tǒng)的淺層神經(jīng)網(wǎng)絡(luò),通常需要人為地定義、標(biāo)注輸入數(shù)據(jù)的特征作為網(wǎng)絡(luò)訓(xùn)練的輸入向量。該種定義方法涉及大量的數(shù)據(jù)處理,工作量極大。此外,對于算法使用者的專業(yè)水平要求較高且效率低下,而所提取的特征數(shù)量也不夠,無法滿足深度學(xué)習(xí)網(wǎng)絡(luò)的要求。因此,該文引入了自編碼器(Autoencoder)網(wǎng)絡(luò)作為特征提取方法。該網(wǎng)絡(luò)的特征提取流程如圖2 所示。

圖2 Autoencoder方法流程

Autoencoder 可以看作是一個無監(jiān)督的學(xué)習(xí)網(wǎng)絡(luò),它將輸入的數(shù)據(jù)(Input)進(jìn)行編碼(Encoder),然后把編碼的結(jié)果解碼(Decoder)后獲得最終的輸出(Output)。隨 后,根 據(jù)Input 與Output 間 的 誤 差(Error)不斷調(diào)整編碼、解碼參數(shù)獲得期望的輸出。其網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。

圖3 Autoencoder網(wǎng)絡(luò)結(jié)構(gòu)

對于m維的輸入變量X與n維的輸出變量Y,定義激活函數(shù)f與g,如式(5)所示。

其中,w與p分別是輸入層到隱藏層的權(quán)重矩陣和偏置矩陣,wˉ與q分別是隱藏層到輸出層的權(quán)重矩陣和偏置矩陣。文中使用的激活函數(shù)sf和sg均是Sigmoid 函數(shù),理想狀態(tài)下,輸出層Y應(yīng)是輸入層X數(shù)據(jù)的復(fù)現(xiàn),因此w有如式(6)所示的關(guān)系:

為了降低輸入與輸出間的誤差,需要定義誤差距離W(x,y),當(dāng)使用Sigmoid 函數(shù)時,W(x,y)的定義方法如下。

根據(jù)W(x,y),可以進(jìn)一步定義自編碼過程中的損失函數(shù)。若訓(xùn)練集的數(shù)據(jù)形式如式(8)所示:

則其損失函數(shù)如式(9)所示。

該文在自組織網(wǎng)絡(luò)訓(xùn)練時,采用梯度下降算法生成的自組織網(wǎng)絡(luò)的隱藏層,即可作為深度神經(jīng)網(wǎng)絡(luò)輸入的特征向量。

結(jié)合DBN 網(wǎng)絡(luò)與和Autoencoder 自編碼網(wǎng)絡(luò),文中構(gòu)建了圖4 所示的系統(tǒng)算法流程圖。

從圖4 可以看出,該算法系統(tǒng),首先,需要對所需的相關(guān)醫(yī)療數(shù)據(jù)進(jìn)行預(yù)處理;然后,使用Autoencoder算法自動化提取數(shù)據(jù)中的相關(guān)特征,利用提取的特征進(jìn)行DBN 網(wǎng)絡(luò)訓(xùn)練;最終,對訓(xùn)練的網(wǎng)絡(luò)進(jìn)行性能測試。

圖4 系統(tǒng)算法流程圖

2 方法實(shí)現(xiàn)

2.1 數(shù)據(jù)預(yù)處理

該文結(jié)合深度置信網(wǎng)絡(luò)與自編碼網(wǎng)絡(luò)構(gòu)成了一個深度學(xué)習(xí)系統(tǒng),并將其應(yīng)用在醫(yī)療財務(wù)數(shù)據(jù)的智能分析上。為了評估系統(tǒng)在數(shù)據(jù)分析上的性能,文中基于某大型醫(yī)院的財務(wù)數(shù)據(jù)集進(jìn)行了測試實(shí)驗(yàn),該數(shù)據(jù)集包含了醫(yī)院一段時期內(nèi)的148 500 條財務(wù)數(shù)據(jù),通過分析每段單位時間內(nèi)財務(wù)數(shù)據(jù),實(shí)現(xiàn)對醫(yī)院運(yùn)轉(zhuǎn)情況的評估標(biāo)注,評估結(jié)果為運(yùn)轉(zhuǎn)健康、運(yùn)轉(zhuǎn)不利兩種。文中評估結(jié)果的判斷依據(jù)為醫(yī)院的財務(wù)周報數(shù)據(jù)集,并使用這兩個結(jié)果作為系統(tǒng)的輸出結(jié)果。

在將數(shù)據(jù)輸入到算法模型前,由于該數(shù)據(jù)集中存在著非格式化數(shù)據(jù)與數(shù)據(jù)缺失的現(xiàn)象,因此需要先進(jìn)行數(shù)據(jù)的預(yù)處理。將預(yù)處理后的數(shù)據(jù)輸入到Autoencoder 網(wǎng)絡(luò)中,提取出17 個相關(guān)特征,具體的特征類目如表1 所示。

表1 模型輸入特征

在表1中,包含了可以反應(yīng)醫(yī)院財務(wù)狀況的17個財務(wù)指標(biāo),這些指標(biāo)覆蓋了醫(yī)院的運(yùn)營成本、盈利狀態(tài)以及未來的發(fā)展預(yù)期等多個方面。

2.2 仿真結(jié)果

在仿真前,首先需要確定深度置信網(wǎng)絡(luò)的相關(guān)參數(shù)。對于深度置信網(wǎng)絡(luò),重要的參數(shù)有輸入層、輸出層的節(jié)點(diǎn)數(shù)、隱藏層的節(jié)點(diǎn)數(shù)。其中,輸入層的節(jié)點(diǎn)數(shù)與特征數(shù)相關(guān),輸出層的節(jié)點(diǎn)數(shù)與網(wǎng)絡(luò)輸出向量的維度有關(guān)。而隱藏層層數(shù)以及每層的節(jié)點(diǎn)數(shù)對網(wǎng)絡(luò)性能有著重要的影響。若層數(shù)與節(jié)點(diǎn)數(shù)較少,網(wǎng)絡(luò)深度不足,則會影響網(wǎng)絡(luò)的數(shù)據(jù)分析能力;若層數(shù)與節(jié)點(diǎn)數(shù)過多,網(wǎng)絡(luò)在訓(xùn)練過程中則產(chǎn)生過擬合現(xiàn)象,從而影響網(wǎng)絡(luò)在測試集上的泛化性能。該文通過逐層實(shí)驗(yàn)的方法,確定網(wǎng)絡(luò)隱藏層層數(shù)與每層隱藏層的節(jié)點(diǎn)數(shù)。

表2、表3 與圖5 給出了隱藏層層數(shù)、隱藏層節(jié)點(diǎn)數(shù)變化對模型精度的影響。表2 的第1 列與第2 列對應(yīng)了第一次實(shí)驗(yàn),第一次實(shí)驗(yàn)只有一個隱藏層??梢钥闯?,當(dāng)節(jié)點(diǎn)數(shù)為22 時,網(wǎng)絡(luò)可達(dá)到最優(yōu)的精度63.4 %。其次,將第一個隱藏層的節(jié)點(diǎn)數(shù)設(shè)置為22,進(jìn)行第二次實(shí)驗(yàn)。表2 的第3 列與第4 列對應(yīng)了第二次實(shí)驗(yàn)的結(jié)果,第二次實(shí)驗(yàn)中,第二個隱藏層節(jié)點(diǎn)數(shù)的變化范圍為6~14。可以看出,當(dāng)節(jié)點(diǎn)數(shù)為10時,網(wǎng)絡(luò)可以達(dá)到最優(yōu)的精度75.5 %。同樣的方法可以確定第3 層與第4 隱藏層的節(jié)點(diǎn)數(shù)。當(dāng)由第3隱藏層增加為第4 隱藏層時,網(wǎng)絡(luò)的最佳性能由80.0 %降低到78.7 %,這是由于網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性造成了訓(xùn)練過程中產(chǎn)生過擬合現(xiàn)象。

表2 第1隱藏層和第2隱藏層節(jié)點(diǎn)數(shù)的影響

表3 第3隱藏層和第4隱藏層節(jié)點(diǎn)數(shù)的影響

圖5 隱藏層層數(shù)和隱藏層節(jié)點(diǎn)數(shù)變化對準(zhǔn)確率的影響

結(jié)合實(shí)驗(yàn)的數(shù)據(jù),最終可以確定網(wǎng)絡(luò)的參數(shù),如表4 所示。

表4 網(wǎng)絡(luò)參數(shù)

根據(jù)表4 中的參數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,然后使用上文中處理后的相關(guān)數(shù)據(jù)進(jìn)行算法性能測試。為了評估文中的DBN 與Autoencoder 方法組合后的算法系統(tǒng)性能,進(jìn)行了對比實(shí)驗(yàn)。具體結(jié)果如表5所示。

表5 網(wǎng)絡(luò)參數(shù)

表5 對比了該文中深度學(xué)習(xí)算法與一些淺層機(jī)器學(xué)習(xí)算法的實(shí)驗(yàn)結(jié)果。可以看出,相較于淺層的機(jī)器學(xué)習(xí)算法,文中算法的AUC 與Accuracy 分別可達(dá)到0.81 與80.0%,而淺層機(jī)器學(xué)習(xí)中,性能最好的Random Forest 的AUC 和Accuracy 分別只能達(dá)到0.71和74.3%,在AUC上,該文算法提升了0.1,在Accuracy上,提升了5.7%,兩個指標(biāo)均有較明顯的提升。

3 結(jié)束語

智能化的醫(yī)療數(shù)據(jù)處理系統(tǒng)對于醫(yī)療大數(shù)據(jù)分析具有重要意義,該文結(jié)合深度學(xué)習(xí)理論中的深度置信網(wǎng)絡(luò)進(jìn)行了相關(guān)研究。通過引入自編碼網(wǎng)絡(luò),實(shí)現(xiàn)了從大規(guī)模醫(yī)療財務(wù)數(shù)據(jù)中自動化的提取特征信息,提升了財務(wù)工作的效率。通過對比實(shí)驗(yàn)證明,在醫(yī)療財務(wù)數(shù)據(jù)集的分析上,深度學(xué)習(xí)算法的各項(xiàng)指標(biāo)均有明顯提升。而淺層機(jī)器學(xué)習(xí)算法的計算效率優(yōu)勢將隨著計算機(jī)硬件技術(shù)的發(fā)展越來越小,深度學(xué)習(xí)算法在數(shù)據(jù)分析領(lǐng)域?qū)懈鼜V闊的應(yīng)用前景。

猜你喜歡
深度實(shí)驗(yàn)
記一次有趣的實(shí)驗(yàn)
微型實(shí)驗(yàn)里看“燃燒”
深度理解一元一次方程
做個怪怪長實(shí)驗(yàn)
深度觀察
深度觀察
深度觀察
深度觀察
NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
實(shí)踐十號上的19項(xiàng)實(shí)驗(yàn)
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 在线欧美a| 久久久无码人妻精品无码| 亚洲av色吊丝无码| 中文字幕在线观看日本| 国产精品亚洲精品爽爽| 四虎综合网| 999国产精品永久免费视频精品久久 | 日本免费福利视频| 色综合天天娱乐综合网| 久久人体视频| 国产粉嫩粉嫩的18在线播放91| 国产凹凸一区在线观看视频| 99在线视频精品| 国产手机在线小视频免费观看 | 97精品久久久大香线焦| 欧美日韩精品在线播放| 亚洲av色吊丝无码| 国产精品嫩草影院视频| 无码乱人伦一区二区亚洲一| 亚洲欧美自拍中文| 熟妇人妻无乱码中文字幕真矢织江| 97亚洲色综久久精品| 精品少妇人妻一区二区| 久久这里只有精品国产99| 98精品全国免费观看视频| 中文成人在线| 色偷偷av男人的天堂不卡| 日本欧美中文字幕精品亚洲| 亚洲黄色片免费看| 国产粉嫩粉嫩的18在线播放91| 色哟哟国产成人精品| 中文字幕天无码久久精品视频免费 | 亚洲综合亚洲国产尤物| 国产精品大尺度尺度视频| 日本在线亚洲| 九色综合伊人久久富二代| 中文字幕亚洲综久久2021| www中文字幕在线观看| 综合天天色| 国产福利小视频在线播放观看| 欧美激情伊人| 国产超碰一区二区三区| 91青青在线视频| 91精品情国产情侣高潮对白蜜| 亚洲欧美综合精品久久成人网| 中文天堂在线视频| 亚洲人成在线精品| 亚洲黄网在线| 欧美一级爱操视频| 亚洲精品少妇熟女| 日韩国产高清无码| 日本亚洲最大的色成网站www| 国产精品一区二区不卡的视频| 97国产在线观看| 中文成人在线视频| 日韩av电影一区二区三区四区 | 亚洲精品黄| 国产一区二区精品高清在线观看| 国产凹凸一区在线观看视频| 51国产偷自视频区视频手机观看 | 国产精品一区二区无码免费看片| 亚洲天堂网站在线| 久久99这里精品8国产| 国产成人综合久久| 久久国产精品77777| 91精品国产一区自在线拍| 777午夜精品电影免费看| 亚洲国产91人成在线| 操国产美女| 在线色国产| 久草网视频在线| 国产人成乱码视频免费观看| 丁香亚洲综合五月天婷婷| 亚洲日本中文字幕乱码中文| 精品国产香蕉伊思人在线| 亚洲av无码专区久久蜜芽| 日韩在线中文| 无码一区二区波多野结衣播放搜索| 亚洲欧美在线看片AI| 99热国产这里只有精品9九| 色亚洲激情综合精品无码视频 | 欧美无遮挡国产欧美另类|