999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度強(qiáng)化學(xué)習(xí)的醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)研究

2022-02-17 12:11:04天,黃冠,李
電子設(shè)計(jì)工程 2022年3期
關(guān)鍵詞:深度智能優(yōu)化

夏 天,黃 冠,李 穎

(湖北省腫瘤醫(yī)院設(shè)備科,湖北武漢 430079)

隨著我國醫(yī)療體制改革的不斷推進(jìn),醫(yī)用直線加速器、麻醉機(jī)、CT、RI 等大型醫(yī)用設(shè)備在大多數(shù)省市地區(qū)醫(yī)院被廣泛配置[1-2]。然而,不合理配置醫(yī)用設(shè)備或者使用效率低等現(xiàn)象愈發(fā)嚴(yán)重,造成大型醫(yī)用設(shè)備資源日趨緊張。因此,合理、高效地進(jìn)行大型醫(yī)用設(shè)備管理變得尤為重要[3-4]。而當(dāng)有突發(fā)公共衛(wèi)生危機(jī)時,如何在保障常規(guī)基礎(chǔ)衛(wèi)生需求的同時,快速調(diào)度大型醫(yī)療設(shè)備是當(dāng)前的研究熱點(diǎn)。

在我國,針對醫(yī)用大型設(shè)備配置、管理的研究開展較晚,且由于研究方法的標(biāo)準(zhǔn)不一致,導(dǎo)致設(shè)備配置的公平性、適宜性無法進(jìn)行對比[5-8]。近年來,物聯(lián)網(wǎng)技術(shù)開始被應(yīng)用在醫(yī)療設(shè)備的日常管理中[9-11]。該技術(shù)融合了智能感知、無線通信和智能識別技術(shù),是信息技術(shù)的重要組成部分。其基于互聯(lián)網(wǎng)匯總各類數(shù)據(jù),形成綜合物聯(lián)網(wǎng)。強(qiáng)化學(xué)習(xí)算法源于心理學(xué),是一種機(jī)器學(xué)習(xí)算法,其目的在于通過分析智能體產(chǎn)生的數(shù)據(jù)來學(xué)習(xí)系統(tǒng)最佳行為[12-16]。

文中使用物聯(lián)網(wǎng)技術(shù)采集設(shè)備日志數(shù)據(jù),將其作為調(diào)度優(yōu)化算法的數(shù)據(jù)源。以馬爾可夫決策過程為調(diào)度優(yōu)化算法的基礎(chǔ)模型,進(jìn)而定義了各類函數(shù)。通過使用貪婪策略和Tanh 函數(shù)作為強(qiáng)化學(xué)習(xí)的動作探索策略和激活函數(shù),提高了對非線性復(fù)雜數(shù)據(jù)的學(xué)習(xí)能力。最終,基于DDPG 算法獲得了價值估計(jì)和行為估計(jì)。

1 醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)

文中所提的醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)主要用于醫(yī)用直線加速器、GE、麻醉機(jī)等大型或者急救相關(guān)的醫(yī)療設(shè)備的日常管理、調(diào)度,以實(shí)現(xiàn)醫(yī)療設(shè)備資源的高效率利用;同時當(dāng)有緊急需要時,可以科學(xué)、合理地調(diào)動這些醫(yī)療設(shè)備資源。由于這些設(shè)備涉及多種精密元器件和技術(shù),并且諸多功能并不能經(jīng)常用到,因此全面監(jiān)控各個醫(yī)用設(shè)備的關(guān)鍵參數(shù)對設(shè)備的維護(hù)也較為重要。

文中所提的醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)涉及兩個方面:一方面利用物聯(lián)網(wǎng)技術(shù)和云計(jì)算技術(shù)進(jìn)行大型醫(yī)用設(shè)備底層關(guān)鍵參數(shù)的實(shí)時采集,實(shí)現(xiàn)對醫(yī)用設(shè)備即時狀態(tài)的監(jiān)控;另一方面利用深度強(qiáng)化學(xué)習(xí)算法分析采集到的數(shù)據(jù),以得到該設(shè)備的使用效率,以便合理安排設(shè)備的使用方式。其中,分別從年檢查人數(shù)、檢查項(xiàng)目數(shù)量等指標(biāo)來考察大型設(shè)備的使用情況,進(jìn)而評估設(shè)備配置是否合理,是否可被應(yīng)急征調(diào),其具體架構(gòu)如圖1 所示。

圖1 醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)結(jié)構(gòu)框架

2 基于深度強(qiáng)化學(xué)習(xí)的調(diào)度優(yōu)化算法

2.1 醫(yī)用設(shè)備應(yīng)急調(diào)度問題的轉(zhuǎn)化

深度強(qiáng)化學(xué)習(xí)包含了兩種模塊:深度學(xué)習(xí)模塊和強(qiáng)化學(xué)習(xí)模塊。兩種模塊分工各不相同,深度學(xué)習(xí)模塊被用來進(jìn)行馬爾科夫決策過程的環(huán)境感知;而強(qiáng)化學(xué)習(xí)模塊則被用來確定決策控制的方向。深度強(qiáng)化學(xué)習(xí)智能訓(xùn)練過程如圖2 所示。

圖2 深度強(qiáng)化學(xué)習(xí)智能訓(xùn)練過程

醫(yī)用設(shè)備應(yīng)急調(diào)度問題可通過建模轉(zhuǎn)化為馬爾可夫決策過程。在該決策過程中,各個醫(yī)用設(shè)備被當(dāng)作智能體,這些智能體在不同時刻產(chǎn)生的信息通過狀態(tài)空間進(jìn)行描述。每當(dāng)智能體執(zhí)行完一個動作時,均會得到系統(tǒng)一個獎勵。深度強(qiáng)化學(xué)習(xí)算法的目的在于,通過分析一系列智能體動作與獎勵的對應(yīng)關(guān)系來推斷使智能體得到最大獎勵的動作形式。

由于大型醫(yī)療設(shè)備數(shù)量和種類較多,并且每類醫(yī)用設(shè)備具有多種功能,因此,醫(yī)用設(shè)備調(diào)度問題屬于多智能體、多狀態(tài)問題。文中將醫(yī)用設(shè)備調(diào)度馬爾可夫建模,轉(zhuǎn)化成多個智能體馬爾可夫決策過程。使用深度強(qiáng)化學(xué)習(xí)算法作為調(diào)度優(yōu)化算法的關(guān)鍵在于狀態(tài)空間、動作空間及獎懲函數(shù)的定義。文中狀態(tài)空間被定義為3 個矩陣的形式:使用時間矩陣、任務(wù)分配布爾矩陣以及狀態(tài)布爾矩陣。矩陣的行代表不同的檢查項(xiàng)目,列代表不同的患者。第一行左邊的矩陣為使用時間矩陣,表示不同檢查項(xiàng)目使用該設(shè)備的時間;中間的矩陣為任務(wù)分配布爾矩陣,表示待檢查項(xiàng)目;右邊的矩陣表示該設(shè)備已經(jīng)完成的檢查項(xiàng)目。當(dāng)該設(shè)備下一狀態(tài)選擇患者1 進(jìn)行第二個檢查項(xiàng)目時,狀態(tài)空間將會更新。以3×3(3 臺設(shè)備,3 個患者)醫(yī)用設(shè)備調(diào)度為例進(jìn)行說明,如圖3所示。

圖3 狀態(tài)空間

動作空間表示的是設(shè)備在當(dāng)前狀態(tài)下,選擇任意患者的任意待測項(xiàng)目的行為。醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù)應(yīng)根據(jù)事先定義的規(guī)則實(shí)現(xiàn)為每一個決策點(diǎn)的待檢測項(xiàng)目分配優(yōu)先級。求解完成設(shè)備調(diào)度問題的候選待測項(xiàng)目規(guī)則如表1 所示。

表1 候選待測項(xiàng)目規(guī)則

獎懲函數(shù)用來評判智能體所選擇動作的優(yōu)劣,可調(diào)控醫(yī)用設(shè)備應(yīng)急調(diào)度算法的偏向。獎懲函數(shù)應(yīng)滿足下列3 個要求:

1)反映智能體行為的即時獎勵;

2)選擇優(yōu)化目標(biāo)作為獎懲函數(shù),以修正深度強(qiáng)化學(xué)習(xí)算法的收斂方向;

3)獎懲函數(shù)應(yīng)滿足不同規(guī)模的調(diào)度應(yīng)用,具有良好的普適通用性。

基于以上分析,文中將患者的檢查時間和所有檢查項(xiàng)目最小完成時間的組合作為獎懲函數(shù),其具體為:

式中,a、b分別為調(diào)節(jié)常數(shù),y為事例的最優(yōu)解,y′為深度強(qiáng)化學(xué)習(xí)算法預(yù)測的最小檢查完成時間。

2.2 基于深度強(qiáng)化學(xué)習(xí)的調(diào)度優(yōu)化算法介紹

通過以上分析可知,深度強(qiáng)化學(xué)習(xí)由深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)構(gòu)成。深度學(xué)習(xí)用于表征學(xué)習(xí),強(qiáng)化學(xué)習(xí)則用于提供控制目標(biāo)和選擇策略。經(jīng)過多次與周圍環(huán)境的交互,深度強(qiáng)化學(xué)習(xí)可實(shí)現(xiàn)自主學(xué)習(xí),不斷增強(qiáng)控制能力。

文中選擇用貪婪策略作為強(qiáng)化學(xué)習(xí)的動作探索策略,通過設(shè)定探索閾值p來進(jìn)行動作的選擇。選定隨機(jī)數(shù)x,若x>p,則使用式(2)進(jìn)行動作探索:

式中,n為動作空間的大小。當(dāng)g(t)=0 時,表明醫(yī)用設(shè)備沒有可執(zhí)行的檢查項(xiàng)目;當(dāng)g(t)=n時,表明醫(yī)用設(shè)備可執(zhí)行的檢查項(xiàng)目為n。若x

式中,h(a|s)為行為策略。

由于醫(yī)用設(shè)備應(yīng)急調(diào)度問題涉及較多的特殊環(huán)境,其模型并不能用簡單的線性模型進(jìn)行擬合。文中使用Tanh 函數(shù)作為激活函數(shù),以提高對非線性復(fù)雜數(shù)據(jù)的學(xué)習(xí)能力。Tanh函數(shù)的表達(dá)式如式(4)所示:

該函數(shù)的取值范圍為[-1,1],適用于輸入數(shù)據(jù)特征相差較大的求解問題。

文中使用DDPG 算法進(jìn)行經(jīng)驗(yàn)數(shù)據(jù)采樣,以獲得價值估計(jì)和行為估計(jì)。針對醫(yī)用設(shè)備應(yīng)急調(diào)度問題,基于DDPG 算法的深度強(qiáng)化學(xué)習(xí)智能體被拆解為評論者網(wǎng)絡(luò)和行動者網(wǎng)絡(luò),這兩種網(wǎng)絡(luò)均使用卷積神經(jīng)網(wǎng)絡(luò)來搭建。在評論者網(wǎng)絡(luò)中,智能體通過評估動作的值來判斷該動作執(zhí)行后狀態(tài)的優(yōu)劣;而行動者網(wǎng)絡(luò)依據(jù)評論者網(wǎng)絡(luò)給出的估值作出相應(yīng)的反應(yīng),DDPG 算法更新形式如圖4 所示。

圖4 DDPG算法更新形式

為了使深度強(qiáng)化學(xué)習(xí)算法的效果最佳,該算法需要根據(jù)學(xué)習(xí)情況不斷修正參數(shù)。深度強(qiáng)化學(xué)習(xí)算法通過損失函數(shù)的計(jì)算得到評論者網(wǎng)絡(luò)的損失和行動者網(wǎng)絡(luò)的損失。評論者網(wǎng)絡(luò)的損失函數(shù)如式(5)所示:

式中,w為評論者網(wǎng)絡(luò)的參數(shù),r為即時獎勵,Q(s′,w)為下一狀態(tài)的估計(jì)值。

在涉及多個智能體調(diào)度問題時,當(dāng)某個智能體因采取某個行動而引起自身狀態(tài)改變后,其他智能體的狀態(tài)也會受到影響。因此,需要從所有智能體的狀態(tài)來考慮整體的調(diào)度問題。多智能體異步DDPG 訓(xùn)練形式及訓(xùn)練過程如圖5 所示。

圖5 多智能體異步DDPG訓(xùn)練形式及訓(xùn)練過程

所有智能體狀態(tài)構(gòu)成全局網(wǎng)絡(luò)模型,每一個智能體都從全局網(wǎng)絡(luò)中復(fù)制網(wǎng)絡(luò)參數(shù),并在該智能體所在的環(huán)境中單獨(dú)訓(xùn)練。全局網(wǎng)絡(luò)參數(shù)的更新取決于所有智能體的累計(jì)梯度。通過讓智能體在其所處的環(huán)境中訓(xùn)練網(wǎng)絡(luò)參數(shù),來避免智能體之間的狀態(tài)改變而影響網(wǎng)絡(luò)訓(xùn)練。

3 測試與驗(yàn)證

為了驗(yàn)證文中所述應(yīng)急調(diào)度算法的有效性,選取某醫(yī)院的8 臺CT 設(shè)備一個月內(nèi)的使用情況作為研究對象,采集到的數(shù)據(jù)作為深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練,使用Matlab 作為算法仿真平臺。首次訓(xùn)練,將樣本數(shù)據(jù)中的五分之四用作模型訓(xùn)練,其余數(shù)據(jù)用于模型驗(yàn)證。圖6和圖7 分別展示了隨著網(wǎng)絡(luò)節(jié)點(diǎn)個數(shù)的增加,r在不同的取值下,Q值之和以及平均獎賞值的變化趨勢。圖6 中,當(dāng)Q值曲線趨于穩(wěn)定時,代表深度強(qiáng)化學(xué)習(xí)算法趨于收斂。由圖6 可知,隨著r的增加,算法的收斂時間越來越小。圖7 中,曲線取值穩(wěn)定時,同樣代表算法收斂。圖7 中曲線穩(wěn)定的數(shù)值越低,即平均獎賞值越低,代表算法時延越小、性能越好。值得注意的是,隨著r的增加,平均獎賞值越大。由此可見,r的取值需要綜合收斂時間和平均獎賞值來考慮。

圖6 Q值之和與節(jié)點(diǎn)個數(shù)的關(guān)系曲線

圖7 平均獎賞值與節(jié)點(diǎn)個數(shù)的關(guān)系曲線

表2 為4 臺設(shè)備使用了文中所提應(yīng)急調(diào)度優(yōu)化算法和未使用調(diào)度算法時,進(jìn)行相同檢測人數(shù)、檢查項(xiàng)目所使用時間的對比。從表中可以看出,實(shí)驗(yàn)組在使用了文中所提醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化算法后,在相同患者人數(shù)、相同檢查項(xiàng)目情況下,整體檢查時間明顯縮短,平均縮短31.2%的時間。

表2 使用文中所述應(yīng)急調(diào)度算法與未使用調(diào)度算法的檢測時間對比

4 結(jié)束語

文中所提基于深度強(qiáng)化學(xué)習(xí)算法的醫(yī)用設(shè)備應(yīng)急調(diào)度優(yōu)化技術(shù),將物聯(lián)網(wǎng)技術(shù)和深度強(qiáng)化學(xué)習(xí)算法融入到設(shè)備調(diào)度優(yōu)化算法中。一方面通過物聯(lián)網(wǎng)技術(shù)采集大型醫(yī)用設(shè)備日常使用時的各類參數(shù),作為后續(xù)調(diào)度優(yōu)化算法的樣本數(shù)據(jù);另一方面使用深度強(qiáng)化學(xué)習(xí)算法來分析醫(yī)用設(shè)備在日常使用中的數(shù)據(jù),給出了狀態(tài)空間、動作空間以及獎懲函數(shù)的定義。同時,用貪婪策略作為強(qiáng)化學(xué)習(xí)的動作探索策略,使用Tanh 函數(shù)作為激活函數(shù),以提高對非線性復(fù)雜數(shù)據(jù)的學(xué)習(xí)能力。最終,使用DDPG 算法在經(jīng)驗(yàn)數(shù)據(jù)中采樣獲得價值估計(jì)和行為估計(jì)。經(jīng)過仿真驗(yàn)證和實(shí)際測試,證明了文中方案的有效性。

猜你喜歡
深度智能優(yōu)化
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
深度理解一元一次方程
深度觀察
深度觀察
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
主站蜘蛛池模板: 毛片基地视频| 曰AV在线无码| 播五月综合| 欧美啪啪网| 国产成人精品男人的天堂| 国产精品欧美激情| 伊在人亚洲香蕉精品播放| 精品国产一区91在线| 国产美女叼嘿视频免费看| 精品国产香蕉在线播出| 亚洲国产精品不卡在线| 狠狠亚洲五月天| 日本午夜三级| 亚洲最黄视频| 99视频在线免费观看| 欧美一级特黄aaaaaa在线看片| 国产欧美高清| 日韩中文精品亚洲第三区| 又黄又湿又爽的视频| 国产精品自在在线午夜区app| 97青草最新免费精品视频| 亚洲高清在线天堂精品| 国产精品亚洲五月天高清| 好吊妞欧美视频免费| 国产91成人| 一本大道香蕉中文日本不卡高清二区 | 日韩免费毛片视频| 激情综合图区| 欧美一区二区三区国产精品| 亚洲精品无码久久久久苍井空| 国产精品视频导航| 精品人妻AV区| 在线高清亚洲精品二区| 亚洲日韩精品无码专区97| 亚洲啪啪网| 国产成人亚洲精品色欲AV| av午夜福利一片免费看| 国产成人亚洲精品色欲AV | 91av成人日本不卡三区| 欧美在线伊人| 高清码无在线看| 国产精品伦视频观看免费| 国产中文在线亚洲精品官网| 亚洲欧美在线看片AI| 成人日韩视频| 特级毛片免费视频| 国产一区二区精品福利| 国产一区二区三区在线精品专区 | 色欲色欲久久综合网| 国产一区二区精品福利| 全午夜免费一级毛片| 久草视频福利在线观看| 制服丝袜一区二区三区在线| 日韩毛片免费| 国产白浆在线观看| 2021国产v亚洲v天堂无码| 亚洲天堂.com| h视频在线观看网站| 亚洲热线99精品视频| 国产菊爆视频在线观看| 欧美五月婷婷| 亚洲成人精品在线| 亚洲精品天堂在线观看| 国产精品女同一区三区五区| 日韩成人在线一区二区| 免费a级毛片视频| 亚洲av片在线免费观看| 国内精品视频| 欧美色亚洲| 亚洲一级毛片在线观| 中文字幕精品一区二区三区视频 | 亚洲国产精品VA在线看黑人| 秘书高跟黑色丝袜国产91在线| 成人中文字幕在线| 亚洲狼网站狼狼鲁亚洲下载| 国产精品视频久| 精品国产香蕉伊思人在线| V一区无码内射国产| 国产乱人伦偷精品视频AAA| 呦女亚洲一区精品| 午夜视频在线观看区二区| 色一情一乱一伦一区二区三区小说|