楊燕,錢正瑛,莊希,金偉
南京醫科大學附屬無錫人民醫院 醫學工程處,江蘇 南京 214023
隨著醫療改革的不斷深入,運營成本控制逐漸成了醫院管理的重要研究方向[1]。醫用耗材管理是醫院成本管理的重要核心[2]。醫院的醫用耗材成本呈逐年上升趨勢[3-4],為提高醫院的經濟和社會效益,一系列醫用耗材管理制度逐漸被提出。低值醫用耗材品種繁多、應用量大,是醫院開展日常工作的物質基礎[5-6]。隨著信息化技術的發展,對低值耗材的管理也從科室申請、庫房入庫、出庫、接收等傳統方式逐漸轉為對臨床科室有所指導,合理使用各類耗材。通過對低值耗材一個月、一季度甚至半年的需求量進行合理有效的分析,結合其他管理因素可以制定出較為科學的采購方式以及合理的采購數量,通過這種方式能夠在降低醫院運營成本同時指導臨床科室更加合理的使用耗材。
另外,時間序列預測方法在眾多領域有著廣泛的應用,以差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average model,ARIMA)為代表的線性模型以簡單和靈活性較高等優點被廣泛應用于時間序列預測中[7],但實際需要預測的序列通常具有非線性特征,傳統線性模型在對時間序列預測研究中具有一定的局限性。為了進一步提高預測精度,以神經網絡為代表的非線性模型在時間序列預測領域的應用越來越廣泛。神經網絡模型能夠處理非線性數據,同時適應性強,可以有效提高模型預測精度。本研究基于長短期記憶神經網絡模型(Long Short Term Memory Neural Networks,LSTM)實現醫用耗材的需求量預測分析;LSTM彌補了循環神經網絡(Recurrent Neural Network,RNN)存在的梯度消失和梯度爆炸、長期記憶力不足等問題,使得RNN能夠有效利用長距離的時序信息[8]。本研究以醫用低值耗材的庫房領用需求量預測為研究對象,提出一種基于時間序列預測方法對耗材的需求量進行科學合理的預測[6],并探究LSTM醫用耗材預測模型的建立以及LSTM網絡訓練和預測結果的評價等方面的內容,以期為構建一種普遍適用的醫用耗材管理模式提供參考。
本研究使用無錫市某三甲醫院2015年1月至2021年12月器械庫房靜脈留置針月度領用量作為示例數據集,訓練LSTM模型。由于2019年底爆發的新冠疫情[9]對醫院醫療活動開展具有重要影響,為了更好評估模型的預測精度,使用新冠爆發前后數據分別訓練LSTM模型。具體實現方式為: ① 根據2015年1月至2019年6月靜脈留置針領用數據預測2019年下半年的需求量;② 根據2015年1月至2021年6月靜脈留置針領用數據預測2021年下半年的需求量。本研究基于MATLAB 2020b實現模型訓練、預測及評價等。
LSTM是RNN的一種[10],LSTM對RNN進行了改進,改變了隱藏層的內部結構,解決了RNN梯度消失的問題。因為只改變了內部結構,所以它保留了RNN神經網絡分析時間序列的優勢。LSTM神經網絡單元結構如圖1所示,其網絡相較傳統的RNN的主要優勢是其有“遺忘”單元,該結構可以使LSTM模型進行時間跨度更長的預測[11]。

圖1 LSTM神經網絡單元結構圖
LSTM神經網絡結構由一系列循環連接的記憶單元組成,記憶單元通常是由一個或多個自連接的細胞,以及輸入門、輸出門和遺忘門三個單元組成[12]。在LSTM網絡中,其執行步驟如下所示。
(1)通過遺忘門ft決定從細胞中所需剔除的信息,見式(1)。

上式中,σ為sigmoid激活函數,該函數把“記憶”權重設置為0~1之間的值,0表示信息將被全部“遺忘”,1表示信息將被全部“記憶”。xt為當前層的輸入向量,Ufht-1為上一隱藏層的輸出,Uf、Wf、bf分別為輸入權重和遺忘門以及偏置的權重。
(2)更新細胞中信息狀態。gt是由sigmoid函數控制的外部輸入門,gt決定從當前輸入數據xt中獲取的信息中選擇多少用于更新細胞狀態如式(2)所示。

式中,Ug、Wg、bg分別為輸入權重和輸入門以及偏置的權重。在Ct-1基礎上更新的細胞狀態Ct,見式(3)。

式中,Uc、Wc、bc為新獲取信息中的權重。Ct是記憶單元的狀態變量,它是LSTM保持長期記憶的關鍵。
(3)由輸出門ot控制的信息輸出結果如式(4)~(5)所示。

式中,Uo、Wo、bo分別為輸入權重和輸出門以及偏置的權重。
LSTM神經網絡通過其遺忘門機制可以充分挖掘醫用耗材每月領用數據序列數據歷史信息同時使序列數據的依賴率更高,因此,依據LSTM建立醫用耗材時間序列數據預測模型在理論上是可行的。
1.3.1 數據處理
選取靜脈留置針的每月領用數量作為本文的示例對象。靜脈留置針使用量大,對于低值耗材而言,代表性較強。提取醫院綜合運營管理系統[13]中2015年1月至2021年12月靜脈留置針每月領用數量作為數據源,對其進行處理,形成以月為單位的每月領用數量(圖2)。處理后的數據作為LSTM模型的輸入數據,LSTM模型中時間步對應于月份,預測值對應于月度領用數量。LSTM模型中每個元素均為每個月度領用量,將數據重構為行向量。

圖2 時間序列數據時序圖
對加載的數據進行標準化處理,本文選擇z-score 標準化算法[14],計算公式如式(6)所示。

其中,z為標準化之后的數據,x為原始數據,μ為原始數據的均值,σ為原始數據的標準差。經過z-score標準化處理之后的數據均值為0,標準差為1。
1.3.2 LSTM參數設定
在LSTM預測模型訓練之前需要設定一些參數,這些參數決定LSTM的結構和訓練效果等。LSTM隱藏層層數決定LSTM模型的結構,本文設置隱藏層數確定為1層;隱藏層內神經元數量設置為256。學習率設置為0.004,訓練最大迭代數為1000。使用自適應矩估計算法[15]模型優化算法。
1.3.3 訓練模型
分別使用2015年1月至2019年6月、2015年1月至2021年6月數據進行LSTM模型訓練;按照上節參數對LSTM進行參數設定,然后對LSTM模型進行訓練,訓練過程如圖3所示。

圖3 LSTM網絡訓練過程
1.3.4 實現預測
使用訓練后的模型預測下一個月的使用量,并在一次預測完成后更新網絡狀態,并把預測結果作為下一次預測的輸入,直至完成指定時間間隔的預測。預測完成后和實際測試集數據進行對比,評價預測效果。
為了量化LSTM模型在醫用耗材領域預測的精度,本文使用了包括平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percent Error,MAPE)和決定系數(Coefficient of Determination,R2)四種量化分析指標[16-17]評價預測精度,計算方式分別如式(7)~(10)所示。

其中,i為第i個時間步;N為總時間步;為預測數據;yi表示真實數據;表示真實數據的平均值。MAE、RMSE用于評估真實值和預測值之間的偏差,取值越低預測結果越準確;MAPE在考慮真實值與預測值誤差的基礎上考慮了誤差比例關系,是一個相對值;R2是一個標準統計指標,其值介于[-∞,1]之間,越接近1表示模型預測結果越準確。
使用訓練的LSTM模型預測醫用耗材留置針一個季度以及半年使用量,本研究分別對新冠疫情前2019年下半年以及新冠疫情后2021年下半年進行預測分析,見圖4~5。

圖4 2019年LSTM預測結果

圖5 2021年LSTM預測結果
使用上文論述的四種評價方法對兩個時間預測結果進行評價,評價結果如表1所示。

表1 LSTM模型評價結果
表1中2019年預測各評價指標均好于同期2021年預測結果,表明2019年底爆發的新冠疫情對靜脈留置針的預測造成了一定影響,使得擁有更多樣本的2021年預測效果弱于2019年。各階段預測結果MAE值和RMSE值均相差不大,表明預測結果中沒有出現特別大的預測誤差。表1中MAPE最小值是2.27%,MAPE最大值出現在2021年預測半年,值為4.54%,所有預測平均絕對誤差均不超過5%。新冠爆發前的2019年預測結果評價指標R2分別為0.95和0.97,接近1且相差不大,此時LSTM模型預測結果較為準確;2021年預測1季度時R2為0.33,預測結果比2019年同期水平差;2021年預測半年時R2為-0.63,說明模型2021年半年預測誤差比使用基準模型誤差稍大。
本文運用無錫市某三甲醫院2015年1月至2019年6月、2015年1月至2021年6月數據分別訓練LSTM模型,使用訓練的模型分別預測2019年7—9月和2019年下半年、2021年7—9月和2021年下半年需求量,通過結果可以發現預測時間越短,預測結果越準確。通過上述預測結果可以直觀的掌握靜脈留置針月度使用量的變化情況,預測留置針的使用需求的變化,能夠降低需求判斷的經驗成分,避免庫存數量不足和不必要的庫存積壓等情況。
由于醫用耗材的使用受多種因素影響,預測模型很難與實際情況完全吻合。白玲等[18]基于ARIMA乘季節性模型進行醫用耗材的使用預測,平均百分比誤差為5.3%;楊越等[1]使用專家建模型模塊自動選擇模型進行某型號吻合器使用預測,預測結果R2=0.317,總體相對誤差為15.12%;許亮業等[19]使用ARIMA模型進行醫用低值耗材使用量進行預測,絕對誤差為8.58%。值得注意的是,上述研究均使用線性模型進行預測且數據均為新冠疫情爆發前數據。本研究使用非線性模型LSTM進行新冠爆發前半年預測結果R2為0.95,平均百分比誤差為3.43,均好于上述研究使用的線性模型,充分體現了非線性模型的優點。由于新冠疫情爆發以來,國內處于點狀發生的狀態,對某一地區的醫療機構而言,其受影響程度處于動態變化中,這使得醫用耗材時間序列數據處于動態受影響狀態中,呈現出一定的無序性;對基于時間序列數據進行歷史規律挖掘的預測算法而言,其需要動態進行模型調整,影響了預測精度。從LSTM預測結果來看,預測誤差上升有限,表明了LSTM模型能夠動態跟蹤時間序列的這種無序變化因素;R2下降明顯,從側面表明了時間序列數據的無序性。2021年一季度預測結果R2為正數,半年預測R2為負數,因此當前預測模型應進行短期預測,避免進行長期預測。
本文以無錫市某醫院常規在用耗材為研究對象,通過LSTM神經網絡模型預測了未來一段時間某類耗材的需求數量,預測結果較理想,但當時間序列數據受到諸如新冠疫情這類突發因素影響時,LSTM模型預測精度將受到一定的影響,后續將考慮采用組合模型方法進行預測,進一步提高模型預測精度。本項研究一定程度上驗證了LSTM模型在醫用耗材需求預測領域的應用前景。