劉 欣,岳曉磊,靖 超,王亞林
(河北北方學院附屬第一醫院,河北張家口 075000)
隨著人工智能技術的發展,醫院的智能化進程也在快速推進,這體現在管理智能化及醫療設備自動化兩方面。作為管理智能化的重要組成部分,人力資源智能化管理被越來越多的醫療機構所重視。人力資源合理化管理對醫院高效培養醫療領域人才、完善醫院管理模式和提高醫院整體資源利用率均有極大的幫助,在有效加強醫院整體性的同時也可以更優的發揮醫院經濟價值與社會價值。因此,對醫院進行高效率、智能化的人力資源管理尤為重要[1-2]。
然而智能化時代的顯著特征即是數據的爆炸式增長,由此帶來的是傳統人力資源管理方式已無法滿足海量的數據處理需求。簡單的人力資源管理系統也無法對醫院的人力數據做出準確的分析與調配,同時也浪費了醫院各類信息系統收集的大量數據。這不僅流失了醫院的信息化資源,也拖累了醫院的智能信息化進程。因此,有必要將先進的人工智能算法應用于醫院人力資源配置系統,可以大幅提高醫院人力資源數據的處理能力。
從根本而言,對數據的處理即是數據挖掘。數據挖掘指的是使用軟件系統對數據包含的有用信息進行合理提取,傳統數據挖掘方法大多是使用統計學的方法。統計學方法在數據內容較少的情況下可以使用,但若有海量數據,統計學方法則較為無法適應需求。機器學習是目前使用廣泛的數據挖掘方法,其可以對海量數據進行訓練,并提取數據隱藏的特征。然后不斷地學習這些特征,可以準確地進行數據信息提取。文中使用了機器學習的方法對人力資源數據進行處理,進而提高人力資源數據處理能力[3-5]。
根據傳統人力資源配置理論,規劃人力資源主要是對單位的人事結構進行分析,并詳細梳理崗位需求與人員能力之間的關聯性。人員能力包括多種要素,對這些要素進行加權求和,判斷人員的素質得分[6-8]。
傳統的人力資源評分過程,如圖1 所示。

圖1 人力資源評分流程
首先,對接收到的數據進行分組分析,數據分組包括人員評價矩陣和人員能力矩陣這兩組。其中最常用的是建立職工能力評價矩陣,該矩陣可能考慮到多方面的因素,如自我評價、上下級評價、患者評價等。人員能力矩陣包括員工績效、出勤率、職稱等信息。在得到人員評價矩陣值與人員能力矩陣值后,可以得到關鍵指標人崗匹配度,如式(1)所示:

其中,n1~n4為對應評價參數。
設另一變量為Xij,有:

因此,可以由人崗匹配度模型對人員進行優化,如下式所示:

上述算法簡單、有效,可以對人力資源進行較好的配置,但這僅適用于人力數據較少的情況下。隨著醫院體制的增加,人力數據也在增多,問題也變得復雜化。這種方法計算效率低,不能較好地對數據進行挖掘,無法對人力資源進行有效的管理。
從上文可知,人力資源調度模型本質是對人力資源數據進行分析,計算人崗匹配度。然后根據人崗匹配度分數進行人員的調度,這在本質上可以抽象成為推薦模型。推薦模型在眾多領域內均有分析和驗證,目前主流的推薦模型使用循環神經網絡作為數據處理模塊。
循環神經網絡最主要的特征是使用循環卷積進行數據訓練運算[9-10]。循環卷積網絡模型可以看作一種層次化的數據模型,卷積網絡的輸入為原始的人力資源數據。經過循環卷積運算、池化、激活函數等過程,將數據之間的抽象特征提取出來,其過程表達式如下:

其中,xL為L層的數據輸入,ω為L層的參數權重值,z為模型選擇的損失函數,y為模型的標定值,函數f為模型的最終計算參數。
文中將基礎神經網絡進行改進,使用混合循環神經網絡模型,并利用全局模型和局部模型相結合的方式,將模型層次化運算后的數據特征作為網絡輸出,進而實現數據的處理。然后使用層次化的模型結構進行網絡搭建,進而實現人崗匹配推薦[11-13]。混合循環網絡模型,如圖2 所示。

圖2 混合循環網絡模型
在模型搭建過程中,文中選取交叉熵作為判斷損失函數。該損失函數可以對數據實際值和數據期望值進行比較,進而確定數據的接近程度,損失函數如下:

同時,在訓練時使用梯度優化算法對參數進行優化。這樣參數傳遞可以盡量準確,模型參數的具體更新過程為:
1)對神經網絡的學習率、迭代次數進行更新,如下式所示:

其中,β1、β2為循環神經網絡的超參數,gt為模型的計算梯度,t為模型的迭代次數。
2)對一階估計值和二階估計值進行優化定向,有:

3)由上文得到的結果對模型的參數進行更新:

文中1.2 節提到,使用的總體算法即為人崗匹配推薦算法。推薦算法的流程設計也要針對不同的應用場景和數據特征。當前使用的人力資源領域的算法通常均是統計算法,未考慮到數據隱藏的特征,僅依靠簡單的打分和專家評判機制,這容易導致信息匱乏問題的出現。
文中將循環卷積神經網絡和傳統人力資源配置算法相結合,設計了適用于人力資源領域的人崗匹配推薦算法。該算法不但改善了傳統算法數據訓練質量較低的問題,而且通過采用循環神經網絡有效提高了數據計算效率。算法的核心思想是:首先對數據中的原始特征進行提取,原始特征和傳統人力資源所需特征一致,包括人員評價矩陣和人員能力矩陣。數據提取進入編碼器進行編碼,然后將編碼特征作為數據輸入項輸入到循環神經網絡的數據輸入層。使用循環卷積層對數據進行處理,進而得到人崗匹配結果,算法流程如圖3 所示。

圖3 算法流程
首先,進行數據采集,其使用分布流式采集方法對數據進行選擇,分組為人員評價矩陣和人員能力矩陣。然后將數據抽象化,對數據進行預處理,使用編碼器對數據進行編碼且保存到數據倉庫;使用提升特征算法對數據特征進一步加強后,輸入至循環卷積網絡。最終輸出人崗匹配分數,人力資源推薦過程完成。
算法流程中的步驟說明如下:
1)數據采集。使用分布流式的數據采集方法,由于不同醫院人力數據不同,格式也存在差異。因此必須對人力數據進行統一格式處理,處理方式包括數據舍棄、轉換等操作。
2)對原始的數據進行預處理。對數據進行分組,從而對人力資源模型特征進行更加全面的了解。同時將數據保存至數據倉庫中,這樣可以對后續的數據模型訓練進行支撐。
3)進行特征增強。從數據倉庫中獲取數據,并對數據分組結果進行學習。將融合后的數據結果作為神經網絡數據輸入,進行網絡訓練。
4)推薦結果輸出。將人崗匹配度結果進行排序,然后參考分數進行合理的崗位分配。
對算法進行評價,一般通過一定數量的指標進行,文中的人力資源推薦算法評價指標采用準確度評價指標[14-16]。
在評價體系中,準確率和召回率越高,代表算法越優。但在一些場景下,準確率和召回率可能是矛盾的,所以為了綜合這兩個指標,文中使用F1 值進行綜合,公式為:

文中數據對醫院人力資源數據進行分類整理,數據包含人員自身信息、人員評價矩陣值及人員能力矩陣值3 種。該次數據共采集到醫院職工4 560名,醫院崗位1 233 個,樣本數量為134 540 個。該次實驗的環境,如表1 所示。

表1 實驗設置環境說明
文中將樣本分為訓練樣本集和測試樣本集。神經網絡測試過程偽代碼如下:
輸入:特征D。
輸出:混合循環神經模型。
1)初始化超參數,參數包括迭代次數t,學習率L,循環神經網絡的超參數β1、β2,模型的計算梯度gt;
2)i從1 到t循環;
3)j從1 到t循環;
4)計算各個通道的特征值,代入函數f;
5)若j=t,則終止循環,執行步驟6);若j<t,則返回步驟3);
6)提取卷積特征,得到F;
7)將F值和局部模型特征值結合,得到概率值;
8)得到當前的人崗匹配值;
9)排序,輸出最終結果;
10)若i<t,則返回步驟2),循環執行i過程;
11)若i=t,結束。
然后對文中算法的可行性進行對比實驗,使用文中算法、卷積神經網絡算法、傳統統計學方法進行模型訓練以及實驗分析,分析評價指標為準確率、召回率和F1 值。實驗結果如表2 所示。

表2 對比實驗結果
由表2 可以看出,文中算法的F1 值和其他兩項算法相比均有明顯提升,傳統統計學方法效果最差。在數據量較多的情況下F1 值為0.678,普通卷積神經網絡算法F1 值有所提升,為0.766;文中算法表現最優,F1 值為0.823。這說明直接使用循環卷積網絡并不能真正提升數據的訓練特征,而文中使用全局網絡加局部網絡的方法,可以有效提升數據的隱層特征,進而提升數據的訓練質量,提高算法的匹配度和推薦精度。
人力資源調度模型本質是對人力資源數據進行分析,計算人崗匹配度。然后根據人崗匹配度分數進行人員的調度,這在本質上可以抽象成為推薦模型。文中對基礎神經網絡進行改進,使用混合循環神經網絡模型、全局模型和局部模型相結合的方式,將模型層次化運算后的數據特征作為網絡輸出,進而實現數據的處理。通過采用層次化的模型結構進行網絡搭建,最終實現高精確度的人崗匹配與推薦。