王夢(中國石油工程建設有限公司,北京 100120)
隨著現代企業規模的不斷擴大,企業對人才的依賴日益突出,能夠準確預測人才招聘中的人才需求量,對于提升企業人事管理水平具有重要意義。因此相關學者就企業人才需求量的預測從定性分析與定量計算進行了一系列的探索。
通過查閱文獻在人才需求量上,主要是以建立影響因素指標體系,采集歷史數據對未來做出預測,或者基于將人才需求量視為關于時間的變量,通過時間序列預測的方式進行預測。時間序列是收集歷史統計數據,將研究的變量按照數據的先后順序排列起來,通過時間序列分析找出研究變量隨時間的變化關系。在分析中對于線性系統可以采用最小二乘法擬合回歸方程,而對于非線性系統的回歸則需要使用具有非線性擬合能力的計算模型,例如:BP神經網絡、支持向量機等模型。此外,相關性預測模型是基于歷史統計數據,研究多影響因素對研究變量的回歸問題。實際上人才需求量的預測是非線性變化的,具有隨機性和突變性,因此傳統的線性擬合算法預測的精度往往較低,并且影響人才需求量的因素還在不斷的研究探索中,整個預測過程呈現出灰色特征,即部分信息已知而部分信息還未知。本文將人才需求量作為時間變量,通過引入學習速率較高的極限學習機(ELM)機器學習算法模型[1-3],對企業人才需求量進行回歸擬合預測,為豐富人才需求量預測模型進行有益的探索與嘗試,為企業人才需求量預測決策提供算法參考。
與BP神經網絡相比,作為一種單隱含層前饋神經網絡(SLFN) ELM在進行機器學習之前只需要設置隱含神經元的個數,通過隨機產生輸入層、隱含層之間的連接權值與閾值便可以獲得最優解,無需向BP神經網絡一樣進行反復多次迭代,采用梯度下降使得誤差降低到所要求的的范圍內。因此,ELM具有較高的學習效率與精度,有很多學者將ELM應用到自己的研究領域中,例如文獻[5-8]。典型的ELM網絡結構圖如圖1所示。

圖1 典型ELM網絡結構
ELM作為機器學習家族中的一員,除了具有強大的分類與擬合預測功能,還具有高效的學習速率。實際上ELM比同家族的BP的神經網絡更容易收斂,訓練的時間也較短。ELM自2004年被提出以來,模型在十幾年的時間里得到不斷的修正,使其泛化能力超過誤差反向傳播以BP神經網絡為代表的機器學習算法。此外,ELM根據自身的神經網絡搭建而定,而不需要向BP神經網絡一樣需要在反復迭代學習中找到自身最合理的結構。
與其他前饋神經網絡結構(SLFN)一樣,ELM網絡層也包括輸入X,輸出Y以及連接二者的隱含層。假設有n個神經元作為輸入層,則對應有n個輸入變量。ELM網絡的連接權值w表達式如式(1)所示,隱含層與輸出層之間的連接權值β表達式如式(2)所示,隱含層閾值b的表達式如式(3)所示,樣本輸入X與結果輸出Y的表達式如式(4)所示,則ELM網絡輸出量為T表達式如式(5),其中g(x)為hardlim激勵函數。


上式可以變形表示為如(6)式所示

其中H的表達式為:

ELM進行機器學習之前通過產生隨機權重值w與閾值b,即是說ELM網絡的輸入神經元個數與隱含層神經元個數數值一旦確定其結構就會確定,則與該結構匹配的連接權重值β就確定,這與BP神經網絡相比省去了反復迭代利用梯度下降得到理想解的過程。由于ELM的學習速度、處理精度高,以及泛化能力強,被廣泛用于回歸、分類、模式識別等領域。
企業在實際確定員工需求量時往往會分崗位,對崗位的工作經驗、崗位的學歷都有不同的要求,并且不同企業的影響因素不同,因此構造通用的評價指標體系存在難度。本文研究是統計了某個企業2010—2019年的員工總人數,相鄰年份的總人數差值即為當年所需要的人才數量,因此是將人才數量作為宏觀統計量,而并沒有按照崗位和學歷等要求進行數據分割。某企業過去10年的員工總人數統計表如表1所示。

表1 某個企業2010—2019年的員工總人數
在學習之前數據已經按照時間順序排好,但是為了提高ELM的預測精度,我們選用9個樣本作為學習輸入樣本,僅剩下1個樣本進行預測,使得ELM不但能夠進行關于時間的正推,也可以實現關于時間的逆推,這樣可以實現每個樣本值的實際值與預測值的比較。ELM的預測結果如表2所示。實際值與預測值的對比如圖2(a)、(b)所示,誤差在可接受的范圍內,并且ELM所預測的趨勢與實際非常接近。

表2 實際值與預測值對比

圖2 實際值與預測值的對比
(1)將企業人才需求量視為基于年份時間變化的函數,以歷史統計數據作為樣本,省去了構建人才需求量的影響因素評價指標體系,使得預測方法更為通用。
(2)引入ELM作為數據預測模型,以時間序列作為輸入變量,由于其預測精度、學習效率較高,可以作為企業人才需求量的預測模型,具有較強的適用性。