李蕓 胡可 董欣雨 董欣雨 袁淑俊



摘 要:人力資源是企業(yè)發(fā)展的重要資源,做好員工離職預警工作有助于企業(yè)長遠發(fā)展。本文采用國網(wǎng)青海省電力公司2010—2018年的員工離職數(shù)據(jù),分析得出人才流失的主要影響因素,使用支持向量機(SVM)算法進行員工離職預測分析。該預警模型使用部分員工數(shù)據(jù)作為訓練集,其余作為測試集,使用精確度為92.7%的中值高斯核函數(shù)型支持向量機(Medium Gaussian SVM)進行預測,模型預測精度符合預期,為電網(wǎng)企業(yè)人才流失預警提供了有效的方法。
關鍵詞:人才流失? SVM? 離職? 預警模型
中圖分類號:F279.23?文獻標識碼:A? ?文章編號:2096-0298(2020)03(b)--03
人才流失是電力企業(yè)亟需解決的一個重要問題,因而員工離職預警研究受到了國內(nèi)外企業(yè)界與學術界重點關注。要想降低員工離職帶來的人才流失風險,建立有效的員工離職預警機制已成為現(xiàn)代企業(yè)管理者必須面對的重大問題。目前,學者們較多采用模糊綜合評價方法、專家評價方法等手段進行員工離職預警研究。盡管這些方法具有計算簡便、易于理解和操作的特點,但由于這些方法涉及大量的具有較強非線性和模糊性特征的定性指標,且無法有效地預警大數(shù)據(jù)時代員工離職情況,而將支持向量機優(yōu)良特性應用于員工離職預警,可以有效解決這一問題。
1 員工離職影響因素分析
本文采集了國網(wǎng)青海省電力公司2010—2018年共2665名入職員工工作單位類型、籍貫區(qū)域類型、年齡、學歷、崗位等數(shù)據(jù)進行分析。從性別離職員工分析,每年的離職人員中男性比例均大于女性比例,可以看出性別是離職的影響因素。從離職人員年齡分析,離職人員呈鐘形左偏態(tài)分布,年齡主要分布在20~34歲,且在25歲達到峰值,23~26歲離職人員占全部人員的58.69%。員工離職呈現(xiàn)年輕化。從婚姻狀況分析,離職人員中未婚人群是主要的群體,其中97.37%的女性為未婚,93.14%的男性為未婚。從工作年限進行分析,工作2年離職的人數(shù)占23%,1年的人數(shù)占18%,人員穩(wěn)定性較差。從離職員工生源地分析,離職人員的生源地主要分布在西部城市,占比55.40%,因此生源地是重要影響因素。 從離職人員學校類別分析,211離職人員最多為88人,占211院校8年入職人數(shù)的8.57%,985離職人數(shù)26人,但是占985入職人員的10.57%,而專科院校是離職人數(shù)占相應入職人數(shù)最少的院校,為4.84%。從最高學歷分析可得,大學本科畢業(yè)174人占離職總人數(shù)的81.69%,且占相應入職人員的8.5%,碩士研究生12人占相應入職人員的7.4%,大學專科畢業(yè)24人占相應入職人數(shù)的5.28%。如此可見,學歷相對較低的人員其工作較為穩(wěn)定,本質(zhì)原因為其可選擇的機會較少;而部分離職人員入職時間較短,且學歷為大學本科及以上。說明其對工作環(huán)境、工作待遇、工作前景較為不滿,對于此類員工,公司要更加重視其需求,爭取降低該類員工的離職率。從離職人員單位名稱分析,檢修公司離職人員最多44人,再是海西供電公司22人,離職人員數(shù)量占入職該單位人員數(shù)量超過10%。從工作地點艱苦程度來看,四類離職人數(shù)最多98人,占入職相應人員的12.53%,條件艱苦地區(qū)離職率較高。
基于以上分析,本文選取了工作單位類型、籍貫區(qū)域類型、崗位、學校類型、生源地、性別、婚姻狀況、專業(yè)、工作地區(qū)艱苦級別9個指標構建員工離職預警模型,如表1所示。
2 模型選取及應用
2.1 SVM的概念
支持向量機(Support Vector Machine,SVM)是一種從線性可分數(shù)據(jù)的“最優(yōu)分類面”求解方法發(fā)展而來、基于結構風險最小化原理(Structure Risk Minimization,SRM)的機器學習方法。由于其出色的學習性能和巨大的應用潛能,支持向量機成為機器學習界備受青睞的方法,在人事管理、項目評估、風險預測等多種領域大放異彩。
2.2 SVM預測原理
2.2.1 線性可分數(shù)據(jù)的最優(yōu)分類面
在原始數(shù)據(jù)空間中,若存在一個能夠無錯誤地把數(shù)據(jù)集分成兩類的線性函數(shù),則稱該數(shù)據(jù)線性可分,對于二維數(shù)據(jù),定義兩條過距離分類最近的數(shù)據(jù)點且平行于數(shù)據(jù)線的直線之間的距離為分類間隔。
線性可分的最優(yōu)分類面問題要求取得的線性函數(shù)不僅要能正確地將兩類點分開,而且能使分類間隔最大,推廣到高維空間,最優(yōu)分類面就成為最優(yōu)超平面。設訓練數(shù)據(jù)集為:
其中,代表數(shù)據(jù)集數(shù)據(jù),,代表兩類數(shù)據(jù)點,設為最優(yōu)超平面的法向量,為分類閾值,具體求解方式見下文,則有如下約束條件:
對于距離最優(yōu)超平面最近的點,等號成立。故在線性可分條件下求出分類間隔為:
因此求解最優(yōu)超平面問題轉化為求解下列優(yōu)化問題:
應用Lagrange乘子法將該問題轉化為對偶問題,即
為每個樣本對應的Lagrange乘子,可證明該問題存在唯一解,且解中只有一部分不為零,對應的樣本數(shù)據(jù)即為支持向量。
最優(yōu)分類函數(shù)為:
可代入任意一個支持向量求得分類閾值。
2.2.2 線性不可分情況
對于線性不可分問題,引入核空間理論,即引入滿足Mercer條件的對稱函數(shù)為核函數(shù),用核函數(shù)代替線性可分情況中的點積運算,通過適當核函數(shù)形式的選取,可使低維的輸入空間數(shù)據(jù)通過非線性映射函數(shù)映射到高維度屬性空間,將輸入空間的線性不可分問題轉化為屬性空間的線性可分問題。常用的核函數(shù)有:
(1)Sigmoid核函數(shù):,其中;
(2)高斯徑向基核函數(shù):;
(3)多項式核函數(shù):,其中。
易知使用核函數(shù)后的最優(yōu)化問題目標函數(shù)和最優(yōu)分類函數(shù)分別為:
2.3 計算過程及結果
2.3.1 數(shù)據(jù)預處理
因指標均為離散變量且選項固定,不存在主觀影響,故只需遵從相同的賦值規(guī)律進行選項數(shù)字化和數(shù)據(jù)標準化,支持向量機就可以在訓練中正確衡量各個參數(shù)對員工離職現(xiàn)象的影響力,部分數(shù)據(jù)賦值結果,如表2所示。
本文隨機抽取2000組數(shù)據(jù),作為我們的支持向量機器訓練集,余下665組數(shù)據(jù)作為測試集。
2.3.2 核函數(shù)的選擇
使用Matlab 2018a 軟件進行支持向量機建模,由支持向量機的原理可知,核函數(shù)的選擇直接決定了輸入空間數(shù)據(jù)能否轉化為屬性空間內(nèi)的線性可分數(shù)據(jù),針對本文數(shù)據(jù),我們計劃通過對比分析,選取更合適的核函數(shù)。我們選取的核函數(shù)及各個核函數(shù)下的支持向量機模型在十次交叉驗證情況下,訓練精確度如表3所示。由此可知,使用SVM模型進行訓練的精確度均較高(90%以上),其中以Medium Gaussian SVM為最高,故我們選取Medium Gaussian 核函數(shù)進行預測集的檢驗。
2.3.3 訓練和測試結果
使用余下665組數(shù)據(jù)作為預測集,預測結果與實際結果對比如表4所示。可以看出,該模型對未離職員工數(shù)量預測較為準確,預測準確度達94.04%。雖然對離職員工預測數(shù)字偏少,但由于整體數(shù)據(jù)中離職員工所占比例并不大,對未離職員工人數(shù)判斷的微小偏差即會明顯地影響離職人數(shù)預測準確率,故該預測結果合理。即以Medium Gaussian 為核函數(shù)的支持向量機模型可以較好地根據(jù)員工的年齡、性別、學歷、崗位、工作區(qū)域等參數(shù)評估員工離職的概率。
3 結語
人才流失是電力企業(yè)亟需解決的一個重要問題,因而對員工離職預警研究是國內(nèi)外企業(yè)界與學術界重點關注的話題。然而,傳統(tǒng)的模糊綜合評價法、專家評價法等方法無法解決大數(shù)據(jù)時代的員工離職問題。針對此問題,本文選取了SVM方法進行企業(yè)員工離職預警研究,采用國網(wǎng)青海省電力公司2010—2018年員工離職的共2665條數(shù)據(jù)進行實證分析。實驗結果表明,支持向量機模型可以較好地根據(jù)員工的年齡、性別、學歷、崗位、工作區(qū)域等參數(shù)評估員工離職的概率,為大數(shù)據(jù)背景下電力企業(yè)員工離職預警提供了新的思路和方法。由于條件的限制,本文僅選取國網(wǎng)青海電力公司一家的數(shù)據(jù),在今后的研究中,將采取多個地區(qū)和企業(yè)的實踐數(shù)據(jù)進行研究,以擴展本文研究方法的適用性。
參考文獻
[1]李強,翟亮.基于Stacking算法的員工離職預測分析與研究[J].重慶工商大學學報(自然科學版),2019(01).
[2]祖鵬.餐飲業(yè)員工人格特質(zhì)與離職意向的關系研究[J].商業(yè)經(jīng)濟,2018(10).
[3]蔣明華,帥建華.知識型員工離職意愿消減行為研究——基于多變量視角下的模型構建與實證研究[J].技術經(jīng)濟與管理研究,2018(01).
[4]趙慧軍,席燕平.情緒勞動與員工離職意愿——情緒耗竭與組織支持感的作用[J].經(jīng)濟與管理研究,2017(02).
[5]翁清雄,陳銀齡,席酉民.員工離職決策多路徑模型案例分析——基于離職傾向與外在事件的兩維視角[J].中國人力資源開發(fā),2014(19).
[6]景光儀,陳井安.西部地區(qū)文化產(chǎn)業(yè)知識型員工工作滿意度對離職傾向概率的影響——基于多分邏輯斯蒂克回歸分析[J].社會科學研究,2014(05).
[7]張爽,崔雪,沙飛.工作滿意度、組織承諾對離職意向影響的實證研究——以江蘇省高技術企業(yè)為例[J].南京郵電大學學報(社會科學版),2012(01).
[8]楊春江,馬欽海,曾先峰.從留職視角預測離職:工作嵌入研究述評[J].南開管理評論,2010(02).
[9]高日光,孫健敏.組織留人還是主管留人?[J].現(xiàn)代管理科學,2009(08).
[10]劉軍,劉小禹,任兵.員工離職:雇傭關系框架下的追蹤研究[J].管理世界,2007(12).
[11]夏功成,胡斌,張金隆.基于定性模擬的員工離職行為預測[J].管理科學學報,2006(04).
①基金項目:本文為國網(wǎng)青海省電力公司委托項目《基于業(yè)務明細數(shù)據(jù)的生產(chǎn)一線員工績效分析與用工配置策略研究》的部分研究成果。
作者簡介:李蕓(1975-),女,漢族,江蘇無錫人,國網(wǎng)青海省電力公司西寧供電公司工程師,本科,主要從事大數(shù)據(jù)分析研究;
胡可(1999-),女,漢族,安徽滁州人,現(xiàn)就讀于西安交通大學管理學院,本科,主要從事大數(shù)據(jù)應用研究;
董欣雨(1999-),女,漢族,陜西西安人,現(xiàn)就讀于英國匹茲堡大學應用數(shù)學學院,本科,主要從事應用數(shù)據(jù)方面的研究;
袁淑俊(1970-),女,漢族,陜西西安人,陜西行政學院副教授,碩士,主要從事政府管理研究。