999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

員工離職可視化分析及傾向預測研究*

2023-10-21 08:59:56劉敏佳
科技創新與生產力 2023年9期
關鍵詞:模型企業

劉敏佳

(豫章師范學院經濟與管理學院,江西 南昌 330103)

經濟新常態背景下,我國發展進入轉型升級階段,這對企業提出了更高的要求,變革和創新成為企業應對未來快速發展市場的重要手段,人作為企業最重要的資源,是推動和主導企業不斷發展升級的主導者。領英發布的《2021 人才趨勢報告》中提到,員工的流動較之以往更為頻繁,流動數據明顯上升,同時市場對人才的需求也不降反升。因此,企業采取靈活的人才戰略,對企業及時儲備人才具有重要意義。企業員工的流失具有不確定性,員工離職不僅增加了企業人力資源管理成本,而且給企業和員工的和諧文化環境帶來了負面影響。應用數據與科學的數據分析工具能夠實現對員工的科學管理[1],不同于以往的傳統經驗判斷,現階段大數據在各行各業、各個領域應用廣泛,在人力資源管理領域里也實現了其重要功能。調研數據顯示,89%的中國企業將大數據用于人力資源管理各職能模塊的工作中。應用大數據分析導致員工離職的主要因素,進而提出科學合理的員工管理對策建議,對于企業人才戰略具有重要意義。

1 員工離職的相關文獻研究

回顧關于員工離職的研究可知,員工離職是指從組織中獲取收益回報的員工與組織結束成員關系的一種行為,而主動離職員工的意愿與行為是研究的主要內容,員工離職傾向發生在員工離職的前一個階段,員工還未采取行動但產生了相關離職傾向。在產生離職傾向到采取離職行動的這個過程中,員工是否采取實際行動受到內部和外部各種因素的影響[2],如果能充分運用企業人力資源管理信息系統中的員工數據,采用數據挖掘技術對數據信息進行提煉,分析離職員工的共同特征,就能對其余員工的離職傾向進行預測,提前采取措施,這對降低員工流失具有重要意義。

隨著數據挖掘的發展與廣泛使用,專家學者們分析并處理員工離職行為模型的工具更加智能化,在運用大數據預測員工離職和流失方面取得了一定的成果[3]。國外eBay、VMware 等公司運用數據挖掘工具對公司的員工數據信息進行分析,發現工作壓力、家庭生活、年齡、業績表現情況等會導致員工離職,預測員工可能離職的傾向,并提前采取措施進行干涉,最終對企業留才起到了一定作用[4]。國內學者在研究員工離職模型的基礎上,運用Stacking、Adaboost 等機器學習算法對企業員工離職傾向進行了預測,提高了企業對員工流動的洞察能力。

Muchinsky 等學者對影響員工離職的因素從3 個層面進行闡述,包括個人因素、經濟機會和工作關系3 個方面[5]。國內學者主要從外部環境、組織和個人3 個方面解釋員工離職的原因,企業儲備的大量員工個人信息數據對于從員工個人層面分析并預測離職傾向具有重要價值,幫助企業在員工甄選階段就提前辨別可能流失的員工[6]。因此,本文通過對互聯網行業員工個人信息數據進行可視化分析,獲取離職員工與在職員工的個體特征,并運用多種機器學習方法對員工離職進行預測結果對比,為企業提出預防措施。

2 研究設計

2.1 研究樣本與數據來源

GL 互聯網公司正處于快速發展階段。近幾年,公司對員工的需求量增加,內部供給不足,通過對公司現階段員工供需平衡問題的分析發現導致近期外部招聘壓力增加的原因是員工離職率上升。文章選取GL 公司2018—2021 年員工數據作為進一步分析該公司員工離職原因的樣本來源,找出影響該公司員工離職的關鍵影響因素,挖掘離職員工的共同特質,進而提出具體和更有針對性的意見,運用數據挖掘的方法對員工數據進行分析并建立模型,幫助GL 公司確定可能離職的員工范圍,并且采取相應措施留住人才或者提前儲備人才,解決員工的流失問題。

2.2 數據整理與變量解釋

此次研究以人力資源部門數據系統中近3 年員工信息作為樣本,對所有收集到的數據進行局部清洗,對異常值和重復值進行處理,同時根據字段屬性對空白值進行填補。將本次數據中收集到的與員工離職關系不大的字段,如序號、員工工號等刪除,最后共計采集到在職員工與離職員工的數據5 396 條,變量9 個,其中包括員工崗位類別、崗位職務、員工年齡、員工職級、員工性別、員工婚姻狀況、員工學歷、員工工作地點8 個自變量,員工是否離職作為因變量。

3 員工數據可視化分析

通過對在職員工和離職員工數據進行可視化分析比較,可以發現在職員工與離職員工之間的特征差異,進而掌握影響員工離職的主要影響因素,并為后期進一步提取員工離職的變量特征和選擇離職模型提供選擇依據,對變量與員工離職之間的關系進行描述性分析。

3.1 各崗位類別在職員工與離職員工可視化分析

從各部門在職與離職員工的分布情況可以發現,不同崗位類別上的員工離職情況存在一些明顯差異,對采集到的員工信息按照工作性質的相似性進行歸類,將員工的崗位類別歸為8 類。不同崗位類別離職人數和離職率差異較大,總體來看,離職人員較多集中在銷售部和技術部,但離職率最高的主要是產品和行政等職能部門(見圖1)。互聯網公司技術人員流失率較高,技術人員也是公司的核心競爭力所在,因此需要加強對關鍵部門的員工流失預防工作。

圖1 各崗位在職員工與離職員工人數柱形圖

3.2 各職位級別在職員工與離職員工可視化分析

圖2 為各職級在職員工與離職員工人數柱形圖。由圖2 可知,職位級別越高,離職的員工人數越少,當前該公司實習生和普通員工離職人數較多,而經理及以上的職位離職人數較少。職位越高的員工在公司的收入和地位越高,其離職成本較大,且公司中高管理層以上人員數量占比較低。但從離職率來看,管理層與普通員工相對較高,對公司而言,管理層員工的流失帶來的損失更為嚴重,中高以上管理人員外部供給緊缺,招募成本較高,同時會給在職員工帶來跟隨效應。因此,公司在關注離職人數較多的普通員工群體的同時,也需要重視中高管理層員工的離職現象。

圖2 各職級在職員工與離職員工人數柱形圖

3.3 離職員工與在職員工工齡與年齡分布可視化分析

圖3 為離職員工與在職員工的年齡分布箱型圖。由圖3 可知,離職員工和在職員工的平均年齡都在30 歲左右,最高年齡在45 歲,與在職員工相比,離職員工年齡偏低,但差異不大;離職人員工齡主要集中在3 年到6 年之間(見圖4)。在職員工工齡中位數比離職員工工齡的中位數更高,在公司服務年限越短的員工離職的可能性越大,相對而言,工齡越長,員工越趨于穩定,對公司的歸屬感和依賴感越強。

圖3 離職員工與在職員工年齡分布箱型圖

圖4 離職員工與在職員工工齡分布箱型圖

4 員工離職模型選擇與結果預測

為了對員工是否離職進行預測,本文使用3 種機器學習模型對員工離職情況進行預測,分別是支持向量機(Support Vector Machine,SVM)、XGBoost 和決策樹(Decision Tree)模型。為了更好地選擇與模型相關的特征變量,運用統計軟件對此次采集到的9 個變量信息進行皮爾遜相關性分析,對員工各變量信息之間是否存在統計上的顯著性相關關系進行檢驗,對具有顯著相關關系的變量進行一定程度的剔除,只選擇其中一個變量進行模型構建與測試,避免選擇多個重復的特征變量。通過變量之間相關分析結果可知,員工是否離職與員工崗位類別、職務、婚否、是否全職、年齡、工齡之間存在一定的關系,員工婚否和是否全職及年齡的關聯度不大,因此刪除這兩個變量,考慮到特征變量不多,保留學歷這一變量,最后選擇剩下的幾個變量作為離職預測模型的特征變量。

4.1 特征處理

在進行模型預測前,首先對離職數據變量進行特征處理,主要是將字符型變量(職務、崗位類別、性別、學歷等)轉換成離散型的數值變量。本文使用one-hot 編碼處理字符型變量,使用pandas的get_dummies 方法。處理完字符型數據后,為防止梯度下降時算法收斂速度過慢,本文對連續性數值做歸一化處理。

4.2 使用支持向量機模型預測員工離職情況

本文選取支持向量機模型預測員工離職情況。采用8∶2 的比例劃分訓練集和測試集,最終獲得4 316 條訓練集和1 080 條測試集數據。本文使用10 折交叉驗證法選取最佳的超參數(懲罰系數C和核函數γ),最終選取的參數值C 為10,γ 為0.1。使用該參數進行預測,訓練集和測試集獲得的分類結果見表1。

表1 支持向量機模型預測離職訓練集和測試集分類結果

4.3 使用XGBoost 模型預測員工離職情況

同理,選取XGBoost 模型預測員工離職情況。訓練集和測試集同樣采用8∶2 的比例劃分。使用10折交叉驗證法選取參數,最終選取控制數深度max_depth 為4,學習率為0.3,學習器個數n_estimators 為10。使用該參數進行預測,訓練集和測試集獲得的分類結果見表2。

表2 XGBoost 模型預測離職訓練集和測試集分類結果

4.4 使用決策樹模型預測員工離職情況

同理,使用決策樹模型預測員工離職情況。使用10 折交叉驗證法選取超參數決策樹深度maxdepth 為4。訓練集和測試集的分類結果見表3。

表3 決策樹模型預測離職訓練集和測試集分類結果

根據實驗結果,XGBoost 模型的預測結果相對其他模型要好,因此,本文最終選擇XGBoost 模型作為預測員工離職情況的模型。

5 結論與對策

員工是企業競爭核心力所在,員工流失會給企業帶來不可估量的損失,企業如果能夠在員工入職前或在員工入職初期就能提前預知某一員工未來離職的概率,發現影響員工離職的主要個人因素,不僅能夠在選用人才階段提高招聘率,還能夠在員工流失前及時采取有效措施,留住人才,將企業損失減至最低。文章基于大數據視角,結合收集整理到的北京GL 互聯網公司人力資源信息管理系統中近幾年在職員工與離職員工的信息數據,運用統計工具對員工各特征變量與員工離職之間的關系進行相關分析,發現崗位類別、職務、婚否、是否全職、年齡、工齡與員工離職存在一定的相關性,并主要從崗位類別、職務級別、工齡和年齡方面對在職員工與離職員工數據進行可視化分析,為企業直觀了解員工個人數據特征提供參考,有利于企業制定人力資源相關決策。運用SVM、XGBoost 和決策樹3 種機器學習模型對員工離職情況進行預測,從預測結果來看,XGBoost 模型預測結果最佳,對企業有效預測員工在未來的離職情況有幫助。

企業結合影響員工離職的主要因素,有效采取預防措施,包括:一是加強人力資源信息系統的建設,全面收集員工入職數據信息,為員工離職預測提供充足的數據資料,使企業在員工入職前就能運用模型提前預測離職率,提高招聘成功率。二是通過企業文化的建設,加強企業與員工之間的情感承諾,為員工提供職業生涯規劃與指導,提升員工的歸屬感。三是制定科學合理的績效考核制度和薪酬體系,為員工提供公平的晉升環境,降低人才因職務晉升問題流失的風險。四是建立合理的企業內部流動機制,打通部門之間人才流動的通道,為內部員工提供適當的轉崗機會,降低企業整體招聘成本。

猜你喜歡
模型企業
一半模型
企業
當代水產(2022年8期)2022-09-20 06:44:30
企業
當代水產(2022年6期)2022-06-29 01:11:44
企業
當代水產(2022年5期)2022-06-05 07:55:06
企業
當代水產(2022年3期)2022-04-26 14:27:04
企業
當代水產(2022年2期)2022-04-26 14:25:10
重要模型『一線三等角』
敢為人先的企業——超惠投不動產
云南畫報(2020年9期)2020-10-27 02:03:26
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 91精品国产一区| 国国产a国产片免费麻豆| 成人午夜福利视频| 精品国产一区二区三区在线观看 | 伊人天堂网| 欧美一区二区三区国产精品| 国产色婷婷| 91精品亚洲| 日韩毛片基地| 国产91高跟丝袜| 18禁黄无遮挡网站| 在线观看国产小视频| 欧美区一区| 少妇精品网站| 中文字幕 日韩 欧美| 国产视频欧美| 内射人妻无码色AV天堂| 日本午夜影院| 欧美在线网| 看你懂的巨臀中文字幕一区二区 | 久久精品丝袜| 91在线中文| jizz在线观看| 91最新精品视频发布页| 亚洲国产成人麻豆精品| 欧美在线黄| 5388国产亚洲欧美在线观看| 国产AV无码专区亚洲A∨毛片| 亚洲精品另类| 97国产在线视频| 激情综合网址| 亚洲精品国产综合99| 欧美午夜在线视频| 国产成+人+综合+亚洲欧美| a级高清毛片| 曰AV在线无码| 中文无码精品a∨在线观看| 91在线日韩在线播放| 久久综合色天堂av| 无码福利视频| 好久久免费视频高清| 波多野结衣无码视频在线观看| 波多野结衣在线se| 免费网站成人亚洲| 欧美另类视频一区二区三区| 国产黄色片在线看| 国产剧情伊人| 成人一级黄色毛片| 亚洲成年网站在线观看| 日韩福利在线视频| 欧美成人精品在线| 国产一区二区网站| 最新亚洲av女人的天堂| 99re视频在线| 2021亚洲精品不卡a| 久久久久国产精品熟女影院| 十八禁美女裸体网站| 久久这里只有精品23| 无码区日韩专区免费系列 | 国产理论一区| 国产成人精品无码一区二| 欧美日韩国产在线人成app| 精品福利网| 性视频久久| 全部免费毛片免费播放| 国产打屁股免费区网站| 国产第一福利影院| 亚洲色欲色欲www在线观看| 日韩黄色精品| 亚洲毛片一级带毛片基地| 国产中文一区a级毛片视频| 午夜成人在线视频| 国产精品一老牛影视频| 丁香五月激情图片| 91年精品国产福利线观看久久 | 久久午夜夜伦鲁鲁片不卡| 久久国产精品波多野结衣| 午夜视频www| 亚洲综合二区| 一区二区三区成人| h网址在线观看| 午夜无码一区二区三区|