999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)表示和特征修正在人崗匹配研究中的應(yīng)用

2022-04-12 20:32:14常兵褚志海印忠文趙龍軍
計算機時代 2022年4期

常兵 褚志海 印忠文 趙龍軍

摘? 要: 人崗匹配度的合理測算是人才合理分配的基礎(chǔ),針對傳統(tǒng)人崗匹配研究中主觀評價占比高、數(shù)據(jù)表示粗糙等問題,對人崗匹配度測算方法進行了研究。首先構(gòu)建了人崗匹配度指標體系;其次進行特征構(gòu)建得到特征字段屬性,采用數(shù)據(jù)表示和特征修正的技術(shù)方法進行特征表示、多區(qū)間劃分及修正,完成各指標匹配度的測算;最后采用XGBoost算法構(gòu)造人崗匹配度分類模型,將模型概率值作為匹配度測算值,通過真實招聘數(shù)據(jù)對該方法的有效性進行了驗證。

關(guān)鍵詞: 指標體系; 數(shù)據(jù)表示; 特征修正; 人崗匹配度

中圖分類號:TP391.1? ? ? ? ? 文獻標識碼:A? ? ? ?文章編號:1006-8228(2022)04-09-04

Application of data representation and feature modification

in resume-post matching research

Chang Bing Zhu Zhihai Yin Zhongwen Zhao Longjun

(1. CETC big data Research Institute Co., Ltd, Guiyang, Guizhou 550022, China; 2. China xiongan Group Co., Ltd)

Abstract: The reasonable estimation of resume-post matching degree is the basis of rational allocation of talents. Aiming at the problems of high proportion of subjective evaluation and rough data representation in the traditional resume-post matching research, the estimation method of resume-post matching degree is studied. Firstly, the index system of resume-post matching degree is constructed. Secondly, the feature field attributes are obtained by feature construction; the technical methods of data representation and feature modification are used for feature representation, division, modification, and the calculation of the matching degree of each index. Finally, the XGBoost algorithm is used to construct a classification model of resume-post matching degree and the model probability value is used as the matching degree estimation value. The effectiveness of the method is verified by real recruitment data.

Key words: index system; data representation; feature modification; resume-post matching degree

0 引言

眾多企事業(yè)單位在評價簡歷與崗位是否匹配時往往采用主觀評定的方法,該方法一般對評價人的經(jīng)驗積累和精力投入要求較高,在時間充裕、小批量的情況下,效果較好,但是在互聯(lián)網(wǎng)信息技術(shù)高速發(fā)展的今天,主觀評定法已經(jīng)無法滿足短時間內(nèi)、大量人崗數(shù)據(jù)快速匹配的需求。如何快速、準確地測算人才與崗位的匹配度,從而科學合理地進行人崗分配管理成為眾多企業(yè)研究的重點。

近年來,人崗匹配研究主要集中在概念、評價指標體系、數(shù)據(jù)維度、數(shù)據(jù)處理與量化、計算模型等幾個方面。李曉寧等[1]從員工職業(yè)勝任力與企業(yè)需求方面研究了員工與崗位需求的匹配情況;袁珍珍等[2]和易斌等[3]分別研究了BP神經(jīng)網(wǎng)絡(luò)和支持向量機在人崗匹配測算中的應(yīng)用;李娟等[4]進行了基于灰色系統(tǒng)理論的人力資源崗位匹配度研究;李松等[5]研究了基于直覺模糊的多指標人崗雙邊匹配決策方法;PAZZANI等[6]和GOPALAN[7]等根據(jù)崗位要求和應(yīng)聘者簡歷研究了基于內(nèi)容匹配的方法。盡管目前人崗匹配測算的研究取得了一定成果,但是多數(shù)研究停留在人崗匹配度指標體系構(gòu)建和簡單的數(shù)值匹配層面,且評分公式權(quán)重的確定大多依賴于調(diào)查問卷或?qū)<以u估,存在數(shù)據(jù)利用程度低、智能化難度大、計算結(jié)果不準等問題。因此,本文提出了一種基于數(shù)據(jù)表示和特征修正的人崗匹配度測算方法:首先構(gòu)建了人崗匹配度測算指標體系;其次采用特征數(shù)據(jù)修正和數(shù)據(jù)處理與表示的技術(shù)方法對數(shù)據(jù)集進行特征表的構(gòu)建、特征數(shù)據(jù)修正、多區(qū)間劃分及表示;最后,采用XGBoost算法構(gòu)建人崗匹配度分類模型,將模型輸出的概率值作為匹配度測算值,最終實現(xiàn)人崗匹配度測算。

1 人崗匹配度測算指標體系的構(gòu)建

本文基于科學性、簡單性、有效性、可實施性、可量化性、統(tǒng)一性的指標體系構(gòu)建原則,結(jié)合真實招聘數(shù)據(jù)的統(tǒng)計分析結(jié)果和經(jīng)驗常識,確定影響人崗匹配的指標因素,構(gòu)建的人崗匹配度測算指標體系如圖1所示。735EF330-3615-4D53-B292-BA567E9EE863

圖1所示的人崗匹配度測算指標體系中一級指標包含3個維度:基本信息匹配度、經(jīng)歷匹配度、經(jīng)驗技術(shù)匹配度,其中基本信息匹配度包含4個二級指標,主要為人員與崗位中性別、年齡、政治面貌、城市的匹配程度;經(jīng)歷匹配度包含5個二級指標,分為學業(yè)經(jīng)歷和工作經(jīng)歷兩個方面,二級指標包括學歷匹配度、專業(yè)匹配度、院校匹配度、工作年限匹配度和工作穩(wěn)定性;經(jīng)驗技術(shù)匹配度包含4個二級指標,主要為項目經(jīng)驗匹配度、薪水匹配度、行業(yè)匹配度和職類匹配度。

2 特征數(shù)據(jù)修正及數(shù)據(jù)表示

2.1 構(gòu)建特征表字段

為了得到能夠應(yīng)用于模型訓(xùn)練測試的特征數(shù)據(jù)集,根據(jù)上述人崗匹配度測算指標體系,對各大在線招聘網(wǎng)站的數(shù)據(jù)進行統(tǒng)計分析,構(gòu)建簡歷特征和崗位特征,其中簡歷特征屬性反映了人員的背景信息及相應(yīng)的求職意愿,主要包括性別、年齡、政治面貌、居住地、專業(yè)、院校、工作經(jīng)驗、行業(yè)、職類等屬性;崗位特征反映的是該崗位的特性及需求,主要包括崗位名稱、學歷要求、年齡要求、職位、性別要求、崗位描述、工作年限等屬性。

2.2 特征數(shù)據(jù)修正

結(jié)合上述所構(gòu)建的崗位特征,對簡歷、崗位的真實數(shù)據(jù)進行特征匹配和統(tǒng)計分析發(fā)現(xiàn)特征數(shù)據(jù)幾乎相同的兩條數(shù)據(jù)其匹配的結(jié)果是不一樣的,如同一份簡歷特征數(shù)據(jù),針對兩條特征相同的崗位信息其匹配結(jié)果是不同的。針對上述問題,本文針對數(shù)據(jù)中匹配不一致的數(shù)據(jù)進行統(tǒng)計分析發(fā)現(xiàn),在結(jié)構(gòu)化特征字段相同的情況下,崗位特征表中的“崗位描述”字段屬性中包含了“性別要求”、“年齡要求”、“政治面貌要求”、“畢業(yè)院校類別要求”、“工作年限要求”、“崗位職責”、“福利待遇”等信息,如“年齡不超過35周歲”、“具有3~5年的工作經(jīng)驗”。由于“崗位描述”在進行人崗匹配過程中是招聘單位和人員所關(guān)注的重點信息,同時“崗位描述”中的長文本信息無法直接用關(guān)鍵字匹配方式直接進行處理,因此需要通過自然語言挖掘技術(shù)對其字段屬性進行信息解析和提取。

本文中基于崗位特征表的“崗位描述”字段信息,解析得到的特征主要包括:“年齡”、“學歷”、“性別”、“政治面貌”、“工作年限”、“院校類型”,由于招聘單位結(jié)合實際要求描述的“崗位描述”會與招聘系統(tǒng)默認生成的特征信息會存在一定程度的偏差,因此,解析特征與原始崗位特征表中已有的“年齡要求”、“工作年限要求”、“性別要求”等特征數(shù)據(jù)存在一定程度的沖突。同時,跨特征屬性信息也存在不合理的要求,如學歷要求為“碩士研究生及以上”且年齡要求為“不超過25周歲”,這在實際中大多情況下是不合理的。因此,需將“崗位描述”解析后的特征與原始特征數(shù)據(jù)進行融合和修正,得到新的崗位特征表,具體操作有以下步驟:①獲取上述2.1構(gòu)建的原始崗位特征信息。②解析“崗位描述”特征字段的長文本信息,獲取崗位解析特征(“年齡”、“學歷”、“性別”、“政治面貌”、“工作年限”、“院校類型”)。③將解析后的特征與原始崗位特征進行融合,首先依次判斷解析后的特征是否存在于原始崗位特征中,若不存在,則直接將解析特征添加到崗位特征表中;若存在,則將解析特征與原始特征進行統(tǒng)一數(shù)據(jù)映射,在此基礎(chǔ)上判斷特征屬性信息是否存在沖突,如不存在沖突,則對此特征信息不做更改。若存在沖突則將解析特征替換掉原始特征;④基于步驟③獲得新的崗位特征數(shù)據(jù)集,在此基礎(chǔ)上對特征重要性進行排序,設(shè)定崗位特征數(shù)據(jù)修正策略。⑤基于修正策略進行跨特征聯(lián)合交叉分析的合理性判斷,若不合理,則根據(jù)特征修正策略對數(shù)據(jù)中存在的異常屬性信息進行逆向反推對特征數(shù)據(jù)進行縮放和修正,否則不做修正。⑥完成特征數(shù)據(jù)的修正,獲得最終崗位特征數(shù)據(jù)表。具體操作流程如圖2所示。

2.3 數(shù)據(jù)處理及表示

基于2.1和2.2構(gòu)造的特征表和特征數(shù)據(jù)修正結(jié)果,對人崗匹配度測算指標體系中的二級指標性別匹配度、政治面貌匹配度、城市匹配度、學歷匹配度等結(jié)構(gòu)化數(shù)據(jù)進行處理與表示,具體方法為:①建立結(jié)構(gòu)化文本數(shù)值映射表,如男性為1,女性為0;②通過構(gòu)建的文本數(shù)值映射表將所有結(jié)構(gòu)化數(shù)據(jù)表示為數(shù)值型數(shù)據(jù);③基于數(shù)據(jù)表示結(jié)果進行人崗特征屬性匹配獲得各指標匹配值。

人崗匹配度測算指標體系中的二級指標年齡匹配度、工作年限匹配度、項目經(jīng)驗匹配度、行業(yè)匹配度、職類匹配度、工作經(jīng)驗等由特征表中非結(jié)構(gòu)化數(shù)據(jù)解析匹配得到,如“年齡不超過35周歲”、“具有3~5年的工作經(jīng)驗”,由于此類數(shù)據(jù)無法直接用關(guān)鍵字匹配方式進行處理,因此需要通過自然語言挖掘技術(shù)對其字段屬性進行數(shù)據(jù)處理與表示,具體方法為:①首先,采用關(guān)鍵詞匹配算法進行關(guān)鍵信息定位;②其次,從定位點分別向左右兩側(cè)進行窗口滑動提取文本信息作為待分析內(nèi)容;③對待分析內(nèi)容進行解析,采用臨界值判斷法則建立臨界值映射策略對指標數(shù)據(jù)進行多區(qū)間覆蓋劃分,設(shè)定上下界閾值,將其映射為對應(yīng)的區(qū)間數(shù)據(jù),如“具有3~5年工作經(jīng)驗”映射為[3,5],“年齡不超過35周歲”映射為(0,35];④參照步驟③完成長文本特征數(shù)據(jù)表示。

2.4 指標體系特征匹配度計算

基于上述人崗匹配度測算指標體系和特征數(shù)據(jù)處理與表示方法,采用臨界值修正匹配法、余弦相似度、編輯距離相似度計算聯(lián)合計算公式完成上述指標匹配度測算,獲得用于模型訓(xùn)練測試的特征數(shù)據(jù)集。

3 人崗匹配測算模型的構(gòu)建及應(yīng)用

3.1 構(gòu)建特征數(shù)據(jù)集

基于人崗匹配度測算指標體系,使用或參考章節(jié)2中的特征數(shù)據(jù)修正及數(shù)據(jù)表示的計算方法進行人崗匹配度特征數(shù)據(jù)集的構(gòu)建,其中分類標簽來源于人崗評定的人崗匹配結(jié)果數(shù)據(jù),1表示匹配,0表示不匹配,得到的部分特征數(shù)據(jù)如表1所示。

3.2 模型構(gòu)建

XGBoost的算法思想是通過不斷進行特征分裂生成一棵樹,用于擬合上一輪預(yù)測的殘差。當完成模型的訓(xùn)練之后會得到一系列的樹并根據(jù)樣本特征分布組合,最后將每棵樹計算得到的分數(shù)累加即為樣本的預(yù)測值。

為驗證本文構(gòu)建的人崗匹配度測算指標體系和提出的特征數(shù)據(jù)修正和數(shù)據(jù)表示技術(shù)及特征數(shù)據(jù)構(gòu)建的有效性,本文在Python3.6環(huán)境下,以特征數(shù)據(jù)集中分類標簽作為訓(xùn)練樣本中的標簽,采用交叉驗證和XGBoost算法構(gòu)造訓(xùn)練人崗匹配度分類模型,將模型輸出的概率值作為人崗匹配度測算值,最終實現(xiàn)人崗匹配度的測算。基于XGBoost的人崗匹配度測算模型擁有學習的能力,可以有效地克服傳統(tǒng)人崗匹配度測算對主觀評價或?qū)<遗袛嗟戎饔^因素的依賴。735EF330-3615-4D53-B292-BA567E9EE863

3.3 模型應(yīng)用

將特征數(shù)據(jù)集輸入XGBoost人崗匹配度分類模型并完成模型的訓(xùn)練和優(yōu)化,將模型輸出的概率值作為人崗匹配度的測算結(jié)果,實現(xiàn)人崗匹配度的測算。表2為本文提出的人崗匹配度測算方法在部分真實數(shù)據(jù)上的測算結(jié)果。

表2中人崗匹配度為XGBoost人崗匹配度分類模型計算出的概率值,范圍為[0,1],計算的概率值越接近于0表示人崗匹配度越低,反之,計算的概率值越接近于1表示人崗匹配度越高。以0.5為分類閾值,匹配度大于等于0.5標簽分類結(jié)果為1,小于0.5標簽分類結(jié)果為0,通過將人崗匹配度換算為標簽分類結(jié)果可知:上述實驗結(jié)果中的標簽分類結(jié)果與特征數(shù)據(jù)中的標簽基本一致,從而驗證了本文構(gòu)造的指標體系及數(shù)據(jù)表示和特征數(shù)據(jù)修正技術(shù)方法在人崗匹配度測算中的有效性。

4 結(jié)論

針對傳統(tǒng)人崗匹配測算方法中存在的問題,文本對人崗匹配度測算指標及測算方法進行探討,構(gòu)建了人崗匹配度測算指標體系,提出了一種基于數(shù)據(jù)表示和特征數(shù)據(jù)修正的人崗匹配度測算方法,該方法一定程度上減少了傳統(tǒng)人崗匹配方法中指標對主觀評價或?qū)<遗袛嗟热藶橹饔^因素的依賴,提升了人崗匹配度的測算準確性和智能化程度,具有較強的普適性。

參考文獻(References):

[1] 李曉寧,王素偉,王成剛.員工職業(yè)勝任力與企業(yè)需求匹配度研究[J].中小企業(yè)管理與科技,2020(9):120-121

[2] 袁珍珍,盧少華.BP神經(jīng)網(wǎng)絡(luò)在人崗匹配度測算中的應(yīng)用[J].武漢理工大學學報(信息與管理工程版),2010,32(3):515-518

[3] 易斌,姜飛.支持向量機在人崗匹配度測算中的應(yīng)用[J].中南林業(yè)科技大學學報(社會科學版),2011,5(6):92-94

[4] 李娟,高百寧.基于灰色系統(tǒng)理論的人力資源崗位匹配度研究[J].中國商界(下半月),2008(3):103-104

[5] 李松,袁安琪.考慮直覺模糊的多指標人崗雙邊匹配決策方法[J].計算機工程與應(yīng)用:1-8[2021-05-13].http://kns.cnki.net/kcms/detail/11.2127.TP.20210420.1121.040.html.

[6] PAZZANI M J, BILLSUS D. Content-based recommen-dation systems[J].The Adaptive Web,2007: 325-341

[7] GOPALAN P K, CHARLIN L, BLEI D. Content-basedrecommendations with poisson factorization[J].Advances in Neural Information Processing Systems,2014,27:3176-3184735EF330-3615-4D53-B292-BA567E9EE863

主站蜘蛛池模板: 国产香蕉在线| 美女国内精品自产拍在线播放| 在线va视频| 国内精品久久九九国产精品| 国产激爽大片在线播放| 亚洲欧美国产五月天综合| 国产成人亚洲无码淙合青草| 99视频在线观看免费| 伊人成人在线视频| 91精品视频在线播放| 无码国内精品人妻少妇蜜桃视频| 日韩一级毛一欧美一国产| 午夜欧美在线| 亚洲欧美国产视频| 香蕉国产精品视频| 亚洲熟女偷拍| 欧美激情视频一区| 亚洲精品国产成人7777| 欧美成人一级| 亚洲天堂网在线观看视频| 日韩欧美网址| 全裸无码专区| 国产精品第| 婷婷成人综合| 国产精品乱偷免费视频| 日韩国产亚洲一区二区在线观看| 国产精品污视频| 欧美一级大片在线观看| 在线网站18禁| 色网站在线免费观看| 欧美亚洲国产精品第一页| 亚洲午夜福利精品无码不卡 | 老司机精品99在线播放| 亚洲成av人无码综合在线观看| 亚洲A∨无码精品午夜在线观看| 在线五月婷婷| 熟妇丰满人妻av无码区| 亚洲人成网线在线播放va| 久久综合丝袜长腿丝袜| 亚洲91在线精品| 欧美精品色视频| 成人亚洲天堂| 中文字幕资源站| 毛片最新网址| 国产午夜不卡| 日韩天堂网| 亚洲视频无码| 国产一二三区在线| 精品一区二区三区波多野结衣 | 欧美一级夜夜爽www| 999福利激情视频| 国产永久在线观看| 日本国产精品一区久久久| 国产91无码福利在线| 99在线视频网站| 国产激爽爽爽大片在线观看| 一级毛片在线免费视频| 久久精品一卡日本电影| 国产精品无码AV中文| 免费jjzz在在线播放国产| 2021国产乱人伦在线播放| 国内精品一区二区在线观看| 亚洲色图欧美在线| 亚洲视屏在线观看| 久久久无码人妻精品无码| 国产欧美综合在线观看第七页| 久久福利网| 国产精品永久久久久| 99re经典视频在线| 福利在线免费视频| 一区二区三区成人| 久久精品无码一区二区国产区| 综1合AV在线播放| 日韩av无码精品专区| 九色在线视频导航91| 欧美精品伊人久久| 国产日韩欧美精品区性色| 中文无码精品a∨在线观看| 亚洲第七页| 韩国v欧美v亚洲v日本v| 欧美精品三级在线| 日韩高清中文字幕|