晁嘉佑 范哲苑
摘 要:掌握互聯網招聘市場的規律對于利用好互聯網招聘平臺有著重要的意義。本文采用詞云、文本挖掘、相關分析等方法對互聯網招聘信息大數據進行研究,發現:招聘信息中的“福利待遇”在不同的地域中存在較大差異,一線城市最注重基本福利;二線城市注重發展福利;三線城市最重視生活福利等規律。了解這些規律有利于招聘企業更好地發布招聘信息,吸引優秀人才。
關鍵詞:互聯網招聘 詞云 數據可視化 數據挖掘
中圖分類號:F724.6 文獻標識碼:A 文章編號:2096-0298(2018)11(a)-017-03
隨著全球化和知識經濟時代的來臨,現代企業之間最大的競爭已經由產品之間的競爭轉變為人才之間的競爭。如何科學合理地選拔所需的人才是企業人才隊伍建設的第一步,同時也是最重要的一步。
與傳統的招聘方式相比,互聯網招聘都具有顯著的優勢。對企業來講,互聯網招聘既能減少企業在時間成本上的投入,也能為企業減少人力物力成本,節省招聘費用,對企業降低招聘成本有著重要意義 [1]。
對應聘者而言,互聯網招聘克服了傳統招聘方式時間和空間上的限制,應聘者足不出戶就能了解企業人才選拔要求以及企業的薪資待遇,福利水平,減少了應聘的盲目性。
然而,企業在實行互聯網招聘過程中也面臨諸多挑戰,由于無法同應聘者進行面對面的交流,企業與應聘者之間缺乏足夠的互動,企業難以了解應聘者的需求,往往無法提供給應聘者所關注的信息。因此招聘信息應該包含哪些必要的內容,如何發布有效的招聘信息對企業完成一次成功的互聯網招聘至關重要。
“福利待遇”是招聘企業給予員工的間接報酬,是求職者最關注的指標之一。通過對“福利待遇”字段的研究,可以更好地了解招聘企業吸引和激勵人才的手段和方法,反映不同地域求職者關注點的差異與特色。然而, 由于“福利待遇”信息一般以文本的形式呈現,這就給研究者帶來了困難和挑戰。因此,分析好“福利待遇”數據,關鍵在于對文本數據進行有效的統計和分類。詞云分析可以在分析文本數據后快速、形象而有效地呈現統計結果,本文在此基礎上,將企業招聘信息中的內容按“基本福利”“發展福利”“生活福利”“薪酬補充”“健康關懷”這5個維度進行分析和比較。
1 數據來源與研究方法
本文使用的數據來自發布在北京大學開放研究數據平臺的“互聯網招聘網站數據”。該數據采集的是2014年4月—2017年10月由58同城、智聯網站發布的企業招聘數據[2]。
1.1 數據處理系統
找到兩個在招聘信息結構上類似的A、B網站,分別爬取信息。將B網站的數據作為目標分析數據,將A網站的數據作為參照數據。
1.2 數據預處理模塊
使用Python對爬取到的JSON文件進行解析和數據提取分析。
在城市分類的提取中,注意到有些公司的登記地址以“xx區”作為開頭,即地址中本身不包含“市”一級的信息。針對這個問題,使用已有的庫函數chinese_province_city_area_mapper中的transform方法,將地址轉換為一個DataFrame。
例如,針對“歷下區和平路xx號xx”可以直接輸入后得到輸出“山東省 濟南市歷下區”,讀取到地址映射到的城市信息——濟南市,提高了分析結果的可信度,如圖1所示。
1.3 詞頻統計模塊1(簡稱“詞頻1”)
網站A的數據經過前面的數據預處理得到“五險一金包住帶薪年假”(節選),如何有效地進行分詞和詞頻統計呢?
經過觀察,發現福利大多以二字詞、四字詞構成,同時詞與詞之間會出現重復字,例如常見的“休”“假”等,建立三個list,存儲所有單字、相鄰2字、相鄰4字,并分別進行循環計數得到每個元素相對應的出現頻次。
1.4 SVM(支持向量機)處理模塊
SVM模塊是詞頻統計系統的關鍵,在詞頻1中只計算出單字、相鄰2字、相鄰4字出現的頻率,根據這些信息可以初步判斷出相鄰2字是否能組成兩字詞語。
其中,P(A,B)是A和B聯合出現的概率,P(A)和P(B)為字符串A和字符串B出現的概率。此時,若I(A,B)≥0,即P(A,B)≥P(A)P(B),則可以認為漢字A和漢字B之間是正相關的。
1.5 詞典生成模塊
獲取到糾正的詞頻統計DataFrame(分割完成的詞匯集合),需要生成需要的福利詞典。通過設計高通濾波器,提取其中的高頻分量即高頻詞條,存入list導出。
1.6 詞頻統計模塊2(簡稱“詞頻2”)
詞頻1不同在于,詞頻2依據的是已經生成的基于A網站數據的詞典List,使用pandas對數據B統計List中詞語出現的頻次,如圖2所示。
2 基于詞云的福利待遇分析
基于地域的分類分析。對地域進行適當分類有利于更好地體現出地域的特色和差異,因此本文首先利用“工作地址”字段中的城市數據進行關鍵詞匹配,從而將數據劃分為一線城市、二線城市和三線城市三種類別。
2.1 基本福利待遇
基本福利,是指“人們在特定的社會生活環境中,維持和從事正常的生命活動,并基本上能夠發展自身的體能與智能,所形成的對物質生活資料、精神生活資料以及必要的社會活動的需要 ”[3]。從一、二、三線城市的詞頻統計結果中可以看出,人們對福利待遇的首要關注的內容基本是一致的,不同城市間人們對于各種基本福利待遇的關注程度存在高度相關性。
然而,相同的背后也仍表現出巨大的地域性差異。以相關分析為例,如圖3所示,一線城市關于二線城市的回歸系數只為1.3,而關于三線城市的回歸系數則高達2.7,側面反映了一線城市的求職者更為注重基本福利待遇的保障,這可能是由于一線城市的工作節奏更快,生活成本更大,因此基本福利待遇的保障對這部分群體而言有更為重要的意義。
2.2 發展福利
發展福利指對職工未來職業發展有幫助的福利,其中“培訓”是企業給予求職者的一項重要福利待遇,包括“免費培訓”“帶薪培訓”等。此外,很多企業也把晉升空間大、晉升機制的公平性等內容作為企業福利待遇的一種。本文發現,三類城市對發展福利的要求基本相似,就地域差異而言,二線城市對培訓相關的福利待遇關注度最高,三線城市對“晉升”的關注度最高,而一線城市在這兩者都屬于關注程度最低的。一線城市晉升空間較大,大多數都有完善的企業培訓制度,因此一線城市的求職者對與發展性福利關注度比較低。與之相反,二、三線城市在企業晉升機制和培訓制度上相對不夠完善,對于謀求長遠發展的求職者而言對于發展性福利無疑更為關注和重視。
2.3 生活福利
生活福利指提高職工生活質量的福利,主要包括“旅游”相關和“休假”相關的福利,很多企業或者推出“定期旅游”“國外旅游”等手段吸引求職者,或者給予額外有保障的假期,來吸引求職者。通過分類分析可以看到,如圖4所示,三線城市的求職者對“旅游”的關注度最高,對“休假”的關注度最低,與之恰好相反的是,一線城市對“旅游”的關注度最低,對“休假”的關注度最高。這可能是因為生活在一線城市的群體由于生活成本高、競爭壓力大等原因,在空閑時間更愿意在家休息;相比之下,三線城市的工作群體對旅游表現出更強烈的興趣。呂晃的研究《贏得 下一個十億亞洲游客—起航中 國》[4]也認為二、三線城市的旅游力量正在爆發,并且認為八成以上的中產階級和有能力的消費群體聚集在二、三線城市。其數據分析還預測了2030年中國將有29個二線、三線城市擁有300萬以上的中產階級和極具消費潛力的人群。
2.4 薪酬補充
薪酬補充中,企業常常用“獎金”或給予“年底雙薪”的手段來吸引和激勵公司員工。可以看到,如圖5所示,給予年底雙薪的企業已接近一半,可見年底雙薪已逐漸成為像“基本福利”一樣的“標配”。具體而言,一線城市和二線城市的情況十分相似,并無明差異。與之不同的是,三線城市給予年底雙薪的僅為32.3%,比一、二線城市均少了超過15個百分點,可見更多的企業傾向給予員工獎金來作為薪酬補充。
此外,部分企業通過給予員工公司“期權”來作為補充和獎勵,然而在三類城市中采用這種方法的都只有0.3%,可見給予期權獎勵在現互聯網招聘市場中尚不流行。
2.5 健康關懷
健康關懷類福利待遇主要指企業給“五險”之外的商業保險或給予員工“定期體檢”。從統計結果中可以看到,給予健康關懷類福利待遇在互聯網招聘中并不流行,占比基本在3%以下。這一方面與人們對于自身健康狀況的關注不夠有關,求職者普遍缺少定期體檢、關注自身健康的觀念;另一方面,通過互聯網方式參與招聘的群體以年輕人為主,發生健康疾病的風險相對較小。還應考慮到傳統的五險一金中的工傷保險和醫療保險已經基本能夠對職工可能發生的人身意外傷害和健康問題給予保障,客觀上使得額外商業保險的吸引力變小。
3 給招聘企業的結論與建議
對于一線城市的招聘企業而言,給予員工“基本福利待遇”的保障無疑是重要的,考慮到一線城市有生活成本高的特點,部分求職者是從外地來的務工人員,因而基本福利待遇對他們而言就顯得有特別的意義。由于很多員工是外來務工人員,年底回家過年時都有經濟上的壓力,因而一線城市的求職者對于“年底雙薪”的保障最為重視,應當得到招聘企業的注意。對于三線城市的招聘企業而言,三線城市求職者對于晉升的條件更為重視。因此,三線城市的企業想要吸引求職者應當注重宣傳企業內部晉升的空間、公平性等問題,以吸引到優秀的員工。三線城市的娛樂生活相對單調,適當組織旅游活動對促進求職者對企業的關注有很大的幫助。二線城市的求職者對于于福利待遇的關注大都介于一線城市和三線城市之間。然而,二線城市的求職者是最“好學”的,企業在條件允許的情況下,適當給予員工一些專業培訓,既能夠使員工獲得更好地薪資和職位,也利于企業提高員工的整體素質,可以說是雙贏的措施。
一、二、三線城市對福利待遇對關注點有明顯的區別,企業如能根據自身情況和所處位置有針對性地發布信息,可以有效提高招聘信息的質量。
參考文獻
[1] 陳曉霞.網絡招聘與傳統招聘方式之比較[J].人力資源管理(學術版),2009(3).
[2] 國家信息中心.“互聯網招聘網站數據”[EB/OL].http:// dx.doi.org/10.18170/DVN/TWEHQO,北京大學開放研究數據平臺,2017,V1.
[3] 王裕國,趙吉林.將保障公民基本福利確立為我國現階段的重要國策[J].消費經濟,2006(5).
[4] 呂晃.贏得下一個十億亞洲游客-起航中國[J].銷售與管理, 2014(5).
①基 金項目:山東大學校級科技創新基金立項(2018075)。
作者簡介:晁嘉佑(1997-),男,漢族,江蘇省徐州市人,本科在讀,主要從事數理統計方面的研究。