王昌林
[摘 要] 大數據時代背景下,傳統的就業指導顯現出諸多弊端,利用大數據對當今就業形勢進行分析顯得尤其重要。
利用爬蟲獲取某招聘網站近些年相關就業數據,利用已有的數據進行處理分詞聚類,確定各個領域的關鍵詞,之后借助頻率統計與決策樹模型,對各個地區、不同的職業方向和崗位、不同學歷帶來的招聘優勢之間的差距進行分析,為就業指導提供幫助。通過分析可以看出,IT行業為現在最熱門的行業,技術領域也最有價值,北京、上海、廣州、深圳四大城市依然是人才招聘最集中的地方,有工作經驗與高學歷的人會更受歡迎。通過基于大數據的分析與挖掘可以為在校大學生根據自身情況、需求、目標量體裁衣,提供一個更有價值的就業選擇。
[關 鍵 詞] 就業;人才; IT
[中圖分類號] G647 [文獻標志碼] A [文章編號] 2096-0603(2018)13-0234-02
一、前言與數據預處理
大數據時代背景下職業發展與就業教育存在的問題主要是傳統的就業指導工作在新時期顯得格格不入,與實際不相符合。就業需求呈現出多樣化、個性化的特征[1]。新時期我國高校在開展就業指導工作的過程中,積極應用大數據技術已迫在眉睫,應能夠轉變傳統模式,對大數據優勢進行充分的利用[2]。
本文先利用爬蟲獲取某招聘網站近幾年內的招聘信息,整理成表進行分析,由于網站的錯誤或爬蟲的漏洞,獲取到的信息有一定的空數據或異常值,我們首先進行數據的清洗與預處理。
(1)空數據,首先使用其他合理的有效記錄值填充空白的職業大類(使用同一職業ID的其他有效記錄值),如果沒有合適的值代替,則直接去除。(2)異常值的處理,分析異常值,對出現異常值的數據直接剔除。(3)去重,分析發現有的公司在一天內多次發布同樣信息,對間隔兩天內信息完全相同的招聘數據,剔除掉一個,保留其中一個。(4)分析發現有些數據后面有括號等符號標注備注,并將其將備注部分去除。(5)利用平均值代替范圍表示該公司工資。
二、熱門行業、職位、地域分析
(一)熱門行業分析
分析行業的頻率,明顯可以看出高過20%只有一個移動互聯網,可以看出現在移動互聯網領域為最熱門行業,15%~20%的為電子商務,10%~15%的為O2O與金融,可見現在的最熱門的四大行業為移動互聯網、電子商務、O2O與金融,而前三項都與IT相關,IT方面為現在最熱門的領域。
(二)熱門職位分析
對職業大類進行統計,可以看出技術人才是現在需求最多的,市場、運營方面也有很不錯的需求,在產品金融設計運營上人才需求較少。
對職位與工資,抽出頻率畫圖并進行樹狀圖分析,可以看出,技術人才與產品方面的人才平均工資更高;對產品領域高端人才需求更多;技術則呈現兩頭翹的情況,即低收入與高收入人才更多,但是中等收入的需求較少;市場銷售則更多的是中等收入的人才,運營在薪資較低的領域分布較多。
(三)熱門地域分析
對地域的招聘職位頻率進行統計發現,北京一枝獨秀,超過30%,上海與深圳較差,以上三個為超過10%的城市,而超過1%的城市為北京、成都、廣州、杭州、南京、上海、深圳、武漢、廈門,這九個城市就占據了總招聘的90.2%,相對于299個城市總數來說,目前單位還是有很強的地域集中性,大部分就業崗位分配在少部分地區,對超過1%的城市單獨篩選出來進行下一步分析。
平均工資為11867.638元,其中北京、杭州、上海、深圳平均工資均超過了1W元,工資受益方面可能會更好。
(四)工作經驗
對工作經驗進行分析,97.1%的用人單位期望有工作經驗的人來他們單位。期望有一到三年工作經驗的占了絕大多數,這也和大部分期望通過網站招聘的人并沒有太多工作經驗有關,工作經驗十分豐富的人往往已經有足夠渠道去獲得工作,不需要通過招聘這種方式。
可以看出隨著工作經驗的增長,工資也隨之增長,可見工作經驗仍然是影響薪資的重要部分。對城市與職業大類進行樹狀圖分析,可見大部分地區依然需要的是技術型人才,而金融人才需求較少。
三、結果分析
從以上建模和模型求解中可得出,目前比較熱門的領域有IT、電商、金融等領域;而各領域的平均資薪中,金融業最高,其他的差別不大;在各地域的招聘中,以北京、成都、上海、深圳、武漢、杭州、南京、廈門、廣州等比較熱門,其中北京、上海、廣州、深圳四個城市尤為熱門。
四、給在校大學生的就業規劃建議
1.對有意雙修、輔修,或者轉專業的大學生,可以考慮在IT方面進行一定的學習,尤其是移動領域,無論是工資還是就業的機會都會很大,不過想要在技術職位上有更高的薪資,需要在大學就打好基礎,踏踏實實學技術,對將來的就業有很大幫助。
2.目前獲得更高收入與更好崗位最好的方法仍然是繼續深造,如果學生有這方面愿望,最好繼續讀研、讀博,對將來自己的發展有很好的幫助,尤其是有意從事金融和數據挖掘行業的學生,深造對自己的幫助很大,如果是有意從事市場營銷運營這些領域,則可以考慮較早地就業,獲得更多的工作經驗,但是整體來說仍然是學歷越高獲得高收入的機會越多。
3.對沒有意愿繼續深造的學生來說,工作經驗則是影響他們就業崗位優劣、薪資多少的主要因素,在校期間積極參加社會實踐,尤其是爭取利用好每一個實習機會,對自己初出大學的第一份工作有很好的影響,不過工作經驗低于一年的新人,薪水都不會很高,學生要有一定的心理準備。
4.越好的工作崗位往往意味著對知識能力要求越高,學好大學課程仍然是很重要的一部分,尤其是期望自己從事技術方面工作的學生,學好現有的知識也是非常重要的,不能為了追求工作經驗放棄了對知識的學習。
5.現階段,北京、上海、廣州、深圳仍然是最好的四個就業城市,對地處華南的學生來說,廈門也是一個很好的就業城市,在校可以留心這些地方的用人單位,由于地緣因素,廣州、深圳、廈門應該是我們著重考慮的就業城市,不過對我們學校的學生來說,由于不在這三座城市,就業時面臨的壓力可能會大于別的地方,這就需要盡早地確定我們希望去的城市,最好能去實地考察一下當地的環境,便于就業后更快地融入當地。
參考文獻:
[1]榮大磊.淺談大數據背景下職業發展前景與就業指導教育[J].現代職業教育,2017(14):192.
[2]湯龍升,陳冉,徐萍,等.大數據時代下的大學生就業指導思考[J].赤峰學院學報(自然科學版),2016,32(10):201-203.