毛朝選 何甜
摘 要 為了更好地了解統計學人才缺口,本文從目前市面上常用招聘網站爬取招聘數據,利用Python分析統計學相關就業崗位信息,通過對市場上統計學相關就業崗位的要求、需求人數及工資水平等方面進行研究,發現:第一,用人單位對統計學專業的學生要求主要集中于數據分析與處理上,就業崗位主要是分析員或者分析師、統計以及工程師。第二,由于統計學人才嚴重短缺,企業不斷降低工作經驗門檻。第三,統計學相關職位的工資大約在5000至15000之間,但具有較大的上升空間。
關鍵詞 網絡爬蟲 數據分析 可視化
一、研究背景
2015年國務院印發《促進大數據發展行動綱要》后,從事數據分析的高級專門人才成為稀缺資源。
為了更好地了解統計學人才缺口,本文從目前市面上常用招聘網站爬取招聘數據,利用Python分析統計學相關就業崗位信息,期望找到統計學專業背后火爆的原因以及就業市場對統計學人才的實際能力要求,為學校培養統計學人才提供借鑒。
二、研究意義
通過對市場上統計學相關就業崗位的要求、需求人數及工資水平的研究,可以在一定程度上了解當今市場對統計學專業學生的需求缺口和實際能力需求。對于高校統計學專業的教育者而言,可以更具有針對性地開設課程,相關專業的學生可以了解目標職位要求,從而提升自己,以更加切合市場需要。
三、數據說明
經過查找“統計”“專業”的關鍵詞,并剔除主要不相關崗位,最后得到997條要求招收統計學專業人才的崗位信息,具體描述如表1所示:
本文首先對experience,job_des,people_num和salary進行數據清洗。
第一,對于工作經驗experience,提取文本中的數字并取最小值,得到最低工作經驗min_exp,對于“不限”“無經驗要求”等數據填充為0。第二,對于需求人數people_num,提取數字,對于“若干人”等數據對其填充缺失值,得到demand_num。第三,對于工資salary,提取最高工資和最低工資并分為兩列min_salary和max_salary,數據以“千”為單位。
四、數據分析
(一)職位描述
通過對職位描述的分詞和詞頻統計得到詞云圖(圖1)。
從圖1中可以看出,主要用人單位對統計學專業的學生要求主要集中于數據分析與處理上,并希望求職者具有一定的工作經驗,能迅速熟悉業務,具有團隊精神和抗壓意識,并善于溝通和組織。
通過對職位名稱的分詞和詞頻統計得到詞云圖(圖2)。
從圖2中可以看出,用人單位對統計學專業學生的崗位要求主要是做各種分析員或者分析師、統計以及工程師,具體包括數據處理、數據分析、量化、開發、算法、建模等方向。整體來講,統計學專業的學生就業崗位與專業鍥合度很高,屬于有一定技術含量和門檻的崗位。
(二)工作經驗
首先對不同最低工作經驗要求進行匯總統計,得到工作經驗要求的不同公司數量。發現大部分公司主要招收無工作經驗或有3年內工作經驗的求職者,部分原因是統計學人才嚴重短缺,迫使企業不斷降低工作經驗門檻,甚至不惜從零培養人才。
其次,對于不同工作經驗要求的公司需求人數進行匯總,得到不同工作經驗要求的總需求人數,發現相關公司對無經驗求職者的需求最大。
最后,查看工作經驗和工資的關系,發現無工作經驗的崗位平均工資在6000至9000之間,隨著工作經驗的增加,平均工資也在逐步上升,其中最低工資在20000元/月趨于平穩,最高工資則有較大的增長空間。
(三)需求人數
招聘10人的公司數量最多,達到307家,其次是招聘1人的公司,有296家。大部分公司的需求數量均在5人以下。
發現一般而言,需求人數越多的公司,平均工資相對較低,而需求人數較少的公司,平均工資相對較高。可以猜測這是因為初創公司有較大的人才需求量,但自身資金有限,平均工資較低。而穩定成熟的公司需求較少,工資也相對較高。
(四)崗位工資
首先查看最低工資和最高工資的分布直方圖(圖3)。
去除部分異常值后的箱形圖如圖3,整體工資水平在5000到15000元之間。
接下來分析相關軟件技能對工資的影響。本文選取了14個主要軟件技能:Excel,Stata,Matlab,Spark,EViews,SPSS,R,Java,Scala,SAS,Python,SQL,Hadoop和C。對職位描述job_des中提及上述軟件的次數進行詞頻統計,發現Python,SQL及Excel是最多被提及的軟件技能。
接下來查看對各軟件有要求的職位的平均工資,如圖4。
發現掌握Spark,Hadoop和Scala的職位平均工資最高,且增長空間非常大。其次是Java,Python等和計算機相關的編程語言,Excel的平均工資最低。
五、總結建議
經過上文的分析研究,發現市場對相關專業的求職者相對友好,大部分都接受無工作經驗的申請,同時可以看到工作經驗與工資有較明顯的正相關關系。一般而言,成熟穩定的公司對統計學相關專業的職位需求較小,但給出的工資較高。部分公司對統計學相關崗位的需求較大,但工資較低。就工資整體情況而言,統計學相關職位的工資大約在5000至15000之間,并且具有較大的上升空間。對相關軟件技能的分析顯示,掌握一門或多門軟件技術對工資具有較明顯的提升作用。綜合上述分析,給出如下建議:第一,高校統計專業的教育者可更多開設軟件操作等實操性課程,提升學生的實際數據處理能力。第二,學習中可更多以小組形式來完成項目,增強和提升學生的團隊意識和溝通能力。第三,為學生提供更多實習機會,豐富工作經歷。第四,學生應主動學習計算機相關知識,鍛煉編程能力,提升自身水平。
(作者單位為上海立信會計金融學院)
參考文獻
[1] 董曉萌.基于多元線性回歸的統計學專業滿意度影響因素分析[J].價值工程,2019,38(36):276-277.
[2] 潘雪萍,陳麗蓮.福州市“四區疊加”視域下經濟統計學人才需求研究[J].科技經濟市場,2018(04):150-152.
[3] 朱莎莎.淺析經濟統計學發展前景和就業分析[J].經貿實踐,2017(20):55.
[4] 南江霞.一級學科背景下統計專業建設的探討與實踐[J].數學學習與研究,2015(03):5+7.