路健 劉彩娜 劉夢瑩 張晶玉
[摘 要]隨著大數據產業的不斷發展,以云計算、大數據、物聯網等為代表的新一代信息技術被廣泛地應用于各個領域,社會對數據分析人才的需求極大增加。文章采集前程無憂招聘網站中3 969條數據分析崗位招聘信息,利用統計分析、文本挖掘等技術進行多維度的數據分析崗位需求特征研究,描繪“知識—能力—素質—經驗”人才需求畫像。以招聘信息分析結果為依據,為高校數據分析類人才培養提供參考意見。
[關鍵詞]文本挖掘;數據分析人才;需求特征;人才培養
doi:10.3969/j.issn.1673 - 0194.2023.20.071
[中圖分類號]F49;C961[文獻標識碼]A[文章編號]1673-0194(2023)20-0224-03
0? ? ?引 言
隨著信息技術的迅猛發展,我國已經進入“大物云移”時代,即大數據、物聯網、云計算與移動互聯網時代[1]。2021年,工業和信息化部發布的《“十四五”大數據產業發展規劃》提出,到2025年,我國大數據產業測算規模突破3萬億元,創新力強、附加值高、自主可控的現代化大數據產業體系基本形成。大數據的發展將引發我國經濟發展模式的變革,各行各業對數據分析人才的需求將日益增大。如何培養滿足行業需要、貼近崗位需求、聚焦能力生成的數據分析人才,是高等院校亟待解決的問題。
本文利用文本挖掘技術對數據分析崗位招聘信息進行多維度的崗位需求特征分析,依據需求特征明確人才培養要素,提高人才供給與企業需求的契合度,以滿足社會新經濟、新產業、新業態和新技術大背景下的人才培養新要求[2]。
1? ? ?數據收集與處理
1.1? ?數據來源
本文于2022年11月以“數據分析”為關鍵詞,采集前程無憂網站的招聘數據,通過數據清洗,包括去除重復數據、填充缺失值、刪除無效值和處理異常值等操作,保留了3 969條招聘數據。每條招聘數據均包含企業名稱、企業類型、企業規模、企業地址、招聘崗位、薪資、工作經驗、學歷要求、招聘人數、崗位職責、任職要求等。
1.2? ?數據處理
1.2.1? ?崗位職責和任職要求分詞
招聘信息中的崗位職責和任職要求數據可以反映出企業對數據分析人才各方面的要求。本文通過Python語言調用Jieba方法實現對崗位職責和任職要求數據的中英文分詞、去停用詞、分詞結果降維、詞頻統計等操作,根據詞頻信息提取技術能力、素質能力、應用行業等相關的關鍵詞。
1.2.2? ?薪資單位統一
薪資數據中出現三種單位:千元/月、萬元/月、萬元/年,利用Python編寫程序將所有單位統一為“萬元/月”。添加“平均薪資”列,根據薪資范圍中最低薪資和最高薪資計算平均工資。如將“0.6~0.8萬元/月”轉化為平均薪資0.7萬元/月。
2? ? ?數據分析崗位基本情況分析
2.1? ?學歷及工作經驗要求分析
數據分析崗位所需的學歷要求中,本科占比88.8%,碩士和博士總占比11.2%,如圖1所示。所需經驗要求中,3~4年工作經驗需求占比最大,如圖2所示。說明數據分析崗位對學歷和行業經驗都有一定的門檻設置,需要從業人員注意經驗的積累和技術能力的提升。
2.2? ?薪資分析
對預處理之后的薪資列進行統計分析,如表1所示。薪資范圍主要集中在1~2萬元/月,說明數據分析崗位薪資待遇整體良好,且高薪占比也較多。
3? ? ?數據分析崗位核心技能分析
3.1? ?整體任職要求分析
運用文本挖掘技術對3 969條招聘信息的任職要求提取關鍵詞,通過詞庫優化、分詞、分詞優化、詞頻統計等方法獲取數據分析崗位人才需求的關鍵詞,以詞云圖形式展現,如圖3和圖4所示。
3.2? ?專業技能需求分析
通過中文分詞結果提取與技術相關的專業技能需求信息,按照出現頻次排序,主要包括:數據庫、統計分析、數據挖掘、數據建模、數據管理、數據倉庫、機器學習、需求分析、數據可視化、數據采集、操作系統、編程語言、深度學習、數據報表等。
3.3? ?軟件技能需求分析
軟件工具的使用是從事數據分析工作的必備技能。通過英文分詞結果提取軟件技能關鍵詞,并將軟件技能關鍵詞分為數據庫、大數據處理、數據分析與挖掘、數據可視化和編程語言5類。依據關鍵詞的詞頻及占比,計算得出統計結果,如表2所示。
數據庫方面,SQL和MySQL使用最為廣泛;大數據處理方面,Hive、Hadoop、Spark、ETL均較為重要;數據分析與挖掘中,以Python和Excel的使用為主;數據可視化工具中,Python占比遙遙領先;編程語言的要求主要為Python、Java、R三種語言。
3.4? ?素質能力需求分析
除了專業和軟件上的核心技能外,員工的基本素質也是企業招聘時非常關注的因素。從詞頻統計中可以看到,責任心、學習能力、團隊合作能力、邏輯思維能力、表達能力、抗壓能力等關鍵詞出現頻率較高,如圖5所示。
3.5? ?應用行業分析
各類行業對于數據分析崗位的需求分布如圖6所示。其中,計算機、互聯網和軟件工程行業對于數據人才需求量最多,市場營銷、醫學、生物制藥、人力資源等行業需求量緊隨其后,自動化、財務管理、供應鏈、電子商務、房地產等行業也需要數據分析人才,半導體、人工智能新興行業更加需要大數據分析。
綜合上述分析,對于數據分析崗位的人才需求,從知識層面看,需要掌握數據庫、數據采集、數據挖掘、數據建模以及數據可視化等相關知識;從工具層面看,需要掌握Python和Java編程語言,MySQL數據庫,Hive、Hadoop和Spark大數據處理軟件、Excel分析軟件;從能力要求來看,需要具備很強的學習能力、邏輯思維能力,合作、表達及抗壓能力;從應用領域來看,需要將技術和業務結合,應用數據分析輔助解決各領域相關業務問題。
4? ? ?數據分析人才培養啟示
4.1? ?構建“供需匹配”的數據分析課程群
高校應以企業崗位需求為導向,設計業務能力與數據能力并重、理論與實踐結合的數據分析課程群,完善數據分析課程體系,進而提高人才供給與需求的契合度。根據上述“知識—能力—素質—經驗”等人才需求畫像,設計覆蓋知識、能力要素的數據分析技術鏈,以技術鏈為主線設置課程群中的理論課程模塊和實踐課程模塊,破除課程間的壁壘,設置綜合實訓模塊,提升學生運用數據思維解決業務問題的能力。以技術鏈中的知識點為粒度構建各課程的教學內容,從課程內容的知識關聯性出發,合理安排課程學分、學時及學期。
4.2? ?突出“理論+技術”式教學,注重實踐能力培養
基于企業對于相關專業技術和軟件工具的要求,高校在培養數據分析人才方面,除了專業理論知識的教學,還應該重視技能工具使用的實踐教學,多開設所需各類軟件工具的實踐應用課程,將理論與技術相結合并應用到實際項目中,解決具體的業務問題,培養學生運用數據軟件處理和分析數據的動手能力[3]。
基于企業對于工作經驗的偏好,高校應該加強與企業的合作,通過校外實習、校企聯合項目等方式,使學生從“學以致用”到“用以促學”,實現良好的循環,獲取到寶貴的實踐經驗,提升實踐能力,匹配企業需求。
4.3? ?強調“知識—能力”轉化,提升綜合素養
基于企業對素質能力的需求,高校在培養數據分析人才時,除了要求學生掌握牢固的數據分析知識,還要實現“知識—能力”的轉化[4],提升學生對知識的靈活運用能力,引導學生建立正確的價值觀,培養學生的邏輯思維能力、團隊合作能力和自主學習能力等。可以通過指導學生參加數據分析相關比賽,激發學生的創新思維,強化學生的合作意識,提高學生的綜合素養,達到知識能力全覆蓋的效果,真正實現人才需求和人才供給的契合。
5? ? ?結束語
數據智能時代,一系列圍繞數據開展的產業鏈正在形成,高校應緊貼市場走向,挖掘社會需求[5]。本文利用統計分析、文本挖掘等技術對企業數據分析崗位的招聘信息進行多維度的需求特征研究,描繪“知識—能力—素質—經驗”人才需求畫像,進而為高校數據分析人才培養提供建議,促進學生高質量就業。
主要參考文獻
[1]徐曉敏.大數據管理與應用新專業建設探索與實踐:以北京信息科技大學為例[J].教育教學論壇,2020(31):229-231.
[2]康鵬,臧潔,曹立華.崗位需求匹配下的本科教學改革與實踐:以大數據分析類課程體系構建為例[J].商業經濟,2021,(4):194-196.
[3]黃智柯,程貞敏.數據分析人才培養與建議:基于數據挖掘招聘信息[J].軟件,2021(4):23-27.
[4]劉紫瑩,王秀紅,韓光平,等.基于DEMATEL/ ISM 集成模型的大學生知識-能力轉化關鍵影響因素研究[J].科技創新與生產力,2021(3):17-20.
[5]朱思霖,郭麗清.基于前程無憂招聘信息的數據人才需求分析[J].物聯網技術,2019(8):112-116.
[收稿日期]2023-04-27
[基金項目]2021—2022年度河北省高等教育教學改革研究與實踐課題“面向新經管的數據分析課程群建設研究”(2021GJJG630)。
[作者簡介]路健(1986— ),女,河北石家莊人,碩士,副教授,主要研究方向:數據挖掘、智能決策;劉彩娜(1983— ),女,河北邯鄲人,碩士,副教授,主要研究方向:數據挖掘、供應鏈管理(通信作者)。