吳小調 謝康
摘?要:隨著數字經濟的發展,社會對電商數據化運營人才的需求急劇增長,商務數據分析與應用專業正是為了滿足這一人才需求而增設的交叉專業。本文通過Python爬蟲程序從“前程無憂”招聘網站上爬取了該專業“電商數據化運營”與“數據分析”兩個就業方向的招聘數據,經過數據去重、去空、分詞等預處理,借助數據可視化技術分析對應崗位的需求特征,并使用TF-IDF模型對招聘信息中的職位要求進行文本挖掘,尋找崗位的核心基本能力和專業能力,并據此給出相應的人才培養建議。
關鍵詞:商務數據分析與應用;Python;TF-IDF;文本挖掘;人才需求
中圖分類號:F25?????文獻標識碼:A??????doi:10.19311/j.cnki.16723198.2023.18.017
0?引言
隨著5G、人工智能等新一代技術的普及應用,數字經濟迅猛發展。我國人口體量龐大,數據應用場景豐富,形成了廣泛的數據源以及海量的數據,進一步推動了數字經濟的高速發展。據領英《2021年新興職業趨勢報告》數據顯示,電子商務、數據分析等自帶數字化基因的職位正在成為新的風口,新興就業需求被釋放,就業規模不斷擴大。
高職商務數據分析與應用專業是在這一背景下增設的新型交叉專業之一,以電子商務、計算機等專業為依托,以發掘數據中潛藏的商業規律、發現商業知識為核心。為了使高校教育更加契合企業實務需求,本文將以該專業的對口崗位為關鍵詞,通過Python爬蟲程序從“前程無憂”招聘網站中爬取招聘信息,分析崗位需求與學歷、經驗的關系;通過TF-IDF模型對職位要求進行關鍵詞提取,從而得出相關崗位的基本能力和專業能力,以期為高職商務數據分析與應用專業人才培養提出更有針對性的對策。
1?數據來源以及預處理
1.1?數據來源
高職商務數據分析與應用專業設置在電子商務類下,其培養對象不是大型企業的數據挖掘人才或者算法工程師,而是對標中小企業的電子商務數據化運營與數據化管理人才。基于此,本文以“電商數據分析”“電商數據運營”“數據分析”以及“電商運營”為關鍵詞,用Python程序爬取了前程無憂招聘網全國范圍內的招聘信息,得到數據共5846條。
1.2?數據預處理
前述獲取的招聘信息包括崗位名稱、公司名稱、城市、發布時間、學歷要求、經驗要求、職位描述等字段。為進一步分析,本文使用Tableau和Python對數據進行了以下預處理:
(1)去重去空。為保證數據的唯一性,使用Python中的pandas.drop_duplicate()函數刪除了重復記錄,使用pandas.dropna()函數刪除“職位描述”為空的記錄。最終保留記錄數4157條。
(2)分詞。先使用Tableau提取“職位描述”中關于“職位要求”的信息。再使用Python第三方庫Jieba進行分詞。由于“職位要求”存在大量專業術語(如SQL、Python),有針對性地添加分隔詞。對職位要求中包含的無意義介詞、連詞及無助于分類的專用名詞,集合哈工大、百度等停用詞表進行停用詞過濾。
(3)崗位分類。爬取到的招聘崗位中,既有電商運營崗,也有數據分析崗,為了進一步探究這兩類崗位在能力要求上的側重,給每條記錄添加“label”字段以區分其為“電商運營”還是“數據”方向崗。
1.3?研究工具與方法
本文在分析崗位需求與學歷、經驗關系時,采用的可視化軟件為Tableau。分析職位要求時,采用python中的jieba.analyse.extract_tags()方法進行基于TF-IDF模型的文本分析,其中,參數topK設為50,表示提取的關鍵字個數為50;withWeight設為True,表示返回關鍵字權重。
TF-IDF模型主要包括兩個因素:
(1)TF(Term?Frequency),即詞頻,表示單詞在某文檔中出現的比例,其公式為:
TF=某個詞在文章中出現的次數文章總詞數
(2)IDF(Inverse?Document?Frequency),即逆向文檔率,表征單詞的普遍重要性,由語料庫的文檔總數和包含該詞的文檔數決定,其公式為:
IDF=log(語料庫的文檔總數包含該詞的文檔數+1)
詞語的權重公式為:
TF-IDF=TF*IDF
這就表示,如果一個詞在一篇文檔中頻繁出現,而且很少出現在其他文檔中,則認為這個詞權重高,具有很好的區分能力。由此可見,TF-IDF模型傾向于過濾掉常見詞匯,保留關鍵詞匯,適合用于本文中的崗位關鍵技能提取。
2?數據結果分析
2.1?學歷與崗位需求
從崗位的人才需求層次看,大專和本科學歷的需求量相對較大。其中,對于電商運營崗位來講,大專學歷的崗位需求大于本科學歷;對于數據相關崗位來講,本科學歷的崗位需求大于大專學歷,但差距不大。從圖1中可以看出,數據方向的崗位在各個學歷層次都有市場需求,大專層次也是數據化人才隊伍的重要組成部分。如何更有針對性地對標這些需求,實現高職教育人才供給與用人單位需求的動態耦合,是高職商務數據分析與應用專業人才培養亟待解決的問題。
2.2?工作經驗與薪酬
從工作經驗與薪資之間的關系圖(圖2)中可知,電商運營和數據崗都比較注重經驗積累,經驗越豐富,薪酬回報越高。這就要求畢業生要深耕所在的專業領域,不要輕易跳槽。同時,也提醒高職教育要注重與崗位相結合,將企業應用場景引入到教學情境中,讓學生提前感知職場,從而引導學生敬業愛業。
2.3?基于TF-IDF模型分析崗位核心能力
用人單位對應聘者的能力要求包括兩個方面:一是專業能力,指從事某項工作必須具備的獨有的知識和能力,比如,數據分析能力、電商運營能力等;二是基本能力,這是相對于專業能力而言的,是伴隨人終身的可持續發展的能力,比如團隊合作能力、抗壓能力。專業能力決定了一個人能否勝任崗位,基本能力則決定了一個人在工作崗位上有多大的發展潛力。
本文基于TF-IDF模型分別對“電商運營”和“數據”方向的職位要求進行文本挖掘得出詞語權重,使用Python第三方庫wordcloud制作詞云圖,最后,提取其中的高權重能力詞匯按基本能力和專業能力維度分別整理,以進一步分析不同能力的重要性。
2.3.1?“電商運營”方向崗位能力分析
“電商運營”方向的崗位能力詞云圖如圖3所示,運營、溝通、數據分析等都是權重比較高的詞匯。
圖3?電商運營方向崗位能力詞云圖
從基本能力維度看,在人際交往上,用人單位比較注重溝通能力和團隊合作能力,電商企業往往是團隊作戰,需要團隊成員之間密切配合,因此,溝通能力和團隊意識尤其重要。在職業素養上,責任心、營銷能力、邏輯思維、執行力、協調能力、抗壓能力也是企業比較看重的基本能力,這與此類崗位性質和電商行業緊張的工作節奏相關。
從專業能力維度看,在電子商務相關知識方面,應聘者需要具備電商知識,要懂運營、會推廣,同時還要熟悉平臺規則。從高權重詞匯中還可看到天貓、京東等平臺,這表明電商知識傳授要與具體電商平臺相結合。此外,數據分析等關鍵詞的權重也很高,表明電商運營現在越來越傾向于數據化運營,傾向于用數據分析的結果來指導運營,優化運營。
2.3.2?“數據”方向崗位能力分析
“數據”方向的崗位能力詞云圖如圖4所示,Excel、Python、數據分析等都是權重較高的詞匯。
從基本能力維度看,在人際交往上,“數據方向”方向的用人單位同樣注重溝通能力和團隊合作能力;在職業素養上,對營銷能力、策劃能力的要求不高,但增加了表達能力、數據敏感性這兩項基本能力。該方向崗位常常要與用戶調研需求,溝通數據結果,這要求具備表達能力,同時也要保持數據敏銳性,才能迅速發現數據隱藏在背后的規律并應用于實踐。
從專業能力維度上,“數據”方向的崗位應聘者需具備一定的數據分析知識、計算機知識和數理統計知識。其中,可以看出Python、Excel、數據分析權重很大,其次是數據庫、大數據、數據挖掘、BI、數據采集、Java等詞匯。這些都是“數據”方向崗位的必備專業能力,高校在建設課程體系的時候,應將這部分專業能力有機地融入課程體系中。
3?教育目標定位與人才培養對策
3.1?教育目標定位
如前文所述,高職商務數據分析與應用專業畢業生對標中小企業的數據化人才和電商數據化運營人才,對應聘者的要求除了具備Python、Excel、數據庫、電商運營等專業能力之外,也要求應聘者具備溝通能力、團隊意識等基本能力。高職教育要明確培養目標,緊緊圍繞中小企業崗位需求設置課程,以基本能力和專業能力培養作為教育管理活動的驅動力,提高學生的綜合素質,使其更符合人才市場的需求。
3.2?人才培養對策
根據以上分析結論及教育目標定位,對商務數據分析與應用專業的人才培養提出以下對策。
(1)課程體系緊跟社會實際需求。
商務數據分析崗位是以業務經驗為支撐的職位,其結果是要應用到具體實踐場景中的。因此,在構建課程體系時,可借助電子商務背景,以電子商務數據化運營為切入點,使置于空中樓閣的數據分析理論真正落地到數據分析實踐中。此外,前述分析提及的一些工具型軟件權重很高,如Excel、Python、數據庫等,高職院校應結合中小企業的崗位需要,堅持業務案例與軟件工具相結合,豐富學生的實操技能體系。
(2)堅持基本能力與專業能力培養并重的理念。
傳統高職教育更側重于知識技能的傳授,容易忽視團隊合作、溝通能力等基本能力的培養,而基本能力又是用人單位較為看重的可持續能力。因此,高職教育應引入側重基本能力培養的課程以提升學生的綜合素質。比如,可在課程開發中增加需要團隊合作的項目,也可開展各類學生活動,以培養學生的團隊意識和溝通能力。通過多元化的教學活動,實現課程體系與社會需求接軌、與崗位能力形成聯動,將學生培養成懂專業、有素養的應用型專門人才。
(3)推進“崗課賽證”綜合育人。
人才培養要與崗位需求適配,將崗位要求、課程體系、職業技能等級證書與技能大賽融為一體是一個著力點。“1+X”證書制度背景下,商務數據分析與應用專業的學生可以考取電子商務數據分析職業技能等級證書,并將其融入日常教學中,做到課程與資格認證相結合。同時,應鼓勵學生多參加高水平賽事,在項目中提高能力。通過競賽,培養學生解決實際問題的能力,還可在團隊協作中提升溝通能力、加強團隊意識,做到以賽促教,以賽促學。
參考文獻
[1]艾瑞咨詢.企業數字化人才發展白皮書[R/OL].[20221220].https://report.iresearch.cn?/report/202206/4018.shtml.
[2]朱思霖,郭麗清.基于前程無憂招聘信息的數據人才需求分析[J].物聯網技術,2019,(8):112116.
[3]施聰鶯,徐朝軍,楊曉江,等.TFIDF算法研究綜述[J].計算機應用,2009,29(z1):167170.
[4]黃智柯,程貞敏.數據分析人才培養與建議―基于數據挖掘招聘信息[J].軟件,2021,42(4):2327.
[5]薛潔,王嫻,籍艷麗,等.大數據時代數據類崗位人才需求特征分析[J].黑龍江高教研究,2022,(10):119124.