

[摘 要]數字經濟時代,新商科建設要求學生同時具備商業分析和數據分析能力,但商科生多為文科背景,商業數據分析崗位適應能力較差。文章通過爬取招聘網站并使用文本分析和隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題分類方法,挖掘商業數據分析崗位需求特征,進一步通過問卷調查商科專業學生對該類崗位的適應度。研究發現,商業數據分析崗位重視應聘者的數學、統計學等專業知識,以及協調能力、邏輯分析能力等綜合素質。高校應構建課堂教學、案例教學與實踐教學相結合的體系,培養學生相關能力。
[關鍵詞]新商科;商業數據分析崗位;人才培養;文本分析;LDA主題分類
doi:10.3969/j.issn.1673 - 0194.2024.24.077
[中圖分類號]G642 [文獻標識碼]A [文章編號]1673-0194(2024)24-0-04
0" " "引 言
數字經濟時代,數據分析師、數據挖掘工程師等數據相關崗位炙手可熱。其中,數據分析師所需專業知識涵蓋范圍廣,為滿足崗位要求,商科專業學生需要注重增強自身商業分析能力和數據分析能力。然而,當前高校的人才培養方案與社會需求還存在一定差距,高校應順應數字經濟時代發展趨勢,優化人才培養方案,以增強人才供給的針對性和適配性。
目前,國內對數據相關崗位的研究主要從招聘信息中挖掘用人單位的需求特征。例如,黃崑等發現相較于數據管理、數據挖掘崗位,數據分析崗位更重視數據采集與分析有關的知識與技能[1]。張俊峰等從能力、專業和技能3個方面對招聘要求進行了分析和歸納[2]。古揚等通過對崗位職責要求、技能要求、背景要求和社會機構需要4個層面的研究,對情報分析師的人才需求進行了剖析[3]。薛潔等進一步比較了社會招聘和校園招聘中數據類崗位在人才特征、技能要求等方面的差異[4]。然而,目前針對商業數據分析崗位需求特征的研究仍顯不足。鑒于商科專業學生的培養目標與其他專業存在差異,有必要深入探究商業數據分析崗位的具體需求特征,從而為商科專業數據分析人才培養提供更加精準的指導。
1" " "商業數據分析崗位人才需求特征分析
1.1" "數據來源與數據預處理
本研究以“商業數據分析”為關鍵詞,利用Python從智聯招聘網站爬取了全國50個重點城市(包括一、二線城市和省會城市)的招聘信息,最終獲得1 046條數據。每條數據主要包括崗位名稱、薪資、工作地點、工作經驗、學歷背景、招聘人數、崗位職責及任職資格等字段。
1.2" "人才需求基本特征分析
1.2.1" "地域分布
統計所爬取數據中的工作地點信息后發現,商業數據分析崗位需求呈現出明顯的地域差異和集聚特征。該崗位主要位于京津冀、長三角、粵港澳大灣區等經濟發達地區和數字經濟先行城市,其次是湖南省長沙市、湖北省武漢市、四川省成都市等一線內陸城市,而西部和東北地區的需求較少,如青海省西寧市、黑龍江省哈爾濱市等城市。
1.2.2" "學歷要求
根據收集的1 046條崗位招聘信息,對學歷要求進行數據統計,結果顯示,絕大部分崗位都有明確的學歷要求。其中,本科學歷要求比例最高,達到72.47%;其次為大專,占19.12%;研究生學歷要求相對較低,僅為4.59%;剩下3.82%的崗位要求為高中、中專或不限學歷。
1.2.3" "工作經驗要求
在工作經驗要求上,分析結果顯示大部分單位都有所要求。其中,要求1年以下工作經驗的崗位占1.72%;要求1~3年工作經驗的崗位占比最高,達到31.36%;要求3~5年工作經驗的崗位占28.68%;要求5~10年工作經驗的占10.23%;要求10年以上工作經驗的崗位占0.57%;僅27.44%的崗位對工作經驗無要求。
2" " "基于文本分析法的商業數據分析人才能力需求分析
為深入了解企業對商業數據分析人才的專業能力和通用能力的需求特點,本文分別提取了崗位職責數據中集中代表專業能力的關鍵詞和任職資格數據中集中代表通用能力的關鍵詞,并進行了詞頻統計。
2.1" "專業知識
本研究采用Python的jieba庫對崗位職責數據進行分詞處理,并使用自然語言處理工具包(Natural Language Toolkit,NLTK)庫進行詞頻統計和排序。結果顯示,專業知識類關鍵詞排名前三的分別是數據分析(784次)、數據處理工具(366次)和數學(342次),其次是統計學、計算機、數據庫等。這說明數學和統計學知識是數據分析的理論基石,而數據處理工具的運用是重點考查要素。此外,計算機、數據庫等信息技術(Information Technology,IT)類知識的高頻出現,反映出當前商業數據分析與信息技術應用已經緊密結合。
2.2" "能力要求
對任職資格數據集進行相同的分詞和詞頻分析后發現,在能力要求方面,協調能力(757次)位列榜首,說明商業數據分析通常涉及多部門、多角色協同;邏輯分析能力(498次)和理解能力(300次)受到高度關注,反映出此類工作需要縝密的邏輯思維和敏銳的商業洞察力;學習能力(314次)、溝通能力(248次)、執行能力(240次)、表達能力(147次)、抗壓能力(131次)等也是用人單位普遍關注的軟實力。
2.3" "專業工具和技能
對數據集中的專業工具和技能關鍵詞進行統計(見表1),結果顯示,Python和R語言是目前數據處理與分析軟件類別中最主要的兩個類型,接著是SPSS、Tableau、SAS和MATLAB等,這說明Python和R語言已經是當前商業數據分析領域的主流數據處理工具。
在數據庫類型中,MySQL和Oracle位居前列,表明關系型數據庫管理系統仍是當前主流。但Hive等大數據處理工具的興起,說明非結構性數據的處理日益重要。
在企業辦公軟件類別中,Excel的使用最為廣泛,PPT和Office次之,而Word、ERP和Visio較少。這反映出在企業數據處理、可視化展示等方面,分析師更多地依靠Office辦公軟件。
2.4" "主題分類
本文采用LDA主題分類法,借助Python中的sk-learn包對數據實現文檔主題分類,對文本信息進行主題劃分,并計算不同主題數的困惑度值,在困惑度值最小處取得最佳主題數為3個[5]。隨后將生成的每個主題下的概率最大的25個詞進行整理并歸納,總結出最符合業務能力與綜合素質、專業基礎與個人特質、數據分析技術與工具3個主題的中心思想(見表2)。
主題1聚焦業務能力與綜合素質,涉及對業務理解、團隊協作、邏輯思維等的要求,如業務、團隊、合作、邏輯、運營等。商業數據分析師需要對所在行業和公司的業務有深刻的理解,具備敏銳的商業洞察力,同時要有很強的團隊協作意識,善于統籌各部門開展數據分析項目。
主題2對應專業基礎與個人特質,一方面強調了數學、計算機等專業知識和各類數據處理和辦公軟件工具的運用;另一方面,重視責任心、抗壓能力、時間管理意識,并對文字表達能力、細心等方面有一定要求。此外,年齡、學歷也是企業關注的個人因素。
主題3反映了商業數據分析崗中的數據分析技術與工具,包括SQL、Python等編程語言,MySQL等主流數據庫,數據挖掘技術和機器學習算法,數據倉庫,以及數據可視化、自動化報表等。同時強調對前沿技術發展的關注,要不斷優化模型。
3" " "商科專業學生數據分析崗位適應度調查分析
為了解商科專業學生對數據分析崗位的適應程度,本文以廣西民族大學商科專業學生為調查對象,調查內容涵蓋學生基本情況、數據分析認知與經歷、數據分析工具使用、自評數據分析能力、數據分析關鍵因素認知、數據使用規范意識、數據隱私保護意識、數據分析與專業相關性認知等8個方面。共發放問卷220份,回收有效問卷195份,經過相關統計分析獲得以下信息。
在數據分析經歷上,44.1%的學生有過數據分析比賽經驗,83.08%的學生首次接觸數據分析是在大學課堂上。這說明學生接觸數據分析的主要途徑是學校教育,課外自主學習的比例相對較低。
在數據分析工具使用上,絕大部分學生(92.82%)使用過Excel,54.36%和46.67%的學生分別使用過SQL和SPSS,而Python(17.95%)、R語言(6.15%)等工具的使用率低。由此可以看出,學生主要使用的是針對結構化數據的傳統工具。
在數據分析能力自評方面,77.44%的學生認為自身數據分析能力一般,19.49%的學生表示自己完全沒有數據分析能力。另外,56.92%的學生對數據分析的基本流程不太了解,13.85%的學生則完全不了解。因此,目前學生普遍認為自身數據分析能力有待提高,對基礎概念和分析流程認知不夠全面。
在數據使用規范與隱私保護意識上,54.87%的學生一般會對數據進行標注,35.9%的學生經常進行標注,這說明大部分學生對數據使用規范有一定認知,但遵守的比例還不夠高。收集數據時,56.41%的學生每次都會征求他人同意,這說明多數學生能夠意識到隱私保護的重要性。在數據處理過程中,47.18%的學生只注重保護基本隱私,這說明學生對數據隱私保護的重視程度需要提高。
在數據分析與專業相關性認知方面,74.87%的學生認為提高數據統計分析能力對自身專業非常重要,說明絕大多數學生認識到了數據分析能力與專業的高度相關性。
4" " "結論與建議
4.1" "結 論
本文對商業數據分析崗位的需求特征進行研究,發現該類崗位的工作地點集中于京津冀、長三角、大灣區等經濟發達地區和數字經濟先行城市,偏好本科學歷和1~3年相關工作經驗。在專業知識上,重視數學、統計學等理論基礎,數據處理工具的運用以及數據庫管理技能。在能力上,協調能力、邏輯分析能力等綜合素質不可或缺。主題分類結果進一步顯示,業務能力與綜合素質、專業基礎與個人特質、數據分析技術與工具是企業關注的三大核心要素。問卷調查反映,大部分商科學生對數據分析基本概念和流程缺乏系統認知,實踐經驗少,規范使用數據和隱私保護方面等也需提高。
4.2" "人才培養建議
4.2.1" "夯實數學統計等理論基礎,提升專業基礎能力
數學、計算機是商業數據分析的基礎,文本分析結果反映出用人單位對此有很高要求,但大部分學生相關基礎理論知識薄弱,對數據分析概念和流程的認知不足。對此,建議高校增加商科專業的數學、統計學等核心基礎課程的學時,確保學生掌握數據分析基礎知識。同時,可以結合數據分析案例進行滲透啟發式教學,帶動學生發現問題、分析問題,增加實操環節,讓學生動手使用常見的數據分析工具。
4.2.2" "更新課程設置,掌握前沿分析技術
目前,學生主要使用傳統工具處理結構化數據,對數據挖掘、機器學習等前沿技術的掌握程度有限。對此,高校應及時更新商科專業的課程內容,開設大數據分析、機器學習等新興課程,同步引入Python、R語言、Hive等熱門或新興的分析語言和工具。在課程上引入更多前沿動態,鼓勵學生參加課外學術講座,保持前沿知識的輸入。
4.2.3" "加強實踐鍛煉,提升業務理解能力和綜合素質
從前述分析可以看出業務理解能力、團隊協作、邏輯思維等綜合素質是企業較為重視的能力,但目前學生實踐經歷較少,使用數據分析思維解決實際問題的能力較差。對此,高校應增加實踐教學環節的比重,鼓勵學生參加相關競賽實踐。另外,與企業建立合作關系,為學生提供真實的商業數據分析項目。同時,課堂教學中注重案例分析、小組合作等形式,鍛煉學生的邏輯思維、溝通協調等通用能力。
4.2.4" "重視數據道德教育,增強規范和隱私保護意識
調研發現,部分學生對數據使用規范和隱私保護的重視度不足。對此,高校在人才培養過程中應加強數據道德教育,增設相關課程,從理論和實踐兩方面增強學生的數據使用規范與隱私保護意識。理論方面,可采用考試的方式,鞏固學生對數據使用準則、隱私法規的掌握程度。實踐環節,可以通過組織討論違規案例、參與科研等方式,使學生切身體會保護隱私的重要性。
主要參考文獻
[1]黃崑,王凱飛,王珊珊,等.數據類崗位招聘需求調查及對圖情學科人才培養的啟示[J].圖書情報知識,2016(6):42-53.
[2]張俊峰,魏瑞斌.國內招聘類網站的數據類崗位人才需求特征挖掘[J].情報雜志,2018(6):176-182.
[3]古揚,呂斌.國內信息分析師職業需求結構研究:基于招聘網站信息的挖掘分析[J].情報探索,2018(7):41-47.
[4]薛潔,王嫻,籍艷麗.大數據時代數據類崗位人才需求特征分析[J].黑龍江高教研究,2022(10):119-124.
[5]趙凱,王鴻源.LDA最優主題數選取方法研究:以CNKI文獻為例[J].統計與決策,2020(16):175-179.