李鑫浩 等
中信院2018大數據白皮書指出,在2018年—2020年,大數據市場整體的收入規模將保持每年約70億美元的增長,復合年均增長率約為15.33%。隨著大數據產業的發展,對于高質量的大數據人才缺口不斷增加,據統計,接下來的3到5年內,各行業將有近100萬的大數據人才需求量,現階段培養的大數據人才規模與市場需求相差甚遠。當前大數據人才需求主要集中在互聯網企業中,因此本文基于中信院公布的2019中國互聯網企業排名,對國內排名前50的互聯網企業的大數據崗位進行統計分析,分析大數據人才在實際工作中的能力要求,有利于高校培養的大數據人才更好地面向社會實踐,更加適應行業的需求,也為未來從事大數據行業的人才指明了就業方向。
一、大數據人才
1.大數據人才定義與基本情況。大數據人才主要指擁有算法設計、程序編寫、數據分析等專業核心技能,并能結合運用各行業背景知識的復合型人才。高等教育中大數據人才輸出途徑主要有兩種,第一種輸出途徑是近幾年高校剛剛開設的大數據相關專業,第二種來自信息管理與信息系統專業等計算機相關專業以及數理統計等數學類專業開設的大數據培養方向。大數據專業分為兩個層次,本科教育階段的大數據專業目前有數據科學與大數據技術專業以及大數據管理與應用專業,高職教育階段則是指大數據技術與應用專業。目前,國內開設大數據相關專業的高校數量還不足全國高校總數的27%。每年的畢業生無法滿足當前龐大的大數據人才需求缺口,因此會有越來越多的高校開展大數據專業建設,或通過新增大數據專業在已有專業基礎上設立大數據培養方向等方式來滿足就業市場需求。
2.大數據人才分類。大數據崗位的工作環境和具體任務會因所處的行業不同而產生較大差異,因此,需要進行分類研究,這樣才能夠保證所提出的大數據人才能力要求具有針對性,職業規劃方向清晰明確。本文根據市場招聘情況將大數據崗位分為三類:大數據架構類崗位、大數據分析類崗位、大數據開發類崗位,并分別對其工作內容進行了分類和整理。①側重于基礎架構設計類:最典型的是大數據架構師;崗位職責重點偏向于平臺設計、技術路線制定等工作,需要對系統架構、核心算法等專業知識具有深度的掌握以及豐富的研發工作經驗。②側重于數據挖掘分析類:主要有數據分析師、數據挖掘工程師等;崗位職責重點偏向于從數據中挖掘商業價值,為企業客戶提供輔助決策的數據分析服務,對數據分析技術比較看重。③側重于應用研發類:主要有大數據產品開發、大數據運維等。崗位職責重點在于設計并研發支持企業具體業務系統的通用大數據工具軟件。
大數據人才與學科專業有著密切聯系,對于大數據開發和架構方面的工作崗位,由于其工作內容需要專業的計算機知識作為基礎,且要求具備較強的計算機編程能力和開發經驗,因此多要求為計算機、信息管理、大數據及相關專業;而大數據分析方向的工作崗位需要比較好的數學素養與數據分析能力,招聘人員多選擇計算機和數學等相關專業。
二、大數據崗位現狀調研分析
1.大數據崗位需求的城市分布情況。根據國家工信部的相關文件,選取2019年國內前50強互聯網企業,收集這些企業大數據崗位的招聘信息,本文數據來源于互聯網招聘平臺——拉勾網以及上述企業官網的招聘信息發布頁面,共得到230條招聘信息。為了探究大數據崗位的具體工作城市分布規律,首先針對招聘信息中的工作地點做了分析統計。
統計結果顯示,北京等經濟發展速度較快的城市對大數據人才的需求最為旺盛,在調研的全部城市中占比72%,其余城市主要為成都、長沙、貴州,占比28%。上述調研結果表明,對于大數據人才來說,經濟發達的城市對大數據人才的需求相對較多,就業者的崗位選擇機會也會隨之增多。所以,對于近兩年就業的大數據人才來說,可以優先選擇北上廣等一線城市。而那些剛剛入學不久的學生,由于沒有迫切的就業需求,可以更多關注于具備大數據行業發展潛力和國家扶持力度較大的城市,如成都、貴陽等。
2.大數據崗位需求的分類統計結果。根據大數據人才分類標準,將當前主要的大數據崗位與之匹配,分別對大數據開發工程師、數據分析師、大數據架構工程師、數據倉庫工程師、大數據運維工程師、大數據產品經理等六種崗位進行統計分析。
從結果可以看出,雖然前50強企業對于大數據開發工程師的崗位需求規模最大,占比達到33.3%,不過其余崗位的需求與其差距并不是非常明顯,數據分析師占比28.3%,大數據架構師占比12.6%,大數據運維工程師占比10.1%,大數據產品經理占比9.4%。因此,企業對于大數據人才需求在整體上呈現出崗位多樣化態勢。在校大學生應當根據自身的能力與崗位的匹配情況以及未來的行業規劃,及時調整自己的學習計劃,進行多樣化知識學習與技能訓練,避免過度集中于某一崗位。
3.大數據人才薪資水平與學歷、工作經驗的相關性分析。由于大數據崗位招聘信息所給出的薪資數據都是一個范圍值,學歷與工作經驗數據都是用描述性語言進行表述,不能直接量化,所以本文對原始數據做了如下預處理和轉換:
用“1”代表工資小于10K;“2”代表工資在10K-20K之間;“3”代表工資在20K-30K之間;“4”代表工資在30K-40K之間;“5”表示高于40K。同樣的方式,學歷分別用“1”、“2”、“3”表示大專及以上學歷、本科及以上學歷、碩士及以上學歷;工作經驗分別用“1”、“2”、“3”、“4”、“5”表示應屆、1年以上、2年以上、3年以上、4年以上、5年以上工作經歷。
通過SPSS將變換后的工資、學歷、工作經驗數據進行標準化處理后,對工資學歷、工作經驗作相關性分析。最后的分析結果表明,工資與學歷的相關性系數為0.076,而工資與工作經驗的相關性系數為0.361。工作經驗小于2年的需求量只有13%,工作經驗高于2年的需求量占80%,不限工作經驗的只有7%;要求本科學歷的崗位最多,占比為86%,要求大專和碩士學歷的則分別占比6%和8%。
調查結果發現,大數據作為一種實操性較強的信息技術,企業在招聘大數據人才時,更看重的是工作經驗而非學歷,而且工作經驗對薪資具影響幅度更大。顯而易見,工作經驗與個人能力之間存在著一定的聯系,因此針對大數據人才的各方面能力要求作進一步分析是非常有必要的。
三、大數據人才的能力要求
1.專業技能要求。①大數據架構類人才的技能要求主要為:掌握常用的大數據技術平臺如Hadoop、Spark的架構以及相關組件、數據結構與算法設計,以及對于大型系統的維護等相關知識。
②大數據分析類人才的技能要求主要為三類:第一類為掌握常用分析語言如Python、SQL等,能夠對日常的數據進行處理;第二類為掌握專業的統計知識,能夠對指標建立分析體系;第三類為熟悉常用可視化工具,如Tableau、Excel等,能夠對數據進行可視化展示。
③大數據開發崗位對人才技能的要求主要包括:掌握大數據技術平臺、計算機編程語言、操作系統以及數據倉庫技術。招聘崗位要求大數據開發人員應當掌握的操作系統主要為Linux或Unix,數據倉庫技術主要為Hive或Kylin。由于崗位對于大數據技術平臺和計算機編程語言的要求較為多樣,因此對其進一步統計。
2.綜合素質要求。通過對招聘信息的整理發現,許多企業將團隊合作能力、溝通能力、學習能力、抗壓能力、責任心、分析能力、執行能力作為大數據人才綜合素質的評價指標。其中,對于大數據人才來說,團隊合作能力、溝通能力和學習能力都是比較重要的。很多大數據相關工作更加強調團隊合作完成,招聘企業更加看重大數據人才的團隊合作能力和溝通能力。高校在進行大數據人才培養時應當有計劃的安排團隊合作訓練科目,逐步培養學生的團隊合作能力。此外,大數據行業本身發展迅速,且與其他領域的交叉性較為復雜,因此要求大數據人才需要不斷地學習新技能和新技術,不斷地擴充相關領域的背景知識,因此學習能力也是企業在進行招聘時較為重要的綜合素質。
四、結語
隨著企業數字化轉型的不斷深入,大數據人才必然成為企業完成生存與發展命題的必需品。當前就業市場上大數據崗位種類繁多,就業面寬廣。大數據人才是一種綜合性的高素質人才,企業對大數據人才會提出多方面的要求,不僅要求就業者專業知識過硬并擁有相關工作經驗,而且要求擁有相應的綜合素質,如溝通能力、學習能力、團隊合作能力等。高校在制定大數據人才培養方案時,應該針對實際崗位所具備的專業技能和綜合素質等多方面條件,設計并執行行之有效的培養方案和實施計劃。同時,對于從業者自身來講,更加應該重視自身綜合能力的不斷提升。[項目支持:1、2018年國家級大學生創新創業訓練項目:面向高校信息資源共享平臺的大數據技術應用研究(201810705044);2、西安石油大學經濟管理學院院級教學改革研究項目:經管類專業“數據庫課程群”綜合教學模式研究]
(執筆人:李鑫浩? 李世玉? 郭名誠? 許宗澤? ?侯珂)
(作者單位:西安石油大學經濟管理學院)