臧 芳,劉 躍
(湖南電子科技職業學院機械與電子信息工程分院,長沙 410205)
基于大數據的長沙高職畢業生就業分析系統建設研究
臧 芳,劉 躍
(湖南電子科技職業學院機械與電子信息工程分院,長沙 410205)
本文通過對大數據分析的預測性應用原理進行分析,提出了基于大數據分析的長沙高職學生就業分析系統的建設及大數據在應用分析中的注意事項。
大數據;長沙高職畢業生;就業分析;系統建設
近年來,許多企業急需動手能力強、工作在生產一線的優秀人才,而主要培養這類技能型人才的高職院校畢業生的就業情況卻并不樂觀。造成此情況的重要原因之一——就業工作與市場需求的信息隔斷。實際數據顯示:全國高職院校從3年前的1 113所增加到1 297所,畢業生從198萬人上升為238萬人,但實際就業率不到50%且專業對口就業率更低。另外,現階段中小企業受國際金融危機的影響正面臨大洗牌,勢必會影響到高職院校畢業生的就業。長沙市范圍內的高職院校就業情況亦是如此。
大數據分析是指對規模巨大、更新速度快、類型多、有價值的數據進行分析。而高職學生的就業與所選擇的工作單位情況、職業崗位、月收入、工種、學生所學專業、課程等數據息息相關,這些均具備大數據的特征。如果能基于這些海量與就業相關數據(以長沙范圍內的幾所高職院校的就業相關數據為例)對高職畢業生就業模式進行深入探究,必將對提高長沙市范圍內的高職院校就業工作起到一定的指導或參考作用。
基于云計算的信息采集與存儲、數據清洗、維護和挖掘手段,能高效地將幾十PB的海量數據存儲下來,利用Hadoop HDFS、Hadoop MapReduce等工具進行分析與計算。大數據存儲舍棄過度數據精準問題和數據間前因后果的關系,重點探索它們的相關關系,這就是大數據的應用原理。大數據分析在高職畢業生就業中的應用即通過分析就業有關的數據,如:選擇工作單位情況、職業崗位、月收入、工種、學生所學專業等數據,發現未來就業趨勢及如何利用大數據分析的結果來更好指導高職畢業生的就業。本文所提到的大數據分析預測范圍主要有:專業對口情況、自主創業情況、薪資情況、對工作滿意度情況、工作地分布情況等。
第一,不能依賴少量數據樣本。少量的數據樣本是采集長沙市某個職院就業情況的數據或某些專業的就業情況,通過整理分析來推測整個長沙市所有高職院校的就業情況,屬于以點概全的方法。此種分析方法一般在特殊領域內有效,但通常情況下,特別是在學生就業問題上容易造成誤差。以長沙市范圍內的高職院校學生就業分析為例,對于已發生的就業行業分布的數據較容易做到精確,但在此基礎上建立分析模型卻較困難。假設湖南電子科技職院的“航海運輸”專業是長沙所有高職院校中的獨特專業,則該專業學生的就業因素維度較容易確定。但對于“計算機應用技術”這一類幾乎所有高職院校都開設的專業,就難以搜集到既有分布提取分析因子以及建立相關分析模型。但如果將長沙市范圍內所有高職院校的一切與就業相關的大數據,包括整體經濟趨勢、就業行業情況及區域分布、相關行業的人才需求情況、畢業學校的該專業師資力量與教學情況、學生素養以及家庭狀況等,從以上數據中提取維度,經由交叉分析對比,可得出某段時期內影響長沙市高職畢業生就業的一些主要因素。第二,切忌一味地追求數據的精確性。本文涉及的數據包括社會、行業、學校、高職畢業生個人信息等海量數據,它們之間關系復雜,每類數據都采集精確的可能性不大。但采集的數據越多,這些海量數據可以抵消掉個別問題數據。如果單純為了獲得畢業生就業薪資的精確數據而犧牲更廣泛數據的采集,忽視了其他應深入采集的數據。如:忽略性格傾向、思想獨立性等因素對就業的影響,就無法對學生的心理健康采取更有效的對策。這將直接影響學生的就業。第三,注重某些在就業關系中起重要作用的因素。如:不要過度重視2011年—2015年這5年間“服裝設計”專業學生就業率具體是多少,不要過度追究某因素對畢業生就業的影響,而是要預測好未來幾年中該專業的高職畢業生就業率是上浮還是下降,以及上浮和下降的幅度。
就建設形式和出資方而言,可將該系統的建設形式分成自行構建和聯合構建兩種。自行構建指以長沙市為中心建立一個數據樞紐,再將這個數據樞紐連接到長沙市范圍內各高職院校就業指導中心,結構如圖1所示。每個院校的就業指導中心主要負責采集本校的就業數據,條件成熟的也可以適當負責數據分析。數據樞紐則負責全市范圍內的各個高職院校畢業生的就業數據分析,負責Hadoop兩個關鍵功能模塊HDFS、Map Reduce的監督。NameNode和JobTracker通過調用管理員配置模塊中的APIresolve來獲取集群里每個slave的機架ID。此種構建形式的特點:數據來源有指向性,有利于建立分析模型,對于趨勢的分析周期較短。但建設周期長,成本高。

圖1 就業大數據應用系統的建設形式之一自行構建Fig.1 One of the construction forms of big data application systems
聯合構建是指長沙市范圍內各高職院校與具備大數據分析能力的公司協作,由該公司提供云計算服務來采集與就業相關的數據,這些采集的數據經過清洗過濾后進入全市就業指導中心數據樞紐數據庫,該數據庫由具有海量結構化數據存儲功能的分布式列存儲系統—HBase,用其超大無模式面向列的HBase表以key-value對的形式存儲這些就業相關數據,為后期做就業趨勢分析或后期研究使用。該形式的特點:數據來源廣泛,分析模型建立復雜,分析周期長。建設周期短,成本低。總地來說,聯合構建相對于自行構建更經濟一些。

圖2 就業大數據應用系統的建設形式之二聯合構建Fig.2 The second joint construction of big data application system construction form
A.因為大數據分析是通過云計算的手段將處理結果進行分析與預測,所以有關影響高職畢業生就業的數據分析維度不必深入探究,重點在于盡可能搜集與就業相關的海量數據。B.就業數據采集過程中遇到涉及敏感隱私數據,應通過合法的法律途徑獲取,如:畢業生的家庭關系、家庭收入等數據。C.大數據采集的海量信息的匯集構成了社會現實,所以不僅在高職畢業生就業研究方面,其他應用領域的大數據采集與分析也得到了發展與應用,體現了數據的價值。
對長沙市范圍內的高職學生就業情況進行分析屬于社會學與教育學交叉領域,其研究意義在于,為高職學生就業趨勢的預測提供了一種高準確性的分析模式,政府和教育界對長沙市范圍內高職院校學生就業工作的管理起到更好的指導作用。本文提出的兩種大數據分析系統建設形式,從經濟效益上來考慮,選擇與企業聯合構建的形式可以節省開支,也可以克服技術上的一些難題。
[1] 胡逸.運用大數據技術促進大學生就業[N].中國組織人事報,2013-09-04.
[2] 桑慶兵.大數據在高校的應用與思考[J].南通紡織職業技術學院學報,2013,(02):45-46.
[3] 王左利.大數據:大數據時代[J].中國教育網絡,2013,(01):67-68.
Research on employment analysis system of Changsha higher vocational college graduates based on big data
ZANG Fang, LIU Yue
(Department of Mechanical and Electronic Information Engineering,Hunan Electronic Science and Technology Vocational College, Changsha 410205, China)
Based on the analysis of the application principle of big data, this paper puts forward the construction of employment analysis system of Changsha higher vocational graduates and the precautions of big data in application analysis.
Big data; Changsha vocational college graduates; Employment analysis; System construction
2017-04-27
臧芳(1980-),女,碩士研究生,講師; 劉躍(1985-),男,經濟學學士,講師。
TP311.52
A
1674-8646(2017)13-0027-02