牛丹丹 劉筠筠




摘? 要:對河南省民辦高校2015—2020年畢業學生的就業數據進行了收集,報告了河南省民辦高校畢業生就業現狀。采用隨機森林算法,對影響就業的特征進行重要性評估,找出影響就業的主要特征和部分成因。實驗結果顯示,民辦高校學生就業率與自身所學專業的熱門程度最相關,分析影響就業的主要特征因素,給出了就業預警機制構建的相關對策。為民辦高校畢業生就業提供更好的支持策略。
關鍵詞:隨機森林;民辦高校;就業預警
中圖分類號:TP181? ? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)22-0101-03
Abstract: This paper collects the employment data of graduates of private colleges in Henan Province from 2015 to 2020, and reports the employment status of graduates of private colleges in Henan Province. Using random forest algorithm, the importance of the characteristics affecting employment is evaluated, and the main characteristics and some causes affecting employment are found out. The experimental results show that the employment rate of private college students is most related to the popularity of their majors. The main characteristic factors affecting employment are analyzed, and the relevant countermeasures for the construction of employment early warning mechanism are given. Which provide better support strategies for the employment of private college graduates.
Keywords: random forest; private college; employment early warning
0? 引? 言
截至2021年6月30日,我國高等院校達到3 005所,普通高等學校2 740所,其中本科高校1 258所、高職(專科)學校1 482所;成人高等學校265所。包含有民辦高校773所。從數據上可見民辦高校在我國高校中占有一席之地。但隨著民辦高校的招生規模的不斷擴大,許多問題也逐漸顯露出來:有一部分民辦高校的畢業生總體就業率較低;但目前我國所需的較高層次、較高技能和復合型人才又十分短缺。為了降低民辦高校盲目發展的風險,避免高校自身發展與社會對人才需求的脫節,需要盡快建立和完善民辦高校畢業生就業動態監測機制,根據當前中國社會經濟情況、產業結構、人才需求等對民辦高校就業狀態進行動態監測,本課題在此背景上創建,不僅為民辦高校就業學生、用人單位提供相關的參考依據,而且對于我國政府及時掌握民辦高校畢業生就業的真實狀況、制定就業的相關政策、維護整個社會的穩定都有較大的意義。
1? 研究現狀
作為當前研究的熱點話題,國內學者關于大學生就業、隨機森林算法、大數據和就業預警有效銜接研究成果也十分豐富。陳踐,王丹在以就業為導向的民辦高校專業調整預警機制研究,在分析畢業生專業就業現狀的基礎上建立民辦高校畢業生專業設置預警機制,并給出去運行機制。郭偉在民辦本科高校畢業生就業指導教育探析中,針對民辦本科高校學生畢業就業指導工作展開研究,分析當前階段民辦本科高校在就業指導方面存在的問題,總結相關工作經驗,提出對應的解決辦法,為同領域工作者提供合理化發展建議,促進我國民辦本科高校畢業生就業工作順利發展。黃建瓊,郭文龍等以有效問卷調查數據作為樣本數據,采用隨機森林建立畢業生就業模型,分析學生的就業影響因素和就業方向之間的內在映射關系。通過調查數據表明,隨機森林算法是可行的。畢瑤家,劉國柱等為了準確的評價高校的畢業生質量,本文基于某高校計算機類畢業生的歷史數據,采用一種改進的隨機森林算法構建人才培養質量評價模型。實踐結果表明,該算法提高了人才培養質量評價的準確率和精確度,可以在高校人才培養方面起到指導作用。
隨機森林算法是一種基于統計學習理論的組合分類器,將Bootstrap重抽樣方法與決策樹算法相結合,該算法的本質是構建一個樹型分類器的集合,然后使用該集合通過投票進行分類和預測。隨機森林算法具有抗噪能力強、預測準確率高、能處理高維數據的特點,現已成為數據挖掘領域的常用工具之一。該算法具有較高的精確度,對特征選擇、優化參數等方面具有很大的優勢。通過隨機森林算法進行數據預測并預警,并提出有關就業能力提升對策的相關研究。
2? 研究方法
2.1? 數據及預處理
民辦高校大學生的就業并不是某一個因素決定的,而是多種因素共同影響的。以觀察、訪談、問卷調查等形式,向河南省內民辦高校2015—2020年畢業的學生了解就業創業學生的情況,收集相關數據。畢業生在找工作時會產生很多數據,如學生所處的社會環境、畢業生數量、職位需求量;性別差異;家庭背景、父母職業、社會地位、經濟收入、受教育水平;所學專業的熱門程度;學生的課程考試成績、專業課成績、專業證書、在校表現;學生的人際交往能力,就業期間就業平臺選擇。上述數據均需要通過實際的走訪、調查研究、實驗對比、數據庫建立等進行數據的收集,建立畢業生就業情況問卷調查系統,使得數據采集更有針對性和規范性。從各個方面尋找影響大學生就業的因素。
2.2? 隨機森林算法樹模型
隨機森林算法是一種集成學習方法,由多個小模型構建,各個小模型輸出結果合成最終的輸出結果,如圖1所示。是一種典型的機器學習算法,主要應用于分類、回歸。此算法是基于Bagging算法,針對每個分組訓練獲得決策樹模型,所有決策數據分類結果的組合分析得到最終分類結果。
隨機森林算法用于就業分析上具有很多優點:首先,該算法能夠將弱分類項通過覆蓋優化的方法進行綜合,從而使分類系統的整體分析能力得到提升。其次,在生成決策樹的過程中,每一棵決策樹都互相獨立且同時生成,大大提高了生成的效率。最后,隨機選擇的特征在選擇樣本和構建決策樹的同時,使該算法的抗噪能力大大提高。
2.3? 隨機森林算法在學生就業上的應用
以河南省民辦院校2015—2020級高校畢業生的畢業數據為對象進行分析,調查問卷共收回有效卷2 293份。表1統計了高校畢業生就業使用數據的屬性及其含義。畢業生就業由8個因素組成:性別、本專業學習水平、所學專業熱門程度、家庭背景、人際交往能力、專業證書水平、就業平臺選擇、創新創業能力。
對表1的8種主要因素采用隨機森林算法將數據進行重要性評估。其中8種因素作為重要特征,學生的就業情況作為分類屬性,使用該算法對分類屬性進行特征重要性分析,分析出的結果如表2所示:表中重要特征的值越大,表示該因素對就業影響就越大。專業熱門程度這一因素的特征重要性達到0.311 6,表明專業熱門程度對學生就業有著最重要的作用,其次是專業學習水平,其特征重要性是0.262 4,再次就是性別,重要特征性是0.133 5。其他5種重要特征對學生能否順利就業的指導作用相對較小。
下面對重要特性較高的三個因素進行分析。(1)從圖2中可以看出民辦高校的畢業生就業的專業熱門程度與就業率總體呈正相關趨勢,即專業越熱門,就業率越高,較冷門的專業可能成為就業預警人員。(機械工程94.2%,建筑學92.84%,通信工程91.71%,工商管理90.27%,車輛工程93.6%,物流管理92.00%,臨床醫學89.46%,數學與應用數學88.55%,法學86.49%,計算機科學與技術91.28%),近年來較熱門的軟件工程,建筑學,通信工程等工學的本科畢業生就業率是所有門類中最高的,就業率較高,數學與應用數學、法學等專業就業率較低。(2)從圖3中可以看出專業學習水平越高,其就業率就越大,專業水平較低就越成為就業預警人員(60分以下69.21%,60~69分79.82%,70~79分89.25%,80~89分96.63%,90分及以上95.33%)。(3)圖4中,男生就業率92.33%,女生就業率89.12%,女性畢業生求職更為不易,求職時間遠大于男性。女生懂的生活技能以及獲取知識渠道比男生少,女生更偏向于文科,藝術類;而男生很多都已經具備“文武雙全”職業素質。職場中,男生比女生能做的事情更多,相比之下,錄取男生比較劃算。國家的三孩兒生育政策也直接導致女性就業率的降低。
3? 就業預警機制構建
通過隨機森林算法對民辦高校影響學生就業因素的數據進行分析,找出了影響學生就業的一些主要因素,為了提高民辦高校就業率,需要建立起就業預警機制,并建立起相關的預警對策。
3.1? 專業的調整
影響民辦高校學生就業的最重要因素是專業的熱門程度,高校在進行專業設置的時候要與市場相結合,平衡自身規模、學校效益、教學質量之間的關系,合理設置專業,根據市場進行動態調節。使學校的發展利益與社會需求相結合,提高學校的競爭力。
3.2? 學習動力的提升
民辦高校在招生時,同等層次學生的分數普遍較低,學習動力也沒有那么高,所有要激發學生的學習動力、社會責任感。學習動力的提升有兩點,一個是內驅動力,一個是周圍環境的影響。抓緊學生入學教育,幫助學生做好定位,提高自身驅動力。發揮校園文化的德育功能,營造熱愛學習的良好氛圍,通過周圍的學習環境帶動新生學習。
3.3? 就業導向
民辦高校更應打造較為完善的畢業生就業指導體系,針對民辦高校就業生的特點,設定較為科學合理的咨詢計劃,設置專業化程度更高的就業咨詢室,開設相應的課程為同學們指導就業。讓同學們對自身的競爭力和能力有更深刻的了解,使學生為就業做更充分的準備,在就業時具備更從容、更理性、更平衡的心態,從而為自己就業奠定更好的自信心。
4? 結? 論
本文對河南省民辦高校2015—2020年畢業學生的就業數據進行了收集,采用隨機森林算法模型,對該數據進行了重要特性分析,找出了影響民辦高校學生就業的一些主要影響因素,針對影響就業的這些主要因素,提出構建民辦高校就業預警機制,為民辦高校畢業生就業提出較好的建議措施,從而使民辦高校就業有更好的支持策略。
參考文獻:
[1] 郭偉.民辦本科高校畢業生就業指導教育探析 [J].教育信息化論壇,2021(3):117-118.
[2] 吳志淵.民辦高校大學生就業指導工作的探索與思考 [J].智庫時代,2020(11):71-72.
[3] 陳踐,王丹.以就業為導向的民辦高校專業調整預警機制研究 [J].中國證券期貨,2011(2):160.
[4] 張丹鶴.基于大數據視角下的民辦本科高校就業指導課程研究與實踐 [J].湖北開放職業學院學報,2020,33(5):121-122.
[5] 晉浩天.2020屆高校畢業生將達874萬人 [N].光明日報,2019-11-01(8).
[6] 彭正霞,陸根書,李麗潔.大學畢業生就業質量的影響因素及路徑分析 [J].中國高教研究,2020(1):57-64.
[7] 劉云翔,陳斌,周子宜.一種基于隨機森林的改進特征篩選算法 [J].現代電子技術,2019,42(12):117-121.
[8] 莊巧蕙.基于IRFC算法的學生課程成績預測的研究與應用 [J].信息技術與信息化,2020(6):192-194.
[9] 呂莉,夏志紅.基于隨機森林的大學生學業預警成因分析及對策 [J].南昌工程學院學報,2020,39(6):81-86.
[10] 黃建瓊,郭文龍,李秋緣.基于隨機森林模型的高校畢業生就業影響因素研究 [J].江蘇師范大學學報(自然科學版),2019. 37(4):55-58+74.
[11] 曹正鳳.隨機森林算法優化研究 [D].北京:首都經濟貿易大學,2014.
[12] 蔣利平,彭立春.大數據時代高校畢業生就業質量預警機制建構研究 [J].中國大學生就業,2020(11),52-57.
[13] 畢瑤家,劉國柱,王華東,等.改進隨機森林算法在人才培養質量評價中的應用 [J].計算機系統應用,2020,29(7):212-216.
[14] 田臣,周麗娟.基于帶多數類權重的少數類過采樣技術和隨機森林的信用評估方法[J].計算機應用,2019,39(6):1707-1712.
作者簡介:牛丹丹(1985—),女,漢族,河南周口人,講師,畢業于重慶郵電大學,碩士研究生,研究方向:移動通信、MIMO通信。