易倩文
◆摘? 要:為了能夠深入的挖掘和剖析影響當前高校大學生畢業求職就業的關鍵影響因素,找到當前大學生就業選擇因素之間的相互作用原因,筆者對重慶工程學院2021屆畢業生進行了關于“后疫情期間就業情況調研”的問卷調查,然后以數據挖掘分類技術為支撐設計出C4.5算法對各種影響重慶工程學院畢業生就業選擇的因素針對性的進行分析,以此來得出影響應屆畢業生就業選擇的決策模型,根據這一算法模型,幫助以后的大學生更好的在大學期間完善自己的專業技能,強化自己的綜合能力,提高自己的社會競爭力,為以后走出校園,在求職就業上有更多的選擇,提高應屆畢業生的就業率。而這一算法模型的運用對于高校在后疫情時期面對嚴峻的就業形勢以及社會經濟發展趨勢下,能夠起到有效的就業指導效果,通過算法模型能夠最大程度的幫助高校了解就業形式,實現在就業指數上的多項比較,以此來針對性的改進教學計劃,刺激高校畢業生就業率的不斷提高。
◆關鍵詞:決策樹;大學生就業指導;重慶工程學院
運用決策樹來保證在后疫情時期高校大學生的就業率能夠有效提高,其本身是基于決策樹分類法能夠深度的挖掘高校畢業生的相關就業數據,借助數據分析去找到畢業生潛在的就業規律,以此來得出影響高校畢業生就業率的關鍵因素,從而幫助高校更好的對應屆畢業生進行就業上的分類指導、精準服務,這樣不僅有助于提高高校在就業指導工作上的效率,還能夠幫助高校打出知名度,提升教育信譽度。在這個后疫情時期,能夠降低疫情對于高校畢業生就業的影響,能夠提高畢業生的就業率以及就業質量。
1決策樹分類法所運用到的C4.5算法
C4.5算法其實是對ID3算法的一種優化,它是以數據增益率為標準來選擇決策樹的節點屬性的一種算法,其本身默認選擇的是當前分支節點下數據增益率最高屬性作為當下的節點測試屬性,因此C4.5算法本身能夠極大的減少對于樣本分類所需要的數據量,同時也能夠保證數據本身的最小隨機性或者說“不純性”。因此C4.5算法能夠降低調研難度,測試數目可以達到最小化,因此基于C4.5算法可以設計出最簡單的一棵決策樹。
2數據挖掘對象以及決策樹分析目標
本文是將重慶工程學院2021屆畢業生作為數據挖掘的對象,以他們作為研究對象,通過對他們的就業意向進行調查,獲取到他們的專業成績、英語水平、計算機技能以及就業選擇等多項相關個人能力因素,并且通過調查報告去確定他們期望的上班時間、薪資范圍、福利待遇以及期望得到的就業指導內容等多個影響個人就業選擇的因素,以此來幫助重慶工程學院獲得相關的畢業生就業數據,通過決策樹分類法幫助重慶工程學院學生工作委員會以及就業指導中心掌握相關的就業指導課程改進以及課程安排,為就業指導教學的開展提供了數據理論的支撐。
3數據采集
要想借助C4.5算法來進行數據的深入挖掘,首先需要確定的是具體可查的研究對象,需要對可能影響高校畢業生就業選擇的諸多因素進行系統的準確的數據收集,可以說整個數據收集的準確度在一定程度上決定著整個C4.5算法對于結果分析上的準確性,而越是準確的結果分析也才越是具有參考的價值。
基于這一點,我們對于重慶工程學院2021屆的畢業生都進行了就業意向調查統計,我們首先從學院中的學生學籍管理系統中獲取了2021屆畢業生的學生基本信息,包括他們的院系、專業、班級、姓名、學號、性別、籍貫、政治面貌以及身份證號等。其次我們還從學校的“成績查詢服務網站”中獲取到了2021屆畢業生的學習成績,包括各科成績、專業績點、學分等。然后從這些數據中心抽取相應的部分畢業生信息作為這次研究分析的對象,一次來保證數據信息本身的準確性以及隨機性。
4構造決策樹
在后疫情時期,影響學生進行就業選擇的因素更多,而疫情對于學生就業選擇的影響也是當前高校在進行就業指導過程中不可忽視的一點。而因為我們選的研究對象是重慶工程學院2021屆的所有畢業生,因此所涉及到的信息數量是十分巨大的,而任務采集也足足花費了將近一年的時間,采集任務重,耗時長,所涉及到的數據信息如果想要完全處理,難度極大,因此我們為了保證數據本身的有效性,需要對數據進行預處理,通過數據集成以及屬性歸納的方式對數據進行預處理。同時通過運用C4.5算法獲得的決策樹,往往也是十分龐大復雜的,要想凸顯主要的影響因素,提高整個決策樹的實用性,我們需要去除掉決策樹中對于實際就業情況影響不大的因素,對決策樹進行必要的修剪,這就需要使用到悲觀后剪枝法。
通過對重慶工程學院2021屆畢業生進行信息數據的調查以及分析我們發現,所有學生對于自己畢業之后的第一份工作都是十分重視的,但是在針對就業單位的選擇上考慮的點卻有很大的區別,在薪資方面,40%以上的畢業生希望在月薪5000元以上,可見現在年輕人對于薪資待遇還是十分重視的。其次就是45%的畢業生都不太關注專業是否對口的問題,只看中行業未來的發展潛力以及自己未來的發展機會。當然對于就業單位所能夠提供的福利待遇則是很多畢業生都關注的問題,95%的畢業生都有強烈的五險一金意識,其次對于周末雙休、帶薪休假、進修培訓以及包吃住等也都十分重視。而更多的畢業生是希望能夠通過第一份工作獲得寶貴的經驗以及清晰的職業規劃的。這些調查對于重慶工程學院構建出清晰的畢業生決策樹是有很大的幫助的,對于該校以后進行就業指導也有很大的幫助。
5疫情影響下決策樹在畢業生就業指導的應用
在構造決策樹之后,就需要依據決策樹所提供的數據信息從決策樹的根結點到葉結點進行分類規則的歸納生成。而基于后疫情時期的高校畢業生就業選擇所涉及到的相關研究文獻比較缺乏,因此需要在不斷的自我總結和深度研究的過程中去探索關于疫情對于高校畢業生就業選擇影響的因素,同時搭建針對新冠疫情影響的決策樹理論框架,以及相對應的數據調查方法,從而嘗試性的探究決策樹在后疫情時期對于大學生就業指導工作的應用研究。
參考文獻
[1]楊斷利,張銳,王文顯.基于模糊決策樹的高校就業數據挖掘研究[J].河北農業大學學報,2012,35(2):111-114.
[2]麥曉冬,賈萍,翁建榮,等.基于多尺度粗糙集模型的決策樹在高校就業數據分析中的應用[J].華南師范大學學報(自然科學版),201,46(4):31-36.
[3]李冬梅,路春艷,張雅惠:決策樹分類方法在大學生就業指導中的應用[J].統計與咨詢,2017(06):29-32.