李佳林
?
基于BP神經網絡對大學生就業率預測模型研究——以四川衛生康復職業學院為例
李佳林
四川衛生康復職業學院人文社科部,四川 自貢 643000
針對近年來大學生就業發展問題,以四川衛生康復職業學院2000~2015年就業率為依據,采用LMBP算法,構建人工神經網絡預測模型,使用MATLAB實驗仿真,預測大學畢業生的就業率。通過該網絡的訓練學習可知,該網絡的最大誤差為1.72%,滿足預期要求;最后通過該模型預測了2016~2018年就業率分別為91.8659%、92.7938%、93.8210%,就業率預測模型研究為大學畢業生的就業指導提供了技術和理論依據,同時為政府和高校提供科學的決策依據。
大學畢業生;就業率;LMBP算法;BP神經網絡;預測
大學生就業問題與專業性、行業性、綜合性有關,而BP神經網絡又具有非線性特性和自學習、自組織、自適應能力,因此本文以BP神經網絡的LM(Levenberg-Marquadt)反傳算法[1],結合四川衛生康復職業學院近16年的畢業生的就業率的數據統計,構建了基于LMBP神經網絡的大學畢業生就業預測模型,并預測了未來3年大學生的就業率,為高校提供了可靠的決策依據和就業指導意義。
1.1 BP神經網絡模型
BP神經網絡也稱為誤差反向傳播網絡(Back Propagation Network),是1986年由Rumelhart和McCelland等科學家提出一種由非線性變換單元組成的前饋網絡,是目前人工神經網絡中使用最為廣泛的學習算法之一[2]。
結構上,BP神經網絡是一種典型的多層網絡,分別是輸入層、隱含層、輸出層,層與層之間采用全鏈接方式,同一層單元之間無連接。輸入層和輸出層的節點數一般由實際的要求確定,而隱含層的節點數根據多次試驗來確定。
1.2 就業率預測模型
一個隱含層的BP網絡可以逼近任意一個連續函數,三層的BP網絡可以完成任意的n維到m維的映射。
為此,本文采用三層BP神經網絡預測大學畢業生的就業率,學習和訓練已有的數據,找到輸入與輸出一種內在關系,從而建立起一種網絡預測模型。如圖1所示。

圖1 BP神經網絡結構
設計每層網絡的神經元個數,由于是基于時間順序的神經網絡預測模型,將前3年數據作為一組輸入向量,第4年作為輸出向量,為此輸入層的神經元個數確定為3,相應的輸出層的神經元個數為1。對于隱元層神經元個數的確定,目前還沒有統一確定的設計方法,目前普遍是根據經驗和多次反復試驗選擇[3]。
根據經驗選擇如下公式進行設計:

本次就業率預測模型中,輸入層到隱含層采用S型傳遞函數tan-sigmod,該函數能將隱含層網絡輸出映射到-1~1,且可微。隱含層到輸出層采用線性函數purelin,拓寬網絡輸出。由于該預測網絡訓練采用LM反轉學習算法,為此選用trainlm作為訓練函數,加快收斂速度。
1.3 LMBP算法
傳統的BP算法的修正權值是采用等量梯度算法,其收斂速度相對較慢,為此采用改進型的LMBP算法達到快速收斂。LMBP算法是利用二階導數信息進行搜索,既具有擬牛頓算法的快速收斂,同時具有梯度算法的整體收斂性;該算法的改進大大提高了BP算法的學習效率,其修正式

式中:JJ=H,是網絡誤差函數對權值和閾值一階導數的雅可比矩陣(Jacobi),是網絡誤差向量[6]。
2.1 樣本采集與預處理
本次研究的樣本采集是依據四川衛生康復職業學院近16年畢業生就業率,樣本如表1所示。
為了適應網絡輸出,減少網絡層之間的權值調整,提高網絡的收斂速度,從而將樣本進行如下歸一化預處理:


表1 2000-2015畢業生就業率
本次設計的就業率預測模型中,前3年作為輸入,第4年作為輸出,為此將歸一化后數據建立如下的樣本,如表2所示:

表2 樣本建立
2.2 建立訓練預測模型
在樣本中,以2000~2012年的數據,建立10組作為學習樣本P,相應地建立10個監督目標樣本T[7]。利用MATLAB的newff函數創建BP網絡模型,源代碼如下:
Net1=newff(minmax(P),[5,1],{‘tansig’,’ purelin’},’trainlm’);
網絡訓練的參數如下:
net1.trainParam.show=100;
net1.trainParam.epoch=1000;
net1.trainParam.goal=1e-4;
net1=train(net1,P,T);
2.3 網絡學習
通過MATLAB的BP神經網絡訓練,圖2可以看到該預測模型結構以及訓練過程的不同參數,同時在圖3的誤差變化曲線圖中發現,經過6次迭代以后就達到了性能要求1e-4。

圖2 預測模型與訓練參數圖

圖3 誤差變化曲線圖
2.4 網絡仿真與檢驗
網絡訓練后,利用2013~2015年的3個樣本來檢驗該預測網絡:
Ptest=[0.9203-0.2717-0.5036
-0.27170.5036-0.5942
-0.5036-0.5942-0.5217];
相應的目標樣本,即:
Ttest=[-0.5942-0.5217-0.4239];
利用MATLAB中仿真函數sim()檢驗預測網絡模型,圖4是實際值與預測值的誤差曲線圖。
其中“-+”表示真實數據,“-o”表示預測數據,從圖3 中可以發現,2013~2015年的實際值與預測值的最大誤差為1.7%,達到了均方誤差的要求,說明該預測模型保證可靠的預測精度。
從圖4的回歸曲線中也可看到該預測模型就有很好的數據擬合能力。

圖4 預測回歸圖
2.5 就業率預測
利用檢驗好的預測模型,分別對2016~2018年的大學畢業生的就業率進行預測,預測的結果為91.865 9%、92.793 8%、93.821 0%,可以看出就業率在逐年緩慢升高,其原因目前醫療行業還處于需求醫務人員狀態,該領域畢業生的就業情況相對較好。
由于大學畢業生就業率問題具有非線性特點,提出了基于BP神經網絡的預測方法。根據四川衛生康復職業學院近年來學生的就業率,使用了MATLAB進行仿真預測,通過已有的數據建立BP神經網絡預測模型,經學習和檢驗,該預測就業率模型達到了預定性能指標,滿足要求;同時通過該模型,預測了2016~2018年學院的就業率。由于大學生就業率問題與專業、行業背景等因素有關,在后續的工作研究中會加入這些因素,從而能更加客觀地評價大學生就業率問題。
[1]張德豐.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2011.
[2]傅薈璇.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2010.
[3]馬丹丹,于占龍,劉越.BP神經網絡在大學畢業生就業率預測中的研究與應用[J].佳木斯大學學報,2014,32(5):751-753.
Research on College Students’ Employment Rate Prediction Model based on BP Neural Network——a Case Study of Sichuan Health and Rehabilitation Career Academy
Li Jialin
Department of Humanities and Social Sciences, Department of Humanities and Social Sciences, Career Academy, Sichuan Zigong 643000
For the employment of university graduates in recent years development, in Sichuan Vocational College of health and rehabilitation 2000-2015 employment rate as the basis by LMBP algorithm, artificial neural network prediction model is constructed, using MATLAB simulation to predict the employment rate of university graduates. Know learning through the training of the network, the maximum error of the network was 1.72%, meet the expected requirements. Finally through the model predicted 2016~2018 employment rate respectively 91.8659%, 92.7938%, 93.8210%, employment rate prediction model research for university graduates employment guidance provides technical and theoretical basis, at the same time as the government and Colleges and universities to provide scientific basis for decision making.
college graduates; employment rate; LMBP algorithm; BP neural network; prediction
F249.2;TP183
A
1009-6434(2016)08-0097-03