董秀英,柏小麗,湯鐵群(.阜陽師范學院物理與電子工程學院,安徽阜陽36037;.四川省瀘州電業局,四川瀘州646000)
改進的BP神經網絡預測高校畢業生就業能力
董秀英1,柏小麗2,湯鐵群1
(1.阜陽師范學院物理與電子工程學院,安徽阜陽236037;2.四川省瀘州電業局,四川瀘州646000)
針對傳統BP算法的神經網絡收斂較慢的缺點,提出基于L-M(Levenberg-Marquard)算法的神經網絡對影響高校畢業生就業能力的各項因素進行分析的模型,以預測高校畢業生的就業能力存在的不足.因素量化采用模糊數學中的格貼近度和專家打分的方法.仿真結果表明:系統模型縮短了訓練時間,具有較高的準確性,預測值與實際值的誤差很小,可以將此模型應用于對高校畢業生就業能力的預測.
L-M算法;BP神經網絡;格貼近度;就業能力
Dong XY,BaiXL,Tang TQ.The Prediction of College Graduates Employ-Ability Based on the Improved BPNeural Network[J].Journalof Yibin University,2015,15(6):93-96.
隨著我國高等教育進入大眾化階段,高校畢業生人數逐年激增,社會經濟發展對不同專業人才的需求差異、就業區域不均衡,畢業生就業能力不足等都在不同程度上影響著高校畢業生的就業[1].根據上述情況需要用一種算法來分析預測畢業生就業能力在哪方面存在不足,以便在今后的教學和輔導工作中為學生提供建設性的意見.由于神經網絡在處理非線性、不確定性或模糊關系方面具有獨特的優勢,而改進型的BP神經網絡采用L-M優化算法,具有梯度下降法的全局特性和高斯—牛頓法的局部收斂性,是傳統BP算法的改進算法,所以L-M算法對準確度和訓練次數來說,明顯優于變學習率法的BP算法,且比梯度法快,對于局部搜索能力而言,L-M優化算法強于BP算法.本文把改進的BP神經網絡智能算法應用于畢業生就業能力的分析預測中,通過實例證明,改進的BP神經網絡模型具有較高的預測精度和良好的泛化能力,能用來預測高校畢業生就業能力在哪些方面存在的不足.
BP神經網絡[2]是一種誤差反向傳播的學習算法.它由輸入層、中間層和輸出層組成,其模型如圖1所示,中間層也就是隱含層一般由一層或多層組成.BP神經網絡的學習過程分為正向傳輸和反向傳輸.在正向傳輸時,主要用于對前向網絡進行計算.如果輸出層的輸出得不到希望值,則轉到反向傳輸,用于反向逐層傳遞誤差,即修改神經元之間的鏈接權值,經過這種不斷迭代,最后使得輸出層的輸出達到期望的誤差要求.

圖1 BP神經網絡模型
BP神經網絡學習算法的收斂速度慢,是一種梯度最速下降法,可能會出現局部最小的問題,即從表面上看,誤差符合要求,但所得到的輸出并不一定是期望輸出.而L-M訓練法能有效地抑制訓練過程中陷入局部最小值,因為它能降低網絡對誤差曲面局部的敏感性.其主要的思想是在每次迭代時,允許誤差沿著惡化的方向進行搜索,而不再沿著單一的負梯度方向,同時在高斯—牛頓法和梯度下降法之間自適應來調整和優化訓練網絡權值,使網絡能夠有效收斂[3-4].
2.1數據分析和處理
就業能力是指高校畢業生獲得工作、維持工作且能應付工作中的變化和工作中成長進步所需各種能力的總和.對于沒有就業經歷和經驗的應屆高校畢業生,影響就業能力的因素可以為知識因素、技能因素、個人因素和求職因素.其中,知識因素主要包括專業知識和非專業知識;技能因素包括專業技能、社會技能和綜合技能;個人因素包括個人特征,職業識別和態度;求職因素主要包括通過各種途徑對就業信息的搜集與處理能力、準確的識別和判斷就業信息的能力、自我展示自身才能的能力、語言的組織和表達能力、理解溝通和合作能力、洞察先機的能力和應對各種場合面試的能力等[5].
影響高校畢業生就業的主要因素有知識因素、技能因素、個人因素和求職因素.這些因素有的是可以進行直接量化的,如知識因素,它包括專業知識和非專業知識,其中非專業知識主要有外語、計算機過級情況、駕駛、社交禮儀等知識.專業知識以畢業生在校期間所修課程的平均成績來分析,而非專業知識主要以計算機和外語過級分數來分析,總的知識因素指標是專業知識和非專業知識分數的平均.而有的因素是定性的,很難進行量化,如技能因素、個人因素、求職因素,因此運用模糊數學中的格貼近度評價[6]方法和專家打分的方法,首先對定性指標進行量化處理.下面分別介紹如何把引起高校畢業生就業能力的這些因素進行量化處理.
測定某人的個人因素需要考察:外在個人特征指標x1,內在個人特征指標x2,職業識別指標x3,態度指標x4等,這些因素構成了一個論域:
U={x1,x2,x3,x4}
評價集V為:
V={A1(優),A2(良),A3(中),A4(差),A5(很差)}
各個評語所對應的指標區間為:
優=[90,100],良=[80,90),中=[50,80),差=[30,50),很差=[0,30).
通過專家意見法設定與評語指標區間對應的四項指標的數值依次為:
A1=(1.00,0.95,1.00,0.90)
A2=(0.85,0.80,0.80,0.85)
A3=(0.55,0.65,0.70,0.60)
A4=(0.40,0.35,0.45,0.30)
A5=(0.05,0.20,0.25,0.15)
待識別的一組個人因素指標為:
B=(0.60,0.50,0.80,0.40)
計算B與A1,A2,A3,A4,A5的格貼近度:
(A1,B)=(A1⊙B)?(A1⊕B)C=0.10
(A2,B)=(A2⊙B)?(A2⊕B)C=0.20
(A3,B)=(A3⊙B)?(A3⊕B)C=0.40
(A4,B)=(A4⊙B)?(A4⊕B)C=0.45
(A5,B)=(A5⊙B)?(A5⊕B)C=0.25
根據擇近原則,得出其個人因素指標為:
個人因素指標= (1×(90+100)/2+2×(80+90)/2+ 4×(50+60+70+80)/4+ 45×(50+40+30)/3+ 25×(10+20+30)/3)/100=75.5
以此類推可求出其他人的個人因素指標.
技能因素指標、求職因素指標跟上述方法類似.影響高校畢業生就業能力的各項信息數據如表1所示.
BP神經網絡模型通常以sigmoid函數作為激勵函數,該函數的值域為[0,1],而從表1可看出,畢業生的各項指標因素和對就業能力影響的數值都是大于1的整數.因此這些數值都需要將其轉化為[0,1]之間的數據.根據歸一化公式:
x(i)=(x(i)-min(x(i)))(max(x(i))-min(x(i)))
對表1數據進行歸一化,通過matlab計算出歸一化數值如表2所示.

表1 影響高校畢業生就業能力的各項信息數據

表2 對表1數據進行歸一化后數值
2.2改進的BP神經網絡的設計
對于一般的模式識別問題,采用三層的BP神經網絡模型就能以任意精度逼近任意非線性關系.所以通過對畢業生就業能力的分析,采用三層的BP神經網絡建立對高校畢業生就業能力的預測分析模型.從表1的分析中可以看出,應用BP神經網絡可以找出引起高校畢業生就業能力的各項因素和對高校畢業生就業能力的影響的關系,以預測高校畢業生就業能力在哪些方面存在不足.改進型的BP神經網絡的輸入值為表2中的影響高校畢業生就業能力的各項指標因素的值,而改進型的BP神經網絡的輸出值為高校畢業生就業能力的值.本實例將從樣本集中隨機選取15個樣本作為訓練樣本.
從上面的分析中知道,BP神經網絡輸入層的神經元為4個,輸出層神經元為1個,但隱含層神經元個數的選取就比較復雜了,選擇過小或過大都有可能產生很大的誤差;通過對網絡進行實際訓練檢驗并不斷調整,綜合考慮網絡的輸出精度和收斂速度,選取隱含層的神經元個數為9[7],則網絡的拓撲結構可表示為4×9×1.
用Matlab的專用newff函數確定傳遞函數,網絡的結構和訓練算法選用L-M算法,即選擇trainlm,其調用形式為:
net=newff(minmax(p),[91],{'tansig','logsig'}, 'trainlm');
根據上面所述語法建立網絡后,對網絡的訓練參數進行設置.Matlab程序如下:
net.trainParam.show=50;
net.trainparam.lr=0.05;
net.trainparam.mc=1.05;
net.trainParam.epochs=1000;
net.trainParam.goal=1e-3;
設置好網絡參數后開始訓練網絡,達到網絡收斂.matlab程序為:
[net,tr]=train(net,p,t)
從圖2可以看出,通過5步訓練后,網絡的性能達到了要求.

圖2 改進的BP神經網絡收斂圖
通過訓練好的改進的BP神經網絡,取某人的各項歸一化指標0.9,0.5,0.4,0.6,則神經網絡的輸入參數A=[0.9,1,1,1;1,0.5,1,1;1,1,0.4,1;1,1,1,0.6],測試樣本的選取是按照只有一種因素的情況下對高校畢業生就業能力的影響,則通過網絡訓練:
a=sim(net,test)
得到仿真結果如下:
a=0.92950.67470.84470.8056
從測試結果可以看出,該生的知識能力個人因素和求職因素都不錯,但技能因素還有待加強.因此,今后的教學和輔導工作應重點對該生進行專業技能、社會技能和綜合技能等方面的指導,從而提高該生的整體就業能力,以適應社會的需求.
BP神經網絡模型可應用在各類普通高校的在校學生中,預測其就業能力,從而找到就業中存在的不足,明確自己改進的方向.本文通過改進的BP神經網絡對高校畢業生就業能力的各種因素進行分析,首先由于在影響高校畢業生就業能力中有的是很難通過直接量化得到的指標,所以采用了模糊數學中的格貼近度評價方法和專家打分的方法對引起高校畢業生就業能力的各項數據進行量化.通過量化,歸一化后的數據可以作為改進的BP神經網絡的輸入數據,然后利用matlab工具建立網絡模型.通過編程測試,實際值與預測值誤差值很小,可以把它作為一種工具對實際問題進行分析.
[1]劉新民,郭供波.影響大學生就業因素分析[J].思想政治教育研究,2007(3):19-21.
[2]尹朝慶.人工智能方法與應用[M].武漢:華中科技大學出版社, 2007.
[3]張長勝,歐陽丹彤,岳娜,等.一種基于遺傳算法和LM算法的混合學習算法[J].吉林大學學報(理學版),2008,46(4):675-680.
[4]王鈺,郭其一,李維剛.基于改進BP神經網絡的預測模型及其應用[J].計算機測量與控制,2005,13(1):39-42.
[5]崔暢,林婭琪.大學生就業能力分析及對策建議[J].黑龍江對外經貿,2010(5):130-131.
[6]李安貴.模糊數學及應用[M].第2版.北京:冶金工業出版社, 2005.
[7]董秀英.便攜式心血管監護系統的設計和實現[D].成都:西華大學,2011.
(編校:王露)
Prediction of College Graduates’Em ploy-Ability Based on the Improved BPNeuralNetwork
DONGXiuying1,BAIXiaoli2,TANGTiequn1
(1.SchoolofPhysicsand Electronic Engineering,Fuyang TeachersCollege,Fuyang,Anhui236037,China;2.Luzhou PowerSupply Bu?reau,Luzhou,Sichuan 646000,China)
An improved neural network model based on L-M(Levenberg-Marquard)algorithm neural network was ap?plied to analyze the factors influencing college graduates’employability.It can remedy the shortcoming of the slow con?vergence rate of traditional BP algorithm neural network.Thismodel can predict the deficiencies in employability of col?lege graduates.The lattice fuzzy close-degree assessmentand expert scoringmethod were adopted,which quantified the various data of the factors on the employability of college graduates.Simulation results indicate that thismodel can re?markably reduce the training time,with relatively high accuracy.With small errors in the predicted value and actual val?ue,thisnetworkmodel can be used to forecast theemployability of college graduates.
L-M algorithm;BPneuralnetwork;close-degree grid;employability
TP18
A
1671-5365(2015)06-0093-04
2014-12-19修回:2015-01-09
阜陽師范學院教學研究項目(2012JYXM91);阜陽師范學院碩士科研啟動資金
董秀英(1984-),女,助教,碩士,研究方向為嵌入式系統應用及開發
網絡出版時間:2015-01-12 12:59網絡出版地址:http://www.cnki.net/kcms/detail/51.1630.Z.20150112.1259.001.html
引用格式:董秀英,柏小麗,湯鐵群.改進的BP神經網絡預測高校畢業生就業能力[J].宜賓學院學報,2015,15(6):93-96.