蔣正婷



摘要:隨著我國高校畢業(yè)人數(shù)逐年增加,大學(xué)生“就業(yè)難”問題越發(fā)突出,其已然成為了社會(huì)廣泛關(guān)注的熱點(diǎn)之一。準(zhǔn)確預(yù)測大學(xué)生的就業(yè)前景,提高當(dāng)代大學(xué)生的就業(yè)率及就業(yè)質(zhì)量引起了黨中央和國家的高度重視。因此,本文通過將改進(jìn)的人工魚群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,提出了基于IAFSA-BP神經(jīng)網(wǎng)絡(luò)并行集成學(xué)習(xí)算法的大學(xué)生就業(yè)預(yù)測模型,并將整理的數(shù)據(jù)集在matlab中進(jìn)行仿真實(shí)驗(yàn)時(shí)達(dá)到了極佳的預(yù)測效果,以期該模型能為推動(dòng)大學(xué)生高質(zhì)量就業(yè)提供參考意見。
Abstract: With the increasing number of college graduates in China, the problem of "difficult employment" for college students has become more and more prominent, and it has become one of the hotspots of widespread concern in society. Accurately predicting the employment prospects of college students and improving the employment rate and quality of employment of contemporary college students have attracted the attention of the Party Central Committee and the state. Therefore, this paper proposes an employment forecasting model based on IAFSA-BP neural network parallel integrated learning algorithm by optimizing the weight and threshold of BP neural network by improved artificial fish swarm algorithm, and compiling the data set in matlab. The experiment achieved excellent prediction results, in the hope that the model can provide reference for promoting high-quality employment of college students.
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);人工魚群算法;并行集成學(xué)習(xí);大學(xué)生就業(yè)預(yù)測模型
Key words: BP neural network;artificial fish swarm algorithm;parallel integrated learning;college student employment prediction model
0? 引言
近年來,隨著我國高校教學(xué)改革全面深入開展,教育水平不斷提高,大學(xué)生數(shù)量逐年增加,大學(xué)生就業(yè)難已然成為了一個(gè)社會(huì)熱點(diǎn)問題。在當(dāng)今嚴(yán)峻的就業(yè)形式下,各用人單位對應(yīng)屆畢業(yè)生的錄用門檻越來越高,很多學(xué)生在大學(xué)期間,只重視書本上的內(nèi)容,忽略了其自身綜合素質(zhì)的提升,造成畢業(yè)時(shí)不能滿足現(xiàn)實(shí)對大學(xué)生的招聘要求。當(dāng)然,也存在著應(yīng)屆畢業(yè)生對自身評價(jià)過高,對就業(yè)崗位期望過大,最終導(dǎo)致其不想就業(yè),亦或?qū)ψ约核鶑氖碌墓ぷ鳚M意度較低。因此,要想改善多種形式的“就業(yè)難”問題,建立一個(gè)精準(zhǔn)的大學(xué)生就業(yè)預(yù)測模型對高校教育方向具有一定的指導(dǎo)意義。現(xiàn)階段國內(nèi)外學(xué)者提出的大學(xué)生就業(yè)預(yù)測方法主要有:樸素貝葉斯算法[1]、數(shù)據(jù)挖掘技術(shù)[2]、最小二乘法[3]、多元統(tǒng)計(jì)分析法[4]、自然鄰居分類算法[5]。樸素貝葉斯算法在屬性個(gè)數(shù)較多或?qū)傩灾g相關(guān)性較大時(shí),分類結(jié)果較差;最小二乘法在解決實(shí)際問題時(shí)具有較大偏差性、非一致性;多元統(tǒng)計(jì)分析法雖然考慮了多個(gè)變量間的線性因果關(guān)系,但其命名清晰度較低;自然鄰居算法中某一噪聲點(diǎn)一旦遠(yuǎn)離數(shù)據(jù)集時(shí),易出現(xiàn)算法搜索鄰居的時(shí)間復(fù)雜度高等缺陷。
本文在目前分析方法不足的基礎(chǔ)上,提出IAFSA-BP的并行集成學(xué)習(xí)算法。通過對人工魚群算法視野范圍和移動(dòng)步長進(jìn)行改進(jìn),將改進(jìn)后的人工魚群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,兩種算法交叉并行,最終獲得最佳權(quán)值和閾值,以構(gòu)建出IAFSA-BP并行集成學(xué)習(xí)算法,再將該算法應(yīng)用于大學(xué)生就業(yè)預(yù)測中,建立出基于IAFSA-BP并行集成學(xué)習(xí)算法的大學(xué)生就業(yè)預(yù)測模型。
1? 影響大學(xué)生就業(yè)的因素分析
當(dāng)今社會(huì)中,大學(xué)生是最富有生命力的就業(yè)群體,他們有夢想、有憧憬、有志氣、有干勁,是社會(huì)主義的接棒人和建設(shè)者。近年來受國家政策、用人市場等社會(huì)環(huán)境的制約,大學(xué)生就業(yè)形式越發(fā)嚴(yán)峻,引發(fā)了廣泛的社會(huì)關(guān)注度。
影響大學(xué)生就業(yè)的因素有很多。在我國當(dāng)前的大學(xué)生就業(yè)問題研究當(dāng)中,陳立俊等人[6]借助人工神經(jīng)網(wǎng)絡(luò)的方法,揭露了影響大學(xué)生就業(yè)的主要因素有地域偏向、盼望薪資、學(xué)校、就業(yè)履歷、學(xué)歷、生源地、故鄉(xiāng)、專業(yè)種類、性別等。為了改善現(xiàn)今大學(xué)生“就業(yè)難”的局面,張清芳[7]應(yīng)用Logit模型驗(yàn)證了大學(xué)生要想有效提高自身就業(yè)水平,必須從學(xué)生本人、學(xué)校、及社會(huì)三個(gè)方面共同發(fā)奮。
國外學(xué)者在大學(xué)生就業(yè)問題的研究中,Sulastri A[8]等選取二百零六名心理學(xué)專業(yè)畢業(yè)生參加了兩波縱向研究,結(jié)果表明GPA、課外活動(dòng)、外語技能和參與一般豐富課程與成功找到基于心理學(xué)的工作有顯著的關(guān)系。大數(shù)據(jù)背景下,Menon M E[9]使用自我報(bào)告的數(shù)據(jù)來比較大學(xué)生的收入和就業(yè)期望,以及最近畢業(yè)生的實(shí)現(xiàn)的收入和就業(yè)路徑。另外,Teichler U[10]調(diào)查的歐洲畢業(yè)生中,大學(xué)學(xué)習(xí)期間一直活動(dòng)的畢業(yè)生國際能力較強(qiáng)的學(xué)生更有可能擁有更好的發(fā)展前景。
綜合國內(nèi)外學(xué)者研究的影響大學(xué)生就業(yè)因素以及結(jié)合我國招聘市場對人才需求的特點(diǎn)分析,本課題主要從獎(jiǎng)學(xué)金數(shù)、黨員、性別、四六級、掛科數(shù)、學(xué)科競賽、社會(huì)實(shí)踐等方面進(jìn)行深入分析,其不僅可以有效確保指標(biāo)的獨(dú)立性及時(shí)效性,同時(shí)也更符合實(shí)際,從而構(gòu)建出較為精確的大學(xué)生就業(yè)預(yù)測模型。
2? 改進(jìn)的人工魚群算法與BP神經(jīng)網(wǎng)絡(luò)并行學(xué)習(xí)算法
2.1 人工魚群算法及改進(jìn)
人工魚群算法[11]是李曉磊等人在2002年提出的一種新型群智能算法。該算法的原理是魚類在一片水域中能自行或尾隨其他魚群找到食物,進(jìn)而可以推斷出魚數(shù)目多的地方即是該片水域食物濃度最高的地方。根據(jù)這一特點(diǎn),對魚群中的模擬魚進(jìn)行編碼,并對其感知半徑和移動(dòng)步長進(jìn)行改進(jìn),經(jīng)過不斷迭代,即可形成解空間中的具體可行解。魚類在尋找食物的過程類似實(shí)際問題中的尋優(yōu)過程,即人工魚通過覓食、聚群、追尾等行為找到食物濃度最高的地方,對應(yīng)實(shí)際問題中的函數(shù)最優(yōu)值。人工魚群算法的三種主要行為描述為:
①覓食行為。水域中的魚發(fā)現(xiàn)食物后,通常會(huì)朝著食物增多的方向移動(dòng),在解決實(shí)際中的尋優(yōu)問題中表現(xiàn)為向最優(yōu)值方向的迭代方式。人工魚Xi在其視野范圍內(nèi)隨機(jī)選擇一條魚Xj,對比兩函數(shù)值,若Yj>Yi,則Xi向Xj移動(dòng)一個(gè)步長;否則,Xi將繼續(xù)在視野范圍內(nèi)尋找滿足條件的Xj,直到達(dá)到最大迭代次數(shù),若仍沒有滿足前進(jìn)條件,則隨機(jī)移動(dòng)一步達(dá)到新位置。即
2.2 IAFSA-BP并行學(xué)習(xí)算法
實(shí)際問題應(yīng)用中,BP神經(jīng)網(wǎng)絡(luò)的輸入值與輸出值都是確定的參數(shù),唯有網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)部的權(quán)值和閾值是不確定的。BP神經(jīng)網(wǎng)絡(luò)在求解具體權(quán)值和閾值的過程中,收斂速率較慢,易陷入局部最優(yōu)值。而人工魚群算法收斂速率較快,常用于解決實(shí)時(shí)性較強(qiáng)的問題。因此,給人工魚群算法中的模擬魚進(jìn)行編碼,使其攜帶著該網(wǎng)路中的權(quán)值和閾值。計(jì)算魚群的適應(yīng)度函數(shù),適當(dāng)改變魚群的感知半徑和移動(dòng)步長,通過不斷迭代之后,得出最佳的適應(yīng)度函數(shù)值,此時(shí),將人工魚攜帶的權(quán)值和閾值賦予到BP神經(jīng)網(wǎng)絡(luò)中,由此構(gòu)建出IAFSA-BP并行學(xué)習(xí)算法。具體步驟如下。
步驟1:構(gòu)建BP神經(jīng)網(wǎng)絡(luò)。將BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值編碼到人工魚個(gè)體。
步驟2:創(chuàng)建任意離散人工魚群。隨機(jī)生成N條人工魚,設(shè)置人工魚的可視域?yàn)関isual,步長step,嘗試次數(shù)t以及最大迭代次數(shù)Tmax。
步驟3:計(jì)算適應(yīng)度函數(shù)值。計(jì)算魚群適應(yīng)度函數(shù)值,并根據(jù)該值更新魚群的行為及狀態(tài)。檢查是否滿足全局條件,如果滿足,則輸出其目標(biāo)函數(shù)值并將人工魚的解碼值賦予BP神經(jīng)網(wǎng)絡(luò)中。反之,將繼續(xù)迭代。
步驟4:訓(xùn)練網(wǎng)絡(luò)。將訓(xùn)練集樣本數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)、測試集樣本數(shù)據(jù)測試網(wǎng)絡(luò)。
步驟5:誤差分析。檢查迭代次數(shù)和測試誤差,如果網(wǎng)絡(luò)測試誤差大于設(shè)定范圍,且未達(dá)到最大迭代次數(shù),則返回步驟3;否則,輸出結(jié)果,算法結(jié)束。具體流程如圖1所示。
3? 基于IAFSA-BP的大學(xué)生就業(yè)預(yù)測模型
3.1 數(shù)據(jù)預(yù)處理與模型構(gòu)建
本課題從安徽財(cái)經(jīng)大學(xué)收集到2016年-2018年205名畢業(yè)生的在校表現(xiàn)情況,具體包括:學(xué)生在校期間所獲獎(jiǎng)學(xué)金數(shù)、是否為黨員、性別、四六級通過情況、掛科數(shù)、學(xué)科競賽獲獎(jiǎng)數(shù)、社會(huì)實(shí)踐經(jīng)驗(yàn)等,并將其中的定性指標(biāo)做量化處理,如表1所示。
通過線上及線下調(diào)查到這部分畢業(yè)生對自己工作的滿意度情況,將其分為三個(gè)等級:滿意、較滿意、不滿意,具體如表2所示。
從上述模型中,BP神經(jīng)網(wǎng)絡(luò)的輸入層n1=7,隱含層n2=2n1+1=15, 輸出層n3=3,神經(jīng)元的節(jié)點(diǎn)有輸入層7個(gè),隱含層15個(gè),輸出層3個(gè),7-15-3,由此得出權(quán)值個(gè)數(shù)為150(15n1+15n3),閾值個(gè)數(shù)為18(n2+n3)。因此,人工魚群算法需優(yōu)化的參數(shù)為168。
選用S型切線、S型對數(shù)函數(shù)作為神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元和輸出層神經(jīng)元的傳遞函數(shù),IAFSA的相關(guān)參數(shù)設(shè)置為:種群規(guī)模N=50,視野范圍Visual=Xmax/4,步長Step=Visual/8,Visualmin=0.001,Stepmin=0.000,最大迭代次數(shù)Tmax=50。
3.2 模型的檢驗(yàn)及應(yīng)用
為了檢驗(yàn)該模型的有效性,本課題選用收集的205名畢業(yè)生的相關(guān)數(shù)據(jù)作為實(shí)驗(yàn)樣本,其中的100條數(shù)據(jù)作為訓(xùn)練樣本,另外105條數(shù)據(jù)作為測試樣本,網(wǎng)絡(luò)訓(xùn)練誤差設(shè)置為:err=4.1179e-04,借助MATLAB分別對三種算法進(jìn)行仿真模擬實(shí)驗(yàn)后得到如圖2所示。
從圖2可以直觀的看出,改進(jìn)的人工魚群算法優(yōu)化BP神經(jīng)網(wǎng)路經(jīng)過30次迭代后,收斂效果達(dá)到預(yù)測值。對比其他兩種算法,其收斂速度大大加快,預(yù)測精度也顯著提高,為大學(xué)生就業(yè)率及就業(yè)質(zhì)量提供了具備現(xiàn)實(shí)意義的預(yù)測模型。
4? 結(jié)語
4.1 結(jié)論
本文在梳理大量文獻(xiàn)和了解了近年就業(yè)市場對人才的需求方向后,選取了七個(gè)實(shí)時(shí)性較高的大學(xué)生就業(yè)因素深入分析。通過構(gòu)建改進(jìn)的人工魚群算法與BP神經(jīng)網(wǎng)絡(luò)并行集成學(xué)習(xí)算法,建立出基于此算法的大學(xué)生就業(yè)預(yù)測模型。算法的改進(jìn)與結(jié)合克服了傳統(tǒng)算法的諸多不足,達(dá)到了更為精確的目標(biāo)函數(shù)值,構(gòu)建出對提升大學(xué)生就業(yè)率及就業(yè)質(zhì)量更具有實(shí)際意義的大學(xué)生就業(yè)預(yù)測模型。
4.2 推動(dòng)大學(xué)生就業(yè)的相關(guān)建議
為了有針對性地解決大學(xué)生就業(yè)難問題,本文提出了相關(guān)參考意見。①學(xué)校應(yīng)實(shí)時(shí)聘請出色的工作者對大學(xué)生進(jìn)行就業(yè)指導(dǎo),學(xué)生在與老師或同學(xué)的交流和分析中易評估自己的價(jià)值、發(fā)現(xiàn)自己的不足,進(jìn)而能有效針對自己的缺點(diǎn)加以改正。②政府每年應(yīng)多提供大學(xué)生就業(yè)實(shí)習(xí)崗位,給更多想要提升自我的學(xué)生提供平臺(tái)。③大學(xué)生在校期間應(yīng)時(shí)刻清楚自己的定位,積極參與學(xué)校組織的各項(xiàng)活動(dòng),注重自身全面發(fā)展。隨著信息化時(shí)代的迅猛發(fā)展,掌握大學(xué)英語和計(jì)算機(jī)基礎(chǔ)亦是當(dāng)今提升就業(yè)的必備技能之一。因此,只有個(gè)人、學(xué)校,以及社會(huì)都精進(jìn)不休,才能有效改善“就業(yè)難”問題,創(chuàng)造出一個(gè)美好的就業(yè)前景。
參考文獻(xiàn):
[1]Masethe M A, Masethe H D. Prediction of Work Integrated Learning Placement Using Data Mining Algorithms.[J] Proceedings of the World Congress on Engineering and Computer Science, 2014(05).
[2]Rahman N A A,Tan K L,Lim C K. Supervised and Unsupervised Learning in Data Mining for Employment Prediction of Fresh Graduate Students.[J] Journal of Telecommunication, Electronic and Computer Engineering, 2017(07).
[3]陳高波.基于自適應(yīng)多分類最小二乘支持向量機(jī)的大學(xué)生就業(yè)預(yù)測[J].甘肅科技,2010(11).
[4]吳亞娟.基于因子-聚類分析的大學(xué)生就業(yè)滿意度統(tǒng)計(jì)及預(yù)測[J].南京信息工程大學(xué)學(xué)報(bào),2010(06).
[5]朱慶生,高璇.應(yīng)用自然鄰居分類算法的大學(xué)生就業(yè)預(yù)測模型[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017(08).
[6]陳立俊,王克強(qiáng).基于人工神經(jīng)網(wǎng)絡(luò)方法的大學(xué)生就業(yè)問題探析——以上海高校畢業(yè)生為例[J].教育發(fā)展研究,2013(06).
[7]張清芳.影響大學(xué)生就業(yè)因素的Logit模型分析[J].湖南科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014(06).
[8]Sulastri A,Handoko M,Janssens J M A M. Grade point average and biographical data in personal resumes: predictors of finding employment. [J]International Journal of Adolescence and Youth,2015(02).
[9]Menon M E, Pashourtidou N, Polycarpou A, Pashardes P. Students expectations about earnings and employment and the experience of recent university graduates: Evidence from Cyprus[J]. International Journal of Educational Development, 2012(09).
[10]Teichler U. International Dimensions of Higher Education and Graduate Employment.[J] The Flexible Professional in the Knowledge Society, 2011(20).
[11]李曉磊.一種新型的智能優(yōu)化方法-人工魚群算法[J].浙江大學(xué),2003(95).