李春燕
(東北石油大學(xué),黑龍江大慶 163318)
伴隨高等教育改革的逐漸深入,畢業(yè)生的就業(yè)競爭逐漸增大,高校大學(xué)生的就業(yè)形勢愈發(fā)嚴(yán)峻。大學(xué)生就業(yè)問題為中國教育領(lǐng)域中的重中之重,此問題對高等教育的延續(xù)、社會經(jīng)濟(jì)發(fā)展與人才培養(yǎng)均存在不可忽視的作用[1]。為了全面優(yōu)化大學(xué)生就業(yè)水平與就業(yè)質(zhì)量,必須全面分析大學(xué)生就業(yè)狀況。大學(xué)生就業(yè)去向跟蹤能夠全方位掌握大學(xué)生就業(yè)趨向,分析大學(xué)生對自身的就業(yè)觀[2]。以往分析大學(xué)生就業(yè)狀況時,各大高校均以就業(yè)率來評價,但有研究結(jié)果顯示,就業(yè)率僅可以體現(xiàn)畢業(yè)生在畢業(yè)之際的就業(yè)狀況。高校畢業(yè)生在剛剛踏入工作崗位后,就業(yè)狀態(tài)將存在一定變動性,所以就業(yè)率并不能科學(xué)、合理地體現(xiàn)大學(xué)生就業(yè)狀況[3]。就業(yè)去向跟蹤,能夠在指定時間段內(nèi),持續(xù)跟蹤學(xué)生就業(yè)狀況,分析學(xué)生就業(yè)質(zhì)量[4]。為此,該文構(gòu)建基于深度學(xué)習(xí)網(wǎng)絡(luò)的大學(xué)生就業(yè)去向跟蹤模型,對大學(xué)生就業(yè)狀況分析存在現(xiàn)實(shí)意義。
因為各大高校畢業(yè)生人群中存在尚未工作的學(xué)生,所以使用基于粗糙集與BP 神經(jīng)網(wǎng)絡(luò)的就業(yè)數(shù)據(jù)分類方法,篩選大學(xué)生就業(yè)數(shù)據(jù),獲取已就業(yè)大學(xué)生的就業(yè)數(shù)據(jù)。
1.1.1 分類模型的構(gòu)建
1)就業(yè)數(shù)據(jù)預(yù)處理。將大學(xué)生就業(yè)原始數(shù)據(jù)集分為條件屬性集合與目標(biāo)屬性集合,把每個就業(yè)數(shù)據(jù)屬性實(shí)施泛化,泛化是為了將大學(xué)生就業(yè)原始數(shù)據(jù)集中就業(yè)數(shù)據(jù)連續(xù)屬性的取值區(qū)間分成很多小區(qū)間,各個區(qū)間存在一種離散符號[5-6]。以此能夠獲取一種決策系統(tǒng),合并決策系統(tǒng)里不存在差異的就業(yè)數(shù)據(jù),獲取用來支持分類模型的決策系統(tǒng)(V,DVE)。
2)把粗糙集理論使用在就業(yè)數(shù)據(jù)特征選取問題中,在原始就業(yè)數(shù)據(jù)里獲取最能體現(xiàn)分類屬性的特征[7]。詳細(xì)方法是:
輸入:就業(yè)數(shù)據(jù)特征選擇的條件屬性集D、就業(yè)數(shù)據(jù)特征選擇的決策屬性集E、就業(yè)數(shù)據(jù)特征選擇的決策信息系統(tǒng)(V,DVE),V表示論域。
輸出:獲取判斷矩陣N、約簡集RRED(D,E)。
第一步:假定決策系統(tǒng)里就業(yè)數(shù)據(jù)屬性的數(shù)目是m,則RRED(D,E)=?,?表示大學(xué)生就業(yè)訓(xùn)練數(shù)據(jù)集,m=|V|。
第二步:建立m×m的空屬性矩陣N。
第三步:構(gòu)建判斷矩陣N。
第四步:輸出判斷矩陣N、約簡集RRED(D,E)。
3)構(gòu)建模型節(jié)點(diǎn)。圍繞約簡集RRED(D,E)構(gòu)建模型的初始節(jié)點(diǎn),把就業(yè)數(shù)據(jù)屬性不存在差異的節(jié)點(diǎn)放在模型的同一層間,之后分別在各個節(jié)點(diǎn)里去除一種屬性,獲取后續(xù)節(jié)點(diǎn)。
4)分類模型。將各個節(jié)點(diǎn)使用BP 神經(jīng)網(wǎng)絡(luò)模型實(shí)施訓(xùn)練,訓(xùn)練時,將第p層第j個節(jié)點(diǎn)設(shè)成獲取的分類模型是:

其中,bn表示就業(yè)數(shù)據(jù)屬性。
1.1.2 就業(yè)數(shù)據(jù)分類實(shí)現(xiàn)
將訓(xùn)練數(shù)據(jù)集構(gòu)建分類模型后,使用該模型對大學(xué)生就業(yè)數(shù)據(jù)實(shí)現(xiàn)分類[8-9]。分類流程如下:
1)將需要分類的就業(yè)數(shù)據(jù)集條件屬性和分層分類模型里的節(jié)點(diǎn)相匹配[10-11]。詳情見圖1。

圖1 分類節(jié)點(diǎn)衍生詳情
自左到右檢索獲取首個匹配節(jié)點(diǎn)。
2)使用此節(jié)點(diǎn)中已經(jīng)訓(xùn)練完畢的BP 神經(jīng)網(wǎng)絡(luò)模型對就業(yè)數(shù)據(jù)集實(shí)施分類,篩選就業(yè)原始數(shù)據(jù)集中已就業(yè)與未就業(yè)的數(shù)據(jù)分類結(jié)果[12-13]。
獲取大學(xué)生就業(yè)原始數(shù)據(jù)集中已就業(yè)的就業(yè)數(shù)據(jù)后,通過基于馬爾科夫過程的大學(xué)生就業(yè)移動預(yù)測模型,完成大學(xué)生就業(yè)去向跟蹤[14]。
1.2.1 轉(zhuǎn)移矩陣
假定{Ym} 描述馬爾科夫鏈,大學(xué)生就業(yè)狀態(tài)空間設(shè)成描述大學(xué)生就業(yè)狀況第一次的概率分布。m描述轉(zhuǎn)移次數(shù)構(gòu)成矩陣形式可能表示為:

1.2.2 穩(wěn)態(tài)概率分布
大學(xué)生在就業(yè)崗位里并不存在固定性,將就業(yè)狀態(tài)設(shè)成V。針對隨機(jī)V而言,具有正整數(shù)n,若qMM()1 ≥0,則馬爾科夫鏈存在平穩(wěn)分布狀態(tài)向量α:

其屬于方程組(4)的唯一正解:

若處于平穩(wěn)分布狀況的鏈?zhǔn)荵,穩(wěn)態(tài)的就業(yè)質(zhì)量等級(就業(yè)狀態(tài)優(yōu)劣)期望值FY與方差EY依次是:

式中,j表示就業(yè)等級(就業(yè)崗位等級)。
分析穩(wěn)態(tài)過程里的就業(yè)崗位屬性,能夠獲取大學(xué)生的就業(yè)結(jié)構(gòu)、就業(yè)程度以及就業(yè)差異[15-16]。
1.2.3 轉(zhuǎn)移步數(shù)跟蹤
當(dāng)就業(yè)去向轉(zhuǎn)移矩陣Q已經(jīng)獲取后,m步轉(zhuǎn)移概率矩陣是:

在第一次就業(yè)便存在m步轉(zhuǎn)移,第m步時就業(yè)狀態(tài)概率分布是:

設(shè)定置信度是β,則就業(yè)各個階段的期望值是:

就業(yè)各個階段的期望值與平穩(wěn)分布α=(α1,α2,…,αj)的期望值之比是:

其中,m描述大學(xué)生第一次就業(yè)實(shí)現(xiàn)穩(wěn)態(tài)時的轉(zhuǎn)移步數(shù)最小值。
1.2.4 就業(yè)崗位級別跟蹤
若大學(xué)生就業(yè)目標(biāo)是一級就業(yè)(一級就業(yè)即為優(yōu)秀崗位),將大學(xué)生在第一次就業(yè)中實(shí)現(xiàn)就業(yè)目標(biāo)的期望時間設(shè)成k(M),那么時間模型是:

在前后兩次就業(yè)跟蹤中,就業(yè)目標(biāo)降級出現(xiàn)的狀況很少,就業(yè)等級變小的比例能夠看成0。若i>j,就業(yè)崗位轉(zhuǎn)移矩陣是:

第一次就業(yè)的大學(xué)生實(shí)現(xiàn)就業(yè)目標(biāo)的期望時間模型是:


使用該文模型對北京市“對外經(jīng)濟(jì)貿(mào)易大學(xué)”2017 屆某本科生在2018-2019 年就業(yè)去向?qū)嵤└櫋T搶W(xué)生學(xué)習(xí)的專業(yè)為經(jīng)濟(jì)與金融,該文模型對其就業(yè)去向跟蹤結(jié)果見表1。
隨機(jī)在表1 中提取幾個月份的就業(yè)去向跟蹤結(jié)果和實(shí)際就業(yè)狀況實(shí)施校對,測試上述分析結(jié)果的真實(shí)性,結(jié)果見表2。根據(jù)表2 顯示,該文模型對北京市“對外經(jīng)濟(jì)貿(mào)易大學(xué)”2017 屆某本科生2018-2019 年的就業(yè)去向跟蹤結(jié)果有效,與實(shí)際就業(yè)狀況完全匹配。

表1 就業(yè)去向跟蹤結(jié)果

表2 跟蹤結(jié)果真實(shí)性
為了測試該文模型的應(yīng)用性能,對不同專業(yè)的大學(xué)生就業(yè)去向?qū)嵤└櫍檶ο笤谛W(xué)習(xí)專業(yè)依次是經(jīng)濟(jì)與金融、物流管理、工商管理、海關(guān)管理、電子商務(wù)、行政管理、國際政治。分析該文模型、支持向量機(jī)模型對7 種專業(yè)大學(xué)生2018-2019 年的就業(yè)去向跟蹤結(jié)果的召回率,結(jié)果見圖2。分析圖2 召回率的測試結(jié)果可知,兩種模型對7 種專業(yè)大學(xué)生2018-2019 年就業(yè)去向的跟蹤結(jié)果存在差異,該文模型跟蹤結(jié)果的召回率大于支持向量機(jī)模型。由此可見,該文模型的跟蹤性能最佳。

圖2 兩種模型召回率對比結(jié)果
測試兩種模型在跟蹤該校7 種專業(yè)大學(xué)生2 年內(nèi)就業(yè)去向時,對大學(xué)生就業(yè)去向的時間、崗位數(shù)據(jù)的漏查率與誤查率進(jìn)行了對比,結(jié)果見圖3、圖4。分析圖3、圖4可知,該文模型對大學(xué)生就業(yè)去向的時間、崗位數(shù)據(jù)的漏查率與誤查率較低,在差異專業(yè)的大學(xué)生就業(yè)數(shù)據(jù)中,該文模型對就業(yè)去向的時間、崗位數(shù)據(jù)漏查率與誤查率均低于2%,而支持向量機(jī)模型對大學(xué)生就業(yè)去向的時間、崗位數(shù)據(jù)的漏查率與誤查率始終高于2%,則該文模型更適用于大學(xué)生就業(yè)去向跟蹤問題。

圖3 兩種模型漏查率對比結(jié)果

圖4 兩種模型誤查率對比結(jié)果
大學(xué)生就業(yè)狀況跟蹤,對各大高校辦學(xué)質(zhì)量存在十分重要的影響。實(shí)時跟蹤大學(xué)生就業(yè)狀況,分析畢業(yè)生在工作崗位遇到的問題后,可在高校教育內(nèi)容中進(jìn)行拓展,對應(yīng)屆大學(xué)生的就業(yè)能力培養(yǎng)存在一定意義。該文構(gòu)建的大學(xué)生就業(yè)去向跟蹤模型,運(yùn)用了深度學(xué)習(xí)理論對數(shù)據(jù)分類、趨勢預(yù)測的優(yōu)勢,能夠?qū)崿F(xiàn)大學(xué)生就業(yè)去向高精度跟蹤。經(jīng)測試,該文模型的跟蹤結(jié)果的召回率優(yōu)于支持向量機(jī)模型,且漏查率與誤查率較低,跟蹤性能佳。