999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習算法的高校學生就業去向預測

2022-02-25 14:45:22谷月
微型電腦應用 2022年2期
關鍵詞:分類特征方法

谷月

(西安航空職業技術學院, 通用航空學院, 陜西, 西安 710089)

0 引言

我國就業壓力隨高校畢業生數量逐年提升而有所提升,充分分析市場就業形勢,預測高校學生就業去向對于緩解我國就業壓力具有重要的現實意義[1]。高校學生就業情況具有較高的復雜性以及動態性,通過簡單的數據分析方法無法獲取高校學生就業的實際情況以及本質,動態、深入研究高校學生就業去向,充分考慮高校學生現實情況利用高效的預測方法實現就業去向分析具有較高實用性[2]。機器學習算法可實現高校學生就業去向精準預測,為高校教育領域以及優化我國就業形式提供有效參考[3-4]。

近年來針對高校學生就業去向預測的研究眾多,呂同雙等[5]研究基于立體數據的高校學生就業去向預測方法;韋師等[6]研究基于灰色預測模型的我國就業發展趨勢分析,分別利用立體數據以及灰色預測模型分析高校學生就業去向以及我國就業發展趨勢,可實現高校學生就業去向以及我國就業發展趨勢預測,但面對就業去向這一非線性問題預測精度較低,對我國高校學生就業去向分析參考意義較小。

機器學習算法主要包括無監督學習、監督學習以及強化學習3類,貝葉斯分類算法、聚類算法、決策樹算法以及支持向量機算法均為機器學習算法中應用較為廣泛的高效算法。為了獲取更精準的高校學生就業去向預測結果,提出了基于機器學習算法的高校學生就業去向預測方法,并通過仿真平臺驗證該方法預測有效性,預測結果可為我國高校學生就業情況分析提供參考依據。

1 機器學習算法的高校學生就業去向預測

通過研究大量資料發現,高校學生的就業去向預測與學生的個體人力特征具有很大關聯,因此分析高校學生就業相關的數據,可以從個體學業水平、經濟條件、家庭背景進行深入研究。基于機器學習算法進行高校學生就業去向預測,主要分為數據采集、數據預處理、生成特征子集和分類預測4個步驟,其流程圖如圖1所示。

圖1 高校學生就業去向預測流程圖

機器學習算法的高校學生就業去向預測首先需要采集高校學生就業的相關信息,如受教育年限、個體人力資本特征、個人偏好、預算約束等,將所采集數據實施數據清洗以及數據規約,將完成清洗與規約的數據處理缺失值、異常值實現數據預處理,利用特征選則算法處理完成預處理數據獲取最優特征子集[7],利用最優特征子集建立高校學生就業去向預測數據集,通過機器學習算法的支持向量機算法建立高校學生就業去向預測分類器,將預測數據集發送至支持向量機分類器中,實現高校學生就業去向預測。

1.1 特征選擇算法

利用特征選擇算法獲取最優特征子集,利用最優特征子集建立數據集實現高校學生就業去向預測,特征子集的優劣決定了高校學生就業去向預測精度[8]。從數據集內提取全部特征并用N表示,依據固定規則從特征中獲取便于高校學生就業去向預測特征,利用所獲取特征建立最優特征子集。用n表示最優特征子集大小,且需滿足n≤N。在總特征數量N內選取大小為n的最優特征子集,可能選取的特征子集數量如式(1),

(1)

特征集合內的特征與特征間可能存在關聯性[9],特征選擇算法有效性極為重要。用T={O,F,G}表示原始數據集,其中F={f1,f2,…,fm}與G={g1,g2,…,gm}分別表示特征以及類別,O={o1,o2,…,om}表示原始數據樣本集。設置結果評估函數如式(2),

H:2F→[0,1]

(2)

所獲取的H(X)值越高時,表明所獲取特征子集X越優,可保留有效特征[10],且所保留有效特征信息完整度較高。隨機選取特征建立特征子集用X表示,設置固定閾值H0,當閾值H大于閾值H0且X最小時完成特征選擇。通過以上方法所獲取特征子集包含特征數量最少且所包含信息完整度較高。

1.2 支持向量機分類器

支持向量機的基本思想是將輸入樣本從低維空間利用核函數映射至高維特征空間R內,利用高維空間獲取最優分類面,所獲取最優分類面可體現輸入樣本與輸出變量間所存在的非線性關系[11]。支持向量機屬于凸二次優化問題,可快速獲取全局最優解,支持向量機適用于高維模式識別以及非線性問題中,具有較高的推廣性能,可應用于函數擬合等問題中。支持向量機分類問題主要包括非線性分類和線性分類兩部分。用{(x1,y1),…,(xl,yl)}表示訓練樣本集,且需滿足xi∈Rn,yi∈{-1,1},i=1,2,…,l。設存在可將兩類樣本精準區分的最佳分類面,該最佳分類面可令不同分類中間存在較大孔隙[12],則存在判別函數公式如式(3):

f(x)=wTx+b

(3)

式中,w表示可確定超平面方向法向量,b表示位移量。

該判別函數相對于全部樣本xi均存在f(xi)≥1,可得最佳分類面與樣本間最小距離公式如式(4):

(4)

最佳分類面需正確分類全部樣本[13-14],設置可令全部樣本正確分類的約束條件如式(5):

yi[wTx+b]≥1

(5)

(6)

式中,ai表示拉格朗日系數,且滿足ai≥0。

利用拉格朗日函數L獲取w與b的最小值,可得公式如式(7)、式(8):

(7)

(8)

綜合以上公式獲取優化問題的凸二次對偶形式的最大化公式如下,

(9)

設置式(9)的約束條件如式(10):

(10)

式中,C表示懲罰參數。

通過以上公式所獲取ai中非0樣本即支持向量。所獲取支持向量分類問題判別式如式(11):

f(x)=sgn(wTx+b)

(11)

高校學生就業去向預測問題屬于非線性問題,需利用非線性映射函數將所采集樣本從原有低維空間映射至高維空間內,通過線性可分方法在高維空間內建立最佳分類面[15],引入松弛變量ξi提升最佳分類面對樣本精準分類,將最佳分類面約束轉化為式(12),

yi[wTx+b]≥1-ξi

(12)

非線性分類時的凸二次對偶形式如式(13),

(13)

式中,K(xi,xj)為核函數。

高校學生就業去向預測問題判別函數為式(14),

(14)

式中,n表示高校學生就業去向預測問題的支持向量數量。

2 仿真測試

為驗證所研究機器學習算法的高校學生就業去向預測有效性,采用MATLAB R2019b軟件作為仿真平臺,選取某高校2019屆畢業生作為實驗對象,采集該校2019屆畢業生的身份信息、專業成績、課外實踐分數、獲取證書等相關數據,所采集數據共18 569條,經過數據清洗等數據預處理后獲取有效數據17 524條,將其中的10 000條數據作為支持向量機分類器訓練樣本,剩余7524條數據作為支持向量機分類器測試樣本。

為確定所采用支持向量機分類器最佳參數,統計不同核函數以及懲罰參數情況下支持向量機分類器分類準確率,統計結果如圖2所示。圖2實驗結果可以看出,支持向量機分類器的核函數為徑向基函數,懲罰參數值為10時,支持向量機分類器所獲取分類精度最高。設置高校學生就業去向預測的核函數為徑向基函數,懲罰參數為10。

圖2 不同參數下分類準確率

采用本研究所設計方法預測該校2019屆畢業生不同就業單位性質所占比例,并將預測結果與該校2019屆畢業生實際就業單位對比,對比結果如圖3所示。

采用本研究所設計方法預測該校2019屆畢業生的就業地理區域分布,并將預測結果與該校2019屆畢業生實際就業地理區域分布對比,對比結果如圖4所示。

從圖3、圖4實驗結果可以看出,采用本研究所設計方法預測該高校2019屆畢業生就業單位性質以及地理區域分布與實際畢業生就業單位性質以及地理區域分布結果極為相近,驗證采用本研究所設計方法預測高校學生就業去向具有較高有效性。

圖3 就業單位性質預測結果

圖4 地理區域分布預測結果

高校學生就業去向預測是典型的分類任務,利用評估預測性能中常用的預測準確率、預測召回率、F1值以及時間開銷作為衡量預測性能的評估指標。將數據集樣本以及預測結果分為真正例TP、假正例FP、真負例FN和假負例TN 4類。預測準確率可體現預測正確的樣本在實際正例中所占比例,其計算式如式(15),

(15)

預測召回率可體現預測為正確的正例在應被分類為正例樣本中所占比例,其式如式(16):

(16)

F1值為預測準確率與預測召回率之間的調和平均值,其計算式如式(17):

(17)

F1值取值區間為[0,1],F1值越高表明預測方法的預測性能越高。

預測時間開銷是評價預測性能的重要評價指標,時間開銷可體現不同方法的計算速度,選取Python的time.clock統計高校學生畢業去向預測計算時間。

為直觀展示本研究所設計方法預測性能,選取文獻[5]立體數據方法以及文獻[6]灰色預測方法作為對比方法,采用3種方法預測高校學生就業去向的預測準確率、預測召回率、F1值以及時間開銷如圖5—圖8所示。圖5—圖8各評價指標對比可以看出,不同特征值情況下采用本研究所設計方法預測高校學生就業去向預測準確率與預測召回率均高于98%,不同特征值情況下采用本研究所設計方法預測高校學生就業去向的F1值均高于0.9,不同特征值情況下采用本研究所設計方法預測高校學生就業去向時間開銷均低于200 ms。對比結果有效驗證采用本研究所設計方法預測高校學生就業去向預測結果相比于另2種方法與實際值更接近,本研究所設計方法的預測效率即時間開銷,同樣優于另2種方法,說明本研究所設計方法具有優越的預測性能。

圖5 預測準確率對比結果

圖6 預測召回率對比結果

圖7 F1值對比結果

圖8 時間開銷對比結果

3 總結

采用機器學習算法預測高校學生就業去向,有助于客觀、全面分析高校學生畢業后就業去向,為緩解社會就業壓力以及高校分析學生畢業動向提供良好依據。機器學習算法具有較高的靈活性,將機器學習算法應用于高校就業去向預測,通過增加變量可提升機器學習算法準確性以及高效性,可以為提升高校教育水平以及社會就業服務提供理論依據。但本文研究所設計方法僅選擇了一所學校的一屆畢業生的數據進行驗證,所得出的結論未必能夠適用于國內其他的高校,且數據的來源是行政部門提供的學生數據,對于學生的心理偏好、家庭背景等未進行深入調研,在未來的研究中,可以考慮選取國內多地區的高校學生數據,以及對個體進行深入調查,以進一步提升設計方法的預測精準度。

猜你喜歡
分類特征方法
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 无码高潮喷水在线观看| 四虎综合网| 在线观看欧美国产| 欧美人与性动交a欧美精品| 国产剧情国内精品原创| 视频国产精品丝袜第一页| 91色在线观看| 91人妻在线视频| 91在线日韩在线播放| 亚洲一区二区无码视频| 国产91麻豆免费观看| 99这里精品| 国产激情在线视频| 视频一区亚洲| 国产成人欧美| 国产成人亚洲精品色欲AV| 亚洲综合专区| 在线色综合| 欧美成人综合视频| 日韩精品一区二区三区视频免费看| 999在线免费视频| 日本道综合一本久久久88| 成人免费黄色小视频| 最新精品久久精品| 在线中文字幕日韩| 69国产精品视频免费| 亚洲五月激情网| 国产欧美自拍视频| 亚洲乱码在线播放| 伊人久久久久久久久久| 亚洲成av人无码综合在线观看 | 思思热精品在线8| 久久久精品国产亚洲AV日韩| 天天综合网色中文字幕| 人妻丰满熟妇av五码区| 综合色88| 国产乱子伦精品视频| 97一区二区在线播放| 亚洲男女在线| 伊人精品成人久久综合| yjizz视频最新网站在线| 99尹人香蕉国产免费天天拍| 成人免费网站久久久| 亚洲精品男人天堂| 老色鬼久久亚洲AV综合| 四虎成人免费毛片| 99人妻碰碰碰久久久久禁片| 亚洲v日韩v欧美在线观看| 成人午夜精品一级毛片| 在线观看国产精品一区| 亚洲欧美国产五月天综合| 国产精品久久久久久搜索| 香蕉视频在线精品| 毛片大全免费观看| 免费欧美一级| 全部免费特黄特色大片视频| 国产jizz| a在线亚洲男人的天堂试看| 欧美成人区| 九九久久精品国产av片囯产区| 日本成人一区| 日本道综合一本久久久88| 2018日日摸夜夜添狠狠躁| 欧美性久久久久| 成人午夜视频免费看欧美| 国产成人喷潮在线观看| 美女毛片在线| 欧美成人aⅴ| 伊人久热这里只有精品视频99| 国内黄色精品| 激情综合婷婷丁香五月尤物| 伊人中文网| 亚洲国产精品久久久久秋霞影院| 奇米影视狠狠精品7777| 亚洲综合激情另类专区| 久久香蕉欧美精品| 亚洲男人的天堂久久香蕉网 | 人妻精品久久久无码区色视| 亚洲中字无码AV电影在线观看| 午夜精品区| 国产一级视频久久| 久久中文字幕2021精品|