999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于智能數(shù)據(jù)信息分析的就業(yè)評估方法研究

2021-08-20 10:28:54趙瑞丹
電子設(shè)計(jì)工程 2021年16期
關(guān)鍵詞:信息質(zhì)量模型

趙瑞丹

(西安航空職業(yè)技術(shù)學(xué)院,陜西西安 710089)

傳統(tǒng)的就業(yè)數(shù)據(jù)來源于調(diào)查問卷(紙質(zhì)或網(wǎng)絡(luò)),以及高校的官方統(tǒng)計(jì)信息。但這兩種方式均存在各自的問題,前者得到的數(shù)據(jù)較為有限,難以涵蓋全部學(xué)生,后者保證了數(shù)量,但無法顧及每個學(xué)生的就業(yè)質(zhì)量[1-3]。事實(shí)表明,即使在畢業(yè)時有確定的就業(yè)崗位,但仍有大批學(xué)生對職業(yè)有了充分了解后,在一年或更短時間內(nèi)更換工作。因此,合理地評估就業(yè)質(zhì)量也是需要關(guān)注的重要問題[4-5]。

在高速發(fā)展的信息化時代,新的行業(yè)不斷產(chǎn)生,對人才的需求也迫切增加。學(xué)生就業(yè)質(zhì)量的優(yōu)劣,不僅能反映社會行業(yè)的發(fā)展趨勢,且可以及時地反饋給高校,從而適當(dāng)?shù)卣{(diào)整專業(yè)分布,提高教育水平[6-7]。

面對大量的就業(yè)數(shù)據(jù),不僅缺少從事質(zhì)量評估的專業(yè)人員,且因評估人員的水平不足導(dǎo)致評價結(jié)果因人而異。近年來,興起的人工智能與數(shù)據(jù)分析方法尤為適合應(yīng)對此類問題。人工智能采用深度學(xué)習(xí),可以模仿人腦對信息做出邏輯判斷,評估隱藏在數(shù)據(jù)背后的就業(yè)質(zhì)量[8-9]。文中采用智能信息分析,將采集到的就業(yè)數(shù)據(jù)通過層次分析方法和單層感知器,確定每種信息每次的相應(yīng)權(quán)重,最終產(chǎn)生對就業(yè)信息的質(zhì)量評估。

1 數(shù)據(jù)采集

1.1 第一階段數(shù)據(jù)采集

數(shù)據(jù)采集包括兩個階段,第一階段采集學(xué)生畢業(yè)前的就業(yè)信息,主要內(nèi)容包括6 個大類:學(xué)生個人信息(編碼A)、就業(yè)信息(編碼B)、檔案寄送地址(編碼C)、就業(yè)單位性質(zhì)(編碼E)、工作性質(zhì)(編碼F)、個人滿意度(編碼G1)。每個大類均包含若干小類,除填寫類信息外,選擇類信息均對應(yīng)著具體的數(shù)值。

第一階段的個人滿意度取值范圍為0~100,表示學(xué)生對就業(yè)方向的滿意程度,第一階段的滿意度占比為40%。

1.2 第二階段數(shù)據(jù)采集

考慮到學(xué)生還未參與到實(shí)際工作中,對工作和前景的認(rèn)知尚不充分。在就業(yè)12 個月后再采集一次就業(yè)數(shù)據(jù),作為第一階段數(shù)據(jù)的修正與補(bǔ)充。第二階段的滿意度由學(xué)生了解實(shí)際工作內(nèi)容及行業(yè)知識后打分,具有更高的可信度,取值范圍為0~100,占比為60%。從數(shù)據(jù)量化可以看出,第一階段的數(shù)據(jù)主要用于建立就業(yè)信息資料庫;第二階段的數(shù)據(jù)用于輸入信息分析網(wǎng)絡(luò)訓(xùn)練集,估計(jì)出每一層數(shù)據(jù)的權(quán)重,從而實(shí)現(xiàn)就業(yè)質(zhì)量的評估。

2 數(shù)據(jù)預(yù)處理

實(shí)際采樣到的數(shù)據(jù)無法達(dá)到理想的采樣狀態(tài),不能直接進(jìn)入訓(xùn)練集中參與運(yùn)算。首先對采樣數(shù)據(jù)進(jìn)行預(yù)處理,其過程包括:數(shù)據(jù)提取、相關(guān)性分析與離散化、數(shù)據(jù)清洗、數(shù)據(jù)集成4 個步驟[10-13]。

2.1 信息提取

考慮采集到的原始信息為3 種格式:文本格式、表格格式和圖片格式。對于文本格式,使用Python自然語言處理,提取第一節(jié)中所述的類別信息。信息提取的基本過程,如圖1 所示。

圖1 文本類信息提取

表格類型的原始信息,多來源于院校發(fā)布,已極為接近理想的采樣狀態(tài),直接進(jìn)入下一步信息處理。

對于圖片類型的采集信息,利用Python構(gòu)造信息提取算法,先調(diào)用文字識別軟件,提取圖片中的文本和圖形信息。再進(jìn)一步提取和目標(biāo)相關(guān)的數(shù)據(jù),轉(zhuǎn)換為表格類型的文件。信息提取過程如圖2 所示。

圖2 圖片類信息提取

2.2 相關(guān)性分析和離散化

對于采集所給類別之外的信息,按照相關(guān)性強(qiáng)弱的關(guān)系將其歸納到該系統(tǒng)的類別中,使用互信息來衡量這種相關(guān)性,互信息的計(jì)算公式如下:

互信息可對文本特征值的相關(guān)性進(jìn)行度量,將互信息值在(0.9,1)范圍內(nèi)的兩種數(shù)據(jù)視為一類數(shù)據(jù),進(jìn)行合并。并將其具體值按類別的范圍歸納到相關(guān)的子類[14]。

文本類信息僅保留A、B、C 類,其余數(shù)據(jù)均將舍棄文本,保留具體的數(shù)值。大多數(shù)類型要求采樣到詳細(xì)的數(shù)值,對于單個如“好”、“差”等語言描述類的采樣數(shù)據(jù),根據(jù)對應(yīng)的取值范圍,離散化為相應(yīng)的數(shù)值。

2.3 數(shù)據(jù)清洗

按A~M 的順序,檢查數(shù)據(jù)集中的數(shù)據(jù)。刪除重復(fù)項(xiàng),計(jì)算數(shù)據(jù)集中的各個子類的均值和眾數(shù)。當(dāng)數(shù)據(jù)集的該項(xiàng)缺失在30%以下時,用眾數(shù)補(bǔ)全缺失的數(shù)據(jù);當(dāng)缺失率達(dá)到50%~80%時,用均值補(bǔ)全缺失的數(shù)據(jù);當(dāng)缺失率達(dá)到80%以上時,從訓(xùn)練集中刪除該子類[15]。數(shù)據(jù)的補(bǔ)全操作不包括A、B、C 項(xiàng)。

2.4 數(shù)據(jù)集成

每位學(xué)生的數(shù)據(jù)按照一個標(biāo)準(zhǔn)模板存放,稱為標(biāo)準(zhǔn)數(shù)據(jù)包。以A 項(xiàng)數(shù)據(jù)為每個數(shù)據(jù)包的總類,存放下屬的B~M 類樣本數(shù)據(jù)及每個樣本的值。對每個類別只保存一個子類的數(shù)值,例如H 項(xiàng)僅保存H1~H5 五項(xiàng)數(shù)據(jù)中的一項(xiàng),及其對應(yīng)的具體數(shù)值。

通過數(shù)據(jù)預(yù)處理可以計(jì)算出學(xué)校的就業(yè)率、升學(xué)率信息,計(jì)算公式如下:

3 質(zhì)量評估模型的構(gòu)建

3.1 層次分析法模型

層次分析算法包括3 個層次:最高層、最低層和中間層。最高層為要解決的問題,最低層為決策時的備選方案,中間層為決策要考慮的因素及決策的準(zhǔn)則。基于這三層的質(zhì)量評估模型如圖3 所示。

圖3 層次分析法模型

3.2 構(gòu)造判斷矩陣

使用一致矩陣法構(gòu)造各類對就業(yè)質(zhì)量的判斷矩陣。判斷矩陣的元素由1~9 標(biāo)度法給出,表示兩個準(zhǔn)則層的因素對于就業(yè)質(zhì)量評判的重要性對比,如表1 所示。

表1 1~9標(biāo)度含義

圖4 依據(jù)重要性對比構(gòu)造的判斷矩陣

3.3 類別權(quán)重因子計(jì)算

為了使判斷矩陣是成對比較陣,對判斷矩陣的列求和,并將每個元素歸一化,其公式如下:

計(jì)算所有元素的和,并對每行歸一化。得到各指標(biāo)對目標(biāo)的權(quán)重,計(jì)算公式如下:

考慮到更換工作次數(shù)與就業(yè)質(zhì)量成反向關(guān)系,且更換工作次數(shù)越多,說明就業(yè)的質(zhì)量越低。因此對更換工作類單獨(dú)建立二次項(xiàng)模型,參與后續(xù)計(jì)算。計(jì)算得到的各類別的權(quán)重因子,如表2 所示。

表2 各類別的初始權(quán)重

更換工作類參與質(zhì)量評估的選定為:

3.4 使用BP算法降低誤差

使用單隱藏層前饋網(wǎng)絡(luò)模型來降低質(zhì)量估計(jì)的誤差,神經(jīng)網(wǎng)絡(luò)由兩層神經(jīng)元組成。輸入層接收8 個類別的采樣信息,隱藏層和輸出層為M-P 神經(jīng)元,模型如圖5 所示[16]。

圖5 單隱藏層神經(jīng)網(wǎng)絡(luò)模型

模型的隱藏層和輸出層神經(jīng)元的激活函數(shù)均采用Sigmoid 函數(shù),公式如下:

對于訓(xùn)練集(xk,y),神經(jīng)網(wǎng)絡(luò)的輸出為:

其中,β為輸出層神經(jīng)元的輸入,θ為其閾值。隱藏層神經(jīng)元的輸入為wj,閾值為bj,而β可表示為:

該網(wǎng)絡(luò)共有8×2+8×8+1=81個參數(shù)待定,BP算法在每一輪迭代中對參數(shù)進(jìn)行更新估計(jì),更新公式為:

其中,η用于控制算法中每一次迭代的更新步長,η∈(0,1]。

BP 算法的流程總結(jié)如下:

1)輸入訓(xùn)練集和學(xué)習(xí)率;

2)使用3.3 節(jié)得到的各類權(quán)值初始化w1,w2,…,w8。v1,1,v1,2,…,v8,8均初始化為0.5;

3)根據(jù)式(7)計(jì)算每個訓(xùn)練樣本的神經(jīng)網(wǎng)絡(luò)輸出;

6)根據(jù)式(13)~(16)更新神經(jīng)元的連接權(quán)值及閾值;

7)重復(fù)步驟2)~6),以達(dá)到停止條件。

停止條件為使訓(xùn)練集上的累計(jì)誤差最小,如式(19)所示。

4 模型仿真

文中使用Python 編寫層次分析模型和單層感知器模型,仿真的訓(xùn)練集采用武漢大學(xué)發(fā)布的2019 屆畢業(yè)生就業(yè)質(zhì)量報告,并加以精簡。學(xué)習(xí)率η設(shè)置為0.6,當(dāng)神經(jīng)網(wǎng)絡(luò)輸出達(dá)到穩(wěn)定時,得到神經(jīng)網(wǎng)絡(luò)的各神經(jīng)元連接權(quán)值和閾值。

使用構(gòu)造的質(zhì)量評估模型,評估2019 年某航空職業(yè)院校的3 492 名畢業(yè)生的就業(yè)質(zhì)量。其中未就業(yè)137 人,就業(yè)率為96.08%,將已就業(yè)學(xué)生的數(shù)據(jù)分兩次進(jìn)行采集,經(jīng)過量化和預(yù)處理以后輸入到質(zhì)量評估模型中,得到如圖6 所示的專業(yè)評分?jǐn)?shù)據(jù)結(jié)果。

圖6 基于該模型的某高校專業(yè)評分結(jié)果

5 結(jié)束語

文中結(jié)合機(jī)器學(xué)習(xí)和信息分析技術(shù),為高校的就業(yè)質(zhì)量評估提供一種新的方法。基于文中構(gòu)建的質(zhì)量評估模型得出的專業(yè)評分?jǐn)?shù)據(jù),與實(shí)際高校專業(yè)質(zhì)量情況進(jìn)行比較,結(jié)果基本一致,證明了該模型的可靠性。與傳統(tǒng)一次性信息采集不同的是,文中選擇時間間隔一年的兩次就業(yè)數(shù)據(jù)采集,且就業(yè)質(zhì)量的分析主要取決于第二次數(shù)據(jù)采集。實(shí)際操作過程中,遇到了樣本較少的問題,但隨著高校對畢業(yè)生的就業(yè)信息跟蹤調(diào)查的力度加大,這一問題也將得到解決。

該系統(tǒng)的優(yōu)點(diǎn)在于,采用人工神經(jīng)網(wǎng)絡(luò)可做出接近人類思維的決策,從而降低人力成本、時間成本。且隨著樣本數(shù)據(jù)的增多和訓(xùn)練集的擴(kuò)展,會使評估結(jié)果更加可靠,系統(tǒng)的升級與誤差修正也遠(yuǎn)比傳統(tǒng)質(zhì)量評估系統(tǒng)方便、簡潔。

猜你喜歡
信息質(zhì)量模型
一半模型
“質(zhì)量”知識鞏固
質(zhì)量守恒定律考什么
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
做夢導(dǎo)致睡眠質(zhì)量差嗎
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
質(zhì)量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产精品永久在线| 国产乱肥老妇精品视频| 亚洲一区免费看| 午夜老司机永久免费看片| 在线观看亚洲国产| 91丨九色丨首页在线播放| 国产精品va免费视频| 一区二区日韩国产精久久| 六月婷婷综合| 精品国产中文一级毛片在线看 | 毛片免费高清免费| 欧美精品一区在线看| 国产精品手机在线观看你懂的| 在线播放国产一区| 久草性视频| 91视频青青草| 永久在线播放| 日日碰狠狠添天天爽| 亚洲av成人无码网站在线观看| 黑人巨大精品欧美一区二区区| 999精品在线视频| 色悠久久久久久久综合网伊人| 三级视频中文字幕| 国产一区二区三区精品久久呦| a级毛片一区二区免费视频| 国产精品观看视频免费完整版| 中国一级特黄大片在线观看| 国产欧美视频一区二区三区| 久久青草精品一区二区三区 | 国产成人高清亚洲一区久久| 国产第三区| 精品福利一区二区免费视频| 成人免费午间影院在线观看| 国产内射在线观看| 久久久四虎成人永久免费网站| 国模极品一区二区三区| 国产成人福利在线视老湿机| 色综合五月婷婷| 国产成人无码AV在线播放动漫 | 亚洲国产成人久久精品软件| 亚洲日本中文字幕乱码中文| 国内嫩模私拍精品视频| 精品无码一区二区三区在线视频| 欧美精品色视频| 人妻丰满熟妇av五码区| 亚洲美女久久| 亚洲国产天堂久久综合| 日韩av在线直播| 男女性午夜福利网站| 国产成本人片免费a∨短片| 中文无码精品a∨在线观看| 欧美亚洲一二三区| 中文字幕无码中文字幕有码在线| 婷婷午夜影院| 国产精品私拍在线爆乳| 三级毛片在线播放| 婷婷六月综合网| 色综合狠狠操| 午夜国产精品视频黄| 国产精品三级av及在线观看| 第一区免费在线观看| 制服丝袜国产精品| 国产福利观看| 韩国自拍偷自拍亚洲精品| 亚洲视频四区| 亚洲精品色AV无码看| 久久久黄色片| 国产三级毛片| 日韩精品一区二区三区中文无码| 久草性视频| 国产区精品高清在线观看| 午夜不卡视频| 97se综合| 久久精品丝袜| 制服丝袜无码每日更新| 国产精品极品美女自在线看免费一区二区| 国产精品中文免费福利| 四虎精品免费久久| 国产视频a| 一区二区在线视频免费观看| 久久这里只有精品66| 91视频首页|