999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人群隊列模型的高校畢業生趨向大數據分析方法研究

2021-08-24 08:37:18劉紀敏謝創森文龍日趙慧奇王心剛賈全秋宋明浩
軟件導刊 2021年8期
關鍵詞:實驗分析模型

劉紀敏,謝創森,文龍日,趙慧奇,王心剛,賈全秋,宋明浩

(1.山東科技大學智能裝備學院;2.泰山科技學院 大數據學院,山東泰安 271000;3.吉林省延邊第一中學,吉林 延吉 133000)

0 引言

根據教育部發布的2019 年全國教育事業發展統計公報,2019 年全國共有各級各類學校53.01 萬所,比上年增加1.13 萬所,增長2.17%;各級各類學歷教育在校生2.82 億人,比上年增加660.62 萬人,增長2.40%[1]。中國高校畢業生數量快速增長,不僅將影響人力資源供需結構,而且因其對高校教學輔助資源的需求迅速增加,為高校帶來了沉重壓力。近年來,大部分高校畢業生選擇通過研究生考試獲得更多深造機會,而選擇深造和選擇就業的畢業生對教學輔助資源的需求是截然不同的。從高校的角度來看,有必要正確理解在校生需求,并有效應對畢業生就業趨向的變化。根據畢業生就業趨向分析結果,合理分配現有教學輔助資源以滿足在校生需求對高校的長遠發展具有重要意義[2]。

在教學輔助資源分配相關研究中,Ho 等[3]提出利用綜合多準則決策分配資源以提高高校績效的方案,馬瑞華[4]提出地方綜合性大學分配學術資源的最佳策略,Zhang[5]提出利用誤差反向傳播(Back Propagation,BP)神經網絡(Arti?ficial Neural Networks,ANN)模型解決高校思想政治教育資源的配置問題,還有一些專家利用數理統計和問卷調查方法分析畢業生就業趨勢和高校教學輔助資源的合理分配問題[6-7]。雖然很多專家一直利用不同分析方法研究有效的教學輔助資源分配方案,但其所利用的分析方法工作量大,且敏感性與準確性不佳。

自1939 年Forst[8]提出從年齡、時期和隊列3 個維度研究結核病數據分析方法后,人群隊列(Age Period Cohort,APC)分析模型已廣泛應用于各領域的數據分析。如Pes等[9]利用人群隊列模型分析社會經濟轉型后人群患癌癥年齡段的變化趨勢;Stanesby 等[10]利用人群隊列模型調查分析1950-1980 年澳大利亞婦女的飲酒趨勢;石超等[11]利用分層人群隊列隨機效應模型(Hierarchical APC-Cross Clas?sified Random Effects Model,HAPC-CCREM)分析中國人對生活的滿意度;Wong 等[12]利用人群隊列模型分析香港年青一代對政府政策的滿意度。研究結果表明,人群隊列模型非常適合基于大數據的預測分析。將人群隊列模型應用于人群大數據分析有很多優點,但是年齡、時期和隊列三要素存在完全線性關系,即時期等于年齡與隊列的和,因此模型矩陣是非滿秩奇異矩陣,而且是不可逆矩陣,所以存在不可識別的問題。針對該問題,不少專家提出改進的人群隊列模型[13-14]。

本文收集了山東科技大學近10 年的畢業生信息,并利用人群隊列模型進行畢業趨向大數據分析。在研究初期,通過數據分析人群隊列模型中的三大要素,即年齡、時期和隊列,在時間跨度不大的前提下,實驗結果并不理想。為提高實驗結果的準確性,本文不僅對收集到的畢業生數據進行特征分析,而且同時進行了畢業去向相關問題的線上問卷調查。通過調研與分析發現,即使時間跨度不大的因子也會對結果造成較大影響。例如,年齡比畢業生平均年齡大的學生更傾向于選擇就業,還有國家政策的改變與性別對實驗結果也有一定影響。綜合這些影響因素和研究目的,最后提出改進的人群隊列模型和人群隊列大數據分析模型。最終實驗結果表明,本文提出的模型適用于高校畢業生畢業趨向分析,可為合理分配教學輔助資源提供參考依據。

1 人群隊列模型

人群隊列模型是人群隊列調查的基本模型,包括年齡、時期和隊列3 個因素。由于這3 個因素之間存在完全線性關系,所以利用傳統回歸方法無法獲得唯一的估計值。為解決該問題,需要改進人群隊列模型特征參數選取方法以及使用內在估計方法計算參數,并使用元數據映射方法導入變換的數據。以下首先提出傳統人群隊列模型存在的問題,然后定義畢業趨向影響因素,最后定義分析模型影響因素。

1.1 傳統人群隊列模型

在泊松回歸(Poisson Regression,PR)模型基礎上,人群隊列模型如今已廣泛應用于數據調查領域[15-16]。通過前期研究發現,傳統人群隊列模型非常適用于高校畢業生就業趨向大數據分析。

傳統人群隊列模型基本公式如下:

式中,E(rijk)是基于年齡(i)、時期(j)和隊列(k)的疾病發病可能性期望值,θijk是第j個時期觀察到的第i個年齡組疾病發病可能性期望值,Nijk是對應年齡、時期和隊列的人數,μ是年齡、時期、隊列作用的趨勢參照值,αi是第i個年齡組群的影響(i=1,2,3,…,i),βj是第j個時期組群的影響(j=1,2,3,…,j),γk是與第i個年齡組和第j個時期組參數相關第k個隊列組的影響,εijk是隨機誤差。

在人群隊列模型中,傳統最小二乘估計方法b=(XT X)-1XTY存在一個“無法估計”的問題。由于年齡、時間和隊列之間存在完全線性關系,即時間值等于年齡加上隊列,該矩陣是一個非滿秩奇異矩陣且是不可逆的,因此b沒有唯一的結果。此外,傳統人群隊列模型以5 年為間隔對樣本數據進行測試,雖然實驗結果可反映大概的畢業趨勢,但不能代表5 年時間間隔之間的變化,因而缺乏對測試的敏感性。在傳統的人群隊列模型中,只分析年齡、時期和隊列因素的影響,如果影響因素更多,將降低實驗結果的準確性。因此,本文提出改進的人群隊列模型以解決這些問題。

1.2 畢業趨向影響因素

本文利用從山東科技大學就業指導中心收集到的2011-2018 年畢業生畢業趨向信息建立樣本數據模型,并定義了高校畢業生畢業趨向影響因素,如表1 所示。

Table 1 Definition of influencing factors of graduation trend表1 畢業趨向影響因素定義

在影響因素中,“深造”表示申報研究生考試或留學讀研的畢業生,“就業”表示參加工作或參加公務員考試的畢業生,“其它”表示參軍或待業的畢業生。另外也考慮了可能影響實驗結果的因素,如性別、國家政策等。

雖然研究中采用的樣本數據可滿足Li 等[17]提出的人群隊列模型對樣本數據的要求,但是年齡較大的高校畢業生更傾向于選擇就業的趨勢等影響實驗結果的情況也不能忽略。為更明確地對畢業趨向進行可視化展示,將樣本數據中的年齡替換成以5 年為間隔的年齡段,通過對年齡的擴展以便于開展畢業趨向分析實驗,同時可避免出現實驗結果不明確的情況。

1.3 分析模型影響因素

畢業生畢業趨向分析結果表明,年齡對畢業趨向的變化影響最大,其原因可能是不同年齡在生理上的需求以及對社會地位的重視程度不同;時期通常反映在縱向分析中,并且影響所有年齡段;隊列表示相同事件。

(1)年齡因素。從樣本原始數據分析中發現,畢業生選擇工作而不是接受進一步的教育(p<0.01),并且這種狀況影響了畢業生深造趨勢。

在過去的調查中,通常將年齡以5 年為間隔劃分成一個隊列組,用來分析年齡對畢業趨向的影響[18]。通過實驗,以5 年為基礎的年齡劃分弱化了年齡差距對結果的影響,例如同一年畢業生在年齡相差為兩歲的情況下往往有著截然不同的選擇,如某年實施的某種政策極大地增加了研究生數量等,從而大大降低了結果的準確性。為了合理使用樣本數據,將年齡映射到5 年的范圍空間中,并將屬性劃分為以下人群隊列,如表2 所示。

Table 2 The range of actual age in the experiment表2 實際年齡在實驗中的對應年齡段

同時,還需要更改相應出生隊列,以保持年齡、時期和出生隊列3 個因素之間原本的線性關系。確定年齡因子的值,并與表達式中的原始數據加以區別。

(2)時期因素。在提出的人群隊列模型中,周期因子的效果尤為明顯。每一年政策和改革等不穩定因素都會對結果產生較大影響。例如,某政策在某年的實施極大地增加了研究生數量,因此以5 年為基礎的時期隊列劃分方式會嚴重影響結果的準確度和靈敏度。以5 年為間隔進行時期劃分,如表3 所示,但這5 年間隔僅用于實驗與結果分析,對結果沒有影響。

Table 3 The corresponding period of actual period in the experiment表3 實際時期在實驗中的對應時期

(3)隊列因素。為了提高結果的準確度,將年齡和時期因素分別映射到5 年間隔中。由于同類群組值的線性關系等于周期減去年齡,因此同類群組值已更改。在先前的數據映射之后,每個更改的隊列對應于表4 中給出的一年的原始數據。

Table 4 The corresponding cohort of actual cohort in the experiment表4 實際隊列在實驗中的對應隊列

在前瞻性隊列分析中,將映射到5 年區間內的對應關系繼續應用于新模型中,以避免因數據不統一導致的意外錯誤。

2 人群隊列大數據分析

為解決傳統人群隊列模型“無法識別”的問題,采用內源估計法(Intrinsic Estimator,IE)對參數進行估計。IE 方法是基于Fu[19]的估計函數方法提出的,Yang 等[20]將IE 方法與傳統的廣義線性方法進行比較,發現其輸出結果相似。IE 方法具有無需假定先驗信息的優點,但由于其參數存在難以解釋的問題,因此尚未得到廣泛應用。

為解決傳統人群隊列模型“低靈敏度”的問題,研究者們又提出一種數據映射方法,將原來的1 年數據擴展為5年數據,從而確保輸入數據的正確性,并分析隨機年份中可能發生的情況(可保證數據符合模型標準,并分析任意一年可能發生的變化)。人群隊列大數據分析模型利用Stata15 和Python 進行實驗,并根據實驗結果提出畢業趨向分析方法和教學輔助資源分配方案。

2.1 畢業趨向分析方法

基于人群隊列大數據分析模型的不同年齡畢業生畢業趨向分析結果如圖1 所示。

Fig.1 Analysis results of graduation trend of graduates of different ages圖1 不同年齡畢業生畢業趨向分析結果

在分析結果中,各年齡階段畢業生選擇“其它”(在表1中變量值定義為0)選項的變化不大且占比較低,選擇“深造”(在表1 中變量值定義為1)選項的大多是年齡較小的畢業生,且畢業生樣本數量不同會影響畢業趨向分析結果,選擇“就業”(在表1 中變量值定義為2)選項的大多是年齡較大的畢業生。

基于人群隊列大數據分析模型的畢業生深造趨勢分析結果如圖2 所示。

Fig.2 Analysis results of graduates'further study trend圖2 畢業生深造趨勢分析結果

在就業藍皮書中提到,深造已成為本科畢業生的熱門選擇之一。深造分為全日制和非全日制,自2017 年起,政府部門表示兩種學歷在中國具有相同的法律地位。因此,從2017 年開始,越來越多高校畢業生選擇深造。但由于競爭比以前更激烈,2018 年選擇深造的人數又呈下降趨勢。

基于人群隊列大數據分析模型的畢業生就業趨勢分析結果如圖3 所示。

Fig.3 Analysis results of graduates'employment trend圖3 畢業生就業趨勢分析結果

2017 年考研政策的修改導致一部分畢業生改變了原有想法而選擇繼續深造,因此2017 年選擇就業的畢業生數量呈明顯下降趨勢,但隨著競爭的加劇,2018 年就業人數有所回升,但占比仍低于往年。

基于人群隊列大數據分析模型的不同性別畢業生畢業趨向分析結果如圖4 所示。

Fig.4 Analysis results of graduation trend of graduates of different genders圖4 不同性別畢業生畢業趨向分析結果

分析結果顯示,女生相比男生更趨向于深造,但大多數畢業生仍然選擇了就業。

2.2 改進的人群隊列模型

使用IE 參數估計方法可得到影響因子隊列,但不能將政策的影響與具體時期分離開。為定義政策因素對結果的獨立影響,基于式(1)提出政策因素計算方法,如式(2)所示。

首先輸入不同時期的樣本數據,然后根據人群隊列模型計算3 年的平均值,最后從偏差結果中得出政策因素的值。為了表示數據映射,將式(1)修改為式(3)。使用變量A、B、C 分別代表年齡、時期、隊列實際值與映射值之間的對應關系。

為進行前瞻性的隊列分析,將每一年的政策因素和性別因素加入式(3)中,提出最終模型,如式(4)所示。

2.3 基于改進人群隊列模型的畢業趨向分析

基于改進人群隊列模型的畢業趨向分析實驗結果如表5 所示。

Table 5 Results of graduation trend analysis based on improved cohort model表5 基于改進人群隊列模型的畢業趨向分析結果

注:*** p <0.000 1,** p <0.001,* p <0.05;(OIM)Std.Err:Coef 系數方差平方根,Coef 的計算基于最大似然估計中的觀測信息矩陣

從分析結果可以看出,年齡因素對結果會產生不同影響。同時,即使是較小的年齡差也會對結果產生較大影響。正向的Coef 表示畢業生們更傾向于選擇“就業”和“其它”,負向的Coef 表示畢業生們更傾向于選擇“深造”。

從整體上看,隨著年齡的增加,Coef 值呈上升趨勢,意味著年齡大的畢業生更傾向于選擇“就業”或“其它”而不是繼續深造,但在Age_30 中發生了較大變化,主要因為在中國極少有年齡為25 歲及以上的畢業生,樣本數量的缺少導致了結果的偏差。

從Period_2050 所對應的Coef 中可以發現,Coef 的變化相對較為隨機且難以預測,表明包括政策因素在內的眾多因素都會對Coef 系數產生影響。因此,在前瞻性隊列分析中,將政策因素從時期隊列因素中分離出來會極大地提高預測的準確性,但其它影響因素還需要繼續調查。

從出生隊列的Coef 變化來看,數據結果呈現先增加、后減少的趨勢,其清晰反映了近幾年中國畢業生選擇趨勢的變化,而Birth_1990 出現了與規律相悖的變化,也是由于樣本數量不足,導致結果出現了偏差。

但本文提出的模型中將結局變量定義如下:“深造”為0,“就業”為1,“其它”為2。所以在相同情況下,結果可能會產生較大偏差。

在改進的人群隊列模型實驗中,年齡對實驗結果的影響如圖5 所示。由圖可見,隨著年齡的增長,Coe(f系數)整體呈上升趨勢,但在25 歲后逐步降低,表示畢業生隨著年齡的增長更傾向于就業而不是深造,而25 歲所呈現的下降趨勢是受到樣本數量限制而導致的結果偏差。

Fig.5 Effect of age on the experimental results圖5 年齡對實驗結果的影響

在改進的人群隊列模型實驗中,時期對實驗結果的影響如圖6 所示。時期隊列因素主要受重大事件或政策的影響,此外也與該年的教學氛圍及學生質量有關。2017 年,由于國家有關研究生入學考試政策的出臺,大量畢業生選擇繼續深造。但隨著競爭的愈加激烈,導致學生對深造的熱情下降,因此2018 年選擇深造的人數又呈下降趨勢。

Fig.6 Effect of the period on experimental results圖6 時期對實驗結果的影響

在改進的人群隊列模型實驗中,出生隊列對實驗結果的影響如圖7 所示。出生隊列代表一個經歷了相同社會變化的群體,可反映出年齡與時間對結果造成的綜合影響。由于樣本數據中的雙極數據(例如1986 和1997 出生隊列)較少,因此結果可能存在偏差,但整體呈下降趨勢,表示越來越多畢業生選擇繼續深造,中國的教育水平正在發生變化。

Fig.7 Effect of birth cohort on experimental results圖7 出生隊列對實驗結果的影響

2.4 教學輔助資源分配方法

畢業趨向可利用年齡、時期、隊列進行分析。根據基于人群隊列模型的前瞻性畢業趨向大數據分析實驗結果,不僅可更加合理地制定教學輔助資源分配方案,而且可根據畢業趨向提前為在校生分配不同的教學輔助資源。例如,當“深造”呈上升趨勢時,可合理分配考研科目相關的教學輔助資源;當“就業”呈上升趨勢時,應增設相關培訓機構或開設更多實踐類課程;對于選擇“其它”的畢業生,可聯系相關部門進行針對性的教育培訓。人群隊列模型可幫助高校更加精準地預測在校生畢業趨向,從而提前合理調配教學輔助資源。

3 實驗結果分析

Ho 等[3]使用層次分析法(Analytic Hierarchy Process,AHP)確定擬議項目相對于大學目標的優先級或相對重要性,并使用目標計劃(Goal Programming,GP)模型選擇最佳項目集。馬瑞華等[4]采用文獻法、調查法和案例分析法相結合的理論與研究方法,提出一種用于教學輔助資源分配的新方法。在提出的人群隊列模型中,通過將數據映射到人群隊列模型的5 年區間中,以提高影響因子對結果的敏感性。因為模型針對的是學生群體,所以通過畢業趨向大數據分析可對教學輔助資源進行合理分配,以避免資源浪費。

本文提出的人群隊列模型與GP 模型以及MA(馬瑞華)模型的性能比較結果如表6 所示。

Table 6 Performance comparison of graduation trend analysis models表6 畢業趨勢分析模型性能比較

分析結果顯示,本文提出的人群隊列模型相比其它模型,在預測難度、測試時間及系統可移植性等方面具有明顯改進。

4 結語

隨著高校畢業生數量的迅速增加,傳統教學輔助資源已無法滿足在校生需求。為解決該問題,本文對教學輔助資源分配相關方法和模型進行了調查,并提出畢業生畢業趨勢分析方法及改進的人群隊列模型。為提高實驗結果的準確性和預測結果的適應性,將更多影響因素加入到改進的人群隊列模型中。結果顯示,本文提出的改進的人群隊列模型不僅可清晰地顯示畢業趨向,而且可幫助高校更合理地制訂教學輔助資源分配策略。隨著研究的進一步深入,未來將定義更多影響因素,以期獲得更好的預測結果。

猜你喜歡
實驗分析模型
一半模型
記一次有趣的實驗
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
做個怪怪長實驗
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
主站蜘蛛池模板: 99性视频| 青青青国产免费线在| 国产精品高清国产三级囯产AV| 久久鸭综合久久国产| 日韩国产黄色网站| 狼友视频一区二区三区| 国产va在线观看免费| 国产精品色婷婷在线观看| 免费一级无码在线网站 | 国产原创演绎剧情有字幕的| 国产成人调教在线视频| 亚洲精品制服丝袜二区| 激情国产精品一区| 国产成人精品亚洲日本对白优播| 国产精品天干天干在线观看| 国产精品自拍露脸视频| 18禁影院亚洲专区| 久久久久中文字幕精品视频| a级毛片毛片免费观看久潮| 91成人在线免费视频| 中文字幕在线一区二区在线| 亚洲综合第一区| 日韩A级毛片一区二区三区| 亚洲日韩精品伊甸| 日韩在线网址| 自拍偷拍欧美| 在线人成精品免费视频| 伊人久久婷婷五月综合97色| 无码中文字幕精品推荐| 亚洲欧洲日韩久久狠狠爱| 九九九久久国产精品| 香蕉在线视频网站| 一本一道波多野结衣一区二区 | 九一九色国产| 色欲国产一区二区日韩欧美| 91免费在线看| 色婷婷成人| 亚洲一区色| 9999在线视频| 亚洲浓毛av| 国产精品第页| 成人中文字幕在线| 伊人久久综在合线亚洲91| 久久婷婷色综合老司机| 欧美精品高清| 91福利一区二区三区| 午夜免费小视频| 欧美一区国产| 国产精品亚洲精品爽爽| 国产最新无码专区在线| 国产91成人| 国产精品一区二区国产主播| 国产性猛交XXXX免费看| 亚洲人成日本在线观看| 亚洲天堂福利视频| 国产91丝袜在线播放动漫 | 中文字幕有乳无码| 亚洲国产日韩在线观看| 一级毛片视频免费| 国产人人射| 91激情视频| 欧美国产日韩另类| 国产精品性| 91精品国产一区自在线拍| 狂欢视频在线观看不卡| 亚洲视频免费在线看| 亚洲午夜久久久精品电影院| 国产玖玖玖精品视频| 国产欧美日韩视频怡春院| 国产裸舞福利在线视频合集| 亚洲第一视频网| 国产簧片免费在线播放| 成人午夜视频免费看欧美| 8090成人午夜精品| 九色综合伊人久久富二代| 波多野结衣爽到高潮漏水大喷| 欧美精品v| 玖玖免费视频在线观看| 无码免费视频| 亚洲经典在线中文字幕 | 无码精品福利一区二区三区| 亚洲自偷自拍另类小说|