999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征選擇的學位預警方法研究

2023-09-14 09:51:28李勁松潘子堯姚明海
計算機技術與發展 2023年9期
關鍵詞:實驗模型學生

王 娜,李勁松,潘子堯,姚明海*

(1.渤海大學 信息科學與技術學院,遼寧 錦州 121013;2.渤海大學 數學科學學院,遼寧 錦州 121013)

0 引 言

2022年10月16日,習近平總書記在中國共產黨第二十次全國代表大會上的報告中明確提出“高質量發展是全面建設社會主義現代化國家的首要任務”[1]。推進“高質量發展”離不開高質量的人才隊伍,所以提升教學質量具有重大的現實意義[2]。早在2019年中共中央、國務院印發的《中國教育現代化2035》中就明確指出,要充分“利用現代技術加快推動人才培養模式改革,實現規?;逃c個性化培養的有機結合”著力提高教育質量?;跀祿诰蛳嚓P理論的教育數據挖掘(Educational Data Mining,EDM)可以從各種教育數據中挖掘數據背后的教育規律,并可以為提高教育質量提供數據支撐,已經成為當前教育工作者們關注的焦點[3-4]。成績預測或成績預警作為EDM的熱門研究領域之一,通過構建有效的預測或預警模型預測其學習成績,發現成績可能不理想甚至有輟學風險的學生,為教師提供精確的教學指導,為學生改變學習方式提供重要的參考依據,對提高教學質量具有重要的應用價值和現實意義[5-6]。

近年來,國內外學者在成績預測和成績預警方面開展了相關研究工作。劉曉雲等人利用多元線性回歸方法構建預測高校學生畢業成績的模型[7]。Chen等人基于梯度提升決策樹算法、人工神經網絡算法和K-means算法,構建了一個基于學生行為特征的分析預測平臺[8]。雖然國內外學者已經對成績預測展開了相關研究,但是隨著大數據時代的到來,與學生成績相關如學生行為記錄、學生消費習慣等教育數據變得越來越龐大。因為課程相關性,數據存在冗余信息等原因會影響基于這些數據構建的成績預測或預警模型的性能。因此,有些學者開始嘗試利用特征選擇的方法對數據進行篩選。Gitinabard等人采用特征選擇和邏輯回歸的方法來預測學生是否退課[9]。Thaher等人利用改進的鯨魚優化算法從學生成績中選擇出有助于構建精準預測模型的特征[10]。雖然國內外學者已經開展了相關的研究工作,但如何構建更為精準的成績預測或預警模型仍是關注重點。

眾所周知,學位能否順利獲得深刻地影響著學生的未來發展[11]。如果能在大學初期就可以向獲得學位存在風險的同學發出預警,就可以督促學生及時改進學習方式,保證其順利畢業。因此,提出基于特征選擇方法構建更為精準的學位預警模型。

1 相關理論

特征選擇是為了構建更精準的學習模型而從原始特征中選擇出一個特征子集的理論方法。在特征選擇的過程中可以有效地去除噪聲、冗余等干擾信息,高效地進行維數約簡,進而提高學習性能,增加對學習結果的理解[12]。

1.1 Fisher特征選擇

基于Fisher得分的特征選擇方法是依據Fisher得分來尋找一組具有最好判別能力的特征子集的有監督特征選擇方法[13]。其定義如公式(1)所示:

(1)

基于Fisher的特征選擇過程描述如下:

輸入:訓練樣本集。其中,X表示n個具有d維特征的樣本;Q是全體特征集合。

輸出:選擇出的特征集D。

Fisher特征選擇方法通過計算原始特征的重要性得分來進行特征選擇,方法簡單、直觀。因此,為了消除原始課程數據間的冗余信息,采用Fisher特征選擇方法來為構建的學位預警模型篩選特征信息。

1.2 支持向量機

基于結構風險最小化理論的支持向量機(Support Vector Machine,SVM)算法[14]是一個高效的有監督分類算法。其核心思想是在特征空間中建構最優分割超平面,使得分類器能夠得到全局最優解。對于線性不可分的問題,SVM使用各種核函數將低維空間線性不可分的數據映射到高維特征空間,達到線性可分的結果。二維數據的SVM分類效果如圖1所示,圖中最優超平面的方程為:

圖1 二維數據的SVM分類示意圖

f(x)=w·x+b=0

(2)

其中,樣本(xi,yi),xi∈Rd,yi∈{+1, -1},i=1,2,…,N,w是權重向量,b為尺度因子,權重向量和尺度因子決定了超平面的位置。

因SVM采用結構風險最小準則來訓練分類器,能較好地處理樣本特征非線性、維數高等問題,使其具有精準的分類能力[15]。因此,提出基于SVM構建學位預警模型。

2 基于Fisher特征選擇的學位預警模型

提出的基于Fisher特征選擇的學位預警模型主要包括數據預處理、模型構建和學分預警三個部分,其算法流程如圖2所示??紤]到學生成績樣本的特殊性,在數據預處理階段要確保樣本數據的規范化。要對學生成績進行篩選,例如,刪除選擇人數較少的課程數據,刪除選課較少的學生(如退學、休學等)成績數據。此外,還要根據公式(3)對數據進行歸一化處理。

(3)

在模型構建階段首先利用Fisher算法進行特征選擇;然后利用選擇后的特征構建學位預警模型。在學位預警階段,首先將測試樣本依據特征選擇規則得到新的測試樣本;然后根據構建好的預警模型判斷是否對學生進行學位預警。

3 實 驗

該文利用某高校2018級軟件工程專業、化學專業、會計學專業、漢語言文學專業學生的真實成績構建學位預警模型,通過統計大量的隨機實驗結果來驗證用特征選擇的方法構建預警模型的可行性和有效性。

3.1 實驗數據

實驗數據為某高校開設的包括工學類、理學類、管理學類、文學類在內的軟件工程專業、化學專業、會計學專業、漢語言文學專業學生在1、2、3學期所獲得的非學位課課程成績和最終的平均學位績點成績,并分別對各專業學生成績進行如下處理:

(1)刪除選課人數過少(專業人數的10%)的課程;

(2)將格式為“優秀”“良好”“中等”“及格”和“不及格”的等級成績替換為“95”“85”“75”“65”和“55”百分制成績;

(3)為了避免不同課程成績間數量級對實驗結果的影響,將學生分數成績歸一化到[0,1]區間內。

最終,利用處理后的1、2、3學期非學位課課程成績和學位績點成績構建各專業的學位預警模型,數據情況如表1所示。

表1 數據情況匯總

3.2 評價指標

該文選用了有效、直觀的錯誤率(ER)作為評價指標,其計算公式如公式(4)所示。此外,由于需要給出預警的樣本僅占總樣本的5%,使得正負樣本間存在嚴重的不平衡問題。因此,該文還用查全率(Recall)、查準率(Precision)、錯誤拒絕率(FRR)和錯誤接受率(FAR)共同作為評價指標。其中,錯誤率值越低說明預警模型的預警準確率越高;召回率又被稱為查全率,表示需要給出預警的樣本被正確給出預警的概率;查準率又被稱為精準率,表示被預警模型給出預警的樣本中真正需要做出預警的概率。錯誤拒絕率預警模型判斷無需做出預警的樣本中實際應該給出預警的概率;錯誤接受率表示無需給出預警的而被錯誤做出預警的概率。它們的計算公式分別為:

(4)

(5)

(6)

(7)

(8)

其中,TP和FN分別表示預警模型對應該給出學位預警的樣本正確做出預警(正確預測)的樣本數量和沒有做出預警(錯誤預測)的樣本數量;FP和TN分別表示預警模型對無需給出學位預警的樣本錯誤給出預警(錯誤預測)的樣本數量和沒有做出預警(正確預測)的樣本數量;TP+FN即正樣本的數量,TN+FP即負樣本的數量。

3.3 實驗結果與分析

為了確保實驗結果的穩定性和證明算法的有效性,分別對每個專業進行6組實驗。實驗1到實驗6分別利用不同的訓練樣本數量來構建預警模型,6組實驗中分別隨機選擇總樣本的40%、50%、60%、70%、80%和90%作為訓練集,其余樣本數據作為測試集。每組實驗都重復100次隨機選樣本,并將多次實驗結果的平均值作為最終的統計結果。實驗結果如表2至表6所示。

表2 各專業學位預警錯誤率結果統計

從表2中可以看出,隨著訓練樣本的增加,各專業構建的學位預警模型的錯誤率普遍呈現下降趨勢。其中,基于特征選擇的預警模型明顯具有更低的預警誤差和更高的穩定性。

從表3到表6中也同樣可以發現,各專業的成績數據經過特征選擇后構建的學位預警模型其查全率和查準率都高于沒有進行特征選擇的模型;而基于特征選擇構建的學位預警模型的錯誤接受率和錯誤拒絕率則明顯低于沒有進行特征選擇的模型。

表3 各專業學位預警查全率結果統計

表4 各專業學位預警查準率結果統計

表5 各專業學位預警錯誤拒絕率結果統計

表6 各專業學位預警錯誤接收率結果統計

綜上所述,從表2至表6中的各項指標的統計結果顯示,基于Fisher特征選擇的學位預警模型具有更低的錯誤率和更高的穩定性。表明基于特征選擇的方法可以選擇出更有效的課程來構建更為精準的學位預警模型,其構建模型給出的預警結果更為可信,更有助于學生和教師及時地調整教學方式。

4 結束語

高校擴招政策的連年實施在為提升國內人口素質的同時,也對現有高校教學管理模型帶來了更高的挑戰。探索學生學習的一般規律,挖掘和分析學生特征和成績的關系,構建更為精準的學位預警模型可以更好地提高教學質量,對完善高校學位預警機制有重要的應用價值和現實意義,因此提出基于Fisher特征選擇的學位預警模型方法。實驗結果表明,構建的學位預警模型能更好地從現有成績數據中挖掘有效信息,使預警模型具有更低的預警誤差和更高的穩定性,能夠更好地完成學位預警工作。但成績預測或預警工作不僅會受到前期成績的單一影響,還可能受到學習背景、行為習慣等因素的影響。因此,成績預測、預警等工作仍是一個較為復雜的課題,在下一步的研究中將會利用特征選擇方法充分挖掘學習背景、學習環境、行為習慣等更多因素,以構建更加精準有效的成績預測或預警模型。

猜你喜歡
實驗模型學生
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
做個怪怪長實驗
趕不走的學生
學生寫話
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 亚洲精品午夜无码电影网| 日本欧美视频在线观看| 永久免费av网站可以直接看的 | 老汉色老汉首页a亚洲| 亚洲人成色77777在线观看| 久久久91人妻无码精品蜜桃HD| 国产精品第一区| 人妻无码中文字幕一区二区三区| 国产精品亚洲精品爽爽| 国产综合精品日本亚洲777| 精品国产电影久久九九| 国产精品分类视频分类一区| 国产精品福利社| 国产精品va免费视频| 国产极品美女在线观看| 都市激情亚洲综合久久| 亚洲天堂视频在线观看| 国产综合另类小说色区色噜噜| 最新国产你懂的在线网址| 亚洲精品男人天堂| 精品人妻AV区| 国产青榴视频在线观看网站| 国产高清在线观看91精品| 色爽网免费视频| 国产99视频精品免费视频7| 国产视频欧美| 国产原创自拍不卡第一页| 2048国产精品原创综合在线| 亚洲视频一区| 极品国产在线| 国产精品一区不卡| 波多野结衣在线se| 综合色在线| 亚洲综合色区在线播放2019| 污视频日本| 亚洲国产成人久久77| 国产精品大尺度尺度视频| 国内精品91| 国产AV毛片| 97se亚洲综合| 五月婷婷丁香色| 一级毛片在线播放免费| 免费无码在线观看| 亚洲电影天堂在线国语对白| 台湾AV国片精品女同性| 人妻一区二区三区无码精品一区| 欧美国产另类| a级毛片一区二区免费视频| 日韩免费视频播播| 人妖无码第一页| 国产精品视频第一专区| 亚洲婷婷丁香| 91免费精品国偷自产在线在线| 亚洲欧美色中文字幕| 国产小视频在线高清播放| 国产尤物jk自慰制服喷水| 亚洲国产系列| AV在线麻免费观看网站| 欧美成一级| 精品成人一区二区三区电影 | 国产成人精品男人的天堂| 40岁成熟女人牲交片免费| 伊人色在线视频| 无码不卡的中文字幕视频| 天堂久久久久久中文字幕| 无码一区二区三区视频在线播放| 亚洲中文字幕手机在线第一页| 91久久偷偷做嫩草影院精品| 91免费观看视频| 天堂网亚洲系列亚洲系列| 日韩成人午夜| 亚洲精品无码在线播放网站| 尤物在线观看乱码| 亚洲欧美精品一中文字幕| 欧美国产日产一区二区| 国产成人一区在线播放| 97se亚洲综合不卡| 国产丝袜啪啪| 精品伊人久久大香线蕉网站| 免费a级毛片18以上观看精品| 欧美α片免费观看| 亚洲精品视频免费观看|