999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生成績預測模型的對比分析

2020-03-30 03:19:04王欣欣湯軍
電腦知識與技術 2020年1期

王欣欣 湯軍

摘要:目的:旨在對比學生成績預測模型。方法:共獲取605條數據,共32個解釋變量,通過特征選擇剩余23個自變量,建立訓練集和測試集,以G3為目標變量,分別構建SVM模型、神經網絡模型和逐步回歸模型,比較這三個模型的預測結果。結果:采用逐步回歸模型預測學生成績在最小誤差、最大誤差、平均誤差、平均絕對誤差和標準差方面均低于神經網絡模型和SVM模型,在預測值和實際值的線性相關系數方面均高于神經網絡模型和SVM模型。結論:在預測學生成績上,逐步回歸模型優于神經網絡模型和SVM模型。

關鍵詞:學生成績預測模型;神經網絡模型;逐步回歸模型;SVM模型;線性相關系數

中圖分類號:TP181 文獻標識碼:A

文章編號:1009-3044(2020)01-0199-04

1概述

教育興則國家興,教育強則國家強。如何實現從我國是人口大國的現狀走向人口強國的轉變,實現中華民族偉大復興,教育有著不可忽視的地位和作用。近年來,隨著時代的進步和國家的發展,教育方式也在不斷變化?,F如今,通過對影響學生成績各種因素的分析,實現對學生成績的預測,從而有針對性的提高學生學習成績是我國教育的主要目標之一。

本文通過獲取有關學生葡萄牙語成績和與成績相關的各方面數據,運用SPSS Statistics 20.0和SPSS Modeler 18.0軟件,分別采用神經網絡模型、SVM模型、逐步回歸模型構建數據挖掘模型進行分析對比,構建合適的預測模型。通過對獲取數據的分析,實現了對學生成績預測的模型構建,對現代教育的發展起到了一定的積極作用。

2數據準備與模型假設

2.1數據準備

本文所使用的兩個數據集是來自葡萄牙Minho大學的Pau-loCortez通過對Gabriel Pereira中學和Mousinho da Silveira中學的學生發放問卷調查來收集關于學生葡萄牙語成績數據,現數據公布于kaggle網站(https://www.kaggle.com/uciml/student-alco-hd-consumptionl。數據中包含schod、sex、Medu、Fedu、Mjob、Fjob等與學生葡萄牙語期末成績相關的32個影響因素,數據集中包含649個樣本數據。

2.2模型假設

通常,在建立模型前,需要先對模型提出假設:

(1)假設學生的學習水平可以在一定程度上可以通過歷史學習水平來反映,通過學生的以往成績可以一定程度的預測未來成績。

(2)假設影響學生成績的各個因素都是穩定的,不會因為突發情況使學生成績大起大落。

3數據預處理

3.1數據描述

原始數據中共包含33個變量,其中G3為目標變量,其余32個變量為解釋變量,得到的模型寬度如表1所示。

3.2變量賦值

由表1可以看出,與目標變量G3相關的32個預測變量中,有些變量類型是字符串類型,比如school、Mjob、fjob、Pstatus等變量。所以需要對這些變量進行類型轉換和賦值。本文運用SPSS Statistics 20.0軟件對字符串類型變量進行變量轉換和賦值,具體賦值結果如表2所示。

3.3無用特征剔除

由表1可知,本文中的輸入變量共32個,但并不是每個變量都對預測目標變量G3有用,例如age變量系數低于閾值、paid單個類別過大,所以需要將這些變量進行剔除。本文運用SPSS Modeler 18.0軟件,采用“特征選擇”節點中的Pearson相關系數為判定準則,剔除輸入變量相對于目標變量的重要性小于0.95的特征。經過特征選擇后,由原始數據的32個輸入變量剩余23個。最終的特征選擇結果如表3所示。

4模型比較

本文對數據進行預處理之后,采用SPSS Modeler 18.0進行建模,將數據按70:30的比例分為訓練集和測試集,先分別將神經網絡模型、SVM模型、逐步回歸模型在訓練集上進行建模,再將建立好的模型在測試集上進行測試,最后對比測試結果。

4.1神經網絡模型的構建

4.1.1神經網絡

神經網絡是通過對人腦神經系統的一系列思考活動過程的模擬,建立一種能接收、處理和判斷信息的類似于人腦結構和功能的系統,表現為通過各處理單元的相互連接而組成類似于人腦結構的一種網狀結構系統,以此來達到處理相關非線性問題和邏輯操作的目的。圖1為一個簡單的三層神經網絡,它包括輸入層、隱藏層和輸出層,各個層之間的連線代表權重。其中,輸入層的節點對應的是待輸入的預測神經元;輸出層的節點對應的是目標神經元,目標神經元的個數可多可少,但是至少為1個;隱含層處于輸入層和輸出層的中間位置,隱含層的層數和節點數決定了神經網絡的復雜程度。

4.1.2神經網絡模型結果分析

從神經網絡模型的具體預測結果的相關指標表4來分析,最小誤差為-11.452,最大誤差為6.004,平均誤差為-0.163,平均絕對誤差為1.77,標準差為2.589,預測值和實際值的線性相關系數為0.637,為中度相關,預測效果不好。

4.2 SVM模型的構建

4.2.1 SVM

SVM(Support Vector Machinel支持向量機,是一種二分類模型,目的是求解一個超平面,根據間隔最大化的原則對樣本數據進行分割,最終轉化為解決一個凸二次規劃問題。

如圖2所示,在低緯度(左邊)上,正負類樣本只能靠一個非線性平面(橢圓)來區分,但是映射到高緯度(右邊)上,可以找到這樣一個分離超平面,從而對樣本數據進行分割。

4.2.2 SVM模型結果分析

從SVM模型的具體預測結果的相關指標表5來分析,最小誤差為-11.151,最大誤差為5.457,平均誤差為-0.183,平均絕對誤差為1.458,標準差為2.322,預測值和實際值的線性相關系數為0.745,為中度相關,預測效果普通。

對比神經網絡模型的預測指標,在最小誤差、最大誤差、平均絕對誤差、標準差方面,SVM模型均低于神經網絡模型,只在平均誤差方面略高于神經網絡模型;神經網絡模型的線性相關系數為0.637,擬合效果不好,而SVM模型的線性相關系數為0.745,擬合效果普通。綜上所述,SVM模型略優于神經網絡模型。

4.3逐步回歸模型的構建

4.3.1逐步回歸

逐步回歸用于多重共線性的檢驗,建立最優或合適的模型,是多元線性回歸分析中的一種方法,數學模型是:

Y=βO+β1*X1+β2*X2+…+βn*Xn

其基本思想是,對每個逐步引入的新變量進行F檢驗,并對已經引入的自變量進行t檢驗,當原來引入的自變量由于新的自變量的引入變得不再顯著時,則將新引入的解釋變量進行刪除舊?;静襟E是:先將每個自變量逐個與因變量進行一元線性回歸分析,對自變量根據對因變量的影響程度進行排序,然后按照影響程度從大到小的順序依次引入自變量,每引入一個新的自變量就要對自變量和回歸方程進行檢驗,若顯著則引入,不顯著則剔除,直到無新的自變量可以引入。

4.3.2逐步回歸模型結果分析

運用SPSS Modeler 18.0軟件對數據構建逐步回歸模型,得到的統計結果如表6所示。由表6可知,在逐步回歸過程中,除G1、G2、failures、studytime、reason這些變量外,其余變量存在多重共線性,不滿足進入逐步回歸的條件而被剔除。且模型的R2判定系數為0.859,說明在因變量的變異中,有85.9%可由自變量來解釋,模型預測效果比較好。根據t檢驗的顯著性和F檢驗的顯著性可知,G1、G2、failures、studytime、reason對目標變量G3有著顯著影響??傻玫骄€性回歸方程為:

Y=0.120*G1+0.911*G2-0.263*failures+0.147*studytime-0.097*reason

根據逐步回歸方程對目標變量G3進行預測,得到逐步回歸的具體預測指標如表7所示。從逐步回歸的具體預測結果的相關指標表7來分析,最小誤差為-9.247,最大誤差為2.576,平均誤差為-0.08,平均絕對誤差為0.861,標準差為1.375,預測值和實際值的線性相關系數為0.913,為高度相關,預測效果非常好。

4.4模型比較

本文運用神經網絡、SVM、逐步回歸模型分別對學生葡萄牙語成績G3進行預測,分別得到三個預測結果指標,具體結果比較如表8所示。

由表7可知,從最小誤差、最大誤差、平均誤差、平均絕對誤差、標準差這五個指標來看,逐步回歸模型均低于神經網絡模型和SVM模型;從實際值與預測值的線性相關系數這一指標來看,逐步回歸模型達到了0.913,均高于神經網絡模型和SVM模型。綜上所述,在預測學生成績方面,逐步回歸模型均優于神經網絡模型和SVM模型。

5結論

本文在獲得學生成績相關數據后,先通過運用SPSS Statis-tics 20.0對數據進行預處理,再運用SPSS Modeler 18.0對指標進行特征選擇,使得剩余變量對目標變量更具有預測性。分別運用神經網絡模型、SVM模型、逐步回歸模型建立學生成績預測模型,通過對三種模型預測結果的對比分析,得出逐步回歸模型比神經網絡模型和SVM模型更適合學生成績預測的結論。因此,本文的研究在現實生活中具有一定的應用價值。

主站蜘蛛池模板: 欧美精品亚洲精品日韩专区| 久久精品视频一| 国产亚卅精品无码| 91蝌蚪视频在线观看| 国产免费怡红院视频| 永久在线播放| 18黑白丝水手服自慰喷水网站| 久久先锋资源| 日韩欧美中文| 亚洲AV色香蕉一区二区| 国产视频资源在线观看| jizz在线观看| 国产凹凸视频在线观看| 午夜老司机永久免费看片| 在线免费观看AV| 日本欧美在线观看| 激情综合婷婷丁香五月尤物| 无码人妻免费| 美女国内精品自产拍在线播放| 搞黄网站免费观看| 国产99精品久久| 国产亚洲精品自在线| 五月婷婷综合网| 国产精品毛片一区视频播| 国产一级毛片yw| 国产极品粉嫩小泬免费看| 无码精油按摩潮喷在线播放| 亚洲bt欧美bt精品| 精品视频在线观看你懂的一区| 一本一道波多野结衣av黑人在线| 亚洲欧美成人| 欧美成人h精品网站| 欧美日韩动态图| 伊人成人在线视频| av手机版在线播放| 欧美三級片黃色三級片黃色1| 亚洲色图欧美在线| 国产一级特黄aa级特黄裸毛片| 久久狠狠色噜噜狠狠狠狠97视色 | 日韩免费成人| 中文毛片无遮挡播放免费| 亚洲AV一二三区无码AV蜜桃| 国产精品亚洲五月天高清| 亚洲欧美成人网| 亚洲制服丝袜第一页| 无码乱人伦一区二区亚洲一| 97国产精品视频自在拍| 欧美精品黑人粗大| 一本大道香蕉久中文在线播放| AV熟女乱| 四虎在线观看视频高清无码| 女人18毛片一级毛片在线 | 亚洲成人免费在线| 国产午夜无码专区喷水| 97影院午夜在线观看视频| 亚洲成人在线免费观看| 9cao视频精品| 国产欧美视频综合二区 | 日本在线亚洲| 国产乱人视频免费观看| 992tv国产人成在线观看| 亚洲人成色77777在线观看| 欧美一区二区精品久久久| 亚洲日本www| 国产精品吹潮在线观看中文| 91最新精品视频发布页| 日本高清成本人视频一区| 老司机久久99久久精品播放| 国产精品亚洲αv天堂无码| 欧美精品1区2区| 美女视频黄又黄又免费高清| 欧美精品成人| 亚洲无限乱码| 精品人妻一区无码视频| 最新加勒比隔壁人妻| 国产一区二区三区视频| 2020国产精品视频| 亚洲国产日韩视频观看| 最新亚洲人成网站在线观看| 国产国语一级毛片在线视频| 欧美在线三级| 欧美色伊人|