999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生成績預測模型的對比分析

2020-03-30 03:19:04王欣欣湯軍
電腦知識與技術 2020年1期

王欣欣 湯軍

摘要:目的:旨在對比學生成績預測模型。方法:共獲取605條數據,共32個解釋變量,通過特征選擇剩余23個自變量,建立訓練集和測試集,以G3為目標變量,分別構建SVM模型、神經網絡模型和逐步回歸模型,比較這三個模型的預測結果。結果:采用逐步回歸模型預測學生成績在最小誤差、最大誤差、平均誤差、平均絕對誤差和標準差方面均低于神經網絡模型和SVM模型,在預測值和實際值的線性相關系數方面均高于神經網絡模型和SVM模型。結論:在預測學生成績上,逐步回歸模型優于神經網絡模型和SVM模型。

關鍵詞:學生成績預測模型;神經網絡模型;逐步回歸模型;SVM模型;線性相關系數

中圖分類號:TP181 文獻標識碼:A

文章編號:1009-3044(2020)01-0199-04

1概述

教育興則國家興,教育強則國家強。如何實現從我國是人口大國的現狀走向人口強國的轉變,實現中華民族偉大復興,教育有著不可忽視的地位和作用。近年來,隨著時代的進步和國家的發展,教育方式也在不斷變化?,F如今,通過對影響學生成績各種因素的分析,實現對學生成績的預測,從而有針對性的提高學生學習成績是我國教育的主要目標之一。

本文通過獲取有關學生葡萄牙語成績和與成績相關的各方面數據,運用SPSS Statistics 20.0和SPSS Modeler 18.0軟件,分別采用神經網絡模型、SVM模型、逐步回歸模型構建數據挖掘模型進行分析對比,構建合適的預測模型。通過對獲取數據的分析,實現了對學生成績預測的模型構建,對現代教育的發展起到了一定的積極作用。

2數據準備與模型假設

2.1數據準備

本文所使用的兩個數據集是來自葡萄牙Minho大學的Pau-loCortez通過對Gabriel Pereira中學和Mousinho da Silveira中學的學生發放問卷調查來收集關于學生葡萄牙語成績數據,現數據公布于kaggle網站(https://www.kaggle.com/uciml/student-alco-hd-consumptionl。數據中包含schod、sex、Medu、Fedu、Mjob、Fjob等與學生葡萄牙語期末成績相關的32個影響因素,數據集中包含649個樣本數據。

2.2模型假設

通常,在建立模型前,需要先對模型提出假設:

(1)假設學生的學習水平可以在一定程度上可以通過歷史學習水平來反映,通過學生的以往成績可以一定程度的預測未來成績。

(2)假設影響學生成績的各個因素都是穩定的,不會因為突發情況使學生成績大起大落。

3數據預處理

3.1數據描述

原始數據中共包含33個變量,其中G3為目標變量,其余32個變量為解釋變量,得到的模型寬度如表1所示。

3.2變量賦值

由表1可以看出,與目標變量G3相關的32個預測變量中,有些變量類型是字符串類型,比如school、Mjob、fjob、Pstatus等變量。所以需要對這些變量進行類型轉換和賦值。本文運用SPSS Statistics 20.0軟件對字符串類型變量進行變量轉換和賦值,具體賦值結果如表2所示。

3.3無用特征剔除

由表1可知,本文中的輸入變量共32個,但并不是每個變量都對預測目標變量G3有用,例如age變量系數低于閾值、paid單個類別過大,所以需要將這些變量進行剔除。本文運用SPSS Modeler 18.0軟件,采用“特征選擇”節點中的Pearson相關系數為判定準則,剔除輸入變量相對于目標變量的重要性小于0.95的特征。經過特征選擇后,由原始數據的32個輸入變量剩余23個。最終的特征選擇結果如表3所示。

4模型比較

本文對數據進行預處理之后,采用SPSS Modeler 18.0進行建模,將數據按70:30的比例分為訓練集和測試集,先分別將神經網絡模型、SVM模型、逐步回歸模型在訓練集上進行建模,再將建立好的模型在測試集上進行測試,最后對比測試結果。

4.1神經網絡模型的構建

4.1.1神經網絡

神經網絡是通過對人腦神經系統的一系列思考活動過程的模擬,建立一種能接收、處理和判斷信息的類似于人腦結構和功能的系統,表現為通過各處理單元的相互連接而組成類似于人腦結構的一種網狀結構系統,以此來達到處理相關非線性問題和邏輯操作的目的。圖1為一個簡單的三層神經網絡,它包括輸入層、隱藏層和輸出層,各個層之間的連線代表權重。其中,輸入層的節點對應的是待輸入的預測神經元;輸出層的節點對應的是目標神經元,目標神經元的個數可多可少,但是至少為1個;隱含層處于輸入層和輸出層的中間位置,隱含層的層數和節點數決定了神經網絡的復雜程度。

4.1.2神經網絡模型結果分析

從神經網絡模型的具體預測結果的相關指標表4來分析,最小誤差為-11.452,最大誤差為6.004,平均誤差為-0.163,平均絕對誤差為1.77,標準差為2.589,預測值和實際值的線性相關系數為0.637,為中度相關,預測效果不好。

4.2 SVM模型的構建

4.2.1 SVM

SVM(Support Vector Machinel支持向量機,是一種二分類模型,目的是求解一個超平面,根據間隔最大化的原則對樣本數據進行分割,最終轉化為解決一個凸二次規劃問題。

如圖2所示,在低緯度(左邊)上,正負類樣本只能靠一個非線性平面(橢圓)來區分,但是映射到高緯度(右邊)上,可以找到這樣一個分離超平面,從而對樣本數據進行分割。

4.2.2 SVM模型結果分析

從SVM模型的具體預測結果的相關指標表5來分析,最小誤差為-11.151,最大誤差為5.457,平均誤差為-0.183,平均絕對誤差為1.458,標準差為2.322,預測值和實際值的線性相關系數為0.745,為中度相關,預測效果普通。

對比神經網絡模型的預測指標,在最小誤差、最大誤差、平均絕對誤差、標準差方面,SVM模型均低于神經網絡模型,只在平均誤差方面略高于神經網絡模型;神經網絡模型的線性相關系數為0.637,擬合效果不好,而SVM模型的線性相關系數為0.745,擬合效果普通。綜上所述,SVM模型略優于神經網絡模型。

4.3逐步回歸模型的構建

4.3.1逐步回歸

逐步回歸用于多重共線性的檢驗,建立最優或合適的模型,是多元線性回歸分析中的一種方法,數學模型是:

Y=βO+β1*X1+β2*X2+…+βn*Xn

其基本思想是,對每個逐步引入的新變量進行F檢驗,并對已經引入的自變量進行t檢驗,當原來引入的自變量由于新的自變量的引入變得不再顯著時,則將新引入的解釋變量進行刪除舊?;静襟E是:先將每個自變量逐個與因變量進行一元線性回歸分析,對自變量根據對因變量的影響程度進行排序,然后按照影響程度從大到小的順序依次引入自變量,每引入一個新的自變量就要對自變量和回歸方程進行檢驗,若顯著則引入,不顯著則剔除,直到無新的自變量可以引入。

4.3.2逐步回歸模型結果分析

運用SPSS Modeler 18.0軟件對數據構建逐步回歸模型,得到的統計結果如表6所示。由表6可知,在逐步回歸過程中,除G1、G2、failures、studytime、reason這些變量外,其余變量存在多重共線性,不滿足進入逐步回歸的條件而被剔除。且模型的R2判定系數為0.859,說明在因變量的變異中,有85.9%可由自變量來解釋,模型預測效果比較好。根據t檢驗的顯著性和F檢驗的顯著性可知,G1、G2、failures、studytime、reason對目標變量G3有著顯著影響??傻玫骄€性回歸方程為:

Y=0.120*G1+0.911*G2-0.263*failures+0.147*studytime-0.097*reason

根據逐步回歸方程對目標變量G3進行預測,得到逐步回歸的具體預測指標如表7所示。從逐步回歸的具體預測結果的相關指標表7來分析,最小誤差為-9.247,最大誤差為2.576,平均誤差為-0.08,平均絕對誤差為0.861,標準差為1.375,預測值和實際值的線性相關系數為0.913,為高度相關,預測效果非常好。

4.4模型比較

本文運用神經網絡、SVM、逐步回歸模型分別對學生葡萄牙語成績G3進行預測,分別得到三個預測結果指標,具體結果比較如表8所示。

由表7可知,從最小誤差、最大誤差、平均誤差、平均絕對誤差、標準差這五個指標來看,逐步回歸模型均低于神經網絡模型和SVM模型;從實際值與預測值的線性相關系數這一指標來看,逐步回歸模型達到了0.913,均高于神經網絡模型和SVM模型。綜上所述,在預測學生成績方面,逐步回歸模型均優于神經網絡模型和SVM模型。

5結論

本文在獲得學生成績相關數據后,先通過運用SPSS Statis-tics 20.0對數據進行預處理,再運用SPSS Modeler 18.0對指標進行特征選擇,使得剩余變量對目標變量更具有預測性。分別運用神經網絡模型、SVM模型、逐步回歸模型建立學生成績預測模型,通過對三種模型預測結果的對比分析,得出逐步回歸模型比神經網絡模型和SVM模型更適合學生成績預測的結論。因此,本文的研究在現實生活中具有一定的應用價值。

主站蜘蛛池模板: 爽爽影院十八禁在线观看| 人人91人人澡人人妻人人爽 | 四虎影视永久在线精品| 欧美精品H在线播放| 亚洲国产成人精品一二区| 亚洲国产精品久久久久秋霞影院| 亚洲Av综合日韩精品久久久| 都市激情亚洲综合久久| 亚洲第一极品精品无码| 亚洲妓女综合网995久久| 亚洲国产精品一区二区第一页免| 亚洲成网站| 国产激情无码一区二区免费| 91亚瑟视频| 亚洲国产精品日韩av专区| 久久精品一品道久久精品| 国产在线观看精品| 中文字幕在线看| 99久久精彩视频| 国产成人免费高清AⅤ| 亚洲第一视频区| 国产真实乱了在线播放| 欧美视频在线观看第一页| 91无码人妻精品一区| 国产区精品高清在线观看| a级免费视频| 亚洲日本中文字幕天堂网| 亚洲欧美激情小说另类| 91在线高清视频| 97青草最新免费精品视频| 野花国产精品入口| 色九九视频| 波多野吉衣一区二区三区av| 欧美国产日韩在线播放| 97国产在线播放| 久久婷婷国产综合尤物精品| 都市激情亚洲综合久久| 99re这里只有国产中文精品国产精品 | lhav亚洲精品| 久久伊伊香蕉综合精品| 永久免费av网站可以直接看的 | 福利在线不卡一区| 国产主播福利在线观看| AV无码一区二区三区四区| 亚洲国产看片基地久久1024 | 精品视频一区二区三区在线播| 国产视频a| 尤物国产在线| YW尤物AV无码国产在线观看| 成人av手机在线观看| 久草国产在线观看| 亚洲成年人网| 免费看的一级毛片| 人妻免费无码不卡视频| 国产精品欧美在线观看| 色欲不卡无码一区二区| 欧美劲爆第一页| 中文字幕无码中文字幕有码在线| 中文字幕欧美日韩高清| 欧美A级V片在线观看| 亚洲视频免费在线看| 538国产视频| 日韩一区二区在线电影| 97国内精品久久久久不卡| 日韩AV无码免费一二三区| 欧美色图第一页| 五月婷婷中文字幕| 蜜桃臀无码内射一区二区三区 | 精品中文字幕一区在线| 日本人妻丰满熟妇区| 成人永久免费A∨一级在线播放| 国产欧美日韩18| 久久人人爽人人爽人人片aV东京热| 丁香亚洲综合五月天婷婷| 日韩在线2020专区| 精品夜恋影院亚洲欧洲| 国产情侣一区二区三区| 国产黄网站在线观看| 久久99国产视频| 不卡视频国产| 成年人午夜免费视频| 不卡网亚洲无码|