999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的高校學業預警管理

2015-10-11 09:01:44
中國管理信息化 2015年18期
關鍵詞:數據挖掘模型學生

王 琪

(中國礦業大學 教務部,江蘇 徐州 221116)

基于數據挖掘技術的高校學業預警管理

王 琪

(中國礦業大學 教務部,江蘇 徐州 221116)

隨著我國高等教育從“精英教育”進入“大眾化教育”,學生的學業問題日益突出。基于數據挖掘技術研究,結合高校信息化現狀,綜合運用遺傳算法、BP神經網絡設計預警模型,并使用現有教務管理系統的實際數據對學生的未來狀態做出有效預測,實現對學生的學業預警管理。

數據挖掘;BP神經網絡;遺傳算法;學業預警管理

0 引 言

2013年全國各類高等教育在校總規模已達到3 460萬人,高等教育毛入學率達到34.5%。在如此規模宏大的高等教育階段,提高高校人才培養質量顯得尤為重要,《國家中長期教育改革和發展規劃綱要(2010-2020年)》中明確指出“提高質量是高等教育發展的核心任務”。而要提高人才培養質量,高校的教務部門、學工部門就不能僅根據現有的學生數據狀況和主觀感官對學生進行管理,而應預測學生在校期間未來可能出現的狀態,并采取相應的措施,進行積極引導。縱觀國內高校信息化建設的現狀,我國幾乎所有的高校都建立了自己的校園網和信息系統,尤其是現代教務管理信息系統,幾乎每個高校都已積累相當多的數據,但對這些數據各高校基本上都沒有進行深入挖掘開發。現階段,高等學校的教務管理信息系統功能主要集中在數據的收集和初步統計方面,如:輸入數據的準確性、及時性,學生成績的不及格門次、學分統計,算術平均分、學分加權平均分以及班級成績統計、班級排名、專業排名計算等;也有部分學校采取根據學生成績的預警管理機制,但只是依據其現有的成績對學生進行預警管理,如學生不及格門次、成績平均分等,并沒有深層次分析處理學生成績。

1 數據挖掘簡述

在信息爆炸的時代,數據挖掘的相關研究十分活躍,其在諸多行業中逐漸成為研究熱點。數據挖掘技術是為解決“數據豐富、知識貧乏”這一現象,在數據庫管理系統基礎上發展起來的一門新技術。數據挖掘的實質是一種發現知識的應用技術,是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用信息和知識的過程,它是一門集統計學、人工智能、模式識別、并行計算、機器學習、知識工程、面向對象方法、信息檢索、數據庫等技術為一體的一個交叉性的研究領域。數據挖掘出現于20世紀80年代后期,90年代有了突飛猛進的發展;現在數據挖掘的研究重點正逐漸從發現方法轉向系統應用,且注重多種發現策略和技術的集成,以及多種學科之間的相互滲透。

因此,將數據挖掘技術相關理論及算法用于高校現代教務管理系統中,充分利用高校教務管理系統數據庫數據來設計開發學生管理預警模型,既擴充了數據挖掘技術的應用領域、也有效解決了高校學生的預警管理問題。

2 基于數據挖掘技術的預警模型研究

BP神經網絡是一種按誤差逆傳播算法訓練的多層前饋映射網絡,是目前廣泛應用的神經網絡學習算法之一。遺傳算法類似于自然進化,通過作用于染色體上的基因尋找好的染色體來求解問題。

基于BP算法的神經網絡通過多個具有簡單處理功能的神經元的復合作用,使網絡具有非線性映射能力,由于BP算法的訓練是基于誤差梯度下降的權重修改原則,其結果不可避免的存在局部最小問題,結構設計問題以及實時性差問題等,因此將其用于學生未來狀態預測中尚存在一定缺陷。遺傳算法是根據生物進化思想而啟發得出的一種全局優化算法,在本質上是一種不依賴具體問題的直接搜索方法,僅需給出目標函數的描述,從一組隨機產生的稱為“種群(Population)”的初始解開始,從全局空間出發搜索問題的最優解。由于遺傳算法善于全局搜索,且能以較大的概率找到全局最優解,故用它來完成前期搜索能較好地克服BP算法局部極小的缺陷。將GA和BP結合起來,形成GAOBP混合訓練算法,以GA優化BP網絡。這種方法既避免了BP網絡易陷入局部極小問題,同時也達到優化網絡目的,更能實現對學生未來狀態的較好預測。基于以上分析,本文采用遺傳算法和神經網絡相結合的方法解決學生未來姿態的預測問題。

2.1 目標數據的建立及清洗

本文從高校教務信息系統中抽取部分數據進行學業預警管理研究,現選取專業甲2010級學生相關信息作為挖掘數據庫進行數據挖掘。本次學業預警管理系統研究中選擇學生入學時成績情況、大一結束時成績以及第一學年的學生素質發展綜合測評情況等三大部分組成輸入量指標,共計29個輸入指標,指標構成如表1所示。選擇大學4年共計7學期所有成績的加權平均分作為輸出量。

在此次選次的目標數據中,2010級學生并不一定全部報到,同時也不一定全部順利畢業,因此要清除其中的未報到、試讀、結業的學生信息及其相關數據。

表1 輸入量指標構成

2.2 數據的處理及標準化

從輸入、輸出變量的性質來看,變量一般分為兩類:一類是數值變量,一類是語言變量。數值變量的值是數值確定的連續量或離散量,語言變量是用自然語言表示的概念。其“語言值”是用自然語言表示的事物的各種屬性,如:顏色、性別及規模等都是語言變量。當選語言變量作為網絡的輸入或輸出變量時,需將其語言值轉換為離散的數值量,此次數據挖掘研究所確定的目標數據庫中,“優秀”記為“90”,“良好”記為“80”,“中等”記為“70”,“及格”記為“60”,“不及格”記為“0”。

標準化就是所有分量都在0~1或-1~1之間變化,從而使網絡訓練一開始就給各輸入分量以同等重要的地位。本次數據挖掘研究中采用的處理公式是

其中,pn為樣本數據;min p為樣本數據中的最小值;max p為樣本數據中的最大值。編寫輸入變量標準化函數Standard.m,對指標值以及樣本值進行標準化處理,將上述數據標準化處理為[0.2,0.8]之間的標準數據。

2.3 模型設計及結構和參數的選取

本文采取同時優化神經網絡結構及初始權值、閾值方法建立模型,其原理是通過遺傳算法的嵌套,實現神經網絡的初始權值、網絡結構的同時優化。遺傳算法嵌套,第一層為優化神經網絡的結構,對隱層節點的個數進行編碼;第二層為優化網絡的初始權值,對固定網絡結構的初始權值進行編碼。每一個第一層個體對應一類固定的網絡結構,通過對這一固定結構進行第二層遺傳優化可得到該第一層個體所對應的初始權值編碼最優個體。以最優個體的適應度值(網絡輸出誤差)作為對應第一層個體的適應度值,并通過遺傳操作即可得到網絡結構和初始權值的最佳組合。

利用遺傳算法優化BP神經網絡的結構,關鍵是對于隱層節點數的確定,本文選擇含有1個隱層的三層BP神經網絡作為模型的基本結構;同時,為避免節點個數過多導致模型過擬合,確定模型隱層節點數的上限為bounds。優化算法的具體步驟主要包括:①編碼和群體的產生;②群體中個體適應度的檢測評估;③選擇適應度值高的染色體進入下一代;④通過交叉、變異操作產生新的染色體;⑤不斷重復步驟②~④直到預定的進化代數,得出最優個體x。經過步驟①-⑤,求解到最優個體x,對于x進行解碼將二進制序列轉化為十進制即可得出模型隱層節點數,x所對應的適應度值即為該模型當初始權值和閾值為最優的情況下所對應的網絡輸出誤差的倒數,進而可列出模型的最優初始權值及閾值。

經過深層次分析并結合本次研究實際情況,確定隱層節點數的上限為bounds=15,同時經過多次實驗確定遺傳算法參數Pc=0.45,Pm=0.05,M=25,G=17。在確定隱層節點數、初始權值和閾值時,采用遺傳算法相互嵌套的方法同時對網絡模型的初始權值進行選擇,解決了遺傳算法在優化神經網絡的應用領域中,僅能單獨對網絡結構或權值進行優化的問題,將兩者合理的結合在一起能夠提高建模過程中的客觀性和精確性。利用MATLAB軟件調用主程序mfunction(編寫)得到隱層節點數、始權值及閾值分別為n、W1、W2、B1、B2,具體如下:

最終學生未來狀態預測模型是一個有29個輸入、1個輸出、1個隱層的三層、4個隱層節點的BP神經網絡,初始權值及閾值分別為W1、W2、B1、B2,其網絡結構如圖1所示。

圖1 BP神經網絡結構

2.4 模型的訓練及結果分析

在確定BP網絡結構后,要通過輸入和輸出樣本集對網絡進行訓練,也就是對網絡的閾值和權值進行學習和修正,以使網絡實現給定的輸入輸出關系。基于此次研究初始權值比較少,現選取LM算法的trainlm作為學業預警研究的訓練函數,其參數選取見圖2。

圖2 訓練函數的參數選取

利用MATLAB語言編寫的程序TrainModel(編寫),亦可使用MATLAB函數,采用經過執行MATLAB程序fenkai(編寫)后生成的標準化輸入數據P、TP及相應的標準化輸出數據T、TT作為Input Data和Target Data進行模型訓練及檢測,輸入P,T經上機運行可得到BP迭代過程誤差曲線神經網絡模型輸出誤差。由運行結果可知,模型僅通過11次迭代就達到了誤差目標要求,輸出誤差平均值僅為7.2e-03,處理為正學成績平均誤差為0.69分,121個訓練樣本的輸出值與期望輸出值之間的誤差均小于0.03,樣本最大誤差絕對值為0.028 2,最小誤差為1.9696e-005,76%的樣本輸出誤差小于0.01,這說明該模型具有很好的擬合精度。對于模型的泛化性能通過數據檢驗數據進行檢測,如圖3所示。

圖3 模型的泛化性能檢測

2.5 模型的檢驗

將TP、TT作為檢驗數據Input Data和Target Data輸入模型,運行得到神經網絡模型檢驗結果,由結果可知,該模型的誤差平均值為0.026 6,全部檢測樣本誤差均小于0.1,最大誤差絕對值為0.095 3,最小誤差絕對值為2.1230e-005,50%的輸出誤差小于0.02,83%的輸出誤差小于0.04,分析可知該神經網絡模型具有良好的泛化性能。

由模型訓練結果和檢測結果不難看出,模型訓練的誤差相當低,模型檢測結果的誤差也比較小,在誤差允許范圍內,可用于對學生進行預警管理。

3 學業預警管理

通過數據挖掘技術和現代教務管理信息系統的有機結合,可實現對學生2~3年后未來狀態的預測,高校學生管理工作者完全可利用此模型對在校學生進行有效預警管理。有效預警管理是基于現有多方面數據深層次分析后的結果所做出的預警管理,不僅是依據現有的成績進行預警。在使用模型預測后,可根據預測結果將預警管理分為紅色預警、黃色預警及綠色預警。所謂紅色預警是指將來在校學習期間成績可能會較差的學生、綠色預警是指將來學習成績可能比較優秀的學生,黃色預警介于二者之間。

3.1 紅色預警管理

針對紅色預警學生,可逐一分析其學習困難原因,并安排互幫互學。輔導員或班主任要盡可能和紅色預警的每位同學進行逐個談話,幫助分析原因,以期盡快找到合適的學習方法,提高學習成績。同時,可以實施“學院-課堂-寢室-家長”四位一體的模式,全方位對其進行幫扶,對于紅色預警的學生也可適當的減少其課外活動,增加學習時間,在學習內容方面要也以學習本專業課程為主,不鼓勵其過多涉獵非本專業培養計劃內課程。此外,對于紅色預警的學生,也可以分為兩類管理,區別對待。

一類是學而不好。這類學生,學習時間用的不少,就是學習方法不對,不要過多批評;其學習不太好,不是主觀不努力造成的,要以合適的方式幫扶,在鼓勵的同時進行幫扶,如:學院安排以學習優秀的學生對其進行一對一幫扶,在潛移默化中把好的學習方法傳授過去。

另一類是不學而不好。這類學生,自主性較差,要進行批評教育,嚴格管理。比如,對該類學生進行集中自習管理,非上課時間規定去指定教室上自習,實行點名統計制度,自習次數過少采取一定處理措施等。

3.2 黃色預警管理

針對此類學生,要以鼓勵為主,既肯定其現有成績,也要對其提出更高的要求,比如:你人很聰明,以現在情況來看,未來畢業時,成績還是可以的,不過以你的學習能力來說,你完全可以取得更好的成績,這樣不管將來你是考研還是工作都會有更多的機遇等。

3.3 綠色預警管理

這類學生的成績優秀,要注意控制其驕傲、自滿情緒,既要表揚、鼓勵,同時也要提出更高要求,使其在保持現有成績并不斷提高的同時,注意綜合能力的培養。一方面優秀不是優,多方面優秀才是真正優。大學時間非常寶貴,要充分利用,鼓勵其在學好本專業的同時進行輔修課程學習,同時對其的計算機水平、英語能力等可高標準要求。另外,以自愿參加的原則組織其對學習落后學習進行互幫互助、參加義務勞動、公益活動、獻愛心等。

4 結 語

學業預警管理是根據學生現有的情況,以科學化的手段分析并發掘現實數據背后隱藏的真相,對學生進行有針對性的管理、引導,在減輕高校教師、管理人員工作壓力的同時,提高高校學生的培養質量及成才率。

[1]中華人民共和國教育部.2013年全國教育事業發展統計公[EB/OL].(2014-08-23)[2015-05-23].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_633/201407/171144.html.

[2]儲誠山,張宏偉,郭軍.基于遺傳算法和BP神經網絡的用水量預測[J].中國農村水利水電,2006(4):36-37.

[3]劉奕君,趙搖強,郝文利.基于遺傳算法優化BP神經網絡的瓦斯濃度預測研究[J].礦業安全與環保,2015(2):56-60.

[4]袁安府,張娜,沈海霞.大學生學業預警評價指標體系的構建與應用研究[J].黑龍江高教研究,2014(3):79-83.

10.3969/j.issn.1673 - 0194.2015.18.177

TP311;G647

A

1673-0194(2015)18-0242-03

2015-07-27

猜你喜歡
數據挖掘模型學生
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
趕不走的學生
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
學生寫話
3D打印中的模型分割與打包
學生寫的話
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产精品高清国产三级囯产AV| 欧美在线一二区| 久久黄色一级视频| 国产精品女在线观看| 波多野结衣一区二区三视频| 国产亚洲精品无码专| 99精品影院| 国产网友愉拍精品视频| 精品国产免费观看| 国产精品jizz在线观看软件| 日韩激情成人| 99精品国产电影| 国产在线98福利播放视频免费| 在线中文字幕日韩| 无码网站免费观看| 久久综合伊人 六十路| 免费高清毛片| 99久久无色码中文字幕| 国产特级毛片aaaaaaa高清| 久久先锋资源| 日韩一区二区三免费高清| 精品精品国产高清A毛片| 蜜桃视频一区二区| 大陆精大陆国产国语精品1024| 精品1区2区3区| 日本不卡在线播放| 夜夜爽免费视频| 国产精品自拍露脸视频| 亚洲中文字幕av无码区| 亚洲国产在一区二区三区| 无码AV高清毛片中国一级毛片| 人妻丰满熟妇啪啪| 免费福利视频网站| 天天躁夜夜躁狠狠躁躁88| 久久免费看片| 国产性生交xxxxx免费| 99这里只有精品在线| 伊人久久精品无码麻豆精品 | 欧美日本一区二区三区免费| 精品国产污污免费网站| www.狠狠| 色综合婷婷| 四虎国产成人免费观看| 色精品视频| 色婷婷视频在线| 无码av免费不卡在线观看| 国产欧美自拍视频| 久久国产精品电影| 97青青青国产在线播放| 中文字幕亚洲电影| 国产成人精品男人的天堂下载| 波多野结衣一区二区三视频| 四虎综合网| 亚洲精品无码AⅤ片青青在线观看| 九色在线视频导航91| 免费毛片视频| 浮力影院国产第一页| 欧美a级完整在线观看| 孕妇高潮太爽了在线观看免费| 国产精品成人免费综合| 久久人体视频| 乱码国产乱码精品精在线播放| 国产精品yjizz视频网一二区| 亚洲人免费视频| 天天爽免费视频| 欧美日韩在线成人| 婷婷丁香色| 91精品啪在线观看国产91九色| 国产精品亚洲а∨天堂免下载| 国产精品久久久久久影院| 99久久精品国产综合婷婷| 久久这里只精品热免费99| 国产玖玖玖精品视频| 99久久国产综合精品2020| 亚洲成人在线网| 国产视频只有无码精品| 国产精品太粉嫩高中在线观看| 无码中字出轨中文人妻中文中| 亚洲专区一区二区在线观看| 99er精品视频| 久久福利网| 女人av社区男人的天堂|