(洛陽科技職業學院 河南 洛陽 471000)
在教學日常管理工作中,對學生的成績進行分析是其中一項重要內容,學生成績系部教學考核中的一項重要指標,成績的合理分析一直是國內外教育教學課程改革中的一個研究熱點,科學合理的分析結果有助于考教分離措施的實施,反映學生掌握知識的實際情況,進一步有利于教師教學工作的開展和教學質量的提高。然而,系部學生成績分析存在數據量龐大、數據分析困難等問題且主要采用成績單、課程總結等方式報送教務處成績管理機構進行存檔,這給教學管理人員進行教學質量分析帶來了很大的不便。數據挖掘作為智能信息處理中的一個研究方向,為人們提供了一種新的認識數據、理解數據的智能手段,在成績分析中具有重要的應用價值。
數據挖掘就是將事先隱藏在數據中的未被發現的,又對現實需求有價值的知識信息從大量繁雜的數據中(這些數據可能是隨機的,不完整的,模糊不清的,有異常噪聲的)發現并提取出的過程。
將數據挖掘應用于學生成績的管理系統中就是要從大量的學生成績中,分析出哪些因素對學生的成績有影響以及影響的因素是多少,哪些因素對學生成績沒有影響,這些信息都是從大量的數據中提取出來的,去除有噪聲的不準確的數據,隨后利用統計分析方法對數據的mean,Standard Deviation,Kurtosis,Skewness進行分析,得出所需要的部分。
(1)
(2)
(3)
(4)
本文研究中,將提取一個專業學生的部分科目成績,采用SPSS分析軟件,對學生的專業課成績進行分析,研究學生成績和學習興趣之間的關系。
在實驗中,提取了電子信息工程專業部分學生的四年學科成績數據,并篩選了基礎課,專業基礎課,專業課的部分課程,在SPSS16 軟件環境下進行數據分析。學生在各階段課程成績統計分析結果如表1所示。在表1中,subject_1表示基礎課,subject_2為一門專業基礎課,subject_3為一門專業課,subject_4為一門專業考查課。

表1 各科成績統計分析結果
從表1可知,學生的總體均值分布中,subject_2最低,為73.9333,最高為subject_4,為87.4333。由均值可知,學生在剛入學的基礎課學習很重視,而在隨后進入專業基礎課學習中,由于各種原因如不適應等,結果考試成績總體較差。隨后,在專業課學習開始適應了,成績上升,至專業考查課,成績最好。說明學生對專業考查課的興趣很高。Median 值中,subject_2的數值最低,為76。而Kurtosis中,subject_2為-0.445,表明該課程成績分布比正態分布的高峰要平坦。其余課程值均大于0,說明這幾門課程成績分布比正態分布的高峰要更陡峭。由Skewness數據可知,subject_1~subject_4 的值均小于0,說明四科成績數據分布形式為負偏,其中subject_4 數值最大,為-0.046,說明該課程成績偏斜程度最大.而標準差分析中,subject_4數值最小,為6.78072,說明學生成績分布集中.
本文針對學生成績分析特點,提出了一個基于數據挖掘的集成應用技術。將學生成績與數據挖掘這種先進的數據分析思想及方法相結合,從學生成績的大量信息中挖掘出了隱藏在數據中的有價值的信息。實踐證明,該方法對學校的教學管理具有較大的實踐意義和應用價值。