(百色學院物理與電信工程系,廣西 百色533000)
隨著計算機技術在現代教育體系中的運用,數據挖掘技術為學生成績考評帶來很大方便,同時保證考核結果的客觀公正性。下面,筆者對應用該技術進行高校計算機能力考核成績分析的情況進行闡述。
1)預測功能 數據挖掘的重要功能是利用大量數據資源,通過分析大量數據資源來達到一定預測效果。例如,教師在考核之前也可以結合學生的平時表現或課堂學習效率,預測其能力考核的最終結果,從而針對成績考核中可能出現的問題事先采取相應解決措施。
2)聯系功能 該功能主要表現在數據關聯分析過程中,即通過對數據庫信息的深入分析來進一步剖析數據之間存在的具體聯系。關聯分析是數據挖掘中最為關鍵的環節,因為分析過程是否嚴謹直接決定了所得結果的可靠性,也是數據資源能否得到充分挖掘、利用的決定性因素[1]。如高校計算機能力考核成績階段,教師可以根據學生的學習情況作進一步關聯性分析,弄清影響學生學習成績的具體因素,從而為教師的教學改革提供科學指導意見。
3)聚類功能 運用該功能可以對數據實施詳細的分類研究,根據數據資源的性質、特點、結構等進行綜合調配歸類(見圖1)。一般情況下,數據挖掘的對象是各種各樣的數據,而大量數據中存在著明顯的相似性或差異性,若能夠將相關數據合理區分開來則有助于對數據資源的利用。聚類分析方法包括劃分法、層次法、基于密度法、基于網格法、基于模型法等[2],在計算機能力考核成績分析時應結合實際需要選擇相應方法,如對不同層次學生的考核可采用層次法進行分析,對不同年級的考核可用劃分法進行分析。

圖1 數據挖掘系統結構
4)描述功能 對于數據挖掘對象而言,在接受挖掘處理之前必須經過一個概念性的描述過程,以保證用戶能從不同角度去分析數據,為后面制定數據挖掘方法做好準備。概念描述是該功能的主要內容,用戶通過對數據概念全面認知后可更深層次的分析被挖掘的數據內容,找出不同對象之間的共同點。例如在進行計算機能力考核成績分析時,利用該功能可以對學生的姓名、年齡、性別、年級等基本信息進行詳細描述,讓教師能在短時間內了解被考核學生的具體情況。
5)檢測功能 目前,計算機數據挖掘技術功能得到進一步優化,其中偏差檢測是數據挖掘功能中的一種新的應用形式[3]。當所有數據挖掘操作結束之后,用戶可以通過偏差檢測對挖掘結果加以檢查來及時發現數據結果中存在的諸多不足。例如,教師在計算機能力考核成績分析時會遇到不同方面的偏差(考試分數偏差、學生信息偏差等),若不及時糾正錯誤會導致最后的考核成績評定結果出現誤差。利用該功能之后,教師可以利用計算機軟件自動發現偏差,從而提醒教師及時修改數據信息。
1)確定對象 確定研究對象是數據挖掘的第1步,能為整個數據挖掘流程(見圖2)設計提供參考。在高校計算機能力考核成績分析中,數據挖掘的對象是學生,這是整個數據挖掘操作的中心。需要指出的是,不能直接將學生的成績確定為數據挖掘的對象,因為這樣偏離了數據挖掘控制的主體要求。

圖2 數據挖掘的具體流程圖
2)數據選擇 確定數據挖掘對象之后,應根據對象所含的相關信息作出準確的數據選擇,即弄清要從被挖掘對象中挖掘何種內容。因此,進行數據選擇時應查找、篩選與業務對象相關的內部數據信息和外部數據信息,再挑選出能夠用于數據挖掘的數據[4]。在高校計算機能力考核成績分析中,教師應選擇的數據包括姓名、性別、年齡、學號、專業、考試成績等,上述數據是高校計算機專業考核的相關信息,教師可在此基礎上進行篩選使用。
3)數據處理 為了獲得學生在計算機能力考核中的成績結果,需要對數據挖掘前篩選的數據進行綜合處理,該過程是所有數據挖掘流程中最重要的環節。通常教師在數據挖掘時主要參考學生的專業考試成績指標,再通過計算機創建模型或數據表對學生成績具體界定[5]。在進行數據處理時,教師可將學生的平時成績、理論成績和操作成績3項指標作為考核對象,具體處理方法如下:①及格,成績用 “1”表示;②不及格,成績用 “0”表示。學生年齡劃分為A1[22~30歲]、A2[31~35歲]、A3[36~49歲]、A4[50~60歲]4個階段,教師職稱用B1[初級]、B2[中級]、B3[副高]和B4[正高]表示,C1[0,1]代表計算機能力考核的最終成績。
4)數據挖掘 參照數據處理后獲得的相關信息,教師可以對本次數據挖掘進行總結,從而挖掘出其他潛在的有價值信息。教師利用數據挖掘不僅能考核學生的計算機等級考試成績,而且能確定學生在該專業學生中的學分高低。此外,教師能利用數據挖掘對影響學生考核成績的原因進行分析。根據表1的結果,教師可以深層次挖掘相關信息,具體內容如下:①學生年齡分為A1[22~30歲]、A2[31~35歲]、A3[36~49歲]、A4[50~60歲]4個階段,根據上述數據,教師可探討學生計算機能力考核成績高低是否受年齡因素的影響。②教師職稱分為B1[初級]、B2[中級]、B3[副高]、B4[正高],根據上述數據,教師可了解學生計算機能力考核成績與教師職稱高低的關系,因為教師的專業水平對計算機課程教學質量會產生較大的影響。
5)數據總結 當數據挖掘工作結束后,教師應及時對數據進行總結,上述過程可通過知識同化技術來實現,即把本次分析所得出的結論集成到業務信息系統的組織結構中,為更深層次的數據挖掘提供科學的指導。
數據挖掘作為計算機技術的核心功能,將其運用到計算機能力考核成績分析后,能提高工作效率,可以保證考核結果的客觀公正性。需要指出的是,教師在利用該技術分析學生考核成績時應注重數據挖掘流程的設計安排,同時應注重選擇對考核有用的數據資源,以保證考核結果的真實可靠。
[1]李樹林,唐俊 .計算機犯罪與計算機犯罪取證技術發展的研究 [J].電腦知識與技術,2008,13(2):21-24.
[2]楊莉莉,王琦.基于數據挖掘的入侵檢測取證系統 [J].網絡安全技術與應用,2005,10(5):44-46.
[3]齊戰勝.數據挖掘技術在計算機犯罪取證中的應用 [J].內蒙古科技大學學報,2011,30(8):6-9.
[4]楊莉莉.基于數據挖掘的數字取證模型設計 [J].南京師范大學學報,2006,29(6):18-21.
[5]包云 .基于軸特征的PrefixSpan算法在網絡入侵檢測機制中的應用研究 [J].山東科技大學學報,2006,29(12):30-33.