詳細介紹了基于數據挖掘技術的課程相關性分析方法(相關分析法、典型相關分析法和關聯規則分析法)的運算原理、適用范圍和優缺點。分析認為,三種分析方法各具優缺點,互不可替代,具有顯著的實用意義和社會價值,可作為教育教學改進決策的支持信息來源,也理應是教育工作者在教學提升方面的重要研究方向。
課程相關性分析數據挖掘相關分析典型相關分析關聯規則一、引言
課程是實現教學內容傳遞的集中體現,是學校教育的目的性、計劃性和組織性的集中體現。課程設置規定著課程類型、課程性質、課程排序和學時分配,還規定各類各科課程的學習目標、學習內容和學習要求等,其合理與否將直接影響到所培養人才的質量,關系到學生知識面的寬度、深度、動手實踐和研究能力的高低,同時也已經成為了影響大學生就業的主要因素之一。因此,課程結構和課程內容的合理設置尤為重要。
課程相關性分析可定量描述課程之間的相關性,可根據相關系數值的大小確定課程間關系的緊密程度,然后從順序性、整體性、關聯性和連續性四個方面為優化課程設置提供參考信息,優化課程結構和課程內容。近年來,國內外教育工作研究人員開展了大量的課程相關性方面的研究,國內外多所著名高校已將課程相關性研究成果作為課程設置的基本依據。
目前課程相關性分析研究所采用的方法均基于數據分析,其方法主要包括傳統數據分析法和數據挖掘分析法兩種,而兩者又有著本質的區別。在探索數據關系時,傳統的分析方法一般是基于驗證的方法,即用戶首先對數據之間的關系做出一定的假設,然后通過數據分析來驗證假設是否正確來得出相應結論,其分析過程是基于假設驅動的演繹型分析;數據挖掘不是用于驗證某個假定的模式(模型)的正確性,而是在數據庫中自己尋找模型,數據挖掘在本質上是一個完全基于發現驅動的歸納型分析過程。
本文對課程相關性分析中的數據挖掘過程及基于數據挖掘技術的課程相關分析方法進行介紹,以期為我國高校課程的優化設置研究提供理論指導和方法借鑒。
二、數據挖掘技術
數據挖掘(Data Mining,DM)又稱數據庫中的知識發現,是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,通過使用成熟的數據挖掘模型,提取出隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識,得到數據中反映出來的數據內在的關系,從而進一步應用到具體的數據分析研究中去。數據挖掘得到的信息具有先前未知、有效和實用三個特征。
目前,數據挖掘技術的已被應用于關聯分析(Association Analysis)、概念/類別描述(Concept/Class Description)、分類與估值(Classification and Estimation)、聚類分析(Clustering Analysis)、時間序列分析(Time-Series Analysis)、偏差分析(Deviation Analysis)、孤立點分析(Outlier Analysis)等方面,隨著數據挖掘技術的發展,可能還會繼續出現新的數據挖掘功能。課程相關性分析為其關聯分析功能中的一部分,所采用的分析方法主要有相關分析法、典型相關分析法和關聯規則分析法等。
數據挖掘分析過程各步驟之間互相影響、反復調整,形成一種螺旋式上升過程,具體分析流程見圖1所示。目前已建立的數據挖掘模型有CRISP-DM模型(Cross Industry Standard Process for Data Mining)、ODDM模型(OLE DB for Data Mining)、Oracle9i數據挖掘模型等多種,對于課程相關性分析來說,具有直觀、簡單和可靠等特點的CRISP-DM模型最為適用,其模型見圖2所示。
三、基于數據挖掘的課程相關性分析方法
基于數據挖掘的課程相關性分析方法主要有相關分析法、典型相關分析法和關聯規則分析法,三種方法各具優缺點,互不可取代。
1.相關分析法
相關分析法又稱單因子相關分析法,主要用于研究兩個變量因子間的相關關系。作為教育信息多元統計分析方法的一種,相關分析法主要用于測定現象之間相關關系的規律性,據此進行預測和控制。將其用于課程相關性的探討研究,可直接量化兩門課程間的相關性,分析過程簡單、快捷,顯示方式直觀,數據可信度高。
相關分析法在課程相關性分析研究中應用,主要有以下幾個步驟:
(1)確定兩門課程之間有無相關關系以及相關關系的類型。在不熟悉課程情況時,則需收集兩門課程的對應資料,用繪制相關圖的方法進行初步判斷。
(2)判定現象之間相關關系的密切程度,通常是計算相關系數R(又稱皮氏積矩相關系數),其絕對值在0.8以上表明高度相關,必要時應對R進行顯著性檢驗。