張瑋
摘 要:近年來,隨著我國高校招生規模的不斷擴大以及不斷提高的信息化程度,在各學校的教務系統中普遍存儲了大量的資料、數據等信息。在這些資料和數據等信息中,內在隱藏了大量的、有價值的內在規律。數據挖掘技術是從大量的、隨機的數據中找出隱藏在其中的、有價值的信息的過程。該文提出了一種基于關聯規則挖掘的成績預警模型。
關鍵詞:關聯規則 Apriori算法 成績預警模型
中圖分類號:TP301 文獻標識碼:A 文章編號:1674-098X(2013)03(c)-00-01
數據挖掘技術可以在教學管理過程中應用,會在教學效果考察、課程設置安排等方面起到幫助作用。舉一個例子來說,學校開設的專業課之間,如何合理安排課程的先后順序,也就是怎樣安排學生在學校中學習和知識增長的過程。合理的安排可以有效提高學校管理的提前預知、教法的合理選擇以及教學的科學指導,對高校教育管理、人才創新能力培養,具有十分重要的意義。因成績預警信息針對性很強,簡單利用以關聯規則為基礎的數據挖掘技術很難解決成績預警問題。該文將關聯規則應用于學生的成績之中,提出有針對性的課程成績預警模型,為實踐提供理論依據。
1 核心原理
在研究和利用關聯規則之前,必須先理清相關概念。關聯規則定義是在交易數據以及信息載體中,對存在于項目集合或對象集合之間的頻繁模式、關聯、相關性或因果結構進行查找,通過分析數據之間的相關關系,找出內在的聯系。說得更具體一些,關聯規則就是類似X→Y的表達式,X、Y分別代表關聯規則的先導、后繼。假設I是項的集合。一個給定的交易數據庫,標記為D,每個數據t都是集合I的非空子集,也就是每個交易都與唯一的標識符相對應,記為TID。
兩個重要的概念:D中的支持度是D中事務同時包含X、Y的百分比,也就是概率;包含X的同時又包含Y的百分比,即條件概率叫做置信度。關聯規則的挖掘過程包含兩個重要階段:第一階段,從資料集合中找出所有的高頻項目組;第二階段,由找到的高頻項目組中產生關聯規則。
該文提出的理論模型基于關聯規則的Apriori算法。Apriori算法是一種基于挖掘關聯規則的頻繁項集算法,通過對數據關聯性進行分析、挖掘,找出數據在決策制定過程中重要的參考價值。
Apriori算法目前也被應用于高校管理中。例如:學校的管理部門對于貧困學生的資助問題,由于貧困生數量的增多導致工作的難度也逐漸加大。針對這一問題,Apriori算法可以提出解決方法。該文借鑒了Apriori算法在教學管理中的具體應用,建立了成績預警模型。
2 基于關聯規則的成績預警模型
在高校的教學管理中,對學生進行科學的學習評價是十分重要的工作職責,不但能對學生起到信息反饋、激發學習動力的作用,又能檢查學校整體的課程安排計劃是否合理,還能發現學生間的個體差異達到因材施教。
在我國目前的教學管理體系中,成績是評價學生的最主要指標。學生在學校學習的過程中,各門課程都會產生成績數據,每門課又會根據實際情況,產生諸如平時成績、考勤成績、期末成績等多項成績數據。面對如此大量的數據,利用數據挖掘技術,對學生的學習成績數據庫進行科學的分析處理,可以及時掌握學生的評價結果,對學生成績出現的問題及時預警、及時解決,更好的開展教學工作。
該文提出了以下一種基于關聯規則的成績預警的理論模型,目的是對成績進行系統地預警分析。本預警模型試圖通過興趣度約束、預警項集約束以及項順序關系約束三種約束關系,實現對數據的定向挖掘,使分析結果具有更強的針對性。該模型完全可以基于現實數據來源來開展實驗研究,具有很強的可操作性。
模型中,預警工作可以劃分成兩個階段:訓練階段、預警階段。在訓練階段,預警系統接收學生成績的訓練數據,從接收到的數據中自動形成系統所需的成績預警規則;在預警階段,系統依照訓練階段生成的預警規則,結合輸入的學生成績和預警課程信息,產生預警信息。
基于關聯規則的成績預警模型由以下五部分組成:(1)成績輸入(輸出)口;(2)預處理模塊;(3)預警規則挖掘模塊;(4)成績預警規則(5)預警模塊。
預警規則的挖掘是成績預警系統中最為核心的部分。預警模塊根據輸入的學生成績數據和預警課程信息,從成績預警規則中提取相應的預警規則集,根據所設計的預警策略決定是否生成預警信息。在實際的預警過程中,具體過程如下:
(1)系統處理一個接收到的學生成績數據;
(2)通過預處理模塊將數據轉變成系統規定的標準格式;
(3)預警模塊中的預警課程信息從預警規則庫中提取預警規則集,分析成績數據,進行匹配分析;
(4)匹配預警時,首先在成績數據中尋找當前規則的前項。如果找不到,則認為此條規則不適用于這條記錄,放棄匹配,轉向規則集中的下一條規則;如果能夠找到,則認為此條規則適用于這條記錄,通過預警信息輸出口輸出預警信息,并退出預警過程。
通過上述過程,學生成績數據的預警工作就可以自動完成。通過系統輸出的預警信息,教師、學生都可以根據具體情況,不斷改進自身的教學或學習工作,提高整體的學習成績。
3 結語
該文提出了一種基于關聯規則挖掘的成績預警的理論模型,以預警規則集為基礎,根據預警算法生成預警信息。該理論模型的實際可操作性極強,可直接應用于目前的教學管理中。通過實際的實踐過程,還可以不斷充實、完善該模型,達到更好的效果。
參考文獻
[1] 張玉林.數據挖掘技術在教學過程中的指導作用[J].西安通信學院學報,2006,5(2):38-40.
[2] 蔣秀英.關聯規則在課堂教學評價中的應用[J].山東師范大學學報(自然科學版),2003,18(3):25-28.
[3] 趙丹群.數據挖掘:原理、方法及其應用[J].現代圖書情報技術,2000(6):1.
[4] 陶蘭,王保迎,呂建軍.數據挖掘技術在高等學校決策支持中的應用[J].中國農業大學學報,2003,8(2):39-41.
[5] 蘆潔,劉志鏡.挖掘關聯規則中對Apriori算法的一個改進[J].微電子學與計算機,2006,23(2):10-12.
[6] 胡吉明,鮮學豐.挖掘關聯規則中Apriori算法的研究與改進[J].計算機技術與發展,2006,16(4):99-104.
[7] 盧炎生,楊芬,趙棟.帶單調約束的關聯規則挖掘[J].計算機工程,2004,30(15):78-80.