文|程知
隨著科學技術的迅猛發展,高等院校的教學質量問題也隨即成為社會關注的重要課題,不斷完善,不斷更新,適應新形式的發展刻不容緩。各種高校在教學管理的過程中,每天都會產生及其大量的數據,目前形勢看來,高校的教學管理系統只是做出了更新、查詢、統計或是打印等操作,完全沒有運用到數據挖掘技術,即從如此海量的數據中挖掘出有益信息或是發現出其中所隱含的規律,這無疑造成了數據浪費。因此,探討數據挖掘在學科建設中的應用與研究對于從數據庫中發掘有益信息、提高教學質量、提高教師教學水平等方面有深遠的意義。
數據挖掘即在給定數據庫中提取出隱含信息。這些隱含信息一般包括人們事先所未知的以及其中潛在的信息資源。這些隱含信息資源可以有多種多樣的表現形式,類似于概念規則、定理規律或者是模式等,沒有一個確定的規則來定義是何種表現形式。一般來說,從這些隱含信息中提取出來的信息知識都兼備有效性、最終可理解性、新穎性,換句話說,所挖掘的信息知識是可運用的、可理解的、可接受的,而且最佳的結果是能夠通過自然的語言來表現出來。
數據挖掘要運用一定的算法,進行有條不紊的操作,一般其操作過程分為幾個步驟,即數據預處理,數據挖掘,模式評估。鞏固知識以及運用知識等。
數據預處理是在數據處理之前的準備工作,這一步驟是數據處理的基礎。進行數據挖掘的對象即數據,這些數據是存儲在數據庫中的,是高校在長期的數據管理中產生的。但是可想而知,若籠統的對這些數據直接進行操作一定是十分不方便的,因此,要提前進行數據預處理。類似于清除數據噪聲等操作。這是數據挖掘中的第一步,也是十分關鍵的一步,它對于數據挖掘的效率以及準確度都有很大的影響。數據預處理之后進行數據挖掘,根據預定的要求選擇出合適科學的算法以及參數,來對已經準備好的數據做分析,產生一個數據集。這就是數據挖掘后可能會出現的知識模型。數據挖掘中,大多數據都是歷屆學生的學習情況以及教師的教學情況,包括教學任務教學計劃、教師的教案等。這些復雜的數據內容構成了數據庫。在數據挖掘這一環節中,其對象是數據倉庫中的這些內容,因而數據倉庫的系統體系結構十分重要。針對高校的教務管理特點,建立起與之相適應的數據倉庫體系結構,類似的體系結構包括中央數據倉庫、數據集市以及個人倉庫;根據不同的數據挖掘需求選取不同的數據庫體系結構;根據相應的具體特征,完成針對各種目標的數據挖掘目的。模式評估作為數據挖掘中的一個關鍵步驟,是由挖掘的算法形成的模式或者是規律,當然也會出現沒有意義或者沒有實用價值的情況,還會出現不能真實反映出數據真正含義的情況,甚至顯示的內容恰與實際情況相悖。這些現象都是會有幾率出現的,因此,進行模式評估意義重大,一來使得挖掘數據的效果更有意義,二來還使得數據在反復的提取中能夠顯示出更有利的知識。鞏固知識以及運用知識的層面,是對于數據挖掘結果的一致性檢查,旨在更大程度確保所挖掘的內容與已知信息不碰撞,同時,還能在運用過程中不斷發現值得優化的方面,更好地做出決策。
我們將電子在線答疑系統中保留的數據內容稱為“原始資料庫”,然后將這一數據內容保存在Web數據庫中,以便于接收學生們對于學科建設等相關內容的咨詢,類似于學科性質或者是相關知識等,包括學生們對于課題求解方法或者是求解步驟的咨詢。除此之外,數據挖掘在學科建設中的應用研究——原始資料庫,還發揮著記錄教師對于學科建設的建議以及看法的作用、解答實際問題的作用等。另外,原始資料庫中還存儲著學生的一些基本資料、老師授課的情況、教案備案信息等多種數據。這些數據信息在與之相應的學院數據庫中的存取、存儲形成了原始資料庫的主要部分。利用數據挖掘技術,能夠將學生們對某一學科的感興趣程度或是相關問題進行實時了解,從而教師可以實現正確的引導,同時能夠把學生的問題以及相對應的解決方案等數據進行科學合理地存儲,存儲到相應的數據倉庫或者是數據集市等領域。這無疑為學科建設的發展起到了極大的推進作用。
學科建設工作的深入開展,使得數據挖掘技術在這一內容中的應用研究地位更加突出。隨訪工作量不斷增大,也使得數據挖掘的應用與研究課題更加有意義。高校中的數據管理內容不斷龐大起來,因此,數據的挖掘管理技術在其計算機學科建設等方面需要不斷的深入應用研究。我們可以把電子在線答疑系統的數據稱為“原始資料庫”,對其進行數據處理,然后建立相應的“隨訪數據庫”。主要作用是師生等對于學科建設進行相應的跟蹤調查。把經過清理處理的原始資料庫中相關的數據內容歸納入隨訪信息庫內,換句話說,這一應用研究對于教改信息資源等內容的第二次開發有著重要影響。隨訪信息庫中,包含了學生的基本信息,如學生信息以及學生的學習情況,學生反映的一些實時情況等多種形式的數據信息。高校中的關于數據挖掘在計算機學科建設中的應用研究中,隨訪數據庫的應用基礎是原始資料庫,通過進行有價值信息的篩選對隨訪數據庫進行實時應用,建成計算機學科建設的隨訪信息庫。
通過一系列的隨訪手段進行相關隨訪,從而建立起一個能夠對于隨訪進行自動處理的在線隨訪答疑系統;這一系統所發揮的作用正是數據挖掘在學科建設中的應用研究。在線隨訪答疑的系統中的學生信息情況是與隨訪信息庫中的學生信息相一致的。高校信息系統中必然會產生大量的數據信息,對這些數據全部調用幾乎是不可能辦到的,即使辦到了,也是屬于無用功。在線隨訪答疑的應用就針對這一現象發揮出作用。通過數據挖掘技術在學科建設中的應用研究,能夠將隨訪信息庫與原始資料庫相結合,從而能夠進行具體科學的數據分析,實現清理以及挖掘操作,以便得到相應的結論,比如具有代表性、具有科學的指導意義的教學案例等,繼而還可以將這一教學案例添加到相應的教學案例庫中。這也為日后形成具有規模性的、輔導價值的教學案例系統、或指導信息庫打下基礎。由此形成師生之間的資源共享,信息共享,老師、學生都可以從此有所借鑒。
總而言之,基于教學管理系統中建立的數據庫,結合學科建設中的具體教學要求,利用數據挖掘,提取出對于學科建設有利的數據,找出在具體的教學環節中所表現出的薄弱環節,繼而根據具體的形式,制定出對于學科建設有利的教學策略,使高校能夠實現數據倉庫建設以及數據挖掘的研究應用。計算機學科建設工作的開展力度不斷加大,數據挖掘技術也隨之凸顯出其優勢,如何將數據挖掘在學科建設中得到更好的研究與應用是推動學科建設更加完善的前提與保障。數據挖掘在學科建設中的應用研究為教學和學科的研究工作提供了極大的方便。