張秀玲
(長春金融高等專科學?,F代教育中心 吉林 長春 130012)
伴隨著科技的不斷發展,信息技術在各行業領域中的應用變得更加廣泛。在這一背景下,傳統的數據收集和統計模式已經無法滿足相關行業能力的需求,特別是在數字化校園技術中,針對數據信息的挖掘分析急需更加先進的技術,因此對于相關領域研究人員而言,了解數據挖掘技術和數字化校園技術的相關理論,認識在數字化校園建設中對數據挖掘技術的具體使用需求,探索數字挖掘技術在數字化校園建設中的具體使用路徑,是其必須要關注的重要課題。
所謂數據挖掘技術,一般是指依靠相關方式從相關實際應用數據中把部分信息最大化地進行提取利用和加工處理,一般來說,這些數據是提取者之前并未了解,但是卻知曉這些數據具有一定的利用價值,在實際使用數據挖掘技術的過程中,可以采用多種數據挖掘技術,例如分析分類技術、序列模式分析技術、關聯分析技術等,但是在針對上述技術進行選擇的過程中,應當充分基于現實情況,依靠數據挖掘,能夠為相關人員的決策行為帶來全方位的數據信息支持[1]。
所謂數字化校園,指的是在互聯網技術背景下,使用所有可以有效利用的資源和設備,實現對教學資源、教學環境、教學活動等內容的整體性全方位管理。把當前的數字化信息技術和現代校園管理工作進行融合,能夠有效推進現代教育事業的發展,在這一大背景下,學校的相關配置能夠得到有效的優化,也能夠有效推進現代學校的建設和進步。值得注意的是,數據挖掘技術在應用過程中涉及到多個環節,如數據清理、數據變換、數據決策樹等,這些都是數據挖掘技術在使用過程中的重要算法,對不同級別的信息實現合理優化分類,確定當中存在的具有較高使用價值的數據信息[2]。在這一背景下,可以使用多種類型的數據挖掘工具,例如Clementine、MineSet。在這些技術當中,Clementine技術是把不同種類的數據挖掘技術進行整合,例如關聯規則技術、神經網絡技術等,讓這些技術同時出現于對應的可視化圖形界面之中,在使用Clementine技術的情況下,數據模型能夠在很短的時間中進行快速建立,幫助相關人員對數據進行有效分析,為其提供合理化建議[3]。
在數字化校園系統當中,認識管理系統指的是基于教師為核心,對教師的心理、治理、能力、績效等因素以及彼此之間的關聯性進行分析,從而建立相關的人才培養機制,實現學校的正規化管理。因此在使用數據挖掘技術具體操作的過程中,第一步從數據庫中獲得教師的性別、年齡、工齡、學歷、職稱、發表論文等信息;第二步是使用Apriori算法,在數據立方體上搜索頻繁項集;第三步得出在Minsup=16%時,{副教授、碩士、核心}support為16%,作為頻繁項集,在進行二步挖掘之后,獲得6個關聯規則,運算其置信度,依次為:
Conf{副教授/碩士 核心}=37%,Conf{碩士/副教授 核心}=47%,
Conf{核心/副教授 碩士}=42%,Conf{副教授 碩士/核心}=67%,
Conf{副教授 核心/碩士}=70%,Conf{碩士 核心/副教授}=67%
通過以上信息運算可以發現,教師群體中職稱為副教授,學歷為碩士同時發表論文等級為核心的教書數量占據人數總量的16%。依靠以上數據分析,能夠幫助學校領導作出相關決策,提升學校教師的整體層次。
一般情況下,校園教務系統內容主要涉及有評價、選課、成績上交、課程設置、考場布置等功能,在教務系統中,含有大量的學生成績信息、學生基礎信息、課程信息等內容,基于上述數據的關聯性,教務人員可以從這些數據中選取學生成績和個人信息,使用C4.5算法來對學生知識的掌握情況進行了解,探尋彼此之間所存在的關系,并有針對性地制定教學內容,提升學生們的學習熱情。
數據挖掘算法常見有:K-means算法、Apriori算法、PageRank算法,數據挖掘技術的創新應用路徑主要可以分成明確目標、數據準備、數據處理以及數據分析(可視化)這些過程[4],如圖1所示。

圖1 數字化校園建設中對數據挖掘技術的應用路徑
確定目標是數字化校園建設中使用數據挖掘技術的起源,因此該階段工作具有十分重要的意義。在數字化校園建設過程中,其存儲的數據信息資源與學校的教師、學生等高度關聯,因此,使用數據挖掘技術必須要基于學生和教師資源為基礎,以協調教師和學生之間的關系為目標,有效推進校園教學活動開展。
在使用數據挖掘技術的過程中,需要開展數據的搜集和描述工作。一般情況下,數據準備涉及兩個程序,依次為數據選取與數據預處理[5]。筆者以所在學校為案例,其數據選取工作包含有學生家庭狀況、閱讀消費狀況、月度圖書借閱情況、社會實踐活動參與情況等,以上均為數據選取的內容。針對某一學生來說,在數據挖掘過程中,需要依靠校園一卡通系統查閱學生的閱讀伙食消費狀況,依靠對學生數據的各個字庫中開展數據挖掘,之后把這些數據開展深層加工處理。學校還需要將學生在文字表現中所呈現的不同點開展量化處理,之后把全班學生分成若干個級別。學校使用了1~5級來進行表示,其中處在1級別的學生為綜合素質最強,之后以此類推。
把以上數據作為基礎,在本次研究活動中,把全校學生級別作為類型標識屬性,把家庭背景、月度消費、必修課平均成績、圖書閱讀量、社會實踐活動等作為屬性集合,之后依靠構建數學模型,計算出每一種屬性的增益,如表1所示。

表1 學生數據表
依靠對以上五項內容的增益情況開展對比,并描繪出相關的數據表以后,能夠讓相關人員對學校中相關學生的等級有較為直接的認識和了解。學??梢酝ㄟ^數據挖掘技術得出相關結論。第一,不難發現,在專業課中表現的好壞是衡量學生級別的重要原因之一;第二,圖書館借書次數較為頻繁,不難發現本校學生都比較重視學習,但是積極參加社會活動的學生,其綜合素質評價并不一定會很高;第三,月度消費額較高的學生都較為重視學習以外方面的內容,如社會實踐活動等,但是在學業上的精力投入會略顯不足;第四,并非是來自貧困家庭的學生都是優秀學生,也不是家庭情況較為優越的學生都是后進生,以此可以衡量大學生是否優秀的關鍵是觀察其個人努力的狀況等,綜合以上信息,經過全面的數據挖掘以后,能夠把大量復雜的信息在進行處理后變得直觀明了。
綜上所述,數據挖掘技術在在數字化校園建設中的應用,能夠有效地將大量的數字信息提煉出有價值的信息,不僅有利于提高學校的管理效率,更有利于加快數字化校園的建設,同時,對學校的長遠發展還具有重要意義。