周金堂 章勝江 黃恩平


摘要:在我國高等教育跨過大眾化門檻,邁入普及化的階段,高校人才培養將從量的擴張向提質培優方向轉變,如何適應新的變化趨勢,更多更好地培養高質量人才是擺在高校教育管理部門面前的一個重要課題。在長期的教育管理實踐中,摸索發現創新教育管理信息化方式對提高人才培養質量的正向作用。針對以往教師對學生成績的分析處理一般僅僅是統計成績處在優、一般、差級別的人數,而對每個學生具體擅長與不擅長的課程往往無法了解。運用本校基于數據挖掘的教育管理信息化平臺后,不但能夠精準了解每個學生的擅長課程與不擅長課程,而且對教學質量的提高起到積極的促進作用。南昌職業大學通過數年的使用,大大提高了教育管理效率,增強了教育管理針對性,促進了學生培養質量明顯改進。
關鍵詞:教育管理;創新;信息化;高校;人才培養
中圖分類號:TP3? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)03-0177-03
2019年,我國在校生規模達4002萬人,隨著我國高等學校的學生數量的增長,學校教育教學管理帶來許多新的問題和挑戰。如高校教育管理部門對學生的課程擅長情況往往不能準確把握,導致無法對癥下藥解決學生偏科嚴重的情況,由此可見挖掘出學生擅長的科目顯得尤為重要。事實上,從我國高等學校學生經過大量的考試積累了大量的數據,利用這些數據理性的分析學生的成績是否符合正常預期,對高等學校根據學生的考試成績來判斷該學生對該門課程的掌握情況變得特別重要。數據挖掘技術能從許許多多的數據中發現潛藏在其中的規律,這些規律對于判斷學生是否擅長該門課程或者對該門課程的擅長情況的判斷具有很強的表現力。利用數據挖掘技術從數據庫中提煉出可靠性的信息可以檢測學生對特定課程的擅長情況。學生成績分析處理之中有大量間接或直接的數據統計,涉及人才的管理方面以及學生選課的引導、學生成績的預測分析等內容。通過數據挖掘技術,得出一些有價值的信息,全面、客觀、科學地供教育管理部門參考。二十一世紀,數據庫技術獲得了突破性的成果并且得到大范圍的應用。海量的信息在給人們帶來便捷的同時也帶來了一大堆困難:第一是信息過量,難以消化;第二是信息虛實難以辨別;第三是數據的安全很難得到保證;第四是數據形式的不統一,很難得到統一的處理。如何從含有海量信息的數據庫中提取高質量的、隱含的信息來幫助決斷出未來能夠到達信息處理的更新興的要求,南昌職業大學經過多年的實踐,把數據挖掘技術應用于高等學校的教育信息化管理中,達到了很好的效果。南昌職業大學開發的教育管理信息化平臺根據學生課程成績以及他所在年級的所有學生的課程成績,來分析預測該學生對該門課程的擅長程度。通過學生成績構建決策樹模型,某個特定學生的課程成績及年級所有學生同課程的成績作為訓練集的輸入,該學生對特定課程的擅長情況作為訓練集的輸出。當用戶輸入學生學號時,平臺給出反饋信息,給出該學生對特定課程的擅長情況等。
1 學校教育管理信息化平臺建設
“規模是一切問題的根源。”“量的增長必然引起質的變化。”在提升大學治理體系和治理能力現代化的大背景下,同步開發的基于數據挖掘的教育管理信息化平臺主要是解決我校教育管理部門對學生成績情況了解不夠清楚問題,對學生偏科情況通過統計表反映不夠直觀問題。運用平臺根據學生課程成績以及他所在年級的所有學生的課程成績,通過決策樹算法來分析預測該學生對該門課程的擅長程度,從而直觀明了地反映出學生對課程成績掌握的情況,即達到對學生成績分析的目的;該平臺還針對整個班級來分析班級的成績情況,讓班主任也能夠直觀了解班里的情況,不是簡單地通過Excel統計表來發現班級情況,而是以各種圖形呈現出班級成績的情況,包括及格人數、優秀人數等等。同時教育管理部門還能夠對學生課程成績進行管理,包括對學生課程成績進行增刪改查以及對學生課程成績按姓名、學號、班級以及課程名等進行模糊搜索等。
1.1 決策樹算法防止欠擬合與過擬合
1.1.1 防止欠擬合的方法
1)增加特征數
當特征不足或者現有特征與樣本標簽的相關性不強時,模型易出現欠擬合。可以通過挖掘上下文特征,ID類特征,組合特征等新的特征,可以取得較好的效果。
2)增加模型復雜度
模型簡單時其表達能力較差,容易導致欠擬合,因此可以適當地增加模型復雜度,使模型擁有更強的擬合能力。如線性模型中添加高次項,神經網絡中增加網絡層數或神經元個數。
3)減小正則化系數
正則化是用于防止過擬合的,但是當出現欠擬合時,就有必要針對性地減小正則化系數。
1.1.2 防止過擬合的方法
1)增加訓練集數據
該方式是從數據入手,將更多的數據參與到模型的訓練中,這是最有效的方法,這樣可以讓模型學習到更多更有效的特征,降低噪聲對模型的影響。但是往往直接增加數據是困難的,因此可以通過一定的規則來擴充訓練數據。
2)降低模型復雜度
在數據量較少的情況下,模型過于復雜將會導致過擬合,因此可以通過降低模型的復雜度來防止過擬合,這樣就可以一定程度上避免模型擬合過多的采樣噪聲。
3)增加正則化約束項
將權值的大小加入損失函數中,避免權值過大帶來的過擬合風險。
4)通過集成學習的方式訓練模型
集成學習是把多個模型集成到一起來作為共同的模型,可以降低單一模型的過擬合風險。
1.2 核心功能
1.2.1 個人成績分析模塊
該模塊采用決策樹算法對學生個人成績進行分析,當輸入指定學生的學號,平臺以柱狀圖的形式反饋出學生所學的各科目的擅長情況,并給出提示語,告知該學生的課程情況以及具體分數,柱狀圖給人以直觀的感覺,讓用戶一眼就能知道該學生的課程擅長情況,同時采用決策樹算法比普通的簡單的sql分析具有更為可靠的優點,個人成績分析如圖1所示。
關鍵代碼:
for each in data_user:
each_tmp = []
each_tmp.append(str(each[0]).replace("xm", ""))
each_tmp.append(course_dict.get(str(each[1])))
if float(each[2])>80:
each_tmp.append(1)
else:
each_tmp.append(0)
y_train.append(each_tmp)
sql_user = "select studentId,grade_list.course as course,score from grade_list where studentId = '{0}'; ".format('xm16211571')
cursor.execute(sql_user)
data_user = cursor.fetchall()
x_test = []
if data_user:
for each in data_user:
each_tmp = []
each_tmp.append(str(each[0]).replace("xm",""))
each_tmp.append(course_dict.get(str(each[1])))
each_tmp.append(str(each[2]))
x_test.append(each_tmp)
estimator = DecisionTreeClassifier(criterion="entropy")
estimator.fit(x_train, y_train)
joblib.dump(estimator, "train_model.m")
y_predict = estimator.predict(x_test)
1.2.2 班級成績分析模塊
該模塊采用對數據庫的查詢操作來實現對班級成績進行分析,當輸入班級時,系統以柱狀圖的形式反饋出本班級學生的課程成績情況,告知該班級的課程情況以及班級每門課的平均分,班級85分以上人數以及班級不及格人數并能把圖片保存下來供長期的研究分析,班級成績分析如圖2所示。
班級成績分析關鍵代碼:
cursor = db.cursor()
sql_user = "select studentId,grade_list.course as course,score from grade_list join (select course from grade_list where studentId = '{0}')t on grade_list.course = t.course;".format('xm16211571')
cursor.execute(sql_user)
data_user = cursor.fetchall()
course_dict = {}
course_dict_2 = {}
i = 1
if data_user:
for each in data_user:
each_tmp = []
each_tmp.append(str(each[0]).replace("xm",""))
if not course_dict.get(str(each[1])):
course_dict.update({str(each[1]):i})
course_dict_2.update({i:str(each[1])})
i = i+1
each_tmp.append(course_dict.get(str(each[1])))
each_tmp.append(str(each[2]))
2 疫情期間的線上教育管理與信息化
疫情期間,運用教育管理信息化平臺,南昌職業大學采取聽課、評課、巡課和陪課的方式,加強線上教學管理。教師采用騰旭課堂、釘釘、騰訊會議和QQ直播等工具進行線上教學。各院系的班主任將任課教師拉入班級群,任課教師利用釘釘群上傳課前任務和課后作業,學生在釘釘群完成課前任務和課后作業,任課教師利用釘釘直播進行課堂教學,釘釘群進行答疑和反饋,并在釘釘群上傳教學課件和電子書,釘釘群公告發布重要通知和相關鏈接。
在課堂教學過程中,運用釘釘直播,可以隨時監測學生是否認真聽課,例如,在講到Android應用程序架構時,邏輯控制層與表現層分開設計,會提問學生這個架構和你們學過Java課程中的哪個非常類似,并給出兩個選擇備選答案,學生在釘釘群里只要回答1還是2就可以,這樣,就能及時掌握有多少人在聽課,凡是群里及時回答1或2的同學,說明在認真聽課,凡是沒有回答的同學,很可能是在掛釘釘上課人不在。下課后,會把按時回答的同學名字登記下來,并保留截圖,這樣就清楚有多少人在認真聽課,同時,也能得到誰沒有聽課,只是掛機,得到數據后,每次上課前,都會把名單公布,并告訴學生:每次課采取的方式和方法都會不同,而且告訴學生,線上上課出勤和認真程度占我這門課的比重很大,如果出現一次課不認真聽,被查到扣10分。從而,學生們都非常重視線上教學,通過抽查的方式,發現學生聽課效果非常好,幾乎都能在極短時間內和任課教師互動,完全可以保證線上課堂正常開展。
3 小結
南昌職業大學平臺主要用于對學生成績擅長程度情況進行分析預測,包含的功能主要有用戶管理、學生課程成績管理、個人成績分析、班級成績分析等功能。平臺采用angularjs作為前端框架,使用flask輕量級框架用于前后端交互進行對數據庫的訪問,使用決策樹算法中的cart算法對學生成績進行分析預測,對決策樹進行剪枝降低樹的高度防止過擬合,不斷調參來優化決策樹模型,使分析預測達到一個較為精準的水平。
參考文獻:
[1] 張麗芳.基于大數據環境下高校教育管理信息化創新[J].科學大眾(科學教育),2020(1):164.
[2] 裴瑩.大數據時代下高校教育管理信息化創新發展路徑思路構建[J].現代經濟信息,2019(34):467.
[3] 華曉庭.高校教育管理信息化創新發展策略[J].中學政治教學參考,2019(33):140.
【通聯編輯:張薇】