張 玥 鄒 健 柏天燕
(安徽工程大學,安徽 蕪湖 241000)
1999年,教育部因解決經濟和就業問題出臺了擴大普通高校本專科院校招生人數的教育改革政策,到2019年高等教育毛入學率達到51.6%,實現高等教育普及化。高校招生人數的劇增在使更多的適齡青年享受教育的同時也為高等教育管理和人才培養質量保障帶來了前所未有的挑戰。據數據檢索顯示,自2007年以來,由于各種因素每學年高校普通本專科約15-20萬學生退學。基于此,“以學生為本”[1]建立科學的和人性化的學業預警機制是高校事務管理中亟待解決的問題。
傳統的學業預警機制主要是通過通報在校學生各階段學習情況來警示可能無法順利完成學業的學生,同時實施針對性的防范措施促使學生順利完成學業。教育管理部門所做的工作主要集中在學生以往學習成績、學習態度問題等方面[2],這種事后預警機制使得在學業預警之前,“學困生”已成為既定的事實,預警機制沒有真正發揮其人性化的警示作用。一方面,“學困生”以往的不良行為已成習慣難以改變;另一方面,學業成績過低會導致學生情緒低迷、不自信和厭倦學習,更甚者會發生極端行為。因此利用學生在校行為軌跡數據對其在成為“學困生”之前進行學業預警是非常必要的。
近年來,黨中央國務院高度重視大數據戰略的實施,而將大數據應用于教育教學領域,為教育數據的積累與收集提供了便利條件,也為學生教育管理變革提供了新的機遇[3]。高校可以借助各類數據中心采集到學生各方面的信息,如成績信息、選課情況、圖書借還信息、宿舍出入信息、校園消費信息、獲獎信息、上網信息等,通過分析這些信息,實現對學生在校情況的評估。在當收集到的有效數據達到一定量級時,就能夠挖掘數據背后隱藏的關聯關系,實現對具有某種特性的群體情況的評估和預測,進一步指導教育實踐。
本文依托安徽工程大學的聯機事務處理系統面向該校2016-2019級在校學生收集其在大一的成績信息與行為數據,總共獲得1,200份有效問卷。數據集包含20個指標,其中指標學業成績作為因變量,其余19個指標作為自變量,具體變量與取值如下:
《高等數學》為安徽工程大學所有學生的必修課,依據各專業對數學要求高低的不同,該校分別開設了《數學分析》《微積分》《高等數學AI》《高等數學I》《高等數學II》《高等數學III》共六類高等數學課程。本文選取大學生在大一時的《高等數學》的成績作為學業成績能夠很好反映學生的學業完成狀況,具有較強的代表性。
目前,我國高校招生的方式是按省分配招生名額,并且自2002年起高考開始自命題改革,這就使得各省份之間的生源質量出現差異的可能性增大。因此,本文按照地區繁榮程度將生源地分為三個大類,分別是:A.華東、華北、華南地區;B.東北、西北、西南地區;C.少數民族自治區。分別將它們設置為:“華東、華北、華南地區”—“3”,“東北、西北、西南地區”—“2”,“少數民族自治區”—“1”。
指標中的二分類變量有性別、貧困程度、宿舍學習氣氛和作業完成度。這里將這些變量進行啞變量化,性別上以1表示女生,0表示男生;貧困程度方面以1表示貧困,0表示不貧困;宿舍學習氛圍方面以1表示學習氛圍濃厚,0表示學習氛圍不濃厚;作業完成度方面以1表示自己獨立完成,0表示非自己獨立完成。
以問卷調查的形式訪問學生對其所學專業是否感興趣,分為三類:A.感興趣;B.一般(不討厭);C.完全沒興趣。分別將他們設置為:“感興趣”—“3”,“一般(不討厭)”—“2”,“完全沒興趣”—“1”。
對于學生來說,周早起次數、月均生活費、周晚睡次數、周運動次數、月逛街次數等變量的取值都比較清晰,故在問卷中均以填空題的方式出現,最后以學生所填數值作為最終結果。而對于學期學科競賽次數、學期圖書館借閱書籍數目、周自習時長、月均戀愛費用、月均學習費用、學期活動次數、周網游時長、周看劇時長等變量的具體數值都比較模糊,因此,在問卷里均將其設為幾個范圍供學生選擇,在處理這些變量時,均取學生所選的范圍的組中值作為實際值處理。

表1 單個學生信息樣表
對于學生的這些信息指標值,原始的非結構化、半結構化數據需要通過清洗形成結構化數據,以及缺失值、異常值和數據標準化等處理。表1展示了所選取的指標在數據處理后的取值狀況。
針對數據集變量多的特點,本文利用了系統聚類法對影響學生成績的19個因素,即生源地(第1個變量)、性別(第2個變量)、貧困程度(第3個變量)、學習氛圍(第4個變量)、專業興趣(第5個變量)、學期學科競賽次數(簡稱學科競賽次數,第6個變量)、學期圖書館借閱書籍數(簡稱借閱書籍,第7個變量)、周自習時長(第8個變量)、作業完成度(第9個變量)、周早起次數(第10個變量)、月均生活費(第11個變量)、周晚睡次數(第12個變量)、月均戀愛費用(第13個變量)、月均學習費用(第14個變量)、周運動次數(第15個變量)、學期活動次數(第16個變量)、周網游時長(第17個變量)、月均逛街次數(第18個變量)、周看劇時長(第19個變量),建立綜合評價指標體系,得到綜合預警指標。然后將獲得的綜合預警指標作為自變量,學業成績作為因變量建立學業成績預警的回歸預測模型。通過實證分析驗證了所建的學業成績預警指標體系以及預測模型是有效的。
將原始數據輸入SPSS軟件中,得到聚合結果——聚類表(表2)和平均連接的樹狀圖(圖1)。表2中第二列和第三列表示聚合類,比如第一階段時,第8個變量和第14個變量聚合成一類,這時有18類(19-1=18)。因此,某階段的分類數等于總的變量數減去這個階段的序號。圖1顯示,當歐式距離約為14時,19個變量聚為10個綜合指標:{綜合指標Z1:學科競賽次數、借閱書籍、周自習時長、作業完成度、月均學習費用};{綜合指標Z2:專業興趣};{綜合指標Z3:月均生活費、月均戀愛費用、月均逛街次數};{綜合指標Z4:性別};{綜合指標Z5:周運動次數、學期活動次數};{綜合指標Z6:生源地};{綜合指標Z7:周早起次數、周晚睡次數};{綜合指標Z8:周網游時長、周看劇時長};{綜合指標Z9:貧困程度};{綜合指標Z10:學習氛圍}。
利用Matlab求出10個主成分(綜合指標Zi,i=1,L,10)與學習成績(y)的回歸方程如下所示:

表2 聚類表

圖1 樹狀圖

以建立的多元回歸分析模型系數作為指標繪制雷達圖(圖2),用以體現不同綜合指標在預警機制中的重要性。圖2表明在我們構建的預警機制中影響最大的綜合指標為學習習慣、生源、消費。
學習習慣包含了學期學科競賽次數、學期圖書館借閱書籍數、周自習時長、作業完成度、月均學習費用等因素。該綜合指標的系數(0.228,2)為正,說明該高校學生的學習行為與學生的成績表現有很大關聯,且學習行為良好的學生會在接下來的學習中大概率會繼續維持好的學習成績,這方面也符合大眾的一般認知,因為學習好的學生普遍已經養成了良好的學習習慣,并且在學習上通過成績獲得了激勵,相對于以往學習成績較差的學生,更了解如何維持自身的學習狀態,也更有動力努力獲得更優良的學業成績。
消費涵蓋了月均生活費、月均戀愛費用、月均逛街次數等因素。該綜合指標的系數(-0.161,7)為負,這很大程度上是由于學生追求“偽精致”生活所造成的。學生進行這類消費通常是因為互相攀比或一時的沖動下的行為。這勢必導致學生將注意力分散在了對吃喝玩樂的追求上,從而降低了對專業學習本身的關注,也減少了在學習上的投入。
除此之外,生源也是影響學生成績的一個重要指標。雖然我國已經實現了高等教育大眾化,但仍然不能保證每個人都能接受高等教育。高考仍然是決定學生能否接受高等教育的主要手段。因此,在同一所大學里,學生往往來自全國各地,家庭背景差異很大。我國是一個幅員遼闊的大國,不同的地區不僅在地理上存在著差異,在經濟和文化上也有著明顯的不同。與西部地區相比,東部沿海地區的經濟比較發達,城市基礎設施和相應的配套設施比較完善,也有著較豐富的教育資源。因而,在這種情況下,來自不同地區的學生,學習上可能會有些不同。

圖2 回歸分析模型雷達圖
學習行為分析有利于促進學生個性化學習,有利于實現教師差異化教學,有利于管理者實施精細化管理。本文對大學生在校行為軌跡的分析,挖掘出學生的學業成績與學習習慣和消費觀之間所存在的關系,為教學管理者和任課教師實施因材施教,進一步增強教學效果、提高人才培養的質量提供理論支撐。
針對安徽工程大學在校大學生建立的學業預警機制向我們展示若要提高學生的學業成績以及高校的管理和教育質量,一是校方需要完善學業預警信息化支撐平臺。利用平臺管理者能夠實時掌握學生在校的行為軌跡。二是培養學生養成良好的學習習慣。充分發揮思政教育的作用,用高尚的道德情操陶冶學生,教育學生樹立正確的愛情觀,用“四有”標準要求自己;從制度上規范學生學習習慣,從思想上端正學生學習態度。三是營造濃厚的學習氛圍。采用“幫扶”措施,輔導員、任課教師、團委、班委、學生黨員、寢室長和學習優秀者都可以從不同方面對被預警的學生進行幫扶,讓幫扶滲透到每個細節;鼓勵學生積極參加學科競賽,引導學生學會借助圖書館培養自己解決問題的能力;大到校風,小到班風和寢室氛圍都應是積極向上和互助友愛的。四是要抓早抓小、防微杜漸。對反映學生的苗頭性、傾向性問題,及時談話提醒、誡勉和教育。引導學生樹立正確消費觀,量入而出,理性消費;培養積極健康的休閑娛樂方式,堅持教育大學生不能過度沉迷于網絡游戲和迷戀小說和影視。