周旭東,馬朝珉,劉淇文
(1.東北農業(yè)大學 文理學院,哈爾濱 150030;2.東北農業(yè)大學 高教研究與教學質量評估中心,哈爾濱 150030)
學生學習成績受眾多因素影響,近年來研究者從不同角度分析影響學生學習成績的因素,并嘗試進行有效干預??挡┑系萚1]通過對西安文理學院學生信息的采集,分析學習成績的影響因子并建立回歸模型,從而預測出各因子和大學生學習成績相關性;馬永梅等[2]利用灰色關聯(lián)分析法分析內在因素對學生學習成績的影響;李雪梅等[3]采用主成分分析的方法,研究分析影響學生數(shù)學成績的主要因素;王曉嬌等[4]研究發(fā)現(xiàn)大學生學習成績受個人、學校、家庭以及社會4個層面各種因素的影響,其中性別、戶籍、家庭受教育程度、學習動機、學習興趣、自習次數(shù)、逃課次數(shù)、作業(yè)情況、宿舍氛圍、兼職、參與社團和學生會等11個變量顯著影響大學生學習成績;李思思等[5]研究發(fā)現(xiàn)影響學生學習成績的主要因素包括:學生的學習目標明確度、學習勤奮度、對待教師授課的滿意度、學生的聽課感覺、考前準備時間、知識來源途徑、撫養(yǎng)人嚴格程度及是否跟得上學習進度等諸多方面;閆波等[6]研究發(fā)現(xiàn)對學生學習影響較大的因素,主要有學生家庭社會和文化地位指數(shù)、學習動機、課堂紀律氛圍、教學方式和師生消極行為等。
本文主要研究的是學生學習成績影響因素,不考慮教師教學因素,即在教師教學因素固定的情況下進行分析,也不考慮難以觀測的主觀意愿,如對課程的喜好程度、學習意愿和興趣熱情動機等,僅選取分析學??捎^測、可量化的影響因素,進而改善教學管理,提高教學質量。
UCL-Math及UCL-Portuguese數(shù)據(jù)集來源于UCL數(shù)據(jù)庫,其中的因變量分別是學生的數(shù)學成績以及葡萄牙語成績,包含的成績影響因素主要分為3大類,分別是個人因素、家庭因素、學校因素。NEAU-stu數(shù)據(jù)集來自于我國一所211農業(yè)院校2020屆部分學生的相關信息。其因變量是某學期學生的智育成績,包含的成績影響因素主要是個人因素和家庭因素。
本文的數(shù)據(jù)預處理主要為以下3項:
(1)對于“是”和“否”的屬性分別賦值1、0。
(2)對于可以取多個值的屬性賦值0、1、2等,而后將其歸一化到[0,1]區(qū)間內。
(3)對于連續(xù)變量直接將其歸一化到[0,1]區(qū)間內。
本文實驗環(huán)境為:Win10 64 bit操作系統(tǒng),Jupyter Notebook(Python 3.8),利用Python中的Sklearn工具包實現(xiàn)回歸算法。
本文擬采用套索回歸和嶺回歸對學生的學習成績進行影響因素分析[7]。具體的策略為:通過建立回歸模型,觀察回歸方程中對應各個屬性的變量前的回歸系數(shù)來確定每個因素對學生學習成績的影響程度,若回歸系數(shù)大于0,則此因素為正向影響,反之則為負向影響?;貧w系數(shù)的絕對值越大則說明對學習成績的影響越深。且通過實驗發(fā)現(xiàn),該回歸模型的MSE、MAE、R2這3種評價指標值也均在合理的區(qū)間內。
嶺回歸和套索回歸的主要差別在于損失函數(shù)中的正則項不同。嶺回歸采用的為L2正則項,而套索回歸采用的為L1正則項[8]。因而在影響因素分析中套索回歸可以剔除一些對因變量影響較小的變量,更有利于進一步分析。
表1為UCL-Math及UCL-Portuguese數(shù)據(jù)集回歸系數(shù),從個人因素、家庭因素、學校因素3大類別進行分析,其中個人因素分為背景信息、前期成績、學習投入及其他4個分項。分析數(shù)據(jù)見表1。
通過分析發(fā)現(xiàn),學生的學習成績與所在學校、性別、年齡、家庭住址、父母是否同居、父親工作、選擇學校原因、監(jiān)護人、談戀愛情況、放學后的課余時間、健康狀況和前一階段的成績等情況關系最為密切。其中女同學比男同學平均學習成績更優(yōu);同一年級情況下年齡小的學生比年齡大的學生成績更優(yōu);在城市居住的孩子比在鄉(xiāng)鎮(zhèn)居住的孩子成績要更優(yōu);同居的父母要比分居的父母的孩子成績更優(yōu);父親是在家工作或者其他工作的其孩子成績更優(yōu);更看重學校聲譽的孩子成績更優(yōu);監(jiān)護人為父親的孩子成績更優(yōu);不談戀愛的孩子成績更優(yōu);放學后有更多課余時間的孩子成績更優(yōu);健康狀況較差的孩子反而學習成績更優(yōu);前一階段成績更好的孩子一般成績也會更優(yōu)。另外,與學生的學習成績關系相對沒有特別密切的有家庭人數(shù)、父母受教育情況、母親工作、居住地到學校花費時間、每周學習時間、過去失敗的次數(shù)、學校和家庭對教育的額外支持、是否補課、是否有課外活動、是否上過幼兒園、想接受高等教育、家庭是否有網(wǎng)絡、家庭關系情況、和朋友外出次數(shù)和飲酒情況等。其中家庭人數(shù)超過3人的家庭其孩子學習成績更優(yōu);母親學歷越高孩子成績越好、父親學歷越高孩子成績相對較差、母親的工作為教師等職業(yè)孩子學習成績更優(yōu);家庭住址與學校距離越近的孩子學習成績越優(yōu);每周的學習時間越長孩子的學習成績越優(yōu);失敗次數(shù)越少的孩子成績越優(yōu);家庭和學校有額外教育支持的孩子成績更優(yōu);不參加補課的孩子比參加補課的孩子成績更優(yōu);沒有課外活動的孩子學習成績比有課外活動的孩子成績更優(yōu);上過幼兒園、想接受高等教育、家庭有網(wǎng)絡等情況的孩子學習成績更優(yōu);家庭關系較好、與朋友外出較多以及無論是工作日還是休息日都不飲酒的孩子成績更優(yōu);另外,有一定量的缺勤次數(shù)的孩子學習成績更優(yōu)。
表2為NEAU-stu數(shù)據(jù)集回歸系數(shù)表,結合本國國情和高校實際情況,在表1的基礎上作了影響因素補充,其中個人因素的背景信息中新增政治面貌及民族;前期成績新增高考成績與一本線分差及上學期智育學分成績;新增第二課堂參與情況,包括思想品德修養(yǎng)模塊、創(chuàng)新能力培養(yǎng)模塊、人文素質拓展模塊、社會能力提升模塊。家庭因素新增省份、居住地類別及家庭條件。分析數(shù)據(jù)見表2。

表1 UCL-Math及UCL-Portuguese數(shù)據(jù)集回歸系數(shù)

表2 NEAU-stu數(shù)據(jù)集回歸系數(shù)
通過分析發(fā)現(xiàn):學生的學習成績與政治面貌、民族、上學期智育學分成績、是否為城市生源、是否為鄉(xiāng)村生源、綜合素質中查寢、晚自習、早操等情況關系最為密切。其中政治面貌為群眾的同學成績要略優(yōu)于共青團員;漢族同學成績要優(yōu)于少數(shù)民族、上學期成績優(yōu)的同學新學期成績也較優(yōu)、城市生源地的同學學習成績更優(yōu);鄉(xiāng)村生源地的同學成績略低于其他生源地;綜合素質中查寢以及早操得分高的學生成績差于得分低的,而晚自習得分高的學生成績好于得分低的。
對學生學習成績影響不太突出的因素有性別、是否為貧困生、是否辦理校園地貸款及生源地貸款、省份、是否城鎮(zhèn)、綜合素質分數(shù)中創(chuàng)新能力得分、人文活動、各類社團及學生組織任職情況、高考成績等。其中女生較男生成績較好;貧困生較非貧困生成績較好;非黑龍江省生源學生成績較好;非城鎮(zhèn)生源要好于城鎮(zhèn)生源;綜合素質得分中創(chuàng)新能力及人文活動對成績是負向影響,而任職情況為正向影響;高考成績與當年一本線分差越大反而成績弱于分差小的學生。
通過對UCL-Math及UCL-Portuguese數(shù)據(jù)集分析發(fā)現(xiàn):①適齡上學對學習成績的提高是很有幫助的;②選擇一個好的學校對孩子的學習是極其重要的,而且在選擇學校時,學校的聲譽是關鍵的因素;③監(jiān)護人為父母以及父親為體制外工作,母親為體制內工作對孩子成績提高最有幫助;④保持一個良好的家庭關系以及在教育上多做支出對孩子的學習成績提高是很有幫助的;⑤增加學習的時間、做適當?shù)恼n外活動也可以有助于提高學習成績;⑥學生期間談戀愛對成績是有負面影響的。
對NEAU-stu數(shù)據(jù)集分析發(fā)現(xiàn):在客觀因素上,女同學的成績平均要比男同學更優(yōu),這可能與她們在性格上更加細心有關系;高考生源地為外省的學生平均學習成績要好于黑龍江本省的生源,這可能與外省的教學質量以及進入NEAU的考試難度有關;城市生源的同學學習成績要更好,這也與其在中學階段可以受到更好的教育有關;是否貧困對學生成績的影響不大,但是貧困在一定程度上會激發(fā)學習熱情,提高學生的學習成績。在主觀因素上,上更多的晚自習,在自習中表現(xiàn)得更好有助于提高學習成績;適當?shù)膶W生工作任職不僅無害于學習,反而有助于成績的提高;大學中的各類科創(chuàng)、人文活動以及類似查寢和早操等常規(guī)化的檢查與學習成績的好壞沒有直接聯(lián)系。