郭 麗
(安徽電子信息職業技術學院 軟件學院,安徽 蚌埠 233000)
高職院校學生學習水平亟待通過各種內外因素共同促進,提高學生的學習能力.制約學生學習績效的多種因素將直接影響到他們未來能否成才.傳統的教育教學方法按部就班,無法真正從根本上促進和提高學生的學習積極性,務必從根源上匹配出適用于高職院校學生的教學方法等.通過大數據技術,開拓高職院校學生績效因素比較研究的新領域.依托高職院校學生學習習慣等建立數據分析模型可以更好地分析制約學生學習績效研究的多種因素.
從大數據視域對教學改革進行解讀,充分利用大數據技術,提高教學改革的針對性和適應性,輔助人才培養工作的穩步推進.通過大數據技術智能收集、處理數據,提供精準的反饋信息,實現了教學的實時跟蹤,精準診斷,對學生學習過程的評價更客觀、真實、準確.隨著數據流在教學各個環節的生成與運行,大數據智能處理驅動的精準教學逐步替代傳統教學模式,見圖1.
基于學生學習情況信息采集的數據背景下,通過多模式樣本t 檢驗方法進行模型的分析與構建實驗,樣本實驗成熟后提高至高數量級大數據樣本,保證結果的更加精準性.目前,在實驗階段首先抽取學院小樣本數據做出基礎實驗.獨立樣本t 檢驗是在比較平均值的不同情況后,通過對每個隸屬于總體樣本的獨立樣本進行分析,進一步推斷兩個樣本之間的方差齊性情況,即顯著性差異情況.成對樣本t 檢驗的數據是同一群被試或個案被測兩次而獲得的,即同一群體有前測和后測兩組測試數據.其研究目的也是均值的差異情況,它與單樣本t 檢驗又有不同,成對樣本t 檢驗是進一步推斷隸屬總體之間的差異情況,即總體間是否存在顯著性差異.

圖1 大數據智能驅動精準教學模式框架圖
被抽取的樣本源符合鐘形分布,即正態分布形態;兩樣本之間無交互效應,獨立存在;樣本變量不可為離散型變量,符合連續型數據特征[1].選擇樣本時,從一個總體中抽取一組樣本與從另一個總體抽取的一組樣本彼此獨立,沒有任何影響,它們分別屬于不同的總體,樣本數量可以相等亦或不相等.與單樣本t檢驗一樣,在寫備擇假設時這里的顯著差異寫法包括顯著不等于(H1:μ1≠μ2)、顯著小于(H1:μ1<μ2)和顯著大于(H1:μ1>μ2),案例基于檢驗顯著不等于的情況,即只做雙側檢驗,如果做單側檢驗,需要通過雙側檢驗數據后再進行人為判斷[2].
利用隨機試題庫篩選出被試共50 人,作為前測;然后將他們隨機分組,1 組采用傳統教學方法教學,2組采用大數據精準化方法教學;干預完成后用隨機試題庫進行第二次測量,這是后測.傳統教學方法和大數據精準化教學方法哪種方法對于教學質量提高更有效可以基于獨立樣本t 檢驗模式,通過萊文方差同性檢驗和平均值同性t 檢驗結合做出診斷,確立樣本是否隨機分組[3].假如被試者隨機分組成功,即隨機分配的兩組學生在不同教學方法干預前的水平不存在顯著性差異,兩組樣本數據又是相互獨立的,符合獨立樣本t 檢驗的前提條件.但在數據精準性方面,要先測試前期分組數據是否隨機,才能確保后續數據分析的正確性.
1.2.1 獨立樣本t 檢驗的原理與步驟
步驟1:建立原假設H0與單樣本t 檢驗一樣,獨立樣本t 檢驗的數值也存在3 種不同情況:顯著不等于、顯著大于和顯著小于.
步驟2:確定檢驗統計.樣本總體均符合鐘形正態分布曲線,方差σ12和σ2確定數值后,對兩樣本進行抽樣分布估計,即σ212,可以表示為:

表達式中,σ12為第一個樣本的總體方差,為第二個樣本的總體方差,n1和n2代表樣本數據中的數量.由于之前已確定樣本符合正態分布,可以采用Z 檢驗得出的萊文統計量做出差異性判定.因為方差的情況不同需要采用不同的t 檢驗方式,所以在進行兩獨立樣本t 檢驗之前,首先應當明確兩者的方差是否相等,以此判斷應該采用哪種檢驗統計量[4].
步驟3:觀察萊文統計量F 值以及檢測性雙尾P 值.根據t 統計量所服從的分布計算對應的概率P值,與單樣本t 檢驗不同的是,獨立樣本t 檢驗的分析結果會給出兩個t 統計量供選擇,需要根據相應的檢驗結果選擇合適的統計量.
步驟4:設定顯著性水平α 與概率P 值進行比較,做出統計決策.
1.2.2 兩獨立樣本t 檢驗的決策分兩步進行
(1)考察兩個獨立樣本的方差齊性問題. F 檢驗中的萊文統計量表判定方差是否相等,通過概率值P查看兩樣本之間是否存在顯著性差異[5].若萊文統計量檢驗中,檢測性雙尾P>0.05,兩總體方差齊性;若概率P<0.05,則判定兩總體方差不相等.
(2)判斷兩獨立樣本的總體均值是否有差異.第一步證明的方差相等與否為選擇合適的t 檢驗提供了依據,再通過t 檢驗的模式,判定兩樣本是否存在顯著性差異,萊文檢驗中,將P 與數值0.05 進行差異性比較,得出結論.檢測性雙尾P>0.05,不存在顯著性差異;檢測性雙尾P<0.05,存在顯著性差異,見表1.

表1 組統計量

表2 獨立樣本檢驗結果
首先,檢驗兩組被試的前測差異性.從表2 可以看出兩者的方差是沒有差異的(F=0.299,P=0.587),進而對兩者進行獨立樣本t 檢驗,發現兩者均值差異也是不顯著的(t=0.955,自由度df=48,P=0.344),可確定隨機分組是成功的.
其次,檢驗兩組被試后測的差異性.表2 中F=1.569,P=0.216,由于P >0.05,即兩者的方差是沒有差異的,進而對兩者進行獨立樣本t 檢驗,發現兩者均值差異也是不顯著的(t=-2.624,自由度df=48,P=0.012),且P <0.05,可確定傳統教學方法和大數據精準化教學方法的干預效果是有顯著性差異的[6].從表1 可以看出傳統教學方法干預后測試平均分是50.480 0,大數據精準化教學方法干預后測試平均分是56.360 0,則大數據精準化教學方法干預后的測試得分顯著高于傳統教學方法,即大數據精準化教學方法教學效果更好.
在進行獨立樣本t 檢驗之前,提出條件假設,查看樣本形態分布是否符合鐘形正態分布特征[7].再則兩樣本均為獨立個體,兩樣本間無交互效應,因而各自樣本數量勿需一致,另外需要保證樣本變量符合連續型變量的要求[8].在數據分析與構建模型過程中,首先要判斷使用前提條件是否符合,決定使用的檢驗方法.兩配對樣本t 檢驗的原理和步驟如下:
步驟1:建立原假設H0,存在3 種不同情況:顯著不等于、顯著大于和顯著小于.
步驟2:由于總方差不確定,抽取樣本的方差可以作為總體樣本方差的替代,其F 檢驗值為:

只要樣本足夠大(n ≥30),都可以用近似正態Z'檢驗[9],其統計量為:

步驟3:得到F 值和檢測性雙尾P 值[10].
步驟4:設定顯著性水平α 并與概率P 值進行比較,做出統計決策.
當P>α 時,不存在顯著性差異; 當P<α 時,存在顯著性差異.
收集某專業數據只涉及一個群體35 個個案,每個個案都有4 門課程的學習時長數據,可理解成被測試了4 次,現在要比較4 門課程學習時長對于學習效果的影響是否存在差異,可以采用成對樣本t 檢驗進行分析,對兩門課程的學習時長進一步做兩兩比較.
表3 可以看出6 個配對組各自的統計指標,表4 指出了6 個配對組的差異性檢驗:“課程1-課程2 =-7.326 540 00”,說明課程2 的學習時長比課程1 的學習時長從均值上來說增加了7.326 540 00,對其進行檢驗的統計量t 值為-3.451,自由度df 為34,概率P 值(顯著性)為0.002<0.05,說明課程2 的學習時長要顯著大于課程1 的學習時長;同理,課程2 的學習時長也顯著大于課程3 和課程4,其他配對組的差異都不顯著.通過樣本的差異性分析,對于后期人才培養方案的修改提供了強有力的理論及數據依據,為后續的課程體系建設提供支持與保障.

表3 成對樣本統計量

表4 成對樣本檢驗
面對迅速崛起、異軍突起的高等職業教育,在大數據背景下,對制約高職院校學生學習績效的各因素進行對比研究,發現各因素中的主要矛盾及次要矛盾,確立研究的重點及次重點,同時高校學生的學習習慣、學習動機等亦是本課題的研究基礎.通過大數據樣本分析為多重因素的研究提供強有力的數據保障與技術支持,努力為學生營造高績效良好的學院教育生態環境.