[摘要] 目前,許多高校都將學(xué)生評教作為考評教師教學(xué)水平的一個重要依據(jù),如何將學(xué)生評教工作更高效、客觀地開展下去,是許多高校正在研究的問題。本文主要介紹抽樣調(diào)查方法中的一種常用方法——假設(shè)檢驗在學(xué)生評教中的應(yīng)用。在文中首先介紹假設(shè)檢驗的原理和分析過程,然后針對三種常見的情況詳細(xì)進(jìn)行使用說明。
[關(guān)鍵詞] 評教 抽樣調(diào)查 假設(shè)檢驗
目前,許多高校都對教師的教學(xué)質(zhì)量進(jìn)行檢驗,作為對教師日常教學(xué)工作考評的一項重要依據(jù)。評教是一種常用的檢驗方式,評教又主要包括同行評教和學(xué)生評教。在實際的評教工作中,很多高校一學(xué)期會進(jìn)行一次全體學(xué)生參與的學(xué)生評教,為何一學(xué)期只進(jìn)行一次學(xué)生評教?其中一個主要是原因是組織一次全體學(xué)生參與的學(xué)生評教工作量大,涉及的學(xué)生數(shù)多且歷時長。如果能把學(xué)生評教作為一項日常檢查工作,就能更好地體現(xiàn)出一個教師在一學(xué)期中教學(xué)的動態(tài)變化情況。但如何節(jié)省日常學(xué)生評教的耗時與成本,抽樣調(diào)查就是一種不錯的方法。在進(jìn)行一次全體學(xué)生評教后,以后可以頻繁地進(jìn)行抽樣調(diào)查。由于抽樣調(diào)查工作量小,耗時少,如果再利用好抽樣調(diào)查的方法,就可以保證抽樣調(diào)查的結(jié)果的準(zhǔn)確性。而且在調(diào)查過程中經(jīng)常會遇到不同的同行群體或不同班級的學(xué)生對同一個教師的評價結(jié)論不一致,有時甚至?xí)霈F(xiàn)比較大的差異,其實在這些差異中很可能蘊藏著一些有價值的信息,可以幫助我們更好地改進(jìn)教學(xué)質(zhì)量。挖掘這些信息的方法有很多,假設(shè)檢驗就是其中一種比較理想的方法。本文將舉例討論多樣本假設(shè)檢驗在評教中的應(yīng)用。
一、假設(shè)檢驗原理
假設(shè)檢驗是統(tǒng)計推斷的一種形式,在不清楚總體的某些參數(shù)情況時,先做出兩種相反的
假設(shè),也就是事實情況肯定在這兩種假設(shè)的其中一種中發(fā)生,接下來再根據(jù)樣本統(tǒng)計量得出結(jié)論。發(fā)生概率非常小的事件在一次試驗中發(fā)生的可能性為零,這就是假設(shè)檢驗所遵循的原理。
二、學(xué)生評教假設(shè)檢驗的分析過程
1.根據(jù)實際情況確定原假設(shè)和備選假設(shè)。由于抽樣調(diào)查是在前面經(jīng)過了全面調(diào)查的基礎(chǔ)上做的調(diào)查,是為了對教師的教學(xué)情況進(jìn)行縱向?qū)Ρ龋虼嗽僭O(shè)可先假設(shè)為教師的教學(xué)水平?jīng)]有發(fā)生變化,即本次的評教平均成績與上次相同。而備選假設(shè)要根據(jù)我們要檢驗的情況來決定。如果我們想知道該教師的教師水平是否提高了,備選假設(shè)就可以假設(shè)為該教師本次的評教平均成績大于上次評教結(jié)果;如果我們想知道該教師的教學(xué)水平是否下降了,備選假設(shè)就可以假設(shè)為該教師本次的評教平均成績小于上次評教結(jié)果。
2.構(gòu)造檢驗統(tǒng)計量。在不同的情況下,假設(shè)檢驗的統(tǒng)計量是不同的,在這里以單樣本均值為例進(jìn)行說明。由于正常情況下學(xué)生評教的成績服從正態(tài)分布,所以可以將抽樣平均數(shù)進(jìn)行標(biāo)準(zhǔn)化處理,以便查表得出結(jié)果,即:,其中,X為樣本平均值,μ0為第一次全體學(xué)生評教的平均值;σ為第一次全體學(xué)生評教成績的標(biāo)準(zhǔn)差;n為對學(xué)生進(jìn)行抽樣調(diào)查時所抽取的學(xué)生數(shù),也即樣本容量。
3.確定拒絕域。確定一個小概率,即拒絕原假設(shè)的拒絕域。這種小概率事件在一次的調(diào)查中出現(xiàn)的可能性幾乎為零,所以如果真的發(fā)生這種小概率事件,就說明情況并非偶然。
4.計算的值。該檢驗統(tǒng)計量的值計算出來后,查標(biāo)準(zhǔn)正態(tài)分布表,如果該值落入接受域,即大概率的范圍,就接受原假設(shè),否則,拒絕原假設(shè)。
三、單樣本均值的學(xué)生評教假設(shè)檢驗的應(yīng)用
在學(xué)生評教中,全體學(xué)生對同一個教師的教學(xué)效果進(jìn)行評價是一種常用方式。有時為了衡量一個教師經(jīng)過一段時間的教學(xué)實踐后其教學(xué)水平有何變化,可隔一段時間由該教師的講授對象針對其教學(xué)情況進(jìn)行評價。由于每次都進(jìn)行大規(guī)模的全體調(diào)查工作量大,耗時長,因此,在第一次進(jìn)行全體調(diào)查工作之后,余下的日常教學(xué)評價進(jìn)行抽樣調(diào)查,這樣可以快速地了解每個教師的教學(xué)水平變化情況。把每次的抽樣調(diào)查的評價數(shù)據(jù)與第一次的全體調(diào)查數(shù)據(jù)進(jìn)行對比,進(jìn)而得出該教師教學(xué)水平的縱向?qū)Ρ惹闆r。例如,在時隔三個星期的針對某教師的教學(xué)評價中,該教師前后兩次的評價數(shù)據(jù)如表1所示。
采用假設(shè)檢驗,就不需要每次都耗時費力地進(jìn)行大規(guī)模的全體學(xué)生參與的評教了,這樣就方便進(jìn)行日常的教師教學(xué)情況分析。根據(jù)表1的數(shù)據(jù),我們可以發(fā)現(xiàn)該教師第二次抽樣調(diào)查的成績高于第一次全體評教的成績,但這是屬于正常的數(shù)據(jù)隨機(jī)波動還是由于該教師的教學(xué)水平真的有顯著提高,我們需要進(jìn)行如下的進(jìn)一步分析。
四、兩個獨立樣本均值的學(xué)生評教假設(shè)檢驗的應(yīng)用
在學(xué)生評教中經(jīng)常會遇到一種情況,就是同一個教師在兩個班級中任課,而兩個班學(xué)生評教的結(jié)果卻不同,這種學(xué)生評教成績的差異是屬于合理的差異,還是有顯著性的差異?一般在評教工作中很多高校都沒有繼續(xù)深入分析,但如果是存在顯著性差異,這就值得高校繼續(xù)調(diào)查,研究同一種教學(xué)法對不同學(xué)生的教學(xué)效果的差異。分析對同一個教師評教結(jié)果的差異的一種簡單有效的方法是兩個獨立樣本均值的假設(shè)檢驗。以下舉例說明。
某教師同時在兩個年級中講授同一門課,在一次學(xué)生評教中,該教師的評教數(shù)據(jù)如表2所示。
根據(jù)表2的數(shù)據(jù)還不能判斷該教師在兩個班的教學(xué)工作中是否有顯著性差異,因此要用假設(shè)檢驗進(jìn)一步分析。由于是對總體的估計,所以應(yīng)該對誤差水平作限制。在本例中將誤差水平設(shè)為5%。
第三步,確定拒絕域,得出結(jié)論。由于兩個獨立樣本的假設(shè)檢驗的統(tǒng)計量應(yīng)用的是自由度為(n1+n2-2)的T分布,查T分布表,知道誤差水平為5%,自由度為(54+48-2)=100的T分布的臨界值為1.984,由于備選假設(shè)用的是“≠”號,所以本次采用雙側(cè)檢驗。檢驗統(tǒng)計量的值為7.46,大于臨界值,所以檢驗統(tǒng)計量的值落入拒絕域,因此拒絕原假設(shè),接受備選假設(shè),即認(rèn)為該教師在兩個年級中所講授的同一門課,在學(xué)生中的反映存在顯著性的差異。學(xué)校發(fā)現(xiàn)這種顯著性差異的存在后,應(yīng)進(jìn)一步研究針對不同學(xué)生群體的教學(xué)法。
五、兩個獨立樣本比例的學(xué)生評教假設(shè)檢驗的應(yīng)用
在學(xué)生評教中,有時不是讓學(xué)生對教師的教學(xué)水平評分,而是直接調(diào)查學(xué)生對教師教學(xué)水平是否滿意,然后再統(tǒng)計出各個教師的教學(xué)水平的學(xué)生滿意度。如果能在一學(xué)期中每隔一段時間就對教師的教學(xué)滿意度進(jìn)行調(diào)查,就能很好地觀察出一個教師的教學(xué)滿意度變化情況,從而能夠及時地發(fā)現(xiàn)教學(xué)中存在的問題。以下舉例進(jìn)行分析。
某教師在時隔三個星期的兩次教學(xué)滿意度調(diào)查中的結(jié)果如表3所示:
雖然表3中的數(shù)據(jù)顯示出該教師的第二次評教滿意度比第一次高,但兩次評教的滿意度差別是屬于正常的數(shù)據(jù)波動,還是該教師的滿意度有顯著提高,這就必須做進(jìn)一步的分析。由于是對總體的估計,所以應(yīng)該對誤差水平作限制。在本例中將誤差水平設(shè)為5%。具體分析過程如下。
第三步,確定拒絕域,得出結(jié)論。由于兩個獨立樣本的假設(shè)檢驗的統(tǒng)計量應(yīng)用的是自由度為(n1+n2-2)的T分布,查T分布表,知道誤差水平為5%,自由度為(45+47-2)=90的T分布的臨界值為1.662,由于備選假設(shè)用的是“<”號,所以采用左側(cè)檢驗。檢驗統(tǒng)計量的值為81%,小于臨界值,所以檢驗統(tǒng)計量的值落入拒絕域,因此拒絕原假設(shè),接受備選假設(shè),認(rèn)為兩次評教結(jié)果的差異顯著,可以認(rèn)為該教師的教學(xué)滿意度有顯著提高。
以上是一些假設(shè)檢驗在學(xué)生評教工作中的應(yīng)用舉例。只要我們能夠科學(xué)地應(yīng)用好抽樣調(diào)查的方法,將會使我們的教學(xué)管理工作更加準(zhǔn)確和高效。
參考文獻(xiàn):
[1]曾五一.統(tǒng)計學(xué)概論[M].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2003.
[2]柯惠新,丁立宏[M].北京:中國統(tǒng)計出版社,2007.
[3]葛建華.為何員工滿意度帶不來業(yè)績[J].中外管理,2007,(176):62-63.