獨立樣本假設(shè)檢驗在高校學(xué)生評教工作中的應(yīng)用解析

2010-12-31 00:00:00江涌

中國校外教育(下旬) 2010年9期

[摘要] 目前，許多高校都將學(xué)生評教作為考評教師教學(xué)水平的一個重要依據(jù)，如何將學(xué)生評教工作更高效、客觀地開展下去，是許多高校正在研究的問題。本文主要介紹抽樣調(diào)查方法中的一種常用方法——假設(shè)檢驗在學(xué)生評教中的應(yīng)用。在文中首先介紹假設(shè)檢驗的原理和分析過程，然后針對三種常見的情況詳細(xì)進(jìn)行使用說明。

[關(guān)鍵詞] 評教抽樣調(diào)查假設(shè)檢驗

目前，許多高校都對教師的教學(xué)質(zhì)量進(jìn)行檢驗，作為對教師日常教學(xué)工作考評的一項重要依據(jù)。評教是一種常用的檢驗方式，評教又主要包括同行評教和學(xué)生評教。在實際的評教工作中，很多高校一學(xué)期會進(jìn)行一次全體學(xué)生參與的學(xué)生評教，為何一學(xué)期只進(jìn)行一次學(xué)生評教?其中一個主要是原因是組織一次全體學(xué)生參與的學(xué)生評教工作量大，涉及的學(xué)生數(shù)多且歷時長。如果能把學(xué)生評教作為一項日常檢查工作，就能更好地體現(xiàn)出一個教師在一學(xué)期中教學(xué)的動態(tài)變化情況。但如何節(jié)省日常學(xué)生評教的耗時與成本，抽樣調(diào)查就是一種不錯的方法。在進(jìn)行一次全體學(xué)生評教后，以后可以頻繁地進(jìn)行抽樣調(diào)查。由于抽樣調(diào)查工作量小，耗時少，如果再利用好抽樣調(diào)查的方法，就可以保證抽樣調(diào)查的結(jié)果的準(zhǔn)確性。而且在調(diào)查過程中經(jīng)常會遇到不同的同行群體或不同班級的學(xué)生對同一個教師的評價結(jié)論不一致，有時甚至?xí)霈F(xiàn)比較大的差異，其實在這些差異中很可能蘊藏著一些有價值的信息，可以幫助我們更好地改進(jìn)教學(xué)質(zhì)量。挖掘這些信息的方法有很多，假設(shè)檢驗就是其中一種比較理想的方法。本文將舉例討論多樣本假設(shè)檢驗在評教中的應(yīng)用。

一、假設(shè)檢驗原理

假設(shè)檢驗是統(tǒng)計推斷的一種形式，在不清楚總體的某些參數(shù)情況時，先做出兩種相反的

假設(shè)，也就是事實情況肯定在這兩種假設(shè)的其中一種中發(fā)生，接下來再根據(jù)樣本統(tǒng)計量得出結(jié)論。發(fā)生概率非常小的事件在一次試驗中發(fā)生的可能性為零，這就是假設(shè)檢驗所遵循的原理。

二、學(xué)生評教假設(shè)檢驗的分析過程

1.根據(jù)實際情況確定原假設(shè)和備選假設(shè)。由于抽樣調(diào)查是在前面經(jīng)過了全面調(diào)查的基礎(chǔ)上做的調(diào)查，是為了對教師的教學(xué)情況進(jìn)行縱向?qū)Ρ龋虼嗽僭O(shè)可先假設(shè)為教師的教學(xué)水平?jīng)]有發(fā)生變化，即本次的評教平均成績與上次相同。而備選假設(shè)要根據(jù)我們要檢驗的情況來決定。如果我們想知道該教師的教師水平是否提高了，備選假設(shè)就可以假設(shè)為該教師本次的評教平均成績大于上次評教結(jié)果;如果我們想知道該教師的教學(xué)水平是否下降了，備選假設(shè)就可以假設(shè)為該教師本次的評教平均成績小于上次評教結(jié)果。

2.構(gòu)造檢驗統(tǒng)計量。在不同的情況下，假設(shè)檢驗的統(tǒng)計量是不同的，在這里以單樣本均值為例進(jìn)行說明。由于正常情況下學(xué)生評教的成績服從正態(tài)分布，所以可以將抽樣平均數(shù)進(jìn)行標(biāo)準(zhǔn)化處理，以便查表得出結(jié)果，即:，其中，X為樣本平均值，μ0為第一次全體學(xué)生評教的平均值;σ為第一次全體學(xué)生評教成績的標(biāo)準(zhǔn)差;n為對學(xué)生進(jìn)行抽樣調(diào)查時所抽取的學(xué)生數(shù)，也即樣本容量。

3.確定拒絕域。確定一個小概率，即拒絕原假設(shè)的拒絕域。這種小概率事件在一次的調(diào)查中出現(xiàn)的可能性幾乎為零，所以如果真的發(fā)生這種小概率事件，就說明情況并非偶然。

4.計算的值。該檢驗統(tǒng)計量的值計算出來后，查標(biāo)準(zhǔn)正態(tài)分布表，如果該值落入接受域，即大概率的范圍，就接受原假設(shè)，否則，拒絕原假設(shè)。

三、單樣本均值的學(xué)生評教假設(shè)檢驗的應(yīng)用

在學(xué)生評教中，全體學(xué)生對同一個教師的教學(xué)效果進(jìn)行評價是一種常用方式。有時為了衡量一個教師經(jīng)過一段時間的教學(xué)實踐后其教學(xué)水平有何變化，可隔一段時間由該教師的講授對象針對其教學(xué)情況進(jìn)行評價。由于每次都進(jìn)行大規(guī)模的全體調(diào)查工作量大，耗時長，因此，在第一次進(jìn)行全體調(diào)查工作之后，余下的日常教學(xué)評價進(jìn)行抽樣調(diào)查，這樣可以快速地了解每個教師的教學(xué)水平變化情況。把每次的抽樣調(diào)查的評價數(shù)據(jù)與第一次的全體調(diào)查數(shù)據(jù)進(jìn)行對比，進(jìn)而得出該教師教學(xué)水平的縱向?qū)Ρ惹闆r。例如，在時隔三個星期的針對某教師的教學(xué)評價中，該教師前后兩次的評價數(shù)據(jù)如表1所示。

采用假設(shè)檢驗，就不需要每次都耗時費力地進(jìn)行大規(guī)模的全體學(xué)生參與的評教了，這樣就方便進(jìn)行日常的教師教學(xué)情況分析。根據(jù)表1的數(shù)據(jù)，我們可以發(fā)現(xiàn)該教師第二次抽樣調(diào)查的成績高于第一次全體評教的成績，但這是屬于正常的數(shù)據(jù)隨機(jī)波動還是由于該教師的教學(xué)水平真的有顯著提高，我們需要進(jìn)行如下的進(jìn)一步分析。

四、兩個獨立樣本均值的學(xué)生評教假設(shè)檢驗的應(yīng)用

在學(xué)生評教中經(jīng)常會遇到一種情況，就是同一個教師在兩個班級中任課，而兩個班學(xué)生評教的結(jié)果卻不同，這種學(xué)生評教成績的差異是屬于合理的差異，還是有顯著性的差異?一般在評教工作中很多高校都沒有繼續(xù)深入分析，但如果是存在顯著性差異，這就值得高校繼續(xù)調(diào)查，研究同一種教學(xué)法對不同學(xué)生的教學(xué)效果的差異。分析對同一個教師評教結(jié)果的差異的一種簡單有效的方法是兩個獨立樣本均值的假設(shè)檢驗。以下舉例說明。

某教師同時在兩個年級中講授同一門課，在一次學(xué)生評教中，該教師的評教數(shù)據(jù)如表2所示。

根據(jù)表2的數(shù)據(jù)還不能判斷該教師在兩個班的教學(xué)工作中是否有顯著性差異，因此要用假設(shè)檢驗進(jìn)一步分析。由于是對總體的估計，所以應(yīng)該對誤差水平作限制。在本例中將誤差水平設(shè)為5%。

第三步，確定拒絕域，得出結(jié)論。由于兩個獨立樣本的假設(shè)檢驗的統(tǒng)計量應(yīng)用的是自由度為(n1+n2-2)的T分布，查T分布表，知道誤差水平為5%，自由度為(54+48-2)=100的T分布的臨界值為1.984，由于備選假設(shè)用的是“≠”號，所以本次采用雙側(cè)檢驗。檢驗統(tǒng)計量的值為7.46，大于臨界值，所以檢驗統(tǒng)計量的值落入拒絕域，因此拒絕原假設(shè)，接受備選假設(shè)，即認(rèn)為該教師在兩個年級中所講授的同一門課，在學(xué)生中的反映存在顯著性的差異。學(xué)校發(fā)現(xiàn)這種顯著性差異的存在后，應(yīng)進(jìn)一步研究針對不同學(xué)生群體的教學(xué)法。

五、兩個獨立樣本比例的學(xué)生評教假設(shè)檢驗的應(yīng)用

在學(xué)生評教中，有時不是讓學(xué)生對教師的教學(xué)水平評分，而是直接調(diào)查學(xué)生對教師教學(xué)水平是否滿意，然后再統(tǒng)計出各個教師的教學(xué)水平的學(xué)生滿意度。如果能在一學(xué)期中每隔一段時間就對教師的教學(xué)滿意度進(jìn)行調(diào)查，就能很好地觀察出一個教師的教學(xué)滿意度變化情況，從而能夠及時地發(fā)現(xiàn)教學(xué)中存在的問題。以下舉例進(jìn)行分析。

某教師在時隔三個星期的兩次教學(xué)滿意度調(diào)查中的結(jié)果如表3所示:

雖然表3中的數(shù)據(jù)顯示出該教師的第二次評教滿意度比第一次高，但兩次評教的滿意度差別是屬于正常的數(shù)據(jù)波動，還是該教師的滿意度有顯著提高，這就必須做進(jìn)一步的分析。由于是對總體的估計，所以應(yīng)該對誤差水平作限制。在本例中將誤差水平設(shè)為5%。具體分析過程如下。

第三步，確定拒絕域，得出結(jié)論。由于兩個獨立樣本的假設(shè)檢驗的統(tǒng)計量應(yīng)用的是自由度為(n1+n2-2)的T分布，查T分布表，知道誤差水平為5%，自由度為(45+47-2)=90的T分布的臨界值為1.662，由于備選假設(shè)用的是“<”號，所以采用左側(cè)檢驗。檢驗統(tǒng)計量的值為81%，小于臨界值，所以檢驗統(tǒng)計量的值落入拒絕域，因此拒絕原假設(shè)，接受備選假設(shè)，認(rèn)為兩次評教結(jié)果的差異顯著，可以認(rèn)為該教師的教學(xué)滿意度有顯著提高。

以上是一些假設(shè)檢驗在學(xué)生評教工作中的應(yīng)用舉例。只要我們能夠科學(xué)地應(yīng)用好抽樣調(diào)查的方法，將會使我們的教學(xué)管理工作更加準(zhǔn)確和高效。

參考文獻(xiàn):

[1]曾五一.統(tǒng)計學(xué)概論[M].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社，2003.

[2]柯惠新，丁立宏[M].北京:中國統(tǒng)計出版社，2007.

[3]葛建華.為何員工滿意度帶不來業(yè)績[J].中外管理，2007，(176):62-63.

中國校外教育(下旬)2010年9期

中國校外教育(下旬)的其它文章: 論建立教學(xué)方法體系的方向及原則; 環(huán)境工程專業(yè)外語教學(xué)的現(xiàn)狀與建議; 高職高專英語教師教學(xué)素質(zhì)提高與自我發(fā)展的策略分析; 英語寫作中的常見問題及對策; 學(xué)校德育課程開設(shè)的歷史回望與現(xiàn)實思考; 樹立科學(xué)考試觀念,以考試改革促進(jìn)教學(xué)