外語教學評價材料收集中的信度

2012-12-31 00:00:00李聯現

考試周刊 2012年8期

　　摘要：外語教學評價是提高外語教學質量的重要途徑，而評價信息的信度直接關系到評價的可靠性。因此，在收集評價信息時一定要保證其信度，只有這樣才能為教學提供準確的評價信息，增強教學效果。
　　關鍵詞：外語教學評價材料信度
　　
　　在對外語教學進行評價時，我們通常采用定質性（質性）和定量性（量性）信息。質性信息有助于我們確定某一特別任務，而量性信息能幫助我們選擇適當的難度。定質信息和定量信息沒有明顯的區別，許多評估中兩者都是并存的。通常來說，信息的種類越多，越能提高評價的準確性。
　　所有信息，無論是質性還是量性，都針對的是事物的特征：學生或教師，課本或錄像帶，文章或短信，黑板或教學管理者。對所有信息我們都應該十分清楚且準確把握，避免誤解。學生語法知識的信息不同于學生使用語言的信息。即便如此，許多教師、學生及家長還是經常把第一種信息當做第二種。
　　信息的質量是至關重要的。無論我們采取什么方法收集信息，都必須始終關注用于評估的信息的質量。信度和效度是信息質量的兩個方面。信度是指信息的一慣性和穩定性，信度是指信息的相關程度。信度和效度是判別信息質量的關鍵。同時，在收集評價信息時還要注意采用數據的實用性，在此我們主要探討外語教學評價中信度的收集問題。
　　一、信度的定義
　　信度指測驗結果的一致性、穩定性及可靠性，一般多以內部一致性表示該測驗信度的高低。信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。系統誤差對信度沒什么影響，因為系統誤差總是以相同的方式影響測量值的，因此不會造成不一致性。反之，隨機誤差可能導致不一致性，從而降低信度。常見的影響信度的因素有三個方面：第一，與評價者的不穩定性有關；第二，與評價對象的不穩定性有關；第三，與信息的收集過程有關。弄清楚了影響信度的主要因素，我們就應該努力減少這種影響，提高信度。
　　二、提高信度
　　三個影響信度的因素不存在哪個比哪個好或者壞的問題。我們總是想要得到盡可能大的信度，而幸運的是，有一些方法能夠幫助我們實現愿望。通常考慮如何加強信度總是從排除不可信因素出發的，換句話說，就是減少可能對評估的穩定性、一致性產生不良影響的因素。
　　與評價者有關的信度可以通過對評價者進行信息收集過程的培訓，讓他們親自參加收集過程，準確了解如何獲得所需的信度等方法提高信度。此外，不論何時，如果可能，使用一個以上的觀察者、面試者、閱卷人就是明智的，他們還應該不受他人的影響獨立地進行觀察、面試、批閱作文。
　　與評價對象有關的信度，即對學生表現的評估可能會受到諸如學生不在狀態或者沒有準備好，疲勞或者精力分散，受其他不可控制因素的干擾等特殊狀況的影響；評估者在評價學生表現時不在最佳狀態而沒能全身心關注學生的表現，不詳盡或不相一致的記錄等影響。正因為如此，對該學生的評價和所做的教學計劃就會基于這些不準確的信息，從而使評價出現偏差。因此，對外語學習者進行評價時，要收集學生在不同場景下的表現和成績并使用不同的收集方法，避免使用學生在一個場景中的表現作為評價學生的唯一依據。
　　與收集過程有關的信度可以通過多渠道收集信息而得到提高。因為用一種方法收集的信息的偏差可能會被用其他方法收集到的信息彌補。例如，外語學習者如果被要求在同學們面前證明他們的所學時，他們往往就會感到很困難，但當他們與老師在一起時他們表現起來可能會覺得輕松自如。由此可見，如果只用一種方法評估學生的表現就可能產生不可信的結果。
　　提高信度包括減少評價者、評價對象、評價過程的非正常因素的影響，但并不是所有的因素對評估的準確性的影響程度是相同的。比如，當進行多項選擇測試時，我們沒有必要對評卷人信度給予太大的關注，但當我們對學生進行口語測試或者面試時，就應該十分重視這類信度。而在評估學生交際能力時，我們必須關注與人或目標相關的信度，因為他們的表現可能會因時間不同和心理狀態不同而波動。如果我們要評價寫作中語言的復雜性，與目標相關的信度就可以忽略不計，因為我們不必擔心文章會隨時發生變化。
　　三、信度的計算
　　信度實際上是一種程度。我們不可能獲得完全的信度，即百分之百的信度，也不可能得到完全沒有信度的信息，即信度為零。事實上，信度始終在0.00—1.00，而我們永遠也不可能到達兩極。
　　信度是一種持續的品質，不會隨評價者的興趣而變化。通常評價者不會對個別學生的學習成績感興趣，他們感興趣的是全班或者全年級的成績。讓人遺憾的是，我們不可能知道信息或者收集數據的過程的真實可信度，因為我們不知道所要評價的對象的真正狀態。實際上，我們只是估計信息或者收集信息過程的信度。估計信度的方法有好幾種，絕大多數所得的數據在0.00沒有信度和完全信度1.00之間。這就叫信度的相關性。
　　四、信息的收集方法
　　外語教學評價需要收集大量的教的信息（教學目的、教學計劃、教學實踐），學生的信息（學生需求、個人背景、語言閱歷、學習成績、學習態度和感受），教師信息（語言經驗、語言技巧、教學態度），學校信息（學校的教學和人力資源）等。可以采取不同的方法收集不同的信息。考試可以用來收集學生學習成績方面的信息但不能用來收集其他方面的信息，而其他的數據收集方法卻適合于收集這些信息。比如，課堂觀察和學生會議可收集到學生在閱讀和學習中使用的策略；對話記錄能說明學生課堂學習的態度；學校記錄、課程檔案或其他資料能說明學校的管理和人力資源情況，也能說明教學本身。
　　有些信息的收集是直接的不需要特別準備的，比如，查看學校記錄和教學資料。在這種情況下，我們就可以了解到與此相關的信息并進而了解其內容。其他方法，比如檔案袋法、會議法、調查問卷法需要事先準備并有一定的程序。
　　我們不必在任何時候都用所有方法收集信息，而是要決定哪個或者哪幾個是某一特定場景下能使我們做出最合適的決定的最恰當的方法。何況，并不是所有的方法都適合我們所要收集的用于評價目的的信息。有些方法（比如，會議和日志）既可用于教學又可用于評價目的。因此，教師可以選用一些方法作為評價活動的一部分，而選用何種方法則要由他們的評價目的決定。
　　
　　參考文獻：
　　［1］Brian K.Lynch.Language Program Evaluation［M］.Shanghai：Shanghai Foreign Language Education Press，2001.
　　［2］Fred Genesee Johna A.Upshur.Classroom-based Evaluation in Second Language Education［M］.Beijing：Foreign Language Teaching and Research Press，2005.
　　［3］James Dean Brown.The Elements of Language Curriculum：A Systematic Approach to Program Development［M］.Foreign Language Teaching and Research Press，2001.

考試周刊2012年8期

考試周刊的其它文章: 讓幼兒在分享中快樂健康成長; 如何有效開發和利用家長資源; 利用音樂活動養成幼兒良好習慣; 材料互; 家校溝; 優良風紀形成的有效策略