田許匣
摘 要: 科學正確的試卷分析能夠為教學及學習提供有意義的反饋,并能在很大程度上提高教學質量。本文綜合介紹了外語試卷信度、效度、難度、區分度四個維度的分析過程及學生考試成績的分析方法,以期對英語教師的教學及測試工作起到指導作用。
關鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學是第一性的,測試為教學服務,在我國,語言教學已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學。本文主要從語言測試理論的發展,外語測試四維度分析過程及方法,以及學生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試理論發展
著名語言學家戴維斯(1968)曾說“好的測試就如同一個忠實的仆人”,這個比喻形象地說明了測試是為教學服務的,所以不同歷史時期,會產生不同的語言觀語言理論,相應的也會產生不同的語言測試。世界語言測試經歷了四個階段(薛榮,2008):(1)前科學語言測試,教學法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結果主要由教師主觀判斷,主觀性極強,信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結構主義語言測試,語言是一套形式結構,可分成不同元素,語言學習就是刺激反應式,養成習慣,其教學法是聽說法,主要采用分離式測試,每題只考一個語言點,主要題型有詞匯填空、改錯、判斷。重標準化、客觀性和結果,有一定信度,考查結構。(3)心理語言學-社會語言學語言測試,Chomsky區分語言能力和語言行為,Hymes提出交際能力的概念,認為使用語言不但要按照語法規則產出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應現階段英語教學方法——任務教學法,強調聽說,加強口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試理論的發展,評判語言測試的標準在不斷完善。對于語言測試的分析,主要看測試本身和結果,通常從信度、效度、難度和區分度分析。
(1)信度
信度是指測試結果的穩定性或一致性,包括測試信度和評分人信度。信度通常用一對相關系數表示,相關系數越大,信度越高,通常對標準化測試的信度系數要求為0.9,課堂測試一般在0.7-0.8,當系數為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達到,只在中間,我們通常用的計算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數 p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關的因素:
題目數,測試內容,題目特點,分數多樣性。
B.與被試相關的因素:
異質性,考生應試能力,考生動機。
C.與施考相關的因素:
時間限制,作弊機會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應性,也就是說,是否考查了該考的東西,包括內容效度,準則相關性效度,結構效度,高考英語所測試的內容是否覆蓋考試大綱或規定的所有內容?效度越高,就越能準確測量要測的內容。計算公式仍體現為相關系數,受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質量的一個重要指標,難度用D表示,D越大,題越簡單,公式為:D=答對該題人數/總人數,試題難度指數一般在0.3-0.7最合適。
(4)區分度
區分度指不同的題把不同水平的考生真正地區分開來,區分度越高,不同水平的考生區別越大,試卷價值就越高,用區分度指數表示DI,區分度指數最高位1,最低位-1,DI>0.40區分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區分度不好,不能采用該試題,計算公式為點雙列相關:
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標準差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區分學生水平,難度適中區分度最好。
3.學生成績分析
英語教師只有對學生成績進行正確科學的分析,才能對學生水平作出更好的評價,才能為日后教學提供依據,從而進一步提升教學水平。學生成績分析包括成績描述和參數檢驗。
(1)成績描述
成績描述主要涉及的項目有:集中趨勢(眾數,中數,平均數),離散趨勢(全距,方差,標準差),數據分布狀態。
集中趨勢是反映數據分布中數據趨向中心位置的統計量。眾數指出現頻率最多的數。中數指處于中間位置的數。離散趨勢與集中趨勢相反,指數據的離散變異情況。全距指一組數據中最大數與最小數之差。標準差、方差對數據離散程度描述更客觀科學。
數據分布狀態:在語言測試中,學生外語成績是否呈正態分布,需要一個檢驗過程,正態分布呈鐘形,兩邊對稱在正態分布中眾數、中數、平均數重合于一點,其圖形為:
(2)參數檢驗
在我國英語教學中,一位英語老師經常會帶幾個平行班,這幾個班學生學習成績到底怎么樣,只靠成績描述數據是不夠的,還需要考慮多方面因素,這就需要參數檢查,主要有獨立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態分布中,這兩種檢驗可以用來檢驗兩個班級成績是否具有統計意義上的明顯區別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計算軟件可以幫助我們在較短的時間內完成大量的計算任務。
結語
作為出色的英語教師,備課上課不是我們唯一的任務,還應該特別注意學生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認為試卷分析就是純粹地看看學生成績高低,強調學生易犯錯誤的地方就行,即使作了分析,也是分析指標單一,分析過程粗糙,這樣就不能深入了解學生學情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學性、理據性,提高成績測試質量,更好地體現公平公正原則,從而更好地促進外語教學及習得。
參考文獻:
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學與研究出版社,2004.
[2]李筱菊.語言測試科學與藝術.長沙:湖南教育出版社,1997.
[3]薛榮.當代語言測試:理論發展與未來趨勢,外語與外語教學,2008(10):44-47.endprint
摘 要: 科學正確的試卷分析能夠為教學及學習提供有意義的反饋,并能在很大程度上提高教學質量。本文綜合介紹了外語試卷信度、效度、難度、區分度四個維度的分析過程及學生考試成績的分析方法,以期對英語教師的教學及測試工作起到指導作用。
關鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學是第一性的,測試為教學服務,在我國,語言教學已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學。本文主要從語言測試理論的發展,外語測試四維度分析過程及方法,以及學生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試理論發展
著名語言學家戴維斯(1968)曾說“好的測試就如同一個忠實的仆人”,這個比喻形象地說明了測試是為教學服務的,所以不同歷史時期,會產生不同的語言觀語言理論,相應的也會產生不同的語言測試。世界語言測試經歷了四個階段(薛榮,2008):(1)前科學語言測試,教學法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結果主要由教師主觀判斷,主觀性極強,信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結構主義語言測試,語言是一套形式結構,可分成不同元素,語言學習就是刺激反應式,養成習慣,其教學法是聽說法,主要采用分離式測試,每題只考一個語言點,主要題型有詞匯填空、改錯、判斷。重標準化、客觀性和結果,有一定信度,考查結構。(3)心理語言學-社會語言學語言測試,Chomsky區分語言能力和語言行為,Hymes提出交際能力的概念,認為使用語言不但要按照語法規則產出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應現階段英語教學方法——任務教學法,強調聽說,加強口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試理論的發展,評判語言測試的標準在不斷完善。對于語言測試的分析,主要看測試本身和結果,通常從信度、效度、難度和區分度分析。
(1)信度
信度是指測試結果的穩定性或一致性,包括測試信度和評分人信度。信度通常用一對相關系數表示,相關系數越大,信度越高,通常對標準化測試的信度系數要求為0.9,課堂測試一般在0.7-0.8,當系數為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達到,只在中間,我們通常用的計算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數 p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關的因素:
題目數,測試內容,題目特點,分數多樣性。
B.與被試相關的因素:
異質性,考生應試能力,考生動機。
C.與施考相關的因素:
時間限制,作弊機會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應性,也就是說,是否考查了該考的東西,包括內容效度,準則相關性效度,結構效度,高考英語所測試的內容是否覆蓋考試大綱或規定的所有內容?效度越高,就越能準確測量要測的內容。計算公式仍體現為相關系數,受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質量的一個重要指標,難度用D表示,D越大,題越簡單,公式為:D=答對該題人數/總人數,試題難度指數一般在0.3-0.7最合適。
(4)區分度
區分度指不同的題把不同水平的考生真正地區分開來,區分度越高,不同水平的考生區別越大,試卷價值就越高,用區分度指數表示DI,區分度指數最高位1,最低位-1,DI>0.40區分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區分度不好,不能采用該試題,計算公式為點雙列相關:
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標準差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區分學生水平,難度適中區分度最好。
3.學生成績分析
英語教師只有對學生成績進行正確科學的分析,才能對學生水平作出更好的評價,才能為日后教學提供依據,從而進一步提升教學水平。學生成績分析包括成績描述和參數檢驗。
(1)成績描述
成績描述主要涉及的項目有:集中趨勢(眾數,中數,平均數),離散趨勢(全距,方差,標準差),數據分布狀態。
集中趨勢是反映數據分布中數據趨向中心位置的統計量。眾數指出現頻率最多的數。中數指處于中間位置的數。離散趨勢與集中趨勢相反,指數據的離散變異情況。全距指一組數據中最大數與最小數之差。標準差、方差對數據離散程度描述更客觀科學。
數據分布狀態:在語言測試中,學生外語成績是否呈正態分布,需要一個檢驗過程,正態分布呈鐘形,兩邊對稱在正態分布中眾數、中數、平均數重合于一點,其圖形為:
(2)參數檢驗
在我國英語教學中,一位英語老師經常會帶幾個平行班,這幾個班學生學習成績到底怎么樣,只靠成績描述數據是不夠的,還需要考慮多方面因素,這就需要參數檢查,主要有獨立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態分布中,這兩種檢驗可以用來檢驗兩個班級成績是否具有統計意義上的明顯區別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計算軟件可以幫助我們在較短的時間內完成大量的計算任務。
結語
作為出色的英語教師,備課上課不是我們唯一的任務,還應該特別注意學生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認為試卷分析就是純粹地看看學生成績高低,強調學生易犯錯誤的地方就行,即使作了分析,也是分析指標單一,分析過程粗糙,這樣就不能深入了解學生學情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學性、理據性,提高成績測試質量,更好地體現公平公正原則,從而更好地促進外語教學及習得。
參考文獻:
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學與研究出版社,2004.
[2]李筱菊.語言測試科學與藝術.長沙:湖南教育出版社,1997.
[3]薛榮.當代語言測試:理論發展與未來趨勢,外語與外語教學,2008(10):44-47.endprint
摘 要: 科學正確的試卷分析能夠為教學及學習提供有意義的反饋,并能在很大程度上提高教學質量。本文綜合介紹了外語試卷信度、效度、難度、區分度四個維度的分析過程及學生考試成績的分析方法,以期對英語教師的教學及測試工作起到指導作用。
關鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學是第一性的,測試為教學服務,在我國,語言教學已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學。本文主要從語言測試理論的發展,外語測試四維度分析過程及方法,以及學生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試理論發展
著名語言學家戴維斯(1968)曾說“好的測試就如同一個忠實的仆人”,這個比喻形象地說明了測試是為教學服務的,所以不同歷史時期,會產生不同的語言觀語言理論,相應的也會產生不同的語言測試。世界語言測試經歷了四個階段(薛榮,2008):(1)前科學語言測試,教學法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結果主要由教師主觀判斷,主觀性極強,信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結構主義語言測試,語言是一套形式結構,可分成不同元素,語言學習就是刺激反應式,養成習慣,其教學法是聽說法,主要采用分離式測試,每題只考一個語言點,主要題型有詞匯填空、改錯、判斷。重標準化、客觀性和結果,有一定信度,考查結構。(3)心理語言學-社會語言學語言測試,Chomsky區分語言能力和語言行為,Hymes提出交際能力的概念,認為使用語言不但要按照語法規則產出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應現階段英語教學方法——任務教學法,強調聽說,加強口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試理論的發展,評判語言測試的標準在不斷完善。對于語言測試的分析,主要看測試本身和結果,通常從信度、效度、難度和區分度分析。
(1)信度
信度是指測試結果的穩定性或一致性,包括測試信度和評分人信度。信度通常用一對相關系數表示,相關系數越大,信度越高,通常對標準化測試的信度系數要求為0.9,課堂測試一般在0.7-0.8,當系數為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達到,只在中間,我們通常用的計算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數 p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關的因素:
題目數,測試內容,題目特點,分數多樣性。
B.與被試相關的因素:
異質性,考生應試能力,考生動機。
C.與施考相關的因素:
時間限制,作弊機會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應性,也就是說,是否考查了該考的東西,包括內容效度,準則相關性效度,結構效度,高考英語所測試的內容是否覆蓋考試大綱或規定的所有內容?效度越高,就越能準確測量要測的內容。計算公式仍體現為相關系數,受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質量的一個重要指標,難度用D表示,D越大,題越簡單,公式為:D=答對該題人數/總人數,試題難度指數一般在0.3-0.7最合適。
(4)區分度
區分度指不同的題把不同水平的考生真正地區分開來,區分度越高,不同水平的考生區別越大,試卷價值就越高,用區分度指數表示DI,區分度指數最高位1,最低位-1,DI>0.40區分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區分度不好,不能采用該試題,計算公式為點雙列相關:
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標準差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區分學生水平,難度適中區分度最好。
3.學生成績分析
英語教師只有對學生成績進行正確科學的分析,才能對學生水平作出更好的評價,才能為日后教學提供依據,從而進一步提升教學水平。學生成績分析包括成績描述和參數檢驗。
(1)成績描述
成績描述主要涉及的項目有:集中趨勢(眾數,中數,平均數),離散趨勢(全距,方差,標準差),數據分布狀態。
集中趨勢是反映數據分布中數據趨向中心位置的統計量。眾數指出現頻率最多的數。中數指處于中間位置的數。離散趨勢與集中趨勢相反,指數據的離散變異情況。全距指一組數據中最大數與最小數之差。標準差、方差對數據離散程度描述更客觀科學。
數據分布狀態:在語言測試中,學生外語成績是否呈正態分布,需要一個檢驗過程,正態分布呈鐘形,兩邊對稱在正態分布中眾數、中數、平均數重合于一點,其圖形為:
(2)參數檢驗
在我國英語教學中,一位英語老師經常會帶幾個平行班,這幾個班學生學習成績到底怎么樣,只靠成績描述數據是不夠的,還需要考慮多方面因素,這就需要參數檢查,主要有獨立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態分布中,這兩種檢驗可以用來檢驗兩個班級成績是否具有統計意義上的明顯區別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計算軟件可以幫助我們在較短的時間內完成大量的計算任務。
結語
作為出色的英語教師,備課上課不是我們唯一的任務,還應該特別注意學生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認為試卷分析就是純粹地看看學生成績高低,強調學生易犯錯誤的地方就行,即使作了分析,也是分析指標單一,分析過程粗糙,這樣就不能深入了解學生學情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學性、理據性,提高成績測試質量,更好地體現公平公正原則,從而更好地促進外語教學及習得。
參考文獻:
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學與研究出版社,2004.
[2]李筱菊.語言測試科學與藝術.長沙:湖南教育出版社,1997.
[3]薛榮.當代語言測試:理論發展與未來趨勢,外語與外語教學,2008(10):44-47.endprint