宮雯雯
摘 要:在測試學領域,對于效度與信度的關系問題一直研究不斷。本文運用了效度和信度的理論,對大學英語無提綱式寫作測試進行分析,以期對測試的設計有所貢獻。
關鍵詞:效度 無提綱式寫作測試 大學英語
中圖分類號:H319 文獻標識碼:A 文章編號:1672-3791(2014)02(b)-0107-01
效度、信度和可行性是語言測試學的三個基本問題。在測試學領域,人們經常會分析和討論效度這一概念。它被看做衡量考試科學與否的重要標準。
1 效度的定義及分類
效度(validation)指測試的有效性,即測驗分數能夠代表所要測量的心理特性的程度,或測驗結果達到測驗目的的程度,換言之,是一項測試對所要測驗的特性測量到什么程度的估計。
由于效度是相對于測試的研究目的和研究側面而言的,具有多層面的特性,因此效度具有多種類型,但主要分為三類,即內容效度,效標關聯效度,結構效度。
內容效度是指測驗項目對所要測量的內容范圍的代表性程度。它是效度研究的重要問題,它決定了測試方法測試語言能力的程度。如果一項測試具有很高的內容效度,那么這項測試很有可能達到了測試目的,測量了它想要測量的內容。例如:一位教師給學生做一次英語測驗,該測驗的題目如果涵蓋了教學所欲達成的目標,及教材的重要內容,就可以說該測驗具有內容效度。目前尚沒有一種數量的測量方法可以衡量測試的內容效度,主要是采用邏輯的分析方法,仔細判斷每一項目是否符合及涵蓋所要測量的研究領域。
效標關聯效度是測驗分數與外部效標之間的相關程度,又稱準則關聯效度。其中,效標表示獨立于測驗結果,反映測驗目的的行為參照。根據選擇效標的時間不同,可分為:同時效度和預測效度。如果當測量學生智力時,將學生當時的成績作為效標,就代表其同時效度,故它表示測驗分數與實施測驗同一個時間所取得的效標之間的相關性,目的使用測驗分數估計個人在效標方面的目前實際表現。而如果當測量學生智力時,將測量之后一段時間的學生成績作為效標,即為預測效度,它是測驗分數與實施測驗后一段時間所取得效標之間的相關性,目的在于使用測驗分數預測個人在效標方面的未來表現。
2 無提綱式寫作測試在大學英語測試中的應用
作為一種高效度的測試形式,長久以來寫作測試被廣泛應用于各種正規語言考試之中,尤其是在中國,寫作是英語考試中固定的部分,比如:高考,大學英語考試和英語專業考試。
大學英語四六級考試作為社會影響大,涉及面廣的全國標準化考試,已有二十多年的歷史,它一直在爭議中不斷的改革發展,然而,無論怎樣變化,英語基礎寫作能力的考查一直占據著一席之地,且2005年改革后,寫作測試被調整為答題順序的第一部分,足見其舉足輕重的地位。
長期以來,寫作部分的考查形式通常是指定一個命題,列出三點提綱式的要求,讓學生在30分鐘內完成一篇120字的作文。這種一成不變的考試模式衍生了一系列應對的作文模板,模板大多用詞精準,結構復雜,沒有任何的語言錯誤,符合四六級高分作文的評分標準,并且模板中的字數會占到四級字數要求的1/3~1/2。如此一來,使得寫作測試轉變為對于英語文章背誦默寫的測試,大大降低了寫作測試的效度,違背了測試的初衷,此種寫作測試一直沿用至2012.12的四級和2011.12的六級考試,在這兩次考試當中,采取了無提綱式寫作測試,改變了以往僵硬的考試形式,讓學生毫無束縛地自由發揮想象力,從傳統的固定寫作測試模式中解脫出來。此后,在近兩年的四六級考試中繼續堅持了這種無提綱式寫作測試。
3 研究過程
針對研究問題,此研究采取實證研究。該次無提綱式寫作測試的研究方法主要為寫作測試,研究起止時間是2012年8月20日至2013年6月15日。研究對象為吉林某高校2012級體驗英語中級班1、2兩班,共計100名學生,把研究對象分為實驗班級(EG)和對照班級(CG)。
首先,在實驗前同時為兩個班級做一次前測,測試結果如下。
通過前測,我們知道,兩個班級最高分與最低分一致,平均分僅相差0.02。結果表明,在做實驗前,實驗班與對照班兩組學生的寫作能力基本為同一水平。
此后,實驗班級采取的是每兩周一次的無提綱式寫作測試,整個測試周期為一學年。每次收回寫作試卷50份。測驗滿分根據大學英語四級寫作部分的核算標準,為100分。評分教師三人均參加過全國四級考試的閱卷工作,每位學生成績取三位教師打分的平均值,作為最終成績。
在研究結束時,再次同時為實驗班和對照班進行后測,測試結果如下。
后測結果明顯展示出,實驗班的最低分比對照班高出7分,同時實驗班的平均分比對照班平均分高6.16分。
另外,為保證實驗的有效性,所有得到的學生成績作為研究所需的數據進行收集整理。
4 結論
一方面,前測結果的一致性說明無提綱式寫作測試與以往的寫作測試一樣,可以如實反映學生的寫作能力,因此它是具有很高的效度的。
另一方面,后測結果顯示出,通過對實驗班長達一學年的無提綱式寫作測試,學生的寫作能力大大提高。在適應了無提綱式寫作形式的同時,學生可以自己合理的安排文章結構,選擇合適的詞匯表達自己的意思。
總而言之,本次研究表明無提綱式寫作測試是一種有效測試學生寫作水平的方法,而且這種寫作練習也可以提高學生寫作水平。測試的目的是為了促進學生的學習,因此,我們的試題設計者應不斷優化試題的設計。
參考文獻
[1] Bachman,L.F. Fundamental Considerations in Language Testing[M].Oxford University Press,1990.
[2] Bachmann,L.F. and A.S. Palmer.Language Testing in Practice[M].Oxford: Oxford University Press,1996.
[3] Hughes,A.Testing for Language Teachers[M].Cambridge:Cambridge University Press,1989.
[4] 蔡基剛.大學英語四,六級寫作要求和評分標準對中國學生寫作的影響[J].解放軍外國語學院學報,2002(5).
[5] 李筱菊,語言測試科學與藝術[M].長沙:湖南教育出版社,1997.
[6] 楊惠中,Weir,c.大學英語四、六級考試效度研究[M].上海:上海外語教育出版社,1998.endprint
摘 要:在測試學領域,對于效度與信度的關系問題一直研究不斷。本文運用了效度和信度的理論,對大學英語無提綱式寫作測試進行分析,以期對測試的設計有所貢獻。
關鍵詞:效度 無提綱式寫作測試 大學英語
中圖分類號:H319 文獻標識碼:A 文章編號:1672-3791(2014)02(b)-0107-01
效度、信度和可行性是語言測試學的三個基本問題。在測試學領域,人們經常會分析和討論效度這一概念。它被看做衡量考試科學與否的重要標準。
1 效度的定義及分類
效度(validation)指測試的有效性,即測驗分數能夠代表所要測量的心理特性的程度,或測驗結果達到測驗目的的程度,換言之,是一項測試對所要測驗的特性測量到什么程度的估計。
由于效度是相對于測試的研究目的和研究側面而言的,具有多層面的特性,因此效度具有多種類型,但主要分為三類,即內容效度,效標關聯效度,結構效度。
內容效度是指測驗項目對所要測量的內容范圍的代表性程度。它是效度研究的重要問題,它決定了測試方法測試語言能力的程度。如果一項測試具有很高的內容效度,那么這項測試很有可能達到了測試目的,測量了它想要測量的內容。例如:一位教師給學生做一次英語測驗,該測驗的題目如果涵蓋了教學所欲達成的目標,及教材的重要內容,就可以說該測驗具有內容效度。目前尚沒有一種數量的測量方法可以衡量測試的內容效度,主要是采用邏輯的分析方法,仔細判斷每一項目是否符合及涵蓋所要測量的研究領域。
效標關聯效度是測驗分數與外部效標之間的相關程度,又稱準則關聯效度。其中,效標表示獨立于測驗結果,反映測驗目的的行為參照。根據選擇效標的時間不同,可分為:同時效度和預測效度。如果當測量學生智力時,將學生當時的成績作為效標,就代表其同時效度,故它表示測驗分數與實施測驗同一個時間所取得的效標之間的相關性,目的使用測驗分數估計個人在效標方面的目前實際表現。而如果當測量學生智力時,將測量之后一段時間的學生成績作為效標,即為預測效度,它是測驗分數與實施測驗后一段時間所取得效標之間的相關性,目的在于使用測驗分數預測個人在效標方面的未來表現。
2 無提綱式寫作測試在大學英語測試中的應用
作為一種高效度的測試形式,長久以來寫作測試被廣泛應用于各種正規語言考試之中,尤其是在中國,寫作是英語考試中固定的部分,比如:高考,大學英語考試和英語專業考試。
大學英語四六級考試作為社會影響大,涉及面廣的全國標準化考試,已有二十多年的歷史,它一直在爭議中不斷的改革發展,然而,無論怎樣變化,英語基礎寫作能力的考查一直占據著一席之地,且2005年改革后,寫作測試被調整為答題順序的第一部分,足見其舉足輕重的地位。
長期以來,寫作部分的考查形式通常是指定一個命題,列出三點提綱式的要求,讓學生在30分鐘內完成一篇120字的作文。這種一成不變的考試模式衍生了一系列應對的作文模板,模板大多用詞精準,結構復雜,沒有任何的語言錯誤,符合四六級高分作文的評分標準,并且模板中的字數會占到四級字數要求的1/3~1/2。如此一來,使得寫作測試轉變為對于英語文章背誦默寫的測試,大大降低了寫作測試的效度,違背了測試的初衷,此種寫作測試一直沿用至2012.12的四級和2011.12的六級考試,在這兩次考試當中,采取了無提綱式寫作測試,改變了以往僵硬的考試形式,讓學生毫無束縛地自由發揮想象力,從傳統的固定寫作測試模式中解脫出來。此后,在近兩年的四六級考試中繼續堅持了這種無提綱式寫作測試。
3 研究過程
針對研究問題,此研究采取實證研究。該次無提綱式寫作測試的研究方法主要為寫作測試,研究起止時間是2012年8月20日至2013年6月15日。研究對象為吉林某高校2012級體驗英語中級班1、2兩班,共計100名學生,把研究對象分為實驗班級(EG)和對照班級(CG)。
首先,在實驗前同時為兩個班級做一次前測,測試結果如下。
通過前測,我們知道,兩個班級最高分與最低分一致,平均分僅相差0.02。結果表明,在做實驗前,實驗班與對照班兩組學生的寫作能力基本為同一水平。
此后,實驗班級采取的是每兩周一次的無提綱式寫作測試,整個測試周期為一學年。每次收回寫作試卷50份。測驗滿分根據大學英語四級寫作部分的核算標準,為100分。評分教師三人均參加過全國四級考試的閱卷工作,每位學生成績取三位教師打分的平均值,作為最終成績。
在研究結束時,再次同時為實驗班和對照班進行后測,測試結果如下。
后測結果明顯展示出,實驗班的最低分比對照班高出7分,同時實驗班的平均分比對照班平均分高6.16分。
另外,為保證實驗的有效性,所有得到的學生成績作為研究所需的數據進行收集整理。
4 結論
一方面,前測結果的一致性說明無提綱式寫作測試與以往的寫作測試一樣,可以如實反映學生的寫作能力,因此它是具有很高的效度的。
另一方面,后測結果顯示出,通過對實驗班長達一學年的無提綱式寫作測試,學生的寫作能力大大提高。在適應了無提綱式寫作形式的同時,學生可以自己合理的安排文章結構,選擇合適的詞匯表達自己的意思。
總而言之,本次研究表明無提綱式寫作測試是一種有效測試學生寫作水平的方法,而且這種寫作練習也可以提高學生寫作水平。測試的目的是為了促進學生的學習,因此,我們的試題設計者應不斷優化試題的設計。
參考文獻
[1] Bachman,L.F. Fundamental Considerations in Language Testing[M].Oxford University Press,1990.
[2] Bachmann,L.F. and A.S. Palmer.Language Testing in Practice[M].Oxford: Oxford University Press,1996.
[3] Hughes,A.Testing for Language Teachers[M].Cambridge:Cambridge University Press,1989.
[4] 蔡基剛.大學英語四,六級寫作要求和評分標準對中國學生寫作的影響[J].解放軍外國語學院學報,2002(5).
[5] 李筱菊,語言測試科學與藝術[M].長沙:湖南教育出版社,1997.
[6] 楊惠中,Weir,c.大學英語四、六級考試效度研究[M].上海:上海外語教育出版社,1998.endprint
摘 要:在測試學領域,對于效度與信度的關系問題一直研究不斷。本文運用了效度和信度的理論,對大學英語無提綱式寫作測試進行分析,以期對測試的設計有所貢獻。
關鍵詞:效度 無提綱式寫作測試 大學英語
中圖分類號:H319 文獻標識碼:A 文章編號:1672-3791(2014)02(b)-0107-01
效度、信度和可行性是語言測試學的三個基本問題。在測試學領域,人們經常會分析和討論效度這一概念。它被看做衡量考試科學與否的重要標準。
1 效度的定義及分類
效度(validation)指測試的有效性,即測驗分數能夠代表所要測量的心理特性的程度,或測驗結果達到測驗目的的程度,換言之,是一項測試對所要測驗的特性測量到什么程度的估計。
由于效度是相對于測試的研究目的和研究側面而言的,具有多層面的特性,因此效度具有多種類型,但主要分為三類,即內容效度,效標關聯效度,結構效度。
內容效度是指測驗項目對所要測量的內容范圍的代表性程度。它是效度研究的重要問題,它決定了測試方法測試語言能力的程度。如果一項測試具有很高的內容效度,那么這項測試很有可能達到了測試目的,測量了它想要測量的內容。例如:一位教師給學生做一次英語測驗,該測驗的題目如果涵蓋了教學所欲達成的目標,及教材的重要內容,就可以說該測驗具有內容效度。目前尚沒有一種數量的測量方法可以衡量測試的內容效度,主要是采用邏輯的分析方法,仔細判斷每一項目是否符合及涵蓋所要測量的研究領域。
效標關聯效度是測驗分數與外部效標之間的相關程度,又稱準則關聯效度。其中,效標表示獨立于測驗結果,反映測驗目的的行為參照。根據選擇效標的時間不同,可分為:同時效度和預測效度。如果當測量學生智力時,將學生當時的成績作為效標,就代表其同時效度,故它表示測驗分數與實施測驗同一個時間所取得的效標之間的相關性,目的使用測驗分數估計個人在效標方面的目前實際表現。而如果當測量學生智力時,將測量之后一段時間的學生成績作為效標,即為預測效度,它是測驗分數與實施測驗后一段時間所取得效標之間的相關性,目的在于使用測驗分數預測個人在效標方面的未來表現。
2 無提綱式寫作測試在大學英語測試中的應用
作為一種高效度的測試形式,長久以來寫作測試被廣泛應用于各種正規語言考試之中,尤其是在中國,寫作是英語考試中固定的部分,比如:高考,大學英語考試和英語專業考試。
大學英語四六級考試作為社會影響大,涉及面廣的全國標準化考試,已有二十多年的歷史,它一直在爭議中不斷的改革發展,然而,無論怎樣變化,英語基礎寫作能力的考查一直占據著一席之地,且2005年改革后,寫作測試被調整為答題順序的第一部分,足見其舉足輕重的地位。
長期以來,寫作部分的考查形式通常是指定一個命題,列出三點提綱式的要求,讓學生在30分鐘內完成一篇120字的作文。這種一成不變的考試模式衍生了一系列應對的作文模板,模板大多用詞精準,結構復雜,沒有任何的語言錯誤,符合四六級高分作文的評分標準,并且模板中的字數會占到四級字數要求的1/3~1/2。如此一來,使得寫作測試轉變為對于英語文章背誦默寫的測試,大大降低了寫作測試的效度,違背了測試的初衷,此種寫作測試一直沿用至2012.12的四級和2011.12的六級考試,在這兩次考試當中,采取了無提綱式寫作測試,改變了以往僵硬的考試形式,讓學生毫無束縛地自由發揮想象力,從傳統的固定寫作測試模式中解脫出來。此后,在近兩年的四六級考試中繼續堅持了這種無提綱式寫作測試。
3 研究過程
針對研究問題,此研究采取實證研究。該次無提綱式寫作測試的研究方法主要為寫作測試,研究起止時間是2012年8月20日至2013年6月15日。研究對象為吉林某高校2012級體驗英語中級班1、2兩班,共計100名學生,把研究對象分為實驗班級(EG)和對照班級(CG)。
首先,在實驗前同時為兩個班級做一次前測,測試結果如下。
通過前測,我們知道,兩個班級最高分與最低分一致,平均分僅相差0.02。結果表明,在做實驗前,實驗班與對照班兩組學生的寫作能力基本為同一水平。
此后,實驗班級采取的是每兩周一次的無提綱式寫作測試,整個測試周期為一學年。每次收回寫作試卷50份。測驗滿分根據大學英語四級寫作部分的核算標準,為100分。評分教師三人均參加過全國四級考試的閱卷工作,每位學生成績取三位教師打分的平均值,作為最終成績。
在研究結束時,再次同時為實驗班和對照班進行后測,測試結果如下。
后測結果明顯展示出,實驗班的最低分比對照班高出7分,同時實驗班的平均分比對照班平均分高6.16分。
另外,為保證實驗的有效性,所有得到的學生成績作為研究所需的數據進行收集整理。
4 結論
一方面,前測結果的一致性說明無提綱式寫作測試與以往的寫作測試一樣,可以如實反映學生的寫作能力,因此它是具有很高的效度的。
另一方面,后測結果顯示出,通過對實驗班長達一學年的無提綱式寫作測試,學生的寫作能力大大提高。在適應了無提綱式寫作形式的同時,學生可以自己合理的安排文章結構,選擇合適的詞匯表達自己的意思。
總而言之,本次研究表明無提綱式寫作測試是一種有效測試學生寫作水平的方法,而且這種寫作練習也可以提高學生寫作水平。測試的目的是為了促進學生的學習,因此,我們的試題設計者應不斷優化試題的設計。
參考文獻
[1] Bachman,L.F. Fundamental Considerations in Language Testing[M].Oxford University Press,1990.
[2] Bachmann,L.F. and A.S. Palmer.Language Testing in Practice[M].Oxford: Oxford University Press,1996.
[3] Hughes,A.Testing for Language Teachers[M].Cambridge:Cambridge University Press,1989.
[4] 蔡基剛.大學英語四,六級寫作要求和評分標準對中國學生寫作的影響[J].解放軍外國語學院學報,2002(5).
[5] 李筱菊,語言測試科學與藝術[M].長沙:湖南教育出版社,1997.
[6] 楊惠中,Weir,c.大學英語四、六級考試效度研究[M].上海:上海外語教育出版社,1998.endprint