【摘要】本文分析了某高校國際教育學院中級水平留學生的一套期末聽力考試試卷,主要對該試卷的信度和難度進行了分析,結果表明該試卷信度較高,難度適中。根據國際漢語教學通用課程大綱的要求,該試卷全面覆蓋了需要學生掌握的各種聽力能力。
【關鍵詞】中級;聽力;信度;測試能力;難度
一、測試概況
1、測試對象
本套試卷的被試均是上海某高校國際教育學院中級班的留學生,共79名。該年級學生于2012年6月,即本科二年級下學期期末參加了本次測試。在79名被試中,及格率為55.69%,在各分數段中,分數段70-80占人數百分比最多,為20.25%。
2、試卷構成及評分
本套試卷由50道單項選擇題構成,考試分為三部分,第一部分試題是一個人說一句話,第二個人根據這句話提出問題。第二部分試題是兩個人的簡短對話,第三個人根據對話提出問題。第三部分試題是幾段簡短的對話或講話,每段話后,被試者將聽到若干個問題。該測試要求被試將答案選項涂在答題卡上,由機器統一閱卷,每答對一題得2分,共100分。
3、試卷信度
信度,是指測試結果的穩定性或可靠性的程度。信度是反映測試是否受到非測試因素的影響,反映測試客觀性和可靠性的指標。影響測試信度的因素很多,主要涉及到試題和評分兩個方面。就試題本身而言,其信度主要取決于測試范圍與題量;而評分的信度則取決于評分標準的客觀性與準確性。本考卷的覆蓋面較廣,對學生聽力技能的各個方面的能力都進行了考核;從題量來看,這次的考試試卷共有50個題,考試時間定為90分鐘。相對于中級漢語學習者的語言水平來說,這次考試的題量與時間安排是比較合理的。從評分標準來看,本試卷試題均為客觀題,因此評分具備客觀性與準確性。本套試卷我們采用了試題分半法(split-halfmethod)來進行信度檢驗,把整個試卷的50道題分為奇數題和偶數題,然后根據SPSS軟件計算出奇數題與偶數題的測試相關性,輸出結果為:0.808,這表明本試卷的對半信度在0.01顯著水平之下,即奇數題和偶數題的測試結果顯著相關,根據斯皮爾曼,布朗(Spearman-Brown)公式校正,得到整個測試的信度系數為0.894,由此可見,此次測試的信度較高,測試分數的穩定和一致性程度符合成績測試的要求。
二、測試能力考察及題目分析
1、測試能力考察
由于本試卷的被試均為漢語水平為中級的留學生,我們參考國際漢語教學通用課程大綱,判定中級學生對應為大綱中的四級標準,大綱中四級標準對語言技能中單項技能“聽”的技能的要求為:能聽懂工作場合及社交場合中的談話或發言,理解陳述性或論述性表達的大意,抓住主要內容和關鍵信息。其中包括:
1.能抓住工作場合中話題熟悉的談話或發言的主要內容和觀點;
2.能抓住社交場合中對話或交談的主要內容和關鍵信息,領悟說話人的真實意圖:
3.能大致聽懂與個人或工作相關的一些議論;
4.能理解陳述性或論述性話語的大意;
5.能聽懂與常見話題相關的一系列指示或要求;
6.能聽懂稍長的敘述性故事。
根據該大綱的要求,我們看出要考察的主要能力有:1、聽辨音能力;2、對字詞意義的理解能力;3、對主要內容的把握和概括能力;4、對細節的把握能力;5、根據語篇推斷的能力;6、對文化的理解能力,其中包括成語、俗語和慣用語以及文化常識。其中聽辨音能力為聽力理解中最基礎的能力,每一道題目都考察這一能力,因此我們在下表中不單獨列出此能力對應試題,這樣我們把除聽辨音能力之外的所有能力,對應本試卷的試題進行了歸類和分析,我們發現,本試卷對大綱中要求的六種能力均有涉及,其中有的題目不只考察了一種能力,總體看來,本試卷對細節的把握能力和根據語篇推斷的能力考點設置較多,而對文化的理解能力(包括成語、俗語、慣用語)考點設置較少,這也可以在以后的考試中增加此類考點。根據學生答對率情況,我們可以看出,學生對于每種能力的題目答對率水平相當,說明學生在各方面的能力比較均衡。
2、測試能力例題解析
根據國際漢語教學通用課程大綱要求,我們可以發現此試卷符合大綱要求,考點設置全面覆蓋。下面我們就各考察能力進行具體分析:
1.對字詞意義的理解能力
例:我花了很長時間準備HSK考試,可昨天一考,我覺得還是夠嗆。
問:說話人HSK考得怎么樣?
A.很好
B.比較好
C.還可以
D.不好
本題我們首先要聽出這句話的意思,才可以根據句子內容理解題意,選出答案。本題中的關鍵詞為“夠嗆”,“夠嗆”是一個具有口語色彩的詞語,在句中的意思是不能夠達到理想的要求。因此答案為D,我們只有知道“夠嗆”的意思,才能做出本題。
2.對主要內容的概括能力
例:經過三個月的努力學習,他的漢語水平明顯提高了。
問:他現在的漢語水平怎么樣?
A.好多了
B.比以前好一點
C.退步了
D.跟原來一樣
本題提問形式為“……怎么樣?”這種提問方式往往考察的是對主要內容的概括能力。本題中說得是“他”的漢語水平問題,其中有“明顯提高”關鍵詞,因此我們可以概括出整句話的意思,知道答案是A。
3.對細節的把握能力
例:男:小金,你不是買新車了嗎?怎么今天沒開?
女:唉,別提了,每天上下班路都特別堵。今天的會議特別重要,我怕開會遲到,所以就坐地鐵來了。
問:女的為什么沒有開車來?
A.汽車壞了
B.擔心堵車
C.擔心出事故
D.車被借走了
本題中有一個細節需要聽清楚正確理解,即:每天上下班路都特別堵。這句話是本題的關鍵信息,聽清楚并理解后,即可選出正確答案B,因此此題主要考察學生對細節的把握能力。
4.根據語篇推斷的能力
例:女:這件毛衣洗了兩遍也沒洗干凈,看來今天我還得再洗一遍。
男:別洗了,干脆扔了吧。
問:男的是什么意思?
A.應該洗三遍
B.洗一遍就夠了
C.不要這件毛衣了
D.再買一件新毛衣
本題聽后,應該對男的的言外之意有所體會,女的說要再洗一遍,男的說:“別洗了,干脆扔了吧”。這里我們應該知道男的的言外之意是不要這件衣服了,那么就可以知道本題答案為C,因此本題主要考察的根據語篇推斷的能力。
5.對文化的理解能力(包括成語、俗語、慣用語)
例:男:如果解決不了人們的飲食問題,就會有很大麻煩。
女:那還用說,俗話說:“民以食為天”嘛。
問:他們正在談論什么?
A.怎么解決“吃”的問題
B.“吃”在人們生活中的重要性
C.吃什么對身體好
D.關于“吃”的一些俗話
本題我們知道男的在說飲食問題,我們知道飲食問題即“吃飯”問題,然后女的用了一句慣用語和一句俗語,分別是“那還用說”,意思是“不用說,顯而易見”,俗語是“民以食為天”,意思是“吃在人們的生活中是非常重要的。”如果被試不懂這些慣用語和俗語的意思,就很難選出正確答案B,因此此題主要考察的是對文化的理解能力。
三、難度分析
難度分析是試卷測試的重要組成部分。題目難度是由答對的比例所決定的。難度公式是:P=∑Cr-N,P是難度,即答對的比例,∑Cr是答對的總數,N是受試者人數。難度越高,答對的比例就越少,答錯的比例就越高。因此,難易度與題目的實際難度成反比。也就是說,數值越小,難度越大。研究證明:難度范圍靠近0.5是最恰當的。研究證實,比較理想的做法是把題目的難易度控制在0.3-0.7之間,根據統計,本套試卷總難度為0.62,在理想范圍之內。總體來說,本套試卷難度適中和偏易題占了絕大多數,由于本套試卷是針對學生學過的知識進行成績測試,并不是水平測試,因此此種難度較為合適。