普通話水平測試對推廣普通話具有極為重要的促進作用。它是促使推廣普通話工作逐步走向科學化、規范化、制度化、常規化的一項非常重要的舉措。普通話水平測試對維護我們母語的純潔性、弘揚中華語言文化傳統、傳承民族精神、增強學生愛國情懷、提高全民的普通話水平將發揮重要作用。現代漢民族共同語——普通話,以北京語音為標準音,以北方話為基礎方言,以典范的現代白話文著作為語法規范。普通話水平測試主要是檢測應試者運用普通話(語音、詞匯、語法)的規范程度和熟練程度,是一種口語形式的考試。普通話水平測試的構成要素有試題、測試員、應試者、評分標準。隨著推廣普通話工作的不斷擴大,普通話測試的信度與效度也面臨著考驗。
普通話水平測試是依據《普通話水平測試大綱》(教育部國家語委發教語用〔2003〕2號文件),以及普通話水平測試國家指導用書《普通話水平測試實施綱要》(國家語言文字工作委員會普通話培訓測試中心編制,商務印書館2004年1月版)的具體要求開展的。根據大綱的要求,普通話水平測試的試卷包括四部分內容:讀單音節詞語100個、讀雙音節詞語50個、朗讀短文、話題說話。
試題第一部分讀單音節詞語主要是測試應試者的語音基本功,也就是普通話中的聲、韻、調發音是否正確、規范。由于普通話測試的大綱中沒有對多音字做出特別的規定,所以在第一題中就出現了大量的多音字。多音字就是一個字有兩個或兩個以上的讀音。在調查的十套試題中,平均每套試題第一題中的多音字平均出現6次。測試中的多音字數量較多,無論是測試者還是應試者在遇到多音字的時候,首先選擇的是常用的讀音。但是當應試者選擇這個多音字不
劉照雄《〈普通話水平測試大綱〉總論》:“普通話水平測試不是普通話系統知識的考試,不是文化水平的考核,也不是口才的評估,是應試人運用普通話所達到的標準程度的檢測和評定。”可見,普通話水平是對應試者運用普通話的語音、詞匯和語法的規范程度的檢測,而不是對應試者文化水平高低的檢測,所以試題中應該避免大量的生僻字。但實際測試中試卷第一部分、第二部分卻出現了一些在現實生活中較少用到的一些偏字、難字、文言用字、方言用字等。在調查的十套試題中,生僻字列舉如下:“鄒”“舜”“檻”“沓”“苤”“稗”“佟”“襄”“簪”“側歪”“押解”“熨帖”“蚌埠”“糜子”“女紅”“倒嚼”等,而且這些生僻字在試題中分布不均衡,有的試卷生僻字多一些,有的試卷生僻字少一些。這樣的試題并不能真實地反映受試者的普通話水平,只是反映了應試者某一方面的文字水平或者說是文化水平。在測試中發現,有些應試者普通話講得很好,但只是因為第一部分遇到大量生僻字,不認識,沒有讀好,就直接影響了總的測試成績。所以我們要在盡可能滿足大綱要求的同時,盡量地采用實用的常見字來代替生僻字。這樣既反映普通話的發音,又可以消除應試者遇到生字時的緊張狀態,將會更公平、客觀地反映應試者普通話的水平,不會因對生字生詞的掌握偏差而影響考試成績。
試題第二部分讀雙音節詞語中,常有3~5個輕聲詞。所謂輕聲指的就是在一定的音節中讀得又輕又短的調子。測試中發現試卷中經常會出現兩讀的情況,即同一詞可以讀輕聲也可以讀非輕聲,這類詞輕聲與否有區別詞義的作用。調查的十套試題中,輕聲非輕聲兩讀詞平均出現2次。如:“兄弟”“對頭”“編輯”“本事”“大爺”“買賣”“實在”“下水”“地道”“大意”等。這類兩讀詞的存在必然會影響普通話測試的信度,因為測試員不可能全部掌握語言中的輕聲和非輕聲,在極短的時間里來判斷這類詞的讀音是否正確必然會出現失誤。解決的主要辦法就是盡量不采用這種兩讀詞,只選擇一些必讀輕聲詞。
各地的測試員由于個人素質有高有低,加之對推廣普通話和語言文字工作重要性的認識不同,對有關規章制度、執行標準的熟悉程度不同,對業務理論的掌握程度以及業務能力的高低不同等等,這些不同的測試員間存在的差異,往往造成普通話水平測試工作評分的不客觀、不公證的情況。有些測試員雖然口語基礎比較好,但聽音、辨音能力差,對一些語音缺陷、方音不夠敏感,捕捉得不夠準確;有的對自己不熟悉的方音敏感,但對自己所在地的方音不夠敏感,于是造成評判時信度失效現象的出現。
由于普通話水平測試大綱中沒有對普通話的各個音位在不同環境下的音位變體有一個統一明確有效的標準,所以測試員在實際測試時就有一定的靈活度。這個靈活度會產生對試題中的同一個音測試員定位標準不同的情況。如,很多測試員在測試過程中對上聲字(第三聲)、兒化、輕聲現象比較敏感,所以對這類音的定位標準過于狹窄,比較嚴格、苛刻;而有時候由于某種原因測試員對某一類音又過于遲鈍,從而造成對這類音的定位標準又過于寬泛;而對于那些比自己普通話水平還高的應試者測試員很難運用測試標準來正確評判,從而影響測試信度。
在具體測試過程中,測試員往往會帶有一些主觀評價。如對自己本專業的應試者的評判標準要比對非本專業的應試者寬松一些;對播音、主持、教師等相關領域的人員要比對其他人員嚴格一些等等。此外,應試者的年齡、身份、舉止、著裝、外貌、籍貫等因素也間接影響到測試員的評判。此外,測試員個人敬業程度的不同,也會造成評分的不客觀。認真嚴謹,一絲不茍的測試員,打的分數也比較客觀公正;相對隨意,對應試者錯誤、缺陷的標記時有時無,甚至開小差的測試員,打的分數就不夠準確。
以上這些不統一的標準會直接影響應試者的成績,造成測試信度降低。解決這些問題的方法有以下幾個:第一,在測試現場設置監控系統;第二,用障礙物把測試員和應試者隔開;第三,應試者信息完全由序號替代,測試過程中不允許出現和應試者有關的任何信息。我們希望通過這些方法能簡單有效地解決測試過程中由主觀原因造成的測試信度降低的問題。
普通話水平測試的試題雖是統一的,但每個測試員對評分標準的理解把握卻存在差異,也在一定程度上影響了評分的客觀性、公正性。根據《普通話水平測試大綱》和《普通話水平測試實施綱要》的評分辦法,對第一題和第二題對錯誤音節的評判,不同測試員在測試過程中基本上不會產生太多差異,但在“系統性”錯誤或缺陷的歸類上卻存在一定程度的差異。第四題朗讀與第五題說話的標準,尤其是方言語調和語言面貌(語音標準程度)標準的把握上,各測試員之間的差異很大。《細則》對朗讀題的方言語調(語調偏誤)是這樣規定的:“視程度扣0.5分、1分、2分(含字調、句調、變調、輕聲、輕重音格式、邏輯重音)。”“視程度”,那么什么程度該扣0.5分,什么程度扣1分,什么程度又該扣2分呢?這種模糊的感覺判斷使得不同測試員之間必然存在差異。于是出現了同一個考生的語調偏誤,不同測試員有的扣2分,有的只扣1分的現象。
[1]國家語委普通話水平測試中心.普通話水平測試實施綱要[Z].北京:商務印書館,2004.
[2]宋欣橋.普通話水平測試的評分差異[J].語文建設,1998,(9).
[3]屠國平.普通話水平測試員審音失度之成因及對策[J].紹興文理學院學報:哲學社會科學版,2000,(2).
[4]原新梅,劉冬冰.關于普通話水平測試若干問題的研究和對策[J].河南師范大學學報:哲學社會科學版,2001,(3).
[5]黃伯榮,廖序東.現代漢語[M].北京:高等教育出版社,2005.