莫 運 曉
(武漢交通職業學院,湖北 武漢 430065)
?
論機輔測試中測試員在封閉測試環境下的行為模式困局
莫 運 曉
(武漢交通職業學院,湖北 武漢 430065)
摘要:普通話水平測試機輔測試是應試人和測試員分別在不同的封閉環境下獨立完成,封閉環境下測試員的行為模式有一些困局。闡釋這些困局產生的原因并提出解決思路及建議。
關鍵詞:普通話水平機輔測試;封閉環境;行為模式
國家普通話水平測試工作從2006年開始進行計算機輔助測試試點,計算機輔助測試在2009年開始在中國大陸全面鋪開,到目前為止,機輔測試已經比較成熟,積累了一定的經驗。但是機輔測試有些地方還不能完全實現計算機智能化,仍需要人工完成。在人機合作的過程中,有些地方并不是盡善盡美,出現了一些困局,這些值得我們思考和探討,以期將來改進。
1計算機機輔測試和封閉環境
在機輔測試的過程中,前三題有文字憑借的讀“單音節字詞”“多音節詞語”和“朗讀短文”項,都可以由評測軟件完成,但是第四題“單向說話”,由于語料不可預估,必須由測試員人工測評。最后得分由系統的前三題打分和測試員第四題打分相加綜合而成。
普通話水平測試進入機測階段,和以前的測試方式相比發生了革命性的變革。考生和測試員分別在封閉環境下完成自己的任務。考生進入測試室開始考試,面對的電腦設備,只需要按照屏幕要求進行朗讀和單向說話,無需進行交流,沒有測試員現場評判,不會受周圍環境的影響。

但是明顯不同于以往。以前測試員都在考試現場,每組測試員“面對面”,可以互相交流討論;機測以后,測試員是“背對背”,根本不和搭檔見面,更無從交流討論,是絕對的獨立完成。整個過程不受外部環境和他人的干擾和影響,這種環境正是管理學上所說的“不受環境影響也不與環境發生相互作用的系統”[1],完全是一個封閉的環境。
在傳統的人工測試活動中,應具備四大要素:測試主體(測試員)、測試對象(考生)、測試依據(《普通話水平測試綱要》)和測試手段[2]。而在機測活動中,四大要素只有測試主體未變,其余都發生了變化:測試手段發生了變革,由人工測試走向電腦智能輔助;測試員只需配備網絡、電腦和與之配套的聲音設備就可以進行工作。測試對象不再出現。由于機測和以前的測試手段不同,所以測試依據也發生了顯著變化。原有的《普通話水平測試綱要》并未包含機輔測試評分的內容,故各省各自制定了相應的《評分細則》或者《計算機輔助普通話水平測試第四題評分補充規定》。
由于測試手段的變化,使得測試環境發生相應的變化,形成各自封閉的測試環境。在不同的封閉的環境下,測試主體和對象分別完成各自的任務,互不干擾,當然也可能產生互動。這樣的封閉的測試環境,對考生來說,有利有弊。由于現場沒有考官,可以緩解考試壓力。但是測試開始調試設備等過程也會使有些考生產生緊張情緒,同時也可能由于現場沒有考官干預而產生漏讀、背稿、朗讀文本、無效語料、缺時等現象。
對于測試員來說,評測的封閉環境也是利弊互現。最大的優勢是避免了人情分的出現,評測結果更加公正。由于單人在線評測,時間上相對來說比較寬松自由,而且可以反復聽,有利于提高準確率;因無法和搭檔交流討論,不易受他人影響,評分相對客觀。在這樣的封閉環境下進行獨立評測,弊端也是無法回避的。沒有了前三題的參考,僅憑第四題單向說話三分鐘,對應試人的語音做全面的判斷,確實有一定的難度;再加上測試員本身的個體差異,就會造成評分的差別。
2測試員在封閉測試環境中的行為模式困局分析
普通話水平測試在我國已經開展20年,培養了大批普通話測試員。測試員們在進行測評打分的時候,聽辨和記錄同時進行、測評標準上定性和定量結合,隨著經驗的不斷積累形成固定的測評行為和完成的方式,這就是測試員的行為模式。在機輔測試中,這種行為模式卻步入困局。表現為,在沒有前三題作為參考的情況下,測試員要么不敢輕易扣分,要么評分失準;在無法和搭檔討論的“背靠背”的打分模式下,兩名測試員給出的分數相差過大。
普通話水平測試第四題評分時,測試員的主觀因素對分值影響很大。比如從生理上來說,測試員天然的聽力水準會有細微差別,所以對于語料的聽辨會有細微的不同,那么對于語音的正誤缺陷的判斷就會有所差異。還有,測試員自身的語音水平和受方音影響的程度,也左右著測試員評分的水準。另外,雖然評分的標準是統一的,但是每個測試員對評分標準的理解和把握不完全一致,會導致打分的差異。還有,測試員的態度、業務水平不同,也會造成評分的不同。
在封閉環境測試評分中,在測評第四題的操作中,絕大多數測試員是堅持按照標準正常打分。但是因為沒有面對面的搭檔,沒有了參考和借鑒、討論,測試員對自己評分水平易產生不自信或打分失準,導致在評分過程中對評分標準的把握出現過松或者過嚴的情況。有時候測試員擔心自己把握標準過嚴,而采取從輕處理;有時候因為不知道應試人前三題得分情況,害怕因為自己的分數導致應試人“不及格”,有意放松(因為普通話水平測試的等級可以直接影響應試人的從業資格)。最常見的應試人在三分鐘內錯誤超過15個音節就歸為五擋扣9分,很多時候,測試員都只扣四擋8分,不會扣到9分。也有測試員覺得把握標準越嚴越好,或者擔心自己把握標準不夠精準,從嚴打分。最突出的表現在高分段,把一擋打成二擋、二擋打成三檔,造成評分失準。
測試員對待測試的態度也是影響評分準確度的重要因素之一。在第四題的評判中,如果只注意應試人的語音標準程度,對應試人的詞匯語法的方言現象輕易放過,就會出現評分誤差。在機輔測試中,應試人在封閉環境下不受任何干預地完成測試。在沒有人干預的情況下,會出現在人測考場上不會出現的狀況,如說話斷斷續續甚至長時間不說話,或者重復一些沒有意義沒有評判價值的語句,或者帶了稿件甚至從現場網上搜到范文進行朗讀。遇到這種錄音,機測測試員如果稍一馬虎,就會放過,僅僅機械評判應試人語音的錯誤、缺陷,忽視流暢度、朗讀文本、離題等項的評分,就會造成很大的評分誤差。所以測試員的在測評的時候,必須具備嚴肅認真的態度,嚴格按照機輔測試的評分細則打分,而不僅僅依靠人測的評分經驗。
3機輔測試測試員行為模式困局的解決思路及建議
要減少機輔測試中測試員封閉環境測試的困局,筆者認為可以從以下方面下功夫:
3.1加強對應試人的測前培訓,減少評分干擾
為減少應試人在考場上因沒有人工干預容易出現的諸如缺時、無效語料等狀況,切實加強測前培訓,并且加重機測部分內容的培訓,使應試人了解機輔測試、掌握相應的應試常識,從而避免無謂的失分。這樣,對于測試員來說,應該可以減少非語音現象的出現,能讓測試員更專注于對應試人語音的評分。
3.2改進機測評分界面,完善評分項目,增加前三題分值作為參考
目前大家使用的國家普通話水平測試信息管理系統,在第四項評分頁面只有語音標準程度、流暢、詞匯語法、缺時、離題、無效語料這幾個評分項目,應試人經常出現的“朗讀文本”扣分項目并沒有出現,應把這一項增加進來。另外,建議在第四題的評分頁面增加機測系統所給出的前三題的分值,這樣測試員就對應試人的語音情況有個大致的了解,可以作為第四題測評時的參考,避免了評分的盲目性。其實,提供前三題的分值作為參考更主要的目的是解決測試員在封閉環境測試時產生的焦慮心理,使之能更自信地打分。
3.3加強測試員培訓,提高其業務水平,增強其敬業精神和責任感
測試員的業務水平是測試質量的保證。在機測的封閉環境下,難免出現新的情況和新的問題,各測試站應該切實加強對測試員業務的培訓和職業操守的教育,定期或者不定期舉行學習、研討、培訓,以提高其業務能力,并增強其責任意識和敬業精神。
參考文獻:
[1]羅賓斯.管理學[M].北京:中國人民大學出版社,2006.
[2]姚喜雙,等.普通話水平測試概論[M].北京:高等教育出版社,2011.
[3]楊康.計算機輔助普通話水平測試評測質量影響因素分析[J].考試研究,2013,(5).
[4]鄒斌.機測普通話說話項測評分析與對策研究[J].鎮江高等專科學報,2011,(4).
[5]陳申.語言文化教學策略研究[M].北京:北京語言文化大學出版社,2001.
責任編輯:李增華
作者簡介:莫運曉(1970—),女,湖北武漢人,碩士,講師。研究方向:語言及語言應用。
收稿日期:2015-12-03
中圖分類號:H102
文獻標志碼:A
文章編號:1674-6341(2016)01-0083-02
doi:10.3969/j.issn.1674-6341.2016.01.036