999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

影響普通話水平測試(PSC)成績的因素分析

2020-05-10 19:34:34楊青
現代職業教育·高職高專 2020年16期
關鍵詞:水平評價

楊青

[摘? ? ? ? ? ?要]? 測試員在進行普通話水平測試時,有時不可避免地受到一些因素干擾,使測試成績出現偏差,無法反映應試者的真實水平。承認普通話測評誤差是真實存在的,不可避免,基于這種認識,試圖總結測試員測試過程中影響測試成績的因素,探討如何能最大限度縮小這些因素對測試成績的影響,使考生普通話水平測試成績更加接近真實水平。

[關? ? 鍵? ?詞]? 普通話水平測試;測試員;影響因素;測試成績

[中圖分類號]? H102-4? ? ? ? ? ? ?[文獻標志碼]? A? ? ? ? ? ? ? [文章編號]? 2096-0603(2020)16-0150-02

普通話水平測試(漢語拼音簡稱為PSC)是一種國家考試,是對語言有較高要求的一些行業工作人員掌握普通話水平的測試。依據全國統一標準,通過朗讀單字、詞語、短文及說話等項目的口頭測試,對他們掌握普通話的程度進行評定。普通話水平測試作為推廣普通話的重要組成部分,無疑是使普通話工作逐步走向現代化的重要措施之一。實行多年發揮了巨大的作用。但是,無論什么考試,考試本身都不可能百分之百反映受試者的真實水平,都會存在誤差,如何才能最大限度地把誤差限定在最小的范圍內,這是PSC所有工作人員應該探索的問題。本文就測試員主觀因素對PSC考試的影響,做出分析,提出相應對策。

現階段的PSC采用計算機輔助測試(CAT-Computer-aided test)的方式進行,應試者朗讀單字、詞語、短文及說話等項目的口頭測試,全部用計算機錄音保存,之后機器識別評分。機器識別語音有其客觀上的公平性、準確性,如在測試單音節、雙音節時,機器識別相對真實正確。但是有些內容的識別相對失真,比如朗讀、說話,機器識別就比較機械,測試成績有偏差,與應試者朗讀技巧的真實水平有距離,在語感、情感、結構特點、思想內容等方面,機器無法像人一樣細膩、深刻、靈活地感知。因此,普通話水平測試的后兩道題部分地方采取人工評價的方式進行,把應試人的應試語料用計算機保存,然后線上分發給3個測試員(通過國家、省普通話水平測試員培訓考試成績合格者,被聘為PSC測試員)來評分。人工評價不可避免地受到“人”的主觀影響。

一、主觀原因

就是與“人”有關的原因,主要指由于測試員的原因造成的評測結果失準。

(一)個人評測水平不同

由于評估者的思想水準、技術水準、測試經驗多少不同,測試水平也不同。評估標準的理解運用差異性較大,評估結果也就差異性較大。測試中有的測試員無法反映并記錄錯誤、缺陷,造成測試結果失真。還有一種情況就是,測試員自己的普通話水平較低、知識掌握有限、經驗不足、對錯標準含糊不清,導致把應試者正確的答案記錄成錯誤,錯誤的答案記錄成正確,影響測試結果。雖然這種評分差距已經在努力縮小,例如測試誤差越級的,那么評測無效,其他測試員重新評測;不越級的測試誤差采用平均數計分,也會縮小誤差。

(二)情緒化評價

情緒控制著人們的行為,也控制著對事物的評價。每個測試員都是一個相對獨立的個體,都有各自相對獨立的個性特征、價值體系、情緒體驗。測試員的測試行為總是在各自的價值系統情緒體驗下進行,個人的價值系統在測試過程中發揮著標準的作用(或者說代替標準行職),相對于被試者所表現出來的真實或實際的成績,有些測試員評分過高,有些則過低。有的人成績被高估了,即比他的實際水平要高;有的成績則被低估了,低于應得的成績,這種錯誤產生的原因是測試員的情緒體驗,應試者關聯到測試員高興的情緒體驗,或應試者的某些方面激發了測試員自身的情緒體驗,從而得到增量評價,相反獲得測試員的減量評價。增量評價與減量評價都是能夠避免或者縮小差量的。

(三)偏見式評價

在生活中我們往往會遇到這樣的情況:如果一個人老實忠厚,而另一個人狡詐陰險,那么就會有這樣的評價,好事都是忠厚老實的人去做,而壞事都是陰險狡詐的人干的。其實有時也不盡然,這就是偏見。測試者對應試者偏見式的評價,影響到這個人各方面的正確評價,也就是戴有色眼鏡看人。應試者的許多特質都可能影響測試員對其正確評價,如甜美的聲音可能使測試員產生好感,使其犯增量評價錯誤,忽略其讀音不準確或朗讀不流暢的失誤,給其一個夸大的評分。還有容貌美麗與丑陋、舉止大方或心理緊張而忸怩、朗讀方式等都可能獲得增量減量評價,而不是正確的評價。

(四)相似性評價

這個名詞來自Stephen P.Robbins的Organiazation Behavior一書,意思是說如果評估者對其他人進行評估時,特別注意別人是否具有他自己所具有的某些特點,那他就犯了相似性評價錯誤。例如,假如一個評估者認為自己進取心很強,在評估他人時,他就可能尋找進取心的特點。那么表現出這種特點行為的人就會受益,而其他人則會吃虧。在PSC測試中,如果測試員自己平翹舌音特別好,那么應試者的平翹舌音處理好的,就會得高分,即使他的調值、流暢度以及準確度都不好。相反,那些不好的應試者則會得低分,即使其他方面都不錯。

(五)低區分度評價

一般來講,PSC測試員可分兩類,一種是高區分度者,能用測評標準各個分數級別進行評估;另一種是低區分者,只能用其中有限的等級評測。低區分度者傾向于忽視或縮小差別,他們看到的同一性比實際情況要高。相反,高區分度者則能更好地發現差異。在實際測試中,低區分度的測試員常常不能發現差別、錯誤,無法按評測標準評測出正確的成績。而高區分度的測試員則能按標準評測出錯誤缺陷,記錄詳細完備,能夠做出正確的評價。

二、客觀原因

主要指試題命題及測試管理工作存在的不足。

(一)試題的歧義性

命題要求應該具有唯一性,口語測試是有時間限制的瞬間口語反應,如答案具有歧義性,則勢必影響時間。所以岐義性試題應設置解題情境,避免答案的岐義性。例如,測試讀單音節字詞,經常出現多音字,本題最好不要出現多音字,即便出現,也應設計出具體的語言環境,使其讀音在具體的語言環境中具有唯一性標準答案。測試題二,讀多音節詞語,應極力避免讀音的雙解,如“孫子”是讀輕聲sun zi,還是讀sun zǐ。如果出現也應加注語言環境。部分測試題為了卷面整齊美觀就忽略了標注語言環境,使應試者答案與試題標準答案有所不同,答案出現歧義。

(二)考試的信度

一項考試的信度,就是這項考試的一組成績和對同一組考生實施等價考試所得的另一組成績相比較,它們的一致性程度。在實際的測試過程中,PSC測試存在的問題,除了測試員問題外,應試者由于心理緊張、焦慮等因素外,可能還與試題的難易度區分度有關系。試題的區分能力就是試題用于考試時使水平高的考生得高分,水平低的考生得低分的傾向力。要做到區分度高,就應注意試題的難易程度,試題應難易程度適當,都在同一水平上波動。

(三)試題的針對性

由于漢語使用地域的廣泛,使得各方言區的漢語語料有所不同。普通話是建立在“以北京語音為標準音,以北方話為基礎方言,以典范的現代白話文著作為語法規范”的標準之上,所以普通話與各地區方言的差異是存在的。PSC除了要測出應試者的普通話水平等級之外,還有一個任務,就是推廣普通話,使各地區的人們使用普通話工作、生活,所以可以研究各方言區人們的語料特點,學習普通話的難點,在擬題時,在滿足評測標準覆蓋率的前提下,擬定有針對性的題目并控制每一題型的比重,做到有針對性。這是建立在滿足PSC標準試題的前提下進行的,只有這樣,才能站在國家的立場公平地評估各方言區的應試者,使PSC公正公平地展開,并且能極大地在各方言區推廣普通話。

(四)管理制度方面

就當前來說,測試工作的管理制度已經建立,但在具體測試中還存在不完善的地方,存在不能依法執行科學評測程序的問題。測試是由人來安排的,人有其主觀的因素在支配著對測評結果的界定。測試人員的短缺,受試人數的倍增,導致測試人員的工作量增加,迫使測試員減免測試的步驟與程序。如試題口頭說話,測試員評測時不按照評測量表評分,忽略量表的科學性計算,而采取缺乏細化的等級來評估應試者的成績,使測試的精確度降低。可能也存在作弊現象,工作人員數量不足,勢必要使用一些臨時的借用人員,就給受測人員提供了作弊的機會,出現替考現象,機器儲存的語料非本人的真實語料。

三、改進措施

(一)針對主觀原因

一方面擴大機器評測的內容,加強機器評測的準確性、智能評測性,使機器語音識別的準確性增強。另一方面應加大培訓測試員的力度,重點培訓口語課教師的測試水平。對普通話測試的內容、評測標準、評測流程都有深入的了解,培訓是建立在已有的知識經驗基礎上,培訓雙方都很輕松。他們還能把培訓成果運用到實際的教學中,加強課堂教學實效,對推廣普通話有著更大的意義。

加強制度的監管,加強工作人員的評測紀律約束。由于測試安排完全操縱在測試管理人員手中,管理人員又不足,加上受試者與日俱增使測試量增大,從而有可能導致管理人員工作量劇增,使他們根本忙不過來,于是就必須從下面各學校借人幫忙,抽調人的素質良莠不齊,應該加強監管和教育,制定相對的約束規則。避免可能出現的測試步驟與程序的監管不力,如替考、口頭說話帶草稿、提前指定考題等偶發事件。

(二)針對客觀原因

一方面更加科學地制訂評測內容,避免因測試內容難易不同造成測試評分的失真。擬題人員已經做出調整,新大綱已經把原40號作品《神奇的燕子洞》、39號作品《世界民居奇葩》拿掉了,因為確實很難。其實也可以把新大綱朗讀作品54號《贈你四味長壽藥》拿掉,因為文章中出現了四次“當”這個多音字,一個錯了,四個都得錯,這是不公平的。再如說話題目30個,難度也不一樣,雖然從題目上看,在尋求最大化的難度一致性,可要做到完全一樣的難度,是不可能的,只能縮小差別。還有就是針對多音字的試題,要加注其字的讀音環境,以確保答案的唯一性,確保測試的規范性、科學性。

另一方面使用機器評測。機器語音識別度高于人,更準確、更高效、更科學,消滅了人為的不確定性、差異性。

綜上所述,PSC誤差消失的最主要因素就是實現更高水平、科學化、現代化、標準化??茖W化就是測試過程及試題制定的科學化管理,它是提高測試信度與效度的重要保證,是克服上述客觀原因的保證?,F代化就是考試手段現代化,是解決測試完全由人所帶來的主觀原因造成誤差的關鍵,要加強機器語音識別的精準度,是解決社會測試需求不斷增加的根本出路。標準化就是在科學化現代化的基礎上,按照最優化要求建立統一高效的工作程序。

參考文獻:

[1]國家語言文字工作委員會普通話培訓測試中心.普通話水平測試大綱[M].北京:商務印書館,2004.

[2]斯蒂芬·羅賓斯,蒂莫西·賈奇.組織行為淡定[M].北京:中國人民大學出版社,2008-01.

[3]安妮特·西蒙斯.你的團隊需要一個會講故事的人[M].尹曉虹,譯.南京:江蘇鳳凰文藝出版社,2016.

編輯 王海文

猜你喜歡
水平評價
張水平作品
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統評價再評價
作家葛水平
火花(2019年12期)2019-12-26 01:00:28
加強上下聯動 提升人大履職水平
人大建設(2019年12期)2019-05-21 02:55:32
老虎獻臀
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
保加利亞轉軌20年評價
多維度巧設聽課評價表 促進聽評課的務實有效
體育師友(2012年4期)2012-03-20 15:30:10
主站蜘蛛池模板: 亚洲人成网7777777国产| 伊人久久精品亚洲午夜| 国产精品久久国产精麻豆99网站| 91精品国产一区自在线拍| av无码久久精品| 亚洲欧美不卡中文字幕| 成年片色大黄全免费网站久久| 国产美女一级毛片| 91精品国产综合久久香蕉922| 亚洲va在线∨a天堂va欧美va| 精品一区二区三区自慰喷水| 欧美日韩国产综合视频在线观看 | 九九视频免费在线观看| 午夜老司机永久免费看片 | 亚洲美女视频一区| 欧美日韩国产成人在线观看| 亚洲成人精品| 亚洲制服中文字幕一区二区| 国产九九精品视频| 久久婷婷五月综合97色| 一级片免费网站| 亚洲天堂视频网| 亚洲天堂精品在线观看| 国产精品成人久久| 老司机精品99在线播放| 国产精品无码AⅤ在线观看播放| 91九色国产porny| 精品欧美一区二区三区久久久| 久久综合国产乱子免费| 亚欧美国产综合| 99伊人精品| 婷婷久久综合九色综合88| 色妞www精品视频一级下载| 国产xx在线观看| 特级毛片免费视频| 人妻丰满熟妇av五码区| 精品夜恋影院亚洲欧洲| 亚洲成人一区二区| 国产精品无码翘臀在线看纯欲| 国产H片无码不卡在线视频| 国产69精品久久久久孕妇大杂乱| a欧美在线| 国产精品视频导航| a级高清毛片| 亚洲伦理一区二区| 亚洲视频在线网| 久久亚洲欧美综合| 亚洲不卡影院| 永久免费无码成人网站| 成人国产精品一级毛片天堂 | 亚洲AV无码乱码在线观看代蜜桃| 日韩毛片免费视频| 97se亚洲综合| 亚欧成人无码AV在线播放| 欧美国产日韩在线观看| 亚洲欧美激情小说另类| 毛片视频网址| 四虎精品免费久久| 91在线无码精品秘九色APP| 91破解版在线亚洲| 亚洲欧美成人综合| 亚洲精品桃花岛av在线| 二级毛片免费观看全程| 高潮毛片免费观看| 欧美另类图片视频无弹跳第一页| 国产亚洲精品无码专| 中文字幕亚洲乱码熟女1区2区| 在线观看免费人成视频色快速| 亚洲天堂福利视频| 久久精品人人做人人综合试看| 亚洲区第一页| 在线观看免费AV网| 午夜精品久久久久久久2023| 无码日韩视频| 成人免费一级片| 亚洲成人免费看| 国产又大又粗又猛又爽的视频| www.亚洲一区二区三区| 国产成人综合日韩精品无码首页| 热99精品视频| 国产尤物在线播放| 亚洲色图欧美在线|