張艷莉 王肖竹



摘要:語言測評素養是語言教師合理認識、設計測評活動和運用測評結果所必需的專業素養。基于語言測評知識、實踐和反思的角度調查國際中文教師語言測評素養,發現:國際中文教師的語言測評知識處于中等水平,教師對語言測評相關的概念和原則有一定了解,但存在理解不充分以及誤解的情況,參加測評培訓對語言測評知識水平有提升作用;教師在教學實踐中注重形成性評價,也存在一定的高風險測試導向;教學經驗和測評培訓因素均對教師語言測評素養自評和提升需求產生積極影響,教師對語言測評素養的提升持積極態度,需要語言測評相關培訓提供具體實踐性的指導。
關鍵詞:語言測評素養;國際中文教師;語言測評知識;教師專業發展
DOI: 10.13734/j.cnki.1000-5315.2023.02.017
收稿日期:2022-10-09
基金項目:本文系漢考國際科研基金重點項目“漢語水平考試認知效度研究”(CTI2021A01)的階段性研究成果。
作者簡介:張艷莉,女,山東曲阜人,上海外國語大學國際文化交流學院教授,E-mail: zhangyanli@shisu.edu.cn;
王肖竹,女,山東威海人,北京語言大學國際學生教育政策與評價研究院博士研究生。
一引言
測試與評價是語言學習中不可缺少的一部分,要判斷測評是否有效地反映學生的語言水平和學習情況,解讀測評信息以指導教學或決策,需要與測評相關的各方(學生、教師、學校管理者等)具有一定的語言測評素養。在語言測試領域,對測試相關方語言測評素養的關注度持續提升。其中,語言教師的測評素養最受關注,因其承擔著課堂測評活動設計和實施者的角色,語言測評素養對教師測評活動的開展及教、學、評一體化發展有重要作用。因此,語言測評素養也是教師專業發展的一環,缺乏測評素養意味著專業性的喪失。
在國內,國際中文教師主要對來華留學生進行漢語作為第二語言的教學,其語言測評素養較少受到關注。一般而言,教師的測評理念和方式與其所接受的教育十分相關,這種“沿襲”的做法不利于測評的創新和發展。國際中文教師面對的學生來自不同的教育文化環境,其語言測評素養需要兼顧高風險考試和課堂測評,并用學生可以接受的方式設計和實施測評活動。目前,對國際中文教師能力的認定標準均涉及測評素養,如從“測試與評估”、“學習評估和反饋”方面對教師所具備的測評能力提出要求,相關的教師培訓項目應當包含語言測評課程。現有的針對國際中文教師的語言測評課程效果如何?教師對學生的測評是怎樣進行的?目前尚缺乏對這些問題的探討。
作為教學與測試的語言能力水平依據,《國際中文教育中文水平等級標準》(以下簡稱《等級標準》)的發布和使用要求教師據此評估和追蹤學生語言發展。此外,自受新冠疫情影響以來,在線教學模式得到了全面深入發展,語言測評的開展形式也發生了相應變化。無論是指導標準的規范化還是語言測評形式的轉變,都對國際中文教師的語言測評素養提出了更為具體的要求,教師需要對語言測評的原則和方法有系統的知識基礎,并在此指導下選擇、改編或設計適合課程教學目標的測評活動和考試來促進教學和學習。在此背景下,本研究嘗試從知識、實踐和反思的角度對國際中文教師的語言測評素養進行調查,并探索提升的方向。
二文獻回顧
(一)語言測評素養內涵與模型
測評素養是一個多層面的概念,最初由教育學界提出,由于教育問責制(Accountability)以及促學評價理念(Assessment for learning)的發展,要求教師及其他測評相關方具有正確使用測評結果的能力。在國際上,語言測試作為測量語言能力水平的工具,與移民和留學等政策息息相關,其應用得到擴展,影響力也在增大。隨著語言測試專業化發展和學科知識體系的形成,語言測評素養作為測評素養的子集被提出,其構念(Construct)和內容融合了測評素養的基本內涵和語言測試學科的特點。為了探尋語言測評素養所涉及的內容,學者對語言測試指導性書籍進行了分析,對以提升語言測評素養為目的的培訓課程進行了調研,并了解了教師學習語言測評知識的需求。在具體內容的基礎上,形成了“技能+知識+原則”、“目的+內容+方式”、“環境+原則+實踐”等語言測評素養的結構模型。在已有研究基礎上,金艷根據我國外語教育領域的主要測評活動分類(大規模考試、學業測試和課堂評價),提出了外語教師測評素養的模型,包含環境、原則、實踐三個層面,以及外語教師在不同類型測評活動中語言測評素養的要求。綜合已有的定義,本研究將教師語言測評素養的概念界定為:語言教師對于大規模標準化考試和課堂測評的基本概念和指導原則的了解以及設計、實施和利用測評活動的知識、技能和能力,并能從社會文化和政策環境的角度理解測試的性質及其影響。
近年來的研究多從社會文化角度對語言測評素養進行解讀。如Xu & Brown在回顧百篇測評素養研究文獻的基礎上,提出了實踐中的教師測評素養模型(Teacher Assessment Literacy in Practice, TALiP),包含“知識基礎”、“教師測評觀念”、“體制和社會文化環境”、“實踐中的測評素養”、“教師學習”、“教師測評者身份”六個部分。該模型反映了測評素養積累、實踐、反思的動態過程,并強調測評知識基礎并不能直接成為測評素養,需要通過教師理解、實踐、進一步學習和反思才能完成知識到素養的轉化,且教師的測評實踐通常是在多種因素的影響和權衡下實現的。Pastore & Andrade通過專家咨詢法歸納了包含“概念知識”、“行動”和“社會情感”三個維度的測評素養模型。潘鳴威通過專家訪談更新的語言測評素養模型也將教師情感和態度作為一個外延。綜合以上框架內容可以看出,教師需要一定的語言測評知識基礎,其內容來源于語言測試學科范圍,并與社會文化、教育政策與教學環境相協調,從而在實踐中具備相應的技能和素質。
(二)教師語言測評素養研究現狀
已有的教師語言測評素養研究內容和方法主要集中于以下五個方面:(1)調查工具的開發和驗證,形式有基于內容的選擇題項 、自評量表、判斷題項、選擇題+自評量表等;(2)量化評估教師測評素養的不足和培訓需求,涉及群體包括國內中小學教師、歐洲外語教師、高校英語教師等,并探討了影響測評素養水平及發展的關鍵因素,如測評培訓、教學經驗、環境因素等;(3)教師與專家對語言測評素養理解的差異,認為語言測評素養培訓中應考慮到教師的理解特點和實踐需求;(4)教師的語言測評實踐,通過分析測評活動設計、命題質量 、課堂觀察、訪談等內容總結出教師在實踐中體現出的語言測評素養;(5)教師觀念、反思等社會文化要素,通過混合研究方法反映教師對語言測評活動的認識與態度,理解教師觀念對于相關政策和培訓課程的實施有重要意義,教師反思則是發揮教師能動性、在現有實踐基礎上尋求提升的有效方式。
目前以國際中文教師為對象的語言測評素養研究較少,鑒于研究環境的差異性及研究內容對國際中文教師發展的意義,有必要探討高校國際中文教師語言測評素養的現狀,以更好地在教師職前培養階段和專業發展上提供幫助。基于以上語言測評素養的理論模型和實證研究,本研究希望回答以下問題:(1)國際中文教師語言測評知識水平如何?(2)國際中文教師的語言測評實踐有何特點?(3)從自評和提升需求的角度看,國際中文教師對其語言測評素養的反思情況如何?
三研究設計
(一)研究對象
本研究的對象為在高校從事國際中文教學工作的教師,通過便利抽樣發放問卷,共得到有效答卷119份。高校所在地分布于上海、山東、遼寧、甘肅、吉林、北京、浙江、廣東等16個省市,教師的教齡分布為0-2年(32.77%),3-10年(32.77%),10年以上(34.45%)。本研究將教齡為0-2年界定為新手教師(39人),大多為正在接受或剛剛完成漢語國際教育碩士項目的學習;教齡為3-10年的教師與10年以上的教師分別為熟練型(39人)、專家型教師(41人),一般為高校在職教師,教學經驗比較豐富。74名(62.18%)教師參加過測評培訓,其中近三年參加過的有52人(46.22%),另外45人(37.82%)未參加過測評培訓。共有8名教師參加了后續訪談,其中新手教師4人,熟練型教師1人,專家型教師3人。
(二)研究框架及工具
為了從多元的角度反映教師語言測評素養,本研究采用Xu & Brown的TALiP模型作為融合理論知識與教師實踐的宏觀理論框架。研究主要圍繞國際中文教師的“語言測評知識”、“語言測評實踐”、“語言測評反思”三方面進行探討。
本研究的分析和解釋框架如圖1,通過問卷調查和訪談的方法收集數據,共使用“語言測評知識問卷”和“語言測評素養評價量表”兩份問卷。在制定“語言測評知識問卷”時,首先通過篩選和整合已有文獻中語言測評素養包含的內容、教師課堂測評標準,并考慮本研究環境,確定問卷的內容結構,然后參考已有的測量工具的問題設置進行改編,主要從情境和語言方面對問題進行修改,使問題情境符合漢語作為第二語言教學的實際情況,考慮文化差異因素,并結合課程評價體系、線上測試的實施情況進行情境設定;在測評的語言對象上,考慮漢語的語言標準、語言要素、語言技能和語言使用等對內容進行調整,例如在環境層面,主要考查教師對漢語教學大綱在教學中的指導作用及對《等級標準》發布背景和意義的了解,但對語言測評基本概念和原則相關的題目基本不作改變。制定好的問卷題目及答案經過3名具有語言測試專業知識的專家審核和修改,此后經過小范圍試測確認問卷達到滿意的信度,并根據試測結果修訂了問卷。最終問卷涵蓋環境、原則、實踐3個層面,包含19個主題的內容(見表2),由26個選擇題構成,以0-1計分(對多個答案的題目每個選項單獨計分),共得到77個計分項用于描述性統計和方差分析。“語言測評素養評價量表”包含自評量表和提升需求量表,根據DeLuca等課堂測評方法調查問卷(ACAI) 進行改編,為Likert五度量表,共24個題項(見表3、4)。在問卷發放之后,對部分教師進行了半結構化訪談,訪談內容主要包括教師對語言測評活動的認識和態度等,教師所接觸和實施的語言測評活動(課程評估體系、具體測評方式和實施情況等),以及對語言測評進行的反思,包括語言測評素養的發展與提升需求等。
(三)數據收集和分析
本研究的數據包括定量和定性兩部分。定量數據通過問卷網發放,使用SPSS 23.0對結果進行統計分析,兩份問卷整卷Cronbachs α系數為0.893。其中,“語言測評知識問卷”總體Cronbachs α系數為0.86,其中環境部分為0.65,原則部分0.70,實踐部分0.80,KMO取值為0.838,Bartletts球形檢驗顯著(p <0.000),說明問卷有較好的信度和結構效度;量表部分整體Cronbachs α系數為0.926,“語言測評素養自評量表” Cronbachs α系數為0.922,KMO取值為0.909,Bartletts球形檢驗顯著(p <0.000),通過探索性因子分析,使用主成分分析法,根據最大方差法旋轉后得到的兩個因子,分別被命名為“測評設計及質量”、“測評準備及反饋”,因子載荷分別為33.217%,30.050%,內部一致性信度分別為0.89,0.85;“語言測評素養提升需求量表” Cronbachs α系數為0.904,KMO取值為0.869,Bartletts球形檢驗顯著(p <0.001),用同樣的方法進行探索性因子分析,得到“測評設計與實施”、“語言測評與反饋”、“測評結果利用”三個因子,因子載荷分別為26.239%,22.993%,20.235%,內部一致性信度分別為0.86,0.83,0.80。為了探究教學經驗(新手教師、熟練型教師、專家型教師)與測評培訓因素(參加過測評培訓、未參加過測評培訓)對兩份問卷得分產生的影響,進行3(3組)×2(2組)的混合設計的方差分析。
定性數據通過半結構化訪談進行收集,其中2名教師的訪談在線下當面進行,另外6名教師通過電話訪談,訪談時間設定為20-30分鐘。訪談內容經過文字轉寫后使用Nvivo 12.0進行編碼與分析,內容主題包括教師語言測評觀念、語言測評實踐和語言測評素養的發展三個方面。
四結果與討論
(一)研究結果
1.語言測評知識
語言測評知識問卷的結果顯示國際中文教師平均正確作答62.63%的選項(M=48.23,SD=10.30,SE=0.94,Min=20,Max=74),分數分布見圖2。其中環境層面59.91%,原則層面64.48%,實踐層面62.90%。多項選擇題和單項選擇題的作答情況分別如表5、6,其中單項選擇題正確比例平均為53.32%,說明對教師來說題目難度較大,多項選擇題全部選對的比例平均為20.76%,部分選對的比例為48.34%,多數教師僅部分掌握題目內容(少選)。綜合以上結果可以看出,國際中文教師具有中等水平的語言測評知識,即對于問卷中涉及的語言測評概念和原則,教師有一定的了解,但了解不充分且存在誤解的情況。
教學經驗對語言測評知識問卷總分和各層面上沒有產生顯著影響,F(2, 116)=0.406,p=0.667,ηp2=0.007;測評培訓因素對語言測評知識問卷的得分有顯著影響,F(1, 117)=6.344,p=0.013,ηp2=0.053。主要體現在環境層面F(1, 117)=6.640,p=0.011,ηp2=0.055,和實踐層面F(1, 117)=5.049,p=0.027,ηp2=0.043。關于教學經驗與測評培訓兩個因素的分析表明,就語言測評知識而言,測評培訓對此有提高作用,而教學經驗并不是顯著影響因素,這一情況可能與當下新手教師的專業學習和訓練時間較近而在職教師培訓有所缺失有關。從調查對象參與測評培訓的結果來看,三年內參加過測評培訓的人數在新手教師中占51.28%,在熟練型教師中占46.34%,在專家型教師中占31.71%,即使是在新手教師中,測評培訓的普及程度也僅在一半左右,說明職前培訓和在職培訓中關于語言測評的學習均需要加強。
2.語言測評實踐
教師的語言測評實踐中,課程成績一般由“課堂表現”、“課堂小測”、“課后練習”、“階段測試”、“期末考試”組成。就課堂表現而言,教師認為根據課堂互動情況對學生進行評價,對考試成績有一定預測性,比較可靠。形成性評價在總成績中比期中、期末考試等終結性評價所占比重更大,教師同時認為期末學業考試是必要的,規定無論學期中學生是否達到及格成績,都需要參加期末考試。
教師從事的語言測評相關工作主要包括“考試設計與命題”、“幫助學生備考”、“評分”、“交流反饋”。在命題方面,與Stiggins的觀點契合,教師認為教學資源中已有的練習或測試題一定程度上減少了自主命題的需要。在備考方面,學校開設HSK輔導課,在綜合課及各技能課上教師也會讓學生練習HSK的題型,反映了一定的高風險測試導向性。在評分和反饋方面,教師關注到考試效度和分數意義的解釋,例如發揮考試的診斷作用,為寫作、課堂報告等主觀試題制定評分標準等。
關于線上的語言測評實踐,教師使用多種線上會議平臺、漢語學習以及數據收集平臺進行教學與測評,形式轉變促使教師對于測評方式和效果進行思考和調整。傳統的紙筆測試、課堂出勤率等評價方式需要完成模式的轉變,例如教師使用問卷星等工具收集測試結果,在直播課上要求學生積極有效互動以確認課堂表現情況。作答方式需要適應線上測評,例如高年級寫作任務通過打字完成。評分標準發生一定變化,例如學生的課堂報告在線上與線下兩種模態的評分維度會發生變化。總之,線上測試雖然在監督、實施等方面遇到問題,但也有其優勢,例如學生學習數據的記錄、測試批改和反饋等方面更加智能化,發揮了計算機輔助學習的作用。為了保證線上考試公平有效,面對學生地區時差的問題,起初是通過調整在線考試的形式來解決,后來通過完善編班和考試系統,保證考生可以在同一時間作答,為監考提供了可行條件。
實踐背后是觀念的指導,根據訪談中教師表達的對于語言測評的觀念,絕大多數教師認同語言測評活動的重要性,并持有積極態度,認為測評的功能是檢驗水平或學習成果,監督、規范學生學習,并針對性地改善教學。也有部分教師認為正式測試的目的是統計學生群體水平的量化信息,而在教師對學生的語言水平足夠了解的情況下,測試成績信息對教師來說是輔助性而不是必需的,甚至可能與教學關聯較弱。此外,測評還與一些決策和風險相關,如分班、獎學金評審等。與Brown提出的四條測評觀念假設對比,國際中文教師對語言測評的觀念較為符合“測評對教學有促進作用”、“測評反映學生學習情況”,某些情況下“測評與教學無關”。
3.語言測評反思
教師語言測評素養自評量表得分(M=47.43/79.38%,SD=7.36)和提升需求量表得分(M=48.06/80.1%,SD=7.56),均處于較高水平(各組量表評分的描述性數據見表8、9)。教學經驗對語言測評素養自評量表F(2, 116)=21.089, p=0.000, ηp2=0.272和提升需求量表F(2, 116)=7.227, p=0.001, ηp2=0.113結果的提升作用顯著,與Deluca等結果相似;對于自評量表評分,三個教齡段之間均有顯著差異;對于提升需求量表評分,教學經驗的顯著性影響體現在新手教師和專家型教師之間。測評培訓因素對量表分數也有顯著影響,自評量表F(1,117)=5.191, p=0.025, ηp2=0.044,提升需求量表F(1,117)=4.275, p=0.041, ηp2=0.036。教學經驗和測評培訓兩個因素之間的交互作用不顯著。雖然均有顯著積極影響,教學經驗對自評量表得分的效應量(0.272)明顯大于測評培訓因素(0.044),參加測評培訓使教師的自我評價提升幅度較小,Deluca等則發現未參加測評課程的教師自我評價比參加過的更高,認為這可能因為參加過測評培訓的教師對相關概念復雜度的理解比未參加過的教師更深刻,因此對自身的評價趨于保守。
在教師對語言測評素養發展的看法中,教師認為教學經驗對于課堂測評中把握學生語言水平、學習重難點方面的能力提升有較大作用,有利于設計測評任務和命題,而與更加專業的測量理論和量化分析技能的提高不直接相關,后者需要通過專門的學習和運用來實現,在測試方面較為專業的知識和技能通常是為教學研究所用。參加與測試相關的工作為教師提供了思考和學習的契機,例如教師認為為學生提供HSK備考的輔導使其對語言測試有了更多的了解。
教師認為自身的語言測評素養有待提升,且接受過測評相關培訓的教師在教學工作中會發現其他教師缺乏語言測評素養的一些做法。與已有研究相似,國際中文教師對語言測評素養的提升需要具體可行的實踐指導,包括測試原則(標準參照、常模參照測試等)、測試命題指導(如何利用大綱、如何提升效度和信度等)、提供學習建議(能力、知識診斷等)等方面。
(二)討論
基于以上研究結果的分析,本研究主要的發現和解釋如下。
1.國際中文教師對語言測評知識的掌握程度為中等(62.63%),對客觀知識的掌握并不充足,這點與已有研究結果相似,語言測評素養自評量表和提升需求量表的結果較高(79.38%,80.1%),說明國際中文教師對語言測評素養的評價可能存在“不實際的樂觀態度” 。
2.從影響因素來看,參加測評培訓對于語言測評知識得分有積極影響,說明現有的測評培訓對于普及語言測評知識有一定效果,主要體現在環境(指導性標準和大綱等)和實踐(測評活動中的具體做法)方面。Mertler使用“課堂測評素養問卷(CALI)”測量教師測評素養,發現課堂教學經驗對于提升語言測評素養在多個方面都有顯著作用,而本研究發現教學經驗對語言測評知識得分基本沒有產生顯著影響,但教學經驗對自評和提升需求量表的結果有顯著影響,結果反映出語言測評“經驗豐富而非專家”的現象。從訪談結果看,語言測評素養對于國際中文教師是一個尚未普及的概念,誠然,教學經驗可以使教師更加準確地診斷學生能力,但在沒有專業知識的指導下依然存在很多教師測評理念并不合理的情況,不能正確處理測試公平性、有效性的問題。
3.國際中文教師的語言測評實踐注重形成性評價,也存在一定的高風險測試導向。教師對語言測評活動的看法整體是積極的,也存在認為教學經驗可以代替正式測試的觀點,對于教師來說,測評依然是國際中文教學中的邊緣成分,更多與教學結合而不具有獨立的專業性。部分教師認為正式的語言測試與測評專業知識的重要性不強,此觀點可以解釋問卷結果中語言測評知識方面教學經驗不是顯著影響因素(因為教師在教學過程中沒有足夠的動力學習這方面知識),也反映出對于國際中文教師來說,促進教學的評價與標準化測試兩方面的能力是相對獨立的,前者更加受到教師重視。
4.國際中文教師對語言測評素養的提升持積極態度,認為有必要提升測評培訓質量,更新在職學習內容。教學經驗豐富的教師對語言測評素養的自我評價更高,對提升需求的評分也較高,參加測評培訓也使提升需求更高。與Deluca等使用“課堂測評方法調查問卷(ACAI)”調查結果相比,教學經驗因素在提升需求量表上表現出更強的促進作用,強調了持續性、與工作結合的測評學習的重要性。教師認為對語言測評素養的提升可以從職前培訓、實踐和研究指導等方面有針對性地幫助提高教師語言測評素養和相關研究興趣。教師語言測評素養的提升需要政策環境支持,對于語言測評素養在實踐中的鞏固和提升,以及創新性測評模式的運用,學校或機構需要提供支持條件,以減少如年輕教師沒有話語權、測評上的創新做法受到管理條件制約等問題。
五總結與建議
本研究反映了國際中文教師多維度、多層面的語言測評素養,研究結果可以為國際中文教師的師資培養和教師專業發展提供參考。研究使用了選擇題和量表兩種問卷方式調查語言測評素養,二者反映的結果可以對比和互補。“語言測評知識問卷”內容以點狀呈現,通過知識的樣本來反映教師對語言測試概念和原則的理解以及特定情境下的選擇;而“語言測評素養評價量表”的內容以能力描述來呈現,讓教師評價自身所具備的語言測評相關能力和提升需求。兩份問卷的結合可以從不同視角解釋信息,彌補單一調查工具的不足。本研究的訪談包含教師對日常語言測評活動和相關工作的描述,也包含教師對語言測評素養概念的理解和現狀反思。整體來說,本研究的開展遵循認識到反思的順序,研究框架體現了Xu & Brown實踐中的教師測評素養的發展循環。
語言測評素養是理論知識、實踐能力和價值態度等多方面融合的表現,對于素養的水平不能僅以“有無”描述,我們從知識、實踐和反思三方面來嘗試解讀國際中文教師的語言測評素養。知識方面,國際中文教師的專業學習、職前培訓等經歷保證了一定的知識基礎,但是問卷與訪談結果顯示,具有系統的語言測評知識體系的教師較少,且教師對相關概念(信度、效度等)的理解比較淺顯,難以對實踐有指導作用。在實踐方面,教學經驗的作用得以突顯,有經驗的教師比較重視以評促學的理念,對學生實施多元化、追蹤性的評價。然而語言測評實踐的情況隨教師個人、教學環境變化較大,很多新手教師由于工作內容有限,設計整體測評方案和實施測評活動的需求較少。而且,無論對于新手教師還是經驗教師,在測評上花費精力有時被視為負擔。在反思方面,教師大多認同測評對于教學的影響力以及語言測評素養的重要性,且指出參與本研究也是一個反思語言測評的機會,將語言測評的實踐納入教學反思中有利于教師更有意識地調整和完善語言測評方面的工作。
針對語言測評素養在這三個方面的表現,我們提出以下提升模式與建議。(1)對語言測評培訓課程的目標進行重新定位。根據教師語言測評素養的特點以及需求分析,改進已有的測評課程,在新手教師的培養階段,要打好測評原理和原則的理論知識基礎,并提供實踐指導。要為在職教師提供適應具體測評環境和實踐需求的學習機會。例如,課堂測評是教師語言測評工作的重要陣地,在測評培訓中可以加入更多前沿的課堂測評方式及其成績報告和反饋的應用等。又如在線上教學資源豐富的情況下,教師需要懂得如何評估、選擇和整合現有的測試和練習資源。(2)將測評融入教研工作中,通過學徒、合作等方式在實踐中發展測評素養。強調測評工作的規范和科學性,如通過教師合作命題等方式調動其思考和學習測評方式的積極性。對于高校在職中文教師,可以鼓勵其將教學與科研相結合學習語言測評相關知識,并應用一些創新的測評方式促進教學。
本研究尚存在不足之處。在研究對象上,樣本數量可以更大,對于教師的教學經驗和培訓經歷分組可以更加清晰合理。在研究方法上,本研究問卷所包含的問題和答案并沒有在真實教學情況中進行檢驗,因此問卷雖一定程度上可以反映教師在語言測評專業方面的知識和素養情況,但與具體教學環境的契合程度有待進一步考察。訪談結果基于教師的自我報告,可能與具體實踐情況有偏差,因此可以采取觀察課堂或測評培訓課程中教師的實際操作的方式來對語言測評素養的表現有更深入的理解。
今后有關國際中文教師語言測評素養的研究可以從以下幾方面來進行拓展:(1)通過課堂觀察、案例研究等方式更加深入地了解教師在具體實踐中的語言測評素養;(2)結合現狀與教師反映的需求,設計開展相應的培訓項目,并據此探索與驗證語言測評素養的發展方式;(3)在整合語言測評素養內涵的基礎上,制定國際中文教師語言測評素養的測量工具并進行有效性驗證和完善。
Investigating the Language Assessment Literacy of College Teachers of Chinese as a Second Language: Knowledge, Practice, and Reflection of Language Assessment
Zhang Yanli1, Wang Xiaozhu2
1. School of Chinese Studies and Exchange, Shanghai International Studies University, Shanghai 200083, China
2. Institute of Educational Policy and Evaluation of International Students, Beijing Language and Culture University, Beijing 100083, China
Abstract: Language assessment literacy (LAL) is an essential professional competence for language teachers to effectively design, interpret, and implement language assessments. This study examines the LAL of Chinese as a Second Language (CSL) college teachers by exploring their knowledge, practice, and reflection regarding language assessment. The findings reveal that CSL teachers possess an intermediate level of language assessment knowledge, displaying a grasp of fundamental concepts and principles, but also exhibiting knowledge gaps and misunderstandings. The study shows that participation in assessment training programs significantly enhances language assessment knowledge. In practice, CSL teachers recognize the importance of formative assessment, yet also demonstrate a tendency to align with high-stakes tests. Both teaching experience and assessment training positively influence teachers perceived level of LAL and learning need. Teachers express a positive attitude towards improving their LAL, emphasizing the need for practical guidance offered by language assessment training.
Key words: language assessment literacy; teachers of Chinese as a Second Language; language assessment knowledge; teachers professional development
[責任編輯:唐普]