張甜
20世紀90年代,美國學者斯蒂金斯[1]首次提出測評素養(assessment literacy)概念,意指教師在評價過程中所需的知識和技能,在學界引起相關問題的探討。國內對此問題的研究起步較晚,21世紀初,王少非[2]在《校內考試監控研究》一文中系統探討了我國教師測評素養的現狀及提升途徑。此后,教師測評素養成為國內教師發展與教育測試領域的熱點話題,相關研究逐漸增多。2020年6月30日,中央全面深化改革委員會第十四次會議審議通過了 《深化新時代教育評價改革總體方案》,提出要“改進結果評價,強化過程評價,探索增值評價,健全綜合評價,建立科學的、符合時代要求的教育評價制度和機制”。該方案的出臺必將進一步推動我國教師測評素養的研究。本文梳理國內外相關研究,以期為國內研究的深入發展提供借鑒。
以“ teacher assessment literacy”為關鍵詞,在SSCI上檢索到相關論文26篇,研究取向可分為理論取向和實證取向。20世紀90年代起,以美國學者斯蒂金斯為代表的相關研究者進行理論取向的研究,構建了教師測評素養的理論體系,為實證研究奠定了基礎。
1991年,斯蒂金斯提出測評素養的定義:即對于測評知識的理解和運用;并指出測評素養可分為三個級別:第一級別的測評素養是指接受測評的能力,第二級別是指同時具備接受和進行測評的能力,第三級別是指在前兩級的基礎上還具備對于測評結果進行評估的能力。基于教師測評素養現狀,斯蒂金斯進一步指出,當前教師提升測評素養的途徑包括:教師自身加強對測評相關概念的理解和構建測評教育共同體。90年代末,斯蒂金斯[3]將教師測評素養的提升途徑具體化,進一步明確教師測評素養培訓應包括:選取測評方法、優化測評方法、完善測評步驟、分析測評結果、運用測評結果、匯報測評結果、消除測評偏見七個方面的內容。21世紀,各國研究者在斯蒂金斯理論的基礎上提出針對各國各學科教師的測評培訓理論。普哈默[4]認為,英語教師測評教育應包括語言測評的作用、語言類試卷的編制等。威利斯等人[5]結合澳大利亞課程改革的背景,運用社會文化理論提出測評素養的工作定義,以指導相關政策的制定。該研究將測評素養定義為一種動態的社會行為,其中教師為實現教學目標,與學生在測評實踐中討論并運用課堂與文化知識。斯達克等學者[6]針對職前體育教師,提出了教師測評知識發展的四階段模型;該模型分為理解、運用、分析和評判四個階段:首先,教師需要理解測評相關知識,再將其運用于自身教學實踐中,然后通過測評數據分析測評結果,最后審視測評過程并對自身教學效果進行反思。
此外,部分研究提出了測評素養的理論框架。如德盧卡等學者[7]通過整理英語國家測評標準和相關測評素養評估量表,分析了國家測評標準的變化,并對教師測評素養的評估提出建議;該研究發現,20世紀國家發布的測評標準多關注教師理解和運用測評的能力,而本世紀的測評標準注重測評對于教師教育和學生學習的指導作用。為優化教師測評素養評估,研究者認為,評估工具的信效度應進一步優化,評估方法的選用應與國家測評標準緊密聯系,評估結果應指導教師教育的有序開展。許悅婷和布朗[8]通過綜述教師教育和教育測評相關研究,重構了測評素養的概念框架。在該框架中,教師測評知識是測評素養的基礎;教師對于測評概念的認知指導測評結果的分析;微觀與宏觀的教育環境對教師測評實踐有約束作用;教師測評實踐需根據實際情況進行妥協;教師學習推動測評素養的發展;教師“評估者”身份的建構是教師測評素養的最終目標。帕斯特羅[9]運用德爾菲調查法(Delphi Inquiry),廣泛聽取專家意見,提出包括概念、行為學和社會情感的三維測評素養模型:概念這一維度是指教師需在測評內容、測評目的和測評方法方面對于測評相關概念有明確的了解;行為學維度是指教師進行測評實踐并根據測評結果反思自身教學效果的過程;社會情感維度則關注測評的環境,強調教師對于測評過程中反映的倫理道德問題的認知。
基于理論研究,實證研究主題可分為以下幾類:教師測評素養現狀[10-13]、測評素養影響因素[14-16]、教師測評教育培訓的訴求[17,18]、教師測評素養的發展路徑[19-21]以及教師測評素養產生的影響與效果[22,23]。
在現狀方面,研究者關注不同國家教師群體以及測試專家的測評素養。如戴維森[24]通過對澳大利亞和香港ESL教師的比較研究,探討以上兩地教師測評實踐的不同,發現澳大利亞教師可分為截然不同的兩類:一類嚴格遵循國家統一測評標準,另一類根據教學實際進行測評;而香港教師則根據教師團體內部達成共識的隱性測評標準進行教育測評。馬龍尼[25]通過從測評概念定義、測試方法運用、測評知識呈現三個方面比較測試專家與美國ESL教師對于測評基礎知識培訓的不同態度,優化測評培訓。該研究發現:在測評概念定義方面,測試專家更傾向于培訓能提供詳細的定義,而教師更傾向于清晰易懂的定義;在測試方法的運用方面,測試專家希望培訓能闡述各種測試方法的信效度、功能和目的,而教師則更關心如何選用測試方法;在測評知識的呈現方面,測評專家沒有特定的要求,而教師則希望呈現方式可以直觀清晰。因此,研究者認為在針對教師群體進行測評素養培訓時應注重教師的上述訴求。
在影響因素方面,研究者認為教師語言背景、專業發展階段都會不同程度地影響教師對自身測評素養的評估。相關研究發現,非英語國家教師對自身測評素養的評價高于英語國家教師;而新手教師,相較于有經驗的教師,對自身測評素養更為自信[26]。
在培訓訴求方面,研究者關注教師對于測評知識和培訓教材的要求。研究發現:教師希望測評培訓能包括試題開發、試卷信效度以及測評結果分析方面的知識[27]。此外,教師希望培訓教材能出版電子書并提供線上課程以適應信息時代的發展[28]。
在發展路徑方面,愛德華茲[29]通過制定量表,并對中學科學職前教師進行為期20個月的觀察,分析八位教師測評素養的發展路徑。該量表分為測評知識、測評背景和測評影響三個維度。測評知識包括測評術語描述、測評目的、測評內容、測評設計和測評結果分析;測評背景包括標準化測試背景、學生標準化測試準備情況、形成性評價和終結性評價結合情況;測評影響包括:測評結果影響和測評公正。研究發現,在20個月的過程中,每位教師以上三個維度的測評素養都產生了不同程度的增長,而每一維度的增長情況不盡相同。測評知識的增長最為顯著,測評影響的增長較為緩慢。其中,兩位教師測評影響中的測評公正因素幾乎沒有增長。
在影響與效果方面,研究者關注教師測評態度對于學生學習效果以及教師專業發展的影響。萊頓等人[30]通過比較中學教師對于大規模測試和課堂測驗的態度,發現教師認為課堂測驗對于教學更具指導作用;持有以上態度的教師更能促進學生有效學習。此外,研究者通過分析教師對于線上測評素養課程的態度,發現對于線上課程接受度較高的教師能更高效地提升測評素養并促進自身專業發展[31]。
從研究方法上看,實證研究多采用問卷調查等量化方法[32-34],但也不乏研究者運用個案研究[35]、敘事研究[36]、訪談/日志分析[37]等質性研究方法。
在研究對象的選取上,職前教師是相關研究關注的焦點[38,39],同時研究者也關注各發展階段的在職教師[40]。此外,教師所教授的學科包括英語、體育、科學等,涉及范圍較廣。
在研究的理論框架方面,運用較多的是社會文化理論,強調教師與教學環境的互動[41,42]。此外,部分研究者運用Earl測試理論[43]、職業社會化理論[44]以及現象圖式學(phenomenographiy)理論[45]等。
由此可見,國外研究在研究取向上可以分為理論和實證兩種類型,而實證取向的研究主題涉及教師測評素養現狀、影響因素和發展路徑等。定性與定量研究方法運用廣泛。研究對象涉及各學科與各職業發展階段的教師。理論框架包括測試學、現象圖式學等。
Assessment Literacy在國內通常被譯為“測評素養”“評價素養”“評估素養”等,因此,本研究以“教師測評素養”“教師評估素養”“教師評價素養”為關鍵詞在CSSCI檢索到論文23篇。
從研究主題上看,國內研究可分為兩類,一類是區域國別研究,基于國外教師測評素養相關標準,對比國內標準,為我國教師測評素養的提升提供建議[46-48];另一類研究是對于教師評估素養的本土化研究,基于國內現狀探討教師測評素養的內涵[49,50]、現狀[51,52]、影響因素[53,54]及提升途徑[55-57]。
從研究焦點上看,區域國別研究主要選取美國、英國、新西蘭和澳大利亞等國的教師專業標準文本,從教師測評素養的地位、構成以及提升途徑等方面與我國的教師專業標準文本進行對比,為我國教師教育以及教師測評素養的提升提供借鑒。在地位方面,教師測評素養的重要地位在各國達成共識,是教師專業素養中不可或缺的一部分。在構成方面,各國的標準對于測評素養的內涵在呈現方式上略有差異,但基本內涵趨向一致,包括:選取恰當的評價方式、運用評價結果改進教學等。在提升途徑方面,周淑琪[58]通過對比國外新手教師與專家型教師的專業標準,發現制定針對性的表現標準、進行一體化的教師教育、開展教學研究與課堂實踐是促進新手教師提升測評素養的重要策略和途徑。
從研究對象上看,區域國別研究多針對整個教師群體,沒有特指某一類教師的測評素養。也有研究關注新手教師與專家型教師的對比[59]以及特殊教育教師[60]。從研究方法上看,此類研究多采用文本分析法,以思辨分析各國教師測評標準的異同。
而立足本土的相關研究在內容上與區域國別研究有所重合,從我國教師測評測素養的現狀出發聚焦教師測評素養的內涵與提升途徑。在內涵方面,我國學者在國外研究的基礎上歸納出本土化的測評素養構成要素,提及較多的是教師測評素養的四維框架:即評價意識、評價態度、評價知識和評價技能[61]。沈兆文[62]對以上框架進一步細化,提出英語教師的測評素養包括英語評價理論和倫理能力、英語評價設計和實施能力、英語評價結果描述和分析能力,以及英語評價反饋和反思能力。
在現狀方面,多數研究認為我國教師測評素養存在不足,影響因素主要分為教師自身、學校環境與教育政策制度三個層面。首先,教師自身測評意識不足,對于教育評估不夠重視[63];其次,班級人數多、教學任務繁重使教師測評存在困難,學校未能提供教師測評的環境給養[64];更重要的是,應試教育傳統使得教育測評與大規模考試緊密相關,與日常教學中教師課堂評估的聯系存在斷層[65]。
針對以上原因,國內研究者提出了提升教師測評素養的途徑。首先,教師應增強自主意識,促進自主發展,利用閑暇時間主動學習測評知識與技能[66,67]。其次,學校可以多開展相關教師培訓活動,促進教師交流,創造測評文化氛圍[68,69];最后,在制度層面,有關政策應明確界定測評素養,構建衡量教師評價質量的標準,鼓勵教師測評素養理論研究與教育實踐[70,71]。
在研究對象方面,從教師學段來看,相關研究多關注高校教師群體[72-74],但也不乏對于基礎教育階段教師的研究[75,76]。從教師教授學科來看,相關研究多關注語言類教師[77-79],少數研究關注科學類課程教師[80],而多數研究未針對某一類教師群體。在研究方法上,思辨型的研究較多,只有少數研究從教學實踐入手,采用問卷調查、訪談與課堂觀察等混合型研究方法[81-83]。在理論基礎方面,多數研究未采用相關理論支撐論點,少數研究采用了生態理論[84]。
由此可見,國內教師測評素養的研究多關注教師測評素養的現狀、內涵、影響因素和提升途徑等方面,研究對象集中在高校語言類教師,研究方法較為單一,理論支撐較為欠缺。
通過對國內外相關研究進行梳理可以發現,在研究主題上,國內外研究都關注教師測評素養的現狀、影響因素和提升途徑,而國外研究從實踐出發,關注教師群體對于測評教育培訓的訴求,以此進一步優化測評素養的培訓;國內研究多從理論與經驗出發,思辨性地探討教師培訓的方法。在研究對象上,國內外研究者都關注語言類教師,而國外研究者也關注體育教師和科學類課程的教師。在研究方法上,國外研究的研究方法較為多樣,而國內研究以思辨為主,研究方法較為單一。最后,在理論支撐方面,國外研究多運用社會文化理論和測試學相關理論,而國內研究的理論支撐較為單薄。
因此,在研究主題方面,國內研究可以從實際出發,探討教師對于測評素養的訴求,提出優化測評素養培訓的建議。在研究對象方面,國內研究可以將關注點從語言類教師轉向非語言類教師,拓寬研究對象的范圍。在研究方法方面,國內研究可以嘗試從思辨性研究轉向實證研究,并在國外研究的基礎上形成符合我國國情的本土化理論。