劉玉勇 張華中 童玉峰



摘要:基于蘇州高新區教師發展增值性評價系統的要求,嘗試開發教師發展增值性評價成果量表。量表由三級指標構成,關注發揮優勢效能,注重與SNDVESTD平臺的融合。量表的優化可以從兩個方面展開:一是關注量表評價對象的差異性,二是提升對評價量表數據的關注度。
關鍵詞:教師發展;增值性評價;成果量表
本文系江蘇省教育科學“十四五”規劃2021年度重點課題“增值性評價模式的區域性構建研究——以SND為例”(編號:B/2021/02/66)、江蘇省基礎教育前瞻性教學改革2023年度實驗項目“基于智慧教育云的教師評價平臺構建研究”(編號:2023JSQZ0179)、江蘇省教育科學“十四五”規劃2023年度重點課題“基于數字化治理轉型的區域智慧教育迭代研究”(編號:B/2023/03/147)的階段性研究成果。
增值性評價是通過對評價對象一段時間內前后發展數據的縱向比較,評判評價對象進步情況(效能)的一種評價方式,通常以預測模型為概念基礎,用一段時間內“現在評價的實測值-基于模型計算出的評價預測值”,取的是排除其他影響后通過自身努力得到的“凈效應”。增值性評價的實質是對評價對象進行縱向區間進步情況的假設、追蹤、凈效應計算、交互反饋的過程。
評價量表多為結構化的等級評價設計,主要包括評價指標結構、閾值確定、等級水平、表現性描述以及具體樣例等。“評價量表的核心是一次重大的權力再分配,也是學術界對教育方式的一次重要界定和指導。”[1]開發教師發展增值性評價量表,可以讓教師在搜集數據過程中履行自我評價的權利,了解學校和上級部門的成長期待,實現評價的多主體參與和評價數據的多元核驗。
基于蘇州高新區教師發展增值性評價系統(以下稱“SNDVESTD平臺”)的設計與要求,結合多項區域評價課題研究,我們嘗試開發教師發展增值性評價量表,具體分為成果量表和過程量表。成果量表設計相對簡單,雖然具有結果性評價的特點,但其階段量化的特征有助于評價對象清晰判斷自己的增值情況,目前已經投入使用;過程量表設計較為復雜,具有動態評價的特點,評價及時,響應性比較高,開發難度較大,目前尚處于開發研制中。本文著重對成果量表的開發和使用進行闡釋,以期為后期增值性評價過程量表的開發提供經驗。
這里的成果量表,是基于教師評價改革的需求,借鑒李克特量表和SOLO分類評價理論,綜合本區域教師各類評價、考核相關指標,以及本地區教師發展的整體情況而制訂的,是對本區域內教師個人素養和教育教學實績的量化采集表。它首先對教師素養結構進行解構,之后進行指標的合理賦分及等級水平的恰當賦率(每項指標分值所占總分值的比率),繼而結合SNDVESTD平臺內嵌的增值性評價模型所需數據特點,進行二維量化采集。數據采集后,通過將量表數據輸入至SNDVESTD平臺,完成增值性評價數據核驗,對數據進行模型化處理,對評價結果實施可視化輸出。可見,成果量表的開發是增值性評價體系中重要的環節,合理的指標分解和賦值可提升教師參與評價的主動性,亦能抵近評價公平。
一、 成果量表的開發
成果量表目前的評價對象是蘇州高新區義務教育階段及幼兒園的教師,未來可向全學段教師逐步推廣,其開發思路也可遷移至學生評價和學校評估層面。
(一) 成果量表的指標劃分
成果量表由三級指標構成。一級指標分為“綜合及單項榮譽”“德育專項榮譽”“教育教學成果”“教科研成果”“競賽指導成果”“其他榮譽或成果”六個部分,每個部分又細分出數量不同的二級指標(如表1所示)。
整體來看,一級指標是按照教師的榮譽類別進行劃分的,同時也兼顧了本地區教師發展的特色活動(如兩年一次的專業素養競賽),使成果量表具有一定的穩定性;而“其他榮譽或成果”的植入讓成果量表具有一定的張力和多元性。除了“其他榮譽或成果”外,二級指標總分值為120分,對各部分指標進行“賦率”計算,其中榮譽(包括綜合及單項榮譽和德育專項榮譽)40分(賦率約為33.3%),教育教學成果40分(賦率約為33.3%),教科研成果30分(賦率為25%),競賽指導成果10分(賦率約為8.3%),比例相對合理。
在賦分方面,我們對這五個一級指標的二級指標都做了10分的等值賦分。一方面,便于觀察計算;另一方面,也便于教師更專注于二級指標內涵本身,重視理讀二級指標的整體結構和與一級指標的關系,快速定位自己的成長狀態。
成果量表在對二級指標進行等值處理后,又將二級以下的三級指標進行階梯賦分,實現兩種賦分方式的融合。對于榮譽類內容,只需在二級指標后面按照榮譽級別添加三級指標(即什么級別或部門評定的什么榮譽)。由于鎮(街道)級比賽很少,未單獨列入,所以,這里的三級指標劃分為省級及以上、市級、區級、校級四個層次,再按照這四個層次進行梯度遞減定值賦分(“區”“校”之間未列入“鎮”,因此遞減兩級差4分;若加入“鎮級”,則實現等距賦分),形成“級別+分值”的細分量表結構(表2所示即“綜合及單項榮譽”指標結構與賦分)。對于量表中其他榮譽類一級指標或二級指標下的三級指標,賦分方式可遷移。這樣的編制思路便于進行評價量表構成指標的解構和再結構。
成果類內容的三級指標和分值基本采用“級別(類別)+獲獎等級+分值”的結構形式和等級賦分方式。例如,教育教學成果的統計就采用階梯賦分的形式確定級差和閾值。下頁表3所示為基本功和優質課的指標結構與賦分情況。因獲獎級別難度存在非線性增減的特點,故分值呈現非等值變化的樣態。一級指標“教科研成果”“競賽指導成果”,也可以采用同樣的結構思維和階梯賦分方式。
就整個成果量表來看,將二級指標賦分的一致性和等級指標賦分的梯度性進行融合,蘊含著一定的哲理:從數值呈現角度看,這體現出不同教師成長機會的均等,也反映出教育實踐成長歷程中的個體差異;從數值
運算角度看,這提示教師成長需要有目標、有毅力的累積,最終會殊途同歸;從設計理念角度看,這可以讓教師洞見自我發展的優勢和短板,確立未來發展方向,也為團體異質協作發展提供了信息支撐。
(二) 成果量表的效能保證
為了保證成果量表的效能,我們十分重視數據核驗,在量表中設計了“自評得分”與“考核得分”兩欄。“自評得分”由教師根據自己的成長情況,結合佐證材料,對照量表確定成長分值;“考核得分”則通過他評進行成長分值的確認,可通過學校評價、團隊評價、骨干評價、教師互評等形式實現。我們還初步引入人工智能,利用AI技術對佐證材料進行快速智能識別,核驗相關指標數據。
此外,我們也關注發揮成果量表的作用。一則,利用量表收集區域教師的綜合性和結果性評價數據,形成與教師個人考核、骨干評選、職稱評定等常規評優、薦優、核優活動數據的交集,幫助教師對個人關鍵成長數據有清晰認知,實現成長數據的充分利用;再則,這些數據資源容易收集,佐證過程也較為簡單,易于教師理解和分類使用,有助于提升教師在評價中的結構意識和數據化能力;三則,此類量表的開發可以促進其他評價量表的開發,進而借助不同量表之間的整合實現多元評價的實踐與運行;另外,此類量表還能有效實現個體過程性評價的數據對比,為過程量表開發提供經驗。
(三) 成果量表與SNDVESTD平臺的融合
成果量表可以將教師成長中的精確結果(如具體成績)、等級結果(如各種獎項)、現象結果(如積極性、努力程度)轉化為統一標準的具體數值,以便用同一尺度進行衡量,進行評價表達的激勵,實現數字化多模態映射。
由于成果量表是基于SNDVESTD平臺而開發的,我們特別關注成果量表和SNDVESTD平臺之間的融合。一是成果量表指標和SNDVESTD平臺預設項目要一致。二是成果量表的所設定的分值和占比也要和SNDVESTD平臺預設一致。三是量表樣式和SNDVESTD平臺開發理念可以“復制”和遷移;四是要重視量表數據準確性的核驗。量表數據的準確度不僅影響SNDVESTD平臺基礎數據的準確,也影響增值模型的擬合,更會影響借助模型生成的增值性評價結果;五是量表測量要保證標準的階段恒定。需要借助同一量表對個體進行多次測量,再用階段的縱向發展數據擬合出比較準確的模型,實現SNDVESTD平臺增值評價結果的科學和多樣輸出。
二、 成果量表的使用
經過近一年的開發,成果量表九易其稿,終于得以投入使用。在立德樹人思想指導下,該量表首先關注德育方面的成果,同時重視教師教學素養、科研素養、特色素養的數據收集,整體分值和比率合理。借助SNDVESTD平臺,在填寫過程中,教師能動態關注自己的發展情況,結合實際發現自身進步和不足,從而對個體成長方向和定位逐步形成清晰的認識。概言之,一張成果量表既可以連接過去,為評價服務;也可以對比現實,為成長加油;同時,它也呈現了未來成長的基本圖景和精準定位。
當然,成果量表還需要進行進一步優化,例如,采用無紙化采集之前,可以通過多種形式先讓教師對量表的整體結構形成初步了解,不能只是被動地碎片化錄入數據;再如,對于常年低分導致的“地板效應”和常年高分引發的“天花板效應”也要思考有效的破解途徑。借助成果量表發現,這兩種類型的教師都面臨著成長瓶頸,因此,需要借助其他的表現性評價形式來激勵他們積極上進、堅持努力,利用“提醒系統”給予其合理化建議,再借助SNDVESTD平臺提供成長學習的必要資源庫,發揮評價的撬動效應,實現增值性評價促進成長的價值。成果量表適合階段性增值性成長的測量,而日常教育教學評價測量亟待過程性量表的編制。因此,只有將成果量表與過程量表相結合,才能真正推動增值性評價科學發展。
量表的開發和使用的基礎是短周期的大數據。數據可以看成教師成長的核心產物,數據之間的聯結存在時間上的先后和空間上的隔離。只有理解其內涵實質才能實現增值理念的轉化與創新。因此,未來的評價量表將為大數據的統計分析服務,在數據基礎上擬合和利用適切的增值模型,通過統計將大數據進行清洗、優化、整合、運算,動態地輸出相對合理的評價結果。
關于成果量表,我們蘇州高新區技術和科研團隊擬從以下方面進行優化提升:
第一,關注評價對象的差異性。注重差異性可以說是增值性評價探索的前提要素,也是未來數字化賦能教研、科研和區域教師研訓的發力方向。這需要我們將量表進一步細化。例如,區分教師任教學段和教齡長短,從性質上進行“伙伴化”劃分,讓評價量表結構更貼合教師個體、代際群體、校級群體和局部校際群體的實際,實現增值性評價的人文關懷。我們還要重視此類成果量表和表現性量表的互補與銜接,除了關注“德”“能”“績”,也要將“勤”“廉”等表現性指標納入評價指標體系中,促進多種量表之間的有效整合,從而對不同群體教師作出適切的評價,全面、客觀、個性地呈現教師發展的軌跡變化,從多維度激發教師發展的自信。
增值性評價進入國內幾十年,之所以長時間停留在理論層面,一方面源于數據存儲、管理支撐不足;另一方面是因為缺少增值性評價模型的理解應用,同時也缺乏增值性評價結果的理解和運用[2]。相對而言,增值性評價屬于強技術、強理論和強專業的一種評價,需要教師有更深厚的信息素養和教科研素養打底,能夠復現對增值的運算、解讀,實現主動且路徑清晰地成長。這也是先研究制定成果量表后推出過程量表的重要原因。
第二,提升對數據的關注度。要從成果量表推開,通過對量表結構和數據的關注,讓評價結果起到驅動作用。適切的量表數據設計、模型擬合和數據服務能提高教師參與增值性評價的熱情。這需要我們做好以下幾點工作:
其一,讓指標數據為教師所需。在設計量表的時候,指標除了要和教師利益高度相關外,也應該和個人成長需求高度貼合,要重視選擇高頻并且容易理解的指標概念。其二,減少量表數據的“碰壁”。避免出現“唯數據論”“數字暗箱”和“窄視化”現象,加強數據理解和數據關聯,進行數字倫理和安全教育,防止出現“數字鴻溝”和“數據孤島”現象,增強量表數據理解的真實感。其三,用數據創建多元增值模型。可利用量表搜集不同時間的個人階段成長數據,進行模型擬合;還可以用量表采集相同時間的區域大數據,基于數據尋找“學術伙伴”,創建教師成長百分等級模型,發揮不同模型的評價優勢并實現可視化輸出。其四,重視對量表數據背景的關懷。量表數據收集過程中,要關注教師家庭環境、經濟條件、籍貫、教育基礎等相關因素,在量表中加以考慮并進行變量控制,以此看到教師通過自身努力得到的不同角度的成長“真風景”(凈效應)。其五,實現量表數據輸入系統的智聯。數據的系統輸入,除了時間上放開,也要在方式上納入智能識別,載體上接入移動互聯,適切地進行數字治理。其六,實現評價結果的可視交互。量表數據經過處理后,在評價輸出時要注意可視化、多模態化以及模塊可拆拼化,也要重視評價結果呈現可選、可用、可推薦和可對比的多元交互。其七,讓數據更多地關聯生活。特別在是評價輸入、運行和結果呈現中,可以和QQ、微信進行程序接入,讓增值性評價成為學習和生活的一種習慣,讓“萬物皆數”體現在自我“體檢”的思想和行動中。
參考文獻:
[1] 丹奈爾·D.史蒂文斯,安東尼婭·J.利維.評價量表:快捷有效的教學評價工具(第2版)[M].陳定剛,譯.廣州:華南理工大學出版社,2014:158.
[2] 劉邦奇,朱廣袤,張金霞.智能技術支持的增值評價模式及典型實踐[J].中國遠程教育,2022(12):4957.
(劉玉勇,江蘇省蘇州高新區文昌實驗小學校。張華中,江蘇省蘇州高新區教育發展中心,特級教師,正高級教師。童玉峰,江蘇省蘇州高新區第五初級中學校。)