王 會,袁詩龍
(陸軍炮兵防空兵學院 教學考評中心,安徽 合肥 230039)
1967年,美國芝加哥大學哲學家與課程評論專家邁克·斯克瑞文(Michael Scriven)首次提出Formative Assessment概念,此后其概念內涵一直處于不斷發展完善之中,歷經為萌芽階段、界定階段、發展階段。[1]中國學者將其譯為形成性評價或形成性評估。2018 年,美國針對其2006年提出的形成性評價概念內涵進行修訂,報告提出“形成性評價是所有學生和教師在學習和教學過程中使用的有計劃性的持續過程,用于引出和使用學生學習的證據,以增加學生對預期學科學習成果的理解,支持學生成為自主學習者的評價”[2]5。
中國學者將形成性評價納入課程教學的理論與實踐研究是在2000年前后,范圍覆蓋小學、初中、高中、大學等諸多層次的課程,尤其是一部分高等教育工作者,在研究實踐中一直嘗試進行形成性評價本土化的定位與引導。
形成性評價與終結性評價在后續的實踐與研究中始終被作為組對概念進行參照使用,諸多研究者認同形成性評價是為了彌補終結性評價的不足。因此,作為組對概念,必須厘清終結性評價需要被彌補的短板在何處。終結性評價歷史悠久,運用廣泛,其絕對優勢便是簡單直接,操作方便,實用性強。在選拔知識量豐富、思維能力敏捷的人才時有著得天獨厚的優勢,因此,在農業經濟時代、工業經濟時代[3]甚至是信息經濟時代的前期,終結性評價均受到社會廣泛認可。然而,經濟與科技的進步,社會對人才的要求僅有知識的儲備是不夠的,其創新引領的能力被凸顯出來,這些能力的需求倒逼學校對之進行反思與改革,傳統考試考核的弊端便顯現出來。一是終結性考試效度受到質疑,主要是“高分低能”學生的頻繁出現引發對考核制度的質疑。二是終結性評價過程中個人、環境、出題方向的偶然性因素,以及一錘定音式的考試選拔模式與考試本身彰顯出的公平公正的語境間相互矛盾,社會對終結性評價的信度生發質疑。三是終結性評價對學習知識占有量的追捧,只關注學習結果,無法監控學習過程和學習行為,催生了“臨時抱佛腳”的考試形態,削弱了對知識探求的意愿與深度。四是終結性評價工具理性導致對考試技巧的無限追求,對技巧的過度宣揚和夸大往往會輕視知識的掌握和理解,違背了教育的求知精神。因此,終結性評價的單一使用,使師生雙邊活動越來越難以合力推動學習發展,形成性評價的出現與介入正是在此基礎上彌補了教育教學過程的監控,推進學生求知本身的發展,塑造時代需求的創新人才。
相對于終結性評價對學生學習結束之后的考察判斷不同,形成性評價發生在教學全程,動態互動與調適中最大化接近學習目標。其在教學中應發揮的作用有:(1)導向作用:告訴學生哪些是學習的重點,引導學生集中精力學習重難點目標;(2)診斷作用:判斷學生的學習水平和其達成目標的程度,分析學生表現的優勢與差距,判定學生是否有進一步的學習動力支持;(3)反饋作用:把學生當前的學習成就水平反饋給教師和學生,為教學調整提供依據;(4)強化作用:給學生提供練習和鞏固知識、技能的機會;(5)激勵作用:肯定學生這一階段取得的成就和進步,激發學生的學習動機,提高自我效能感;(6)改進作用:基于學生的水平和反饋效果改進教師的教和學生的學;(7)長遠發展:通過持續的評價引導學生了解自己的學習狀況,把控自己的學習進程,影響其后續的課程學習乃至職業生涯設計。[4]
我們在案例調研中發現大部分教師對形成性評價存在誤解:在傳統教學過程中增加頻繁的單元測試后進行分數收集,或者對學生的課堂表現進行登記并區分學生等級,或者在互動過程中增加一些隨機的鼓勵性、評價性語言以此作為形成性評價的手段,把這種模式權且稱為傳統課堂外掛監督模式,以簡單的幾個方法來解決觀念上認知,這顯然是不夠的。若要很好運用形成性評價的功能,首先,在師生角色認知上,必須區分以教師為主導和以學生為主導的課堂,形成性評價的課堂中教師必須建立以學生為主導的教學觀念。其次,對形成性評價的核心要素要有清晰地把控。以課堂為單位進行劃分,形成性評價的課堂要素至少包括:“設計與呈現學習目標、收集學習證據、解釋學習證據、形成性反饋和教學調整”[5]五個核心部分。設計與呈現學習目標即體現教學內容的計劃性,學生對教學目標的認知與其自身知識儲備承托起對該目標的認知程度,這是形成性評價的第一步;收集學習證據,即在課前、課中、課后收集學生學習行為及其結果的內容,這些學習證據足以體現學生對學習目標的達成程度,經過分析,這些學習證據足以說明學生達成學習目標的努力程度,以及達不到學習目標的主要原因,從而進入下一個環節。在整個過程中,這個環節是至關重要的,也正因為重要,很多實踐研究者單純運用了這一環節便以偏概全的認為已經運用了形成性評價。形成性反饋是緊接著學習證據的收集環節,這一環節需要完成教與學的雙向反饋,教師經過學習證據綜合分析給與學生評價指導,學生的學習狀態及證據因素也是反饋給教師完成教學節奏、方法、進度等的調整。因此,課程形成性評價的最終目的是促進目標的達成,而不是為了收集數據而給學生判定等級。在高校外語教學領域,曹榮平教授在英語口譯翻譯課程中運用了形成性評價,給工具型課程起到了很好的示范作用。[6]
從課程來看,形成性評價并非針對某幾個重點知識點的一次或幾次課堂中的暫時性使用,它必須通過連續的師生相互反饋調整合力達成目標過程,并在這個過程中對學生進行“潤物細無聲”的情感教育與心智提升,它在實施過程中具備顯著的特征:一是評價過程的反饋即時性,這是相對終結性評價反饋滯后性提出的,教學即時反饋是師生教學相長的即時表現;二是評價的持續性,表現在課堂教學目標的閉環之中,也表現在一門課程的教學閉環之中;三是評價的系統性,課堂觀察、師生互動、作業反饋等這些只是形成性評價過程中的各要素之內的零星方法體現,不能盲人摸象,以偏概全。
調研對象為安徽省某高校通識課程“高等數學”的形成性評價實踐方案及實踐成果。該學院為公辦本科院校,連續三年高考錄取分數線超過一本線45~75分。2019年,該校教務部門發文將課程形成性評價的使用制度化,要求所有考試課程結課成績均采取終結性考試成績與形成性評價成績相結合的方式。2022年,該學院在體系內最近一期院校綜合評價中為綜合優秀,數學教研室“高等數學”形成性評價方案試行稿受到管理層認可,要求修訂后作為示范模版發放至各教研室供學習參考。該校“高等數學”形成性評價辦法規定課程形成性評價成績占結課成績的40%,終結性考試成績占結課成績的60%,終結性考試成績不及格者該課程為不及格,增加形成性評價成績的目的“是加強學生學習的過程管理,提高學生的學習質效”。形成性評價設百分制,有3項一級指標,若干項二級指標,二級指標使用加減分制,個別班級還增設限定上線的加權項。具體內容見表1。
查閱“高等數學”形成性評價使用以來的兩屆學員共計2015人,以及未使用形成性評價的最末一級學生987人的課程結課成績,結果顯示:一是卷面成績不及格學生,形成性評價成績為良好及以上的(80~100分)超過95%;二是形成性評價成績集中在85~90分的學生占84.6%;三是形成性評價使用前后,連續三屆學生的“高等數學”分數表現差異不大,試卷分析報告顯示“卷面難度較往年有所下降”,學生中高分數段(90分及以上)人數從占比近20%下降至9.2%。數學教研室共計32位教師針對不同班級記錄的形成性評價成績曲線趨同。

表1 “高等數學”形成性評價辦法
解析表1中的指標,一級指標課堂表現所含的11項二級指標中,除“正確回答問題”“對教員講解提出合理質疑”“對提問一無所知”3項是對學習質量的判斷,其余8項指標均指向學習態度。一級指標作業質量對應的7項二級指標,主要也是考量態度。這些指標主要監督的是學生學習態度、學習狀態、學習情感的付出,而不考量學習質量,學習主動性,以及學習與目標的達成度,這種考量內容解釋了為何卷面成績不及格學生在形成性評價中能獲得高分。對態度的考量給了一些學習不良學生正驅動,因為良好的形成性評價成績可以拉高結課分值,然而,這種考量方式也傷害了一部分熱愛深度學習的學生,為了迎合老師的課堂記錄不得不放棄深度思考來進行表面的互動,這就解釋了高分值學生人數為何不斷下降。二是對學習質量的評價手段使用階段性測試,但對階段測試的結果僅用以學生成績等級劃分、區別記錄拉開分數。測試本身不具備區分形成性評價還是終結性評價的屬性,但是對測試功能的選用可以區分是靜態的判斷還是動態的評價,顯然“高等數學”課程形成性評價中的測試是靜態的。三是形成性評價的“形成性”在于持續的動態的過程,指標的記錄也應該是持續的,互動的,針對學習目標的閉環的記錄,然而,表1中的指標皆是靜態的記錄。
總體來看,該學院“高等數學”形成性評價方法的使用從管理上表現為事無巨細,時刻關注,學習上無管理盲區,但就目的而言并未明顯提升學生學習的質效。在傳統課程上增加一些手段和方法監督學生的學習積極性,雖然頻繁地收集信息,以傳遞壓力的方式增加學生的自我約束,這增加了教師的工作量,卻并非是真正意義上的課程形成性評價。然而,這種模式卻在實踐中有一定的代表性。追溯其原因很可能是政策指導教育的一種特色化體現。2005年,教育部首次在高等教育課程管理領域使用“形成性”的概念,《教育部辦公廳轉發中央廣播電視大學關于實施教師網聯計劃進一步加強和改進教師教育工作意見的通知》中附件內容《中央廣播電視大學關于實施教師網聯計劃進一步加強和改進教師教育工作的意見(試行)》中對遠程教育的考核評價方式有明確的指導意見:“建立和完善形成性考核和終結性考試相結合的考核制度,側重考核學生的知識運用和綜合分析能力;在考核中逐漸加大形成性考核比例,適當采取表現性評價方式,如:論文式試題、學習記錄袋、調查報告等。”[7]此后一段時間,遠程教育課程形成性考核的研究甚囂塵上,在遠程教育中取得了一定的成果。但是,其所提出的“形成性考核”并不能直接認定為是“形成性評價”。“評價”與“考核”的主客體皆有一致性,都是對學習結果的判定,但二者在內涵、考量上仍有不同。考核的釋義為“考查核實,研究考證”[8]2008,評估解釋義為“衡量、評定其價值;評定的價值”[8]519。“考核”重在結果呈現,“評價”重在衡量價值;“考核”重在標準參照;“評價”重在價值判斷;“考核”多為定量分析,“考評”多為定性分析。遠程教育因為其特殊的教育模式,教師與學生間的物理距離限制了師生交互溝通的頻率與效率,因此,使用“考核”這種參照標準更為明確,結果表現更為直觀簡潔的方式來彌補物理距離產生的心理距離和疏離導致的信任不足,“考核”制造出的強制參與的指令感氛圍增加了遠程教育中教師對學生的控制力,而這種遠距離的控制力反而讓學生體會到學校對自己的關注與管理,與散漫無序無管理的一般性遠程教育傳統狀態形成對抗,以此實現遠程教育中的主動管理和有效管理。而在校教育,具備師與生的課堂內外密切聯系的時空條件,因此,要弱化考核帶來的緊張感,增強過程的反饋與指導,讓學生以最快的方式對學習進行自我判斷和調整,從而達到最佳的學習效果。形成性評價絕不能等同于“評判”或“打分”,其注重的不是學生學習的結果,而是如何促進學生學習發展的過程。
依據美國形成性評價研究機構FAST對課程形成性評價的課堂環境闡述,課程形成性評價需要:1)要闡明學習目標和標準;2)能激發學生思考,獲取學生學習的證據;3)鼓勵學生進行自我評價和同伴反饋;4) 提供有實踐指導意義的反饋;5)使用學生學習的證據和反饋調整學習策略、目標和接下來的教學步驟,促進學習過程。[2]12-20對應這5個步驟,上述“高等數學”的課程形成性評價方案顯然是不完整的。只有全部涵蓋這5個步驟,并以其收集的學生學習信息作為指導教學調整的實踐反饋,這樣的收集才是形成性評價的過程,否則,單純的測試與行為記錄都只能算為平時成績的指標化。之所以會出現這種將“考核”誤解為“評價”,將形成性評價收取信息這一單獨環節等同于形成性評價全流程去理解,這表明相當一部分高等教育工作者對形成性評價的理論認知還需要進一步加強。