李葆萍 陶丹

【摘 要】為適應智能時代人才培養(yǎng)的需求,當前的學校教育體系需要進行全方位、深層次的變革。為克服變革過程中教育系統(tǒng)運作的慣性影響,本文提出以構建智能時代的教育評價體系賦能未來學校轉型。智能時代的教育評價應當聚焦于學生核心素養(yǎng)發(fā)展規(guī)律來構建評價的認知模型;借助智能技術以真實場景下的表現性評估手段來測量和診斷學生的高階能力發(fā)展水平并探索其培養(yǎng)規(guī)律;用“以評促教”的理念改變教育評價模式,構建課程、教學、評價一體化的閉環(huán)模型,發(fā)揮教育評價的導向、診斷和改進功能,進而促進未來學校轉型。本文還對教師跨學科教學能力、人工智能技術素養(yǎng)、數據素養(yǎng)和評價素養(yǎng)等新型教師專業(yè)發(fā)展能力在推動教育評價賦能未來學校轉型中的潛在價值進行了分析。
【關鍵詞】未來學校 教育評價 人機交互教育評價 教學研一體化模式
一、智能時代教育面臨的挑戰(zhàn)
學校教育具備其固有的社會功能,學校教育體系需要和社會生產生活方式的轉變保持一致。在工業(yè)化時代,各行各業(yè)對從業(yè)人員的技能需求相對穩(wěn)定,對應的教育體系只需要傳授給學生相應的知識和技能。放眼今天,世界步入智能時代,知識與技術創(chuàng)新加速,部分領域知識更新周期由20世紀的40~50年急劇縮短至16~18個月[1]。隨著知識更新和淘汰周期的加速,新行業(yè)和技術產品層出不窮[2]。然而,現實中的教育系統(tǒng)仍然延續(xù)工業(yè)化時代的體系,各級各類學校以培養(yǎng)專業(yè)型、工匠型人才為主要目標,學校轉變的速度遠遠跟不上知識與產業(yè)更新的步伐。同時,在通信技術和交通技術的助力下,跨國、跨區(qū)域的經濟文化交流空前便捷,多元文化、不同觀念間的融合與沖突無處不在,未來充滿了巨大的不確定性。這些挑戰(zhàn)對整個教育系統(tǒng)和各級學校教育提出了新的需求。
為了應對這些挑戰(zhàn)和需求,未來人才培養(yǎng)的目標需要有新的定位。2016年,教育部發(fā)布了中國學生發(fā)展核心素養(yǎng)框架,框架以培養(yǎng)“全面發(fā)展的人”為核心,將核心素養(yǎng)分為文化基礎、自主發(fā)展、社會參與三個方面。作為社會人才培養(yǎng)的主要機構,學校必須完成從工業(yè)化人才培養(yǎng)模式向智能化人才培養(yǎng)模式的深層次轉型。以“培養(yǎng)學生”這個學校的核心業(yè)務為例,學校的課程內容將從分科式的組織方式轉向學科融合的方式,指導學與教的理論基礎將從以知識傳遞為目標轉向以深層次的理解和知識創(chuàng)造為核心,評估學習者學習效果的指標也將從以言語、數理邏輯為代表的傳統(tǒng)智能轉向多元智能和德智體美勞五育并舉。為了響應這些轉變,各級教育系統(tǒng)的教師教學技能、管理組織架構等都需要做出相應的調整。未來學校轉型的具體策略和路徑會有所不同,但可以預見的是,這個過程一定會受學校已有運作體系龐大慣性的影響。
二、新型教育評價賦能未來學校轉型
教育評價是通過規(guī)范的教育研究設計和步驟,系統(tǒng)收集和分析數據,對特定的教育實踐確定其價值的過程[3]。對整個教育系統(tǒng)而言,教育評價的內容和標準就是教育活動規(guī)劃和組織的指揮棒。鑒于工業(yè)化的教育評價體系不能滿足新的教育理念以及智能時代的人才培養(yǎng)訴求,歐盟、經合組織等陸續(xù)發(fā)布政策引導國家教育評價體系在評價內容、評價手段以及評價的功能等方面進行變革。2020年,我國頒布的《深化新時代教育評價改革總體方案》也同樣站在重塑智能時代教育體系的高度上,對于評價改革的方向和整體路徑進行了全面的規(guī)劃。概括來說,新型教育評價賦能未來學校轉型主要體現在以下幾個方面。
1. 以學生全面發(fā)展和終身學習教育評價內容推動育人觀念轉變
傳統(tǒng)學校教育所提供的知識和技能無論在內容上還是形式上均無法滿足個人進入社會生產生活領域的需要。學生獲取和應用知識的能力的重要性勝過學生掌握具體的內容,單純評估學生知識內容掌握的教育評價體系極有可能會誤導學校教育活動的組織和開展。目前固定年齡階段在固定場所的常規(guī)學校學習方式也無法適應快速發(fā)展社會的需求,自主學習、終身學習和職場中的學習將成為新的學習方式和學習場景,教育評價需要引導學校教育適應校內外融合體系下的學習模式。基于最新的研究總結,教育評價在內容組織層面呈現如下趨勢[4]:
(1)教育評價設計和開發(fā)所依據的認知模型突破分科教學的模式,包含整合的核心知識、技能以及彼此之間的關聯。教育評價的范圍擴展到學生的復雜思維、問題解決能力以及隱性知識評估。2006年,歐盟啟動的教育與培訓領導的未來十年發(fā)展規(guī)劃項目發(fā)現,在核心素養(yǎng)的培養(yǎng)目標的指導下,歐盟各國的課程改革實現了分科知識的課程向核心素養(yǎng)跨學科課程的轉變;綜合評價問題逐漸成為評價改革的焦點,如阿姆斯特丹大學開發(fā)用于評價15~16歲學生跨學科素養(yǎng)的測試方法等。
(2)教育評價關注學習者知識建構的貫通性,致力于為課程、教學和評價提供一種跨越不同年齡階段的、貫通的認知發(fā)展模型。這方面比較典型的做法就是將“學習進階”的理念引入學科核心大概念的學習中。學習進階是基于實證研究中學生的認知發(fā)展過程開發(fā)出來的一條“假定的”學習路徑,其核心假設在于學生對于同一核心概念的理解是隨著年級的升高而逐漸深入的[5]。用學習進階的模型指導教育評價的設計和開發(fā),可以關注到學生深層次理解的發(fā)展過程,從而為學生的具體學科核心概念的理解和發(fā)展提供相應的建議。
(3)關注學生的認知、元認知、社會認知和非認知特征對個體行為和學習表現的影響。學生在學習過程中涉及的社會、情感和自我管理這些變量通常被稱為非認知技能或軟技能。當前教育過于關注學生的認知技能,而忽視了對非認知技能的培養(yǎng)。過去十年里大量的研究表明,非認知變量與學生在教育過程和后期企業(yè)生涯中取得的成績之間存在較強的關聯性[6]。因此,未來學校的教學評價設計也需要關注學習的非認知維度,以及如何將它們體現在具體的學習目標中。
2. 以智能技術支持的表現性評價推進高階能力培養(yǎng)
各級教育系統(tǒng)也面臨著如何設計和開發(fā)有效的評價項目來測量和支持包括數學能力、閱讀能力、協(xié)作技能、好奇心、智力、創(chuàng)造力和責任心等在內核心能力和素養(yǎng)的培養(yǎng)。這些核心能力和素養(yǎng)通常無法被直接測量,需要尋找新的評價途徑和方式。研究表明,可以根據測量對象(即學生)在特定環(huán)境中可被直接觀察的語言、行為等信息來推測該對象在某項技能上的水平,如創(chuàng)造力的測量[7]、問題解決能力的測量[8]等。盡管教育評價的目的和應用的情境各異,但其從本質上來說就是一種通過觀察學生的行為和表現生成相應的數據,以此為證據對學生的知識狀態(tài)、認知狀態(tài)進行合理推斷的過程[9]。從這個角度出發(fā),依據科學的理論模型設計特定的交互環(huán)境,從中準確地獲取學生可被觀測的言語、身體動作等信息,便可以推斷出學生的某些素養(yǎng)和能力水平。
傳統(tǒng)的紙筆測試環(huán)節(jié)中產生的大量的思考過程數據被忽視,且紙筆測試在創(chuàng)設學生應用知識和技能情境方面具有先天的不足,不適于對學生高階思維能力的考查。計算機支持的學習和模擬可以用來創(chuàng)設真實的情境,讓學習者在這種情境中展示出他們知道什么以及他們能夠做什么。互聯網、虛擬現實技術等已經被應用在如電子檔案袋、計算機自適應測驗等方面,為學生營造“人—機”交互的測試平臺與方式,再現生活情境或模擬的情境化評價氛圍,采集積累學生學習的過程數據。通過人機交互環(huán)境記錄下來的學習行為使得考查學習者的學習過程成為可能[10]。如圖1所示,該界面是北京師范大學未來教育高精尖創(chuàng)新中心研發(fā)的問題解決能力評估系統(tǒng)中的一個評估場景。首先,它提供了帳篷分配的規(guī)則,包括:異性不得在同一帳篷和每一個帳篷中至少有一位成年人。學生需要根據總體人數、帳篷的容量和帳篷的數量,拖拽對象進入相應的帳篷;同時,系統(tǒng)可以記錄學生閱讀規(guī)則的時間、操作步驟、操作時間、重做次數和操作結果等。通過分析發(fā)現學生的決策模式,可以將學生的學科成績與之關聯,探查問題解決決策模式與學科學習結果之間的相互影響[11]。
借助于數據挖掘和建模技術,可以實現外部可觀察行為向內部思維的映射,發(fā)現學生深層次的認知模式和策略,從而為高階技能和核心素養(yǎng)的培養(yǎng)提供基于實證的建議。例如,對PISA 2012全球42個國家和地區(qū)3萬余名學生Climate Control(氣候控制)題目的日志數據行為序列分析的研究發(fā)現,學生在問題解決空間搜索過程中顯現出深度優(yōu)先策略、廣度優(yōu)先策略、混合策略和無策略等模式,且深度優(yōu)先策略和混合策略表現顯著優(yōu)于廣度優(yōu)先策略和無策略模式;同時,這些模式提示不同策略運用可能與學生的工作記憶容量和認知負荷有關,這些發(fā)現就可以為學生問題解決能力的培養(yǎng)提供相應的教學干預證據[12]。
3. 以課程、教學和評價的一體化模式來推動教與學模式的轉型
當未來學校致力于讓每一個學生都能獲得適合于自身特征的發(fā)展機會時,繼續(xù)沿用整齊劃一的標準對學生進行分層的策略是不合適的。未來學校的評價應當強調對多元價值觀的包容以及評價結果對學生進一步的學習的反饋和推進作用[13],使課程、教學和評價三者之間在價值取向上具有高度的一致性,在活動實施上具備良好的連貫性[14]。教育評價的模式上,需要轉變傳統(tǒng)教、評分離的模式,對學生能力的考查和教與學的改進形成良性的閉環(huán),進而通過判斷和解釋學生獲得能力過程的證據起到評價學習狀態(tài)、改進教與學的作用,將評價作為激發(fā)個體能力和潛能的過程[15]。當前,主要有如下兩類展示教與學模式一體化的設計思想。
(1)探索目標為導向的教學評估一體化模式。翻轉課堂是當前備受關注的課堂教學模式,其最顯著的特征便是將課堂教授和學生練習環(huán)節(jié)交換了順序。對翻轉課堂的討論主要集中在技術支持課程資源的傳遞、學生學習主體性的確立以及知識建構水平的提升方面,然而從課程、教學和評價一體化模式上的探討并不多,這在某種程度上影響了一線教師對翻轉課堂模式的認知。因為涉及技術應用,建構式教學等對于教師來說是極具有挑戰(zhàn)性的技能和知識,容易使其對嘗試翻轉課堂產生畏難情緒。從教育評價和教學活動這兩類教師基本技能組合順序而言,翻轉課堂就是把以往“教—學—練—評”教評分離的模式變成了“學—練—評—教”這種教學和評價一體的模式。通過評價前置于教學,使教學有了依據。教師教學內容的選擇不再依賴經驗,而是以目標和學情為導向,由傳輸式課堂模式變成改進式課堂模式。當翻轉課堂的評價內容和標準參照未來人才培養(yǎng)要求時,評價前置的一體化課堂模式,“評價即教學”思想下的課堂教學自然是符合未來學校發(fā)展理念的方式。
(2)支持個性發(fā)展的精準教學評價模式。因材施教、個性化教學是古往今來教育追求的目標,也是未來社會“以人為本”理念的真實體現。如前所述,借助于在線學習平臺、可穿戴設備、近場紅外感應等技術能夠在自然交互的狀態(tài)下,采集到更加豐富全面的學生學習表現數據。結合教育評價模型的進步和數據分析處理能力的加強,更加精準刻畫每一位學生元認知、認知和非認知特征,進而使得為教師和學習者提供個別化精準的教和學的決策建議成為可能。累計長周期的學生學習數據后,還可以形成代表學生學習全過程的數據鏈條,完整展現學生的學習特征與認知規(guī)律,將這樣的教育評價結果融合到課堂教學決策之中,會有效促進教師從經驗型混沌的教學模式向科學化精準轉型,為學生的個性化成長提供適切的教學支持。
三、新型教育評價方式下的教師素養(yǎng)發(fā)展
盡管新型教育評價在促進未來學校的轉型過程中蘊含著強大的潛能,但教育研究者和實踐者應該清楚地認識到從可能到現實之間也存在著一定的鴻溝,而教師對應專業(yè)素養(yǎng)的提升是跨越這一鴻溝的關鍵。
首先,新型教育評價依賴于學生認知模型的重構,教育評價的實施和對評價結果的解釋需要和認知模型保持一致。如果教師依舊固守分科教學的模式以及割裂細碎的知識點教學等傳統(tǒng)觀念,教育評價的價值判定和指向作用將被嚴重削弱。未來學校需要加強教師跨學科教學能力和基于核心大概念教學能力的培訓力度,推行班組群式的混齡教學模式,借助于教師教學知識和技能的更新和教學組織管理方式的變化促進教師教學觀念的轉變,為新型教育評價實施構建良好的環(huán)境。
其次,新型教育評價離不開教育大數據和智能技術的支持。當前智能教學系統(tǒng)的開發(fā)和應用還處于初級階段,對于智能評估系統(tǒng)的過分依賴有可能造成對學生學習狀態(tài)的誤判[16]。此外,對教育數據所蘊含學生信息的不同解讀,也會產生不同的教學決策,人機協(xié)同的教育評價、決策方式仍然是當前最可靠且高效的模式。教師自身的數據素養(yǎng)和技術素養(yǎng)水平也會影響智能評價技術的應用。因此,在面向未來學校的教師的培訓中要重視人工智能技術素養(yǎng)和數據素養(yǎng)的相關內容,使教師能夠有意識地應用如線上學習、可穿戴設備、學習檔案袋等手段收集學生的學習數據,能夠解讀數據和學生成長發(fā)展之間的意義關聯,理解各類數據圖表的教育含義。同時,教師也需要清晰地認識到技術介入教育活動的邊界和倫理問題,避免技術應用對于學生發(fā)展和教育活動的綁架。
最后,面向學生發(fā)展的新型教育評價,要強化形成性評價、成長性評價和增值性評價等方式。教育評價不是對學習結果的一次性、總結性評判和分等,而是貫穿于學校內外的教育教學全過程的一系列的評估活動,指向的是對于學生成長現狀的了解,未來發(fā)展?jié)撃艿念A測,以及教學問題的診斷和改進等活動。因此教師既要重視課堂教學能力,更要重視教育評價的能力,并將其和教研、教學活動整合為一個完整的閉環(huán),形成教師的評價素養(yǎng)。教師既需要能夠借助于智能技術和自身的教學知識有目的地選擇最適合的評價項目,還應能夠將其與后續(xù)的教學活動相結合,形成以評為導向的一體化模式。借助教師評價素養(yǎng)的研究和培養(yǎng),可以促進教師以關注學生的核心素養(yǎng)和能力發(fā)展為目標,基于學習階段性表現開展形成性評價,將學情診斷納入教學決策和教學過程中,切實發(fā)揮教育評價的導向和反饋功能[17]。
參考文獻
[1] BROWN J S. Sense-making in our post AlphaGo world:New mindset & lenses may be required[EB/OL]. (2017-04-20)[2021-09-01]. http://www.johnseelybrown.com/SensemakingStanford.pdf.
[2] KELLY K. The inevitable:understanding the 12 technologies forces that will shape our future[M]. New York:Viking Press,2016:2.
[3] 陳春勇.試論教育評估在教育實踐中的運用[J].中國教育學刊,2012(10):79-82.
[4] RUPP A A,LEIGHTON J P. Introduction to the handbook[M]// RUPP A A,LEIGHTON J P . The handbook of cognition and assessment: Frameworks, methodologies, and applications. Oxford:Wiley Blackwell,2017:1-2.
[5] National Research Council. Taking science to school:Learning and teaching science in grades K-8 [R]. Washington, D.C.:The National Academies Press,2007:214.
[6] Psychology Wiki. Big five personality traits and life outcomes[EB/OL]. (2013-07-13)[2021-09-01] https://psychology.wikia.org/wiki/Big_Five_personality_traits_and_life_outcomes.
[7] KIM Y J,SHUTE V J. Opportunities and challenges in assessing and supporting creativity in video games[M]// Green G , KAUFMAN J,Video games and creativity. San Diego:Elsevier,2015:99-117.
[8] SHUTE V J,VENTURA M,KE F. The power of play: the effects of Portal 2 and Lumosity on cognitive and noncognitive skills[J]. Computers & Education,2015,80:58-67.
[9] PELLEGRINO J W. Assessment of and for learning[M]// F FISCHER, HMELO-SILVER C E , GOLDMAN S R ,REIMANN P. International handbook of the learning sciences. New York:Routledge,2018:412.
[10] ROMERO C, VENTURA S. Educational data mining: A survey from 1995 to 2005[J]. Expert Systems with Application, 2006,33(1):135-146.
[11] ZHANG L, YU S, LI B, et al. Can students identify the relevant information to solve a problem?[J]. Journal of Educational Technology & Society,2017,20(4):288–299.
[12] LIU Y, YANG B, WU L, et al. Middle-school students behavior pattern and strategy selection in problem solving: a study based on data from PISA 2012[C]// So H J , et al. Proceedings of the 28th International Conference on Computers in Education. Asia-Pacific Society for Computers in Education,2020:318-323.
[13] 張娜. 從對教育的評價到促進教育的評價——教育評價國際研究進展綜述[J].基礎教育,2017,14(4):81-88.
[14] National Research Council. Knowing what students know: the science and design of education assessment[R]. Washington, D.C.:The National Academies Press,2001:294-297.
[15] ARMOUR-THOMAS E, GORDON E W. Toward an understanding of assessment as a dynamic component of pedagogy [EB/OL]. [2021-09-06]. https://www.ets.org/Media/Research/pdf/armour_thomas_gordon_understanding_assessment.pdf.
[16] 汪瓊,李文超.人工智能助力因材施教:實踐誤區(qū)與對策[J].現代遠程教育研究,2021,33(3):12-17+43.
[17] 李葆萍.平板電腦創(chuàng)新中小學教學研究[J].中國信息技術教育,2013(10):64-66.
本文系北京市教育科學規(guī)劃項目“基于信息網絡技術的未來學校研究”(項目編號:CHEA20200024)和“教育部—中國移動”科研基金(2020)研發(fā)項目“在線教育發(fā)展現狀分析與政策研究”(項目編號:MCM20200406)的資助項目。
(作者單位:北京師范大學教育學部)
責任編輯:孫昕
heartedu_sx@163.com