周世科
【摘 要】教育循證評價著力將教育的改革與發展建構在扎實的科學證據的基礎之上,在數十年的發展過程中,其理念和舉措都被證明,對于提升教育決策的科學性以及教育教學的有效性都有顯著的成效。國際教育循證評價的經驗對完善具有中國特色的教育評價體系具有較高的參考價值。江蘇省借鑒國際教育循證評價的經驗,依托省域內學業質量監測工作,著力提高測量與調查工具的科學性,大力推進“跟進式”循證改革項目,通過構建多方參與的改革共同體,極大地提升了監測的科學品質,形成了具有本土特色的教育循證改革路徑。
【關鍵詞】循證評價 國際經驗 本土探索
自2020年中共中央、國務院印發《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》)以來,建構具有時代特征、彰顯中國特色、體現世界水平的教育評價體系越發成為政策實踐和學術研究的重要議題。人們圍繞這一主題,不但在學術層面開展了深入的討論,而且在此基礎上,著力推動了新時代教育綜合改革的進程。
教育評價作為教育改革與發展過程中具有引領性的核心環節,其改革具有專業性強、牽扯面廣、紛繁復雜的特點,很難畢其功于一役。到目前為止,人們盡管在學術研究與實踐探索方面均已取得了一定的成果,但對于如何更好地完成《總體方案》的目標,仍有諸多未明之處有待進一步討論與探索。針對于此,本文力圖通過分析教育循證改革的國際經驗與基于江蘇省的本土探索,為深化當下的教育評價改革提供參考。
一、教育循證評價的國際經驗
事實上,如何讓教育決策和教育教學工作更為科學有效,是全球所有教育工作者的共同追求。但長期以來,教育改革與發展大多依賴人們的經驗與情懷推進,這就使得相關工作存在較大的不確定性,人們對教育改革的效果也難以進行科學評估。這種情況帶來的最直接結果就是,教育領域各種理論和觀點橫飛,看似熱鬧非凡,但卻難以推動真正的教育變革,在造成理論的“空中樓閣”與實踐的“沃野千里”漸行漸遠的同時,教育一線工作者難以得到科學研究的滋養,長期處于迷茫與困惑的狀態,教育教學工作效率低下,效果不佳。
針對于此,研究者們在推進教育改革科學化方面,做出了大量努力。在這一過程中,讓教育評價能夠準確、全面、科學地呈現出教育教學工作的流程、存在問題、效果、影響因素等要素,是教育教學改革的重要一環。自20世紀80年代起,伴隨著循證醫學和教育評價理論的發展,教育循證評價在各國的教育改革過程中發揮著越來越重要的作用,并取得了顯著的成效[1]。
所謂“循證”,簡言之即為基于證據或遵循證據行事,其目的是使相關工作構建于扎實的科學研究證據基礎之上,以期更好地改進工作流程,獲得更好的工作效果。需要指出的是,教育循證改革對于“證據”有著更嚴格的要求,教育日常場域中常見的經驗性、個體性的經歷與體驗,由于并非良好設計的科學研究,并不能成為循證改革所依據的“證據”。2016年,美國聯邦教育部出臺了《非監管性指南:使用證據去強化教育投資》(Non-Regulatory Guidance: Using Evidence to Strengthen Education Investments)文件,將可以用于決策的證據分為四個等級,即高水平證據,主要通過設計和運轉良好的大規模隨機“實驗研究”獲得;中等水平證據,主要通過設計和運轉良好的大規?!皽蕦嶒炑芯俊鲍@得;具有可能性的證據,主要通過設計和運轉良好的、控制取樣偏差的“相關性研究”獲得;呈現的原理,主要通過能夠解釋教育干預對結果影響原理的“邏輯模型”來呈現[2]。由此可見,在循證教育改革過程中,對證據的獲取與質量都有嚴格的標準,以確保相關決策的科學性。
進入21世紀以來,教育循證改革的理念受到了西方主要國家的普遍認可,各國教育主管部門、學者與實踐者共同努力,著力推動教育循證改革。在這一背景下,教育評價無論是在理論層面還是在實踐層面,都獲得了長足的發展,取得了顯著的成效。
首先,伴隨著教育循證評價的發展,“無證據不決策”已成為人們的共識,并轉化為政策與實踐行動。在教育循證的發展中,為教育問責提供扎實的科學依據是推動教育評價循證轉向的重要驅動力。在21世紀初,美國通過《不讓一個孩子掉隊法案》,提升了教育問責的力度。為此,美國聯邦及州政府必須拿出令人信服的證據,來評估各級各類政府、學校的績效。在此背景下,大而化之、似是而非的評價越來越沒有市場,人們需要更為精準、科學與客觀的教育評價結果,并以此作為資源分配的依據。這在客觀上促進了教育評價的循證改革。而相關政策法案的出臺,則進一步強化了科學證據在教育評價中的重要地位。比如,2002年美國頒布的《教育科學改革法案》要求,所有的重大教育決策和投資都必須得到科學的實證證據支持[3],2006年德國各聯邦文教部長聯席會議頒布了《教育監測全局戰略》,要求將PISA、TIMMS、TALIS等國際大規模教育評價的結果與德國國內的學業水平評價、學校評價、國家教育發展評價等結合到一起,“為所有州的循證教育政策奠定基礎”[4]。這些舉措在為循證評價提供政策依據的同時,也使得循證決策成為西方主要國家教育工作者的普遍價值導向與共識。
其次,伴隨著對證據科學性的追求,教育評估的工具與方法日益嚴謹專業。循證評價的目的是為教育改革與發展提供“最佳證據”。這就要求教育評價者摒棄既往過度依靠主觀偏好和個體經驗的評價方式,采用更為科學有效的評價工具與手段,來獲取具有穩健性和推廣價值的證據。在這一過程中,大量研究者在評價方法上做出了大量的努力,共同推進了循證評價方法的發展與不斷完善。以美國有效教學策略網(What Works Clearinghouse,WWC)為例,該網站不但呈現了大量有效教學的評估證據,還以手冊形式發布了循證評價的證據標準、獲取程序和處理步驟,相比傳統的經驗評價而言,這些方法流程更為科學嚴謹,其評估結果也更為科學穩健[5]。近年來,伴隨著評估技術的進步,循證評估的方法亦呈現出多樣化的快速發展態勢。諸如人工智能、因果推斷、大數據、信息技術、腦科學、元分析等前沿技術大量應用于教育評價過程中,憑借這些技術和方法,循證評價的應用場景更為廣泛,評價結果的應用效果也越發顯著。
最后,教育評價與教育實踐緊密結合,推動了教育的改革與發展。與傳統的教育評價主體與客體相對“獨立”不同,教育循證評價往往采取“干預”式的評價,且更強調證據的實際應用,這就使得教育循證評價在推進教育改革方面有著更強的推動力,甚至于說,一些循證評價本身就是教育改革的組成部分。以美國的“為了所有人的成功(Success for All,SFA)”為例,該項目由美國約翰斯·霍普金斯大學的兩位教授發起,是目前影響力最大的循證改革項目之一。SFA以合作閱讀作為主要的干預手段,通過科學評估來獲得學生學科素養提升的方法和路徑[6]。其特點是,所有的干預與改進都立足于評價,而在評價的過程中,更多采取實驗方法實施,這就使得項目本身的實施既是評估也是實踐改革。這樣的評估方式是諸多循證評價與改革的典型方式,不但解決了干預效果評價的問題,也使得相關教學改進舉措均能得到全程的證據支持,從而獲得更好的效果。
綜上,教育循證評價著力將教育的改革與發展建構在扎實的科學證據的基礎之上,在數十年的發展過程中,其理念和舉措都被證明在提升教育決策的科學性以及教育教學的有效性方面,具有顯著的成效,其經驗對完善具有中國特色的教育評價體系具有較高的參考價值。
二、教育循證評價的本土探索:以江蘇省為例
江蘇省作為中國社會經濟發達地區,教育改革探索也走在全國前列。但多年以來,在取得了豐碩成果的同時,江蘇的教育也面臨諸多問題。比如,教育發展觀與質量觀存在偏差,人們在教育改革與發展過程中,依然存在過度關注學業成績,忽視學生的全面發展的“老大難問題”;教育決策過于依賴經驗性實踐,科學性不足,缺少對一般性規律的科學總結與歸納,從而帶來主觀性過強、實施效率低下、無法形成可靠實踐模式等問題;缺少科學有效、綜合全面的質量評估的標準與工具,難以保證測評結果的信效度與穩健性;學術研究與教育質量監測結果難以有效推動教研模式創新和教育質量提升,專業研究與實踐工作往往各自為戰,相關主體之間缺乏整合與協調,力量難以聚焦。理論與實踐的分離,不但使得學術研究缺少實踐的支撐與滋養,也導致實踐工作常常處于盲目摸索的狀態。
針對這些問題,江蘇省依托教育質量監測,大力推進循證評價與改革,探索出了一條具有本土特色、科學有效的教育高質量發展之路。從2006年開始,江蘇加入教育部基礎教育課程教材發展中心“建立中小學生學業質量分析、反饋與指導系統”項目,每兩年一次,對全省所有縣(市、區)四年級、八年級學生進行學業質量監測,同時對學生的學習環境、學校的教學環境等因素進行問卷調查。2008年4月,“江蘇省基礎教育質量監測中心”(以下簡稱“監測中心”)在江蘇省教育科學研究院正式掛牌成立,承擔江蘇省基礎教育質量的監測調查、數據分析、信息反饋、政策建議、業務指導等工作。
在這一過程中,監測中心充分借鑒包括PISA在內的國際經驗,逐步形成了覆蓋全省、體系完備、功能齊全的學業監測體系。從2011年開始,監測中心以“課程教學現狀”為對象,對全省普通高中25%的教師和10%的學生開展了大規模的調查研究;從2012年開始實施“建立學前與特殊教育質量監測點”項目,在全省設立若干質量監測點,采集和分析“辦學條件、課程狀況、教學管理、教學方式、學生發展、教師發展、家校聯系”等方面的過程信息和研究質量狀況,提供全省性的反饋和指導。目前,江蘇省的基礎教育質量監測工作已經覆蓋了基礎教育的全部學段和省域內的所有縣市,各主管部門對這項工作給予了高度的重視和支持,力圖將其打造成“江蘇版的PISA”,使之成為全面、科學、及時地監測全省基礎教育情況,提高基礎教育質量監測工作的水平和質量,改善教育教學過程的服務手段,促進基礎教育改革發展,為江蘇省率先基本實現教育現代化提供切實保障。
省域范圍內學業監測體系的建立與完善,為江蘇省推進教育循證評價與循證改革提供了堅實的體系和數據基礎。由于我國長期缺乏教育實驗的土壤,因此以學業監測為突破口推動教育循證改革是十分現實且高效的選擇。自2006年江蘇省依托學業監測開始踏上教育循證之路起,十余年的探索碩果累累,也為中國教育循證改革積累了江蘇經驗[7]。
第一,提高測量與調查工具的科學性,著力解決數據的準確性問題。監測和調查工作要發揮應有的作用,首先要解決“測得準、問得對”的問題。監測中心在編制測試試卷和調查問卷的過程中,充分依靠專業力量,采用前沿的評估和調查方法,努力提高測試工作的信效度,力求得到可靠的測試和調查結果。在這一過程中,監測中心不但聘請具有豐富教學經驗和教科研實力的一線教師與測量專家參與命題與問卷編制工作,而且還組織專人對PISA等國際學生評估項目的測量工具進行分析,充分吸納此類權威評估項目的理論、經驗與方法,使評估工具既充分實現監測工作的目標,貼近實際問題與本省教情,又可以前沿的方法、技術確保測量工具的可靠性。除了充分依靠專家提高評估工具的效度外,監測中心還在近些年監測數據的處理過程中,應用項目反應理論、結構方程、層次分析法等較為前沿的數據分析方法,檢驗數據的信效度,解決數據的賦權問題,這進一步提高了測量工具的精確性和數據的可靠性,更為精準地反映了江蘇省的基礎教育質量及相關影響因素的情況。到目前為止,江蘇省不但已經構建了覆蓋義務教育9門學科的學業質量監測工具,而且編制了包括辦學條件、課程狀況、教學管理、教學方式、學生發展、教師發展、家校聯系等方面完整的調查工具,形成了11大類、15000多份教育質量監測分析報告,形成了體系完備的監測與調查工具體系。
第二,推進“跟進式”改革項目,以教育評估的證據推動循證改革。如何讓監測評價的證據真正落地,是發揮教育循證評價功效的重要任務。為此,江蘇省參考發達國家教育循證改革的經驗,創造性地推進了“跟進式”改革項目,探索構建循證改革指導下區域教育質量提升的工作模型。2013年,在蘇南、蘇中、蘇北各選擇1個樣本縣,開展“基于測試分析,提升區域義務教育質量”的合作研究與探索,為全省各地在測試后開展跟進式的改革提供示范;2015年,在前期探索的基礎上,江蘇省教育廳在全省以項目推進的方式,設立了“基于測試分析的跟進式改革重大項目”,全省共立項29個;自2017年起,為推動質量監測與教研、科研的融合實踐,將跟進式改革項目設為全省中小學課題研究專項研究,先后設立133個省級研究項目,各設區市、縣(市、區)配套設置各級同類項目達700余項,極大地鼓勵與推動了各地及學校探索跟進式循證改革。這些跟進式項目大多根據前期的監測評價數據分析的結果,以改革項目的形式聚焦重點問題予以探索和解決。這些項目中,有的聚焦學業質量區域差異的成因,有的著力推進區域循證教學管理實踐研究,有的關注教育教學效率的提升。以江陰市教育局承擔的“縣域推進基于質量監測的教學管理變革研究”項目為例,該項目探索了從相關要素出發的教學管理整體推進路徑,建構了區域推進教學管理變革的體系,概括了“工具研發、科學抽樣、規范施測、數據處理、反饋指導”監測管理流程,形成了“前測—后測”相互銜接的閉環運行路徑、“過程—結果”協調互促的動態改進路徑。這樣的跟進式改革,從科學研究出發,回饋實踐工作,使監測成果無縫服務于實踐工作,解決了專業研究與實踐工作“兩張皮”的問題,形成了理實結合的改革推進路徑,提高了科學研究的針對性和有效性,強化了對實踐工作的引領。
第三,構建多方參與的改革共同體,以“集團軍作戰”方式推進教育循證評價改革。在長期的探索過程中,江蘇省已經形成了高校專業研究人員負責科研與技術保障、政府管理部門和教研機構負責行政管理與項目推進、中小學校等負責實踐探索的優勢互補與協同合作的改革共同體。這一共同體以教育質量提升為核心工作,將相關研究成果及政策舉措落到實處,使相關研究成果能真正發揮作用,有效提高教育教學質量。為解決監測中心人員和專業能力不足的問題,江蘇省大膽創新,在確保數據安全的情況下,開放數據資源,下放監測項目與研究主題的設計權限,嘗試引入多方智力資源以提升監測質量和改革成效。以2020年監測為例,監測中心聯合南京師范大學、南京大學、東南大學、南京市浦口區教育局等單位,重點關注學生減負、高效教學策略、弱勢群體的教育公平、學生抗逆力、教師工作滿意度、學生高階認知能力發展、教育資源配置等方面的問題,在國內外權威學術期刊發表與問題高度相關的論文30多篇,為教育政策制定和改革決策提供了重要參考。
三、推進教育循證評價的未來啟示
首先,須進一步改進數據條件,嘗試建立包括更多科目的縱向跟蹤數據。到目前為止,缺少縱向跟蹤數據一直是制約我國教育研究、影響循證改革進程的重要問題。建立科學全面的縱向跟蹤數據庫,是精確評估相關教育教學舉措的“增值”、分析其中的影響因素和機制的基礎,是進一步推進教育循證改革的重要“基礎建設”工作。
其次,須緊跟循證研究的進步,嘗試引入更為前沿、科學的分析技術。伴隨著科學技術的進步,更為前沿的技術與方法已經越來越多地應用到教育測評與循證改革的過程中。未來改革應在這一領域投入更多的精力,緊跟前沿技術并力圖實現本土創新,尤其是,應當高度重視大數據、人工智能、信息技術、腦科學等前沿技術在教育評價中的應用,推動教育循證改革向著智能化、現代化的方向發展。
最后,須進一步強化“跟進式”改革的力度,讓科學證據與實踐工作更緊密地結合。盡管江蘇省教育循證改革已經取得了顯著成效,但仍存在科學意識不足,科學視野不寬,證據獲取、理解和分析能力不足等問題。未來需要以更具靈活性和創新性的跟進舉措,進一步加大證據推廣、宣傳和使用的力度,提高證據使用的效能。
參考文獻
[1] SLAVIN R E. Evidence-based Education Policies:Transforming Educational Practice and Research[J]. Educational Researcher,2002,31(7):15-21.
[2] WHITEHURST G J. Evidence-Based Education(EBE)[EB/OL].(2006-05-02)[2022-12-28]. https://ies.ed.gov/director/pdf/2002_10.pdf.
[3] SLAVIN R E. How evidence-based reform will transform research and practice in education[J]. Educational Psychologist, 2020,55(1):21-31.
[4] 俞可,陳丹,趙帥.循證:歐盟教育實證研究新趨向[J]. 華東師范大學學報(教育科學版),2017,35(3):142-149+173-174.
[5] Institute of Education Sciences. What Works Clearinghouse Standard Handbook Version 4.0 [EB/OL].(2017-12-01)[2022-11-11].
https://ies.ed.gov/ncee/wwc/Docs/referenceresources/wwc_standards_handbook_v4.pdf.
[6] SLAVIN R E,MADDEN? N A,CHAMBERS B,et al. Two Million Children:Success for All(2nd ed.)[M]. Thousand Oaks,CA.:Corwin Press,2009:1-14.
[7] ZHOU S K. The Role of Chinas Teaching Research System in Promoting Evidence-based Reform in Education: A Case Study of Jiangsu Province[J]. Best Evidence in Chinese Education,2021, 9(2):1227-1241.
(作者單位:江蘇省教育科學研究院)
責任編輯:孫昕