









【摘要】評估與提升班級質量是改進幼兒園教育質量的核心,也是落實《幼兒園保育教育質量評估指南》的關鍵。本研究采用追蹤設計,對上海市12所幼兒園中的20個班級進行持續3年的量表評估,發現班級質量總體呈現穩步小幅上升趨勢,示范園與一級園班級在總體質量和若干子領域的項目上顯著優于二級園班級,語言與早期閱讀和學習活動等子領域的質量應得到更多關注。基于此,研究者從營造積極評估文化、建立精準輻射機制以及重視全過程質量建設等角度提出了對策建議。
【關鍵詞】班級質量;追蹤評估;上海市;幼兒園;改進探索
【中圖分類號】G610 【文獻標識碼】A" "【文章編號】1004-4604(2022)7/8-0020-07
通過評估監測并提升幼兒園教育質量是當前國際社會和我國政府促進學前教育事業發展的普遍舉措。〔1〕評估與提升班級質量是改進幼兒園教育質量的核心,也是落實《幼兒園保育教育質量評估指南》(以下簡稱《評估指南》)的關鍵。本研究采用追蹤設計,選取上海市不同區域、不同級別的12所幼兒園中的20個班級,從2016年到2018年對其進行連續3年的追蹤評估,以探討3年間班級總體質量的發展變化、不同級別園所的質量差異以及不同質量子領域的表現,以期為幼兒園質量評估與改進提供參考。
一、研究設計
(一)研究對象
研究者在上海市中心城區、半中心城區、半郊區共選取12所不同級別的幼兒園,每個園所隨機選取1—3個小班,共計20個班級,作為樣本班級,具體情況見表1。
(二)研究工具
為從整體上評估幼兒園班級質量,研究者選用國際通用的《幼兒學習環境評估量表(第三版)》(Early Childhood Environment Rating Scale, Third Edition)進行測評。該量表分為6個子領域(空間與設施、個人護理常規、語言與早期閱讀、學習活動、互動、一日活動結構)、35個評估項目、461個評估指標。①評估項目采用自低到高7點記分,并給出了1、3、5、7分的具體指標,分別對應不適當、合格、良好、優秀4個質量等級。評分者基于具體評分指標對每個評估項目進行打分。該量表6個子領域對應的克龍巴赫α系數分別為0.93、0.91、0.91、0.93、0.96、0.87。〔2〕
(三)研究實施
接受過量表培訓的研究者以2人為一組,每年秋季學期隨機選擇1天,進入幼兒園現場,從8:30至11:30開展持續3小時的非參與式觀察。每個班級3年追蹤觀察3次,研究者共計觀察60次。
二、研究結果與分析
(一)幼兒園班級質量追蹤評估總體結果
1.班級總體質量3年追蹤評估情況
圖1呈現了同一批樣本班級從小班到大班質量總平均分的變化情況。質量總平均分從3.26分上升至3.70分,保持了相對穩定的小幅增長,從“合格”向“良好”發展。②
2.不同級別幼兒園班級質量3年追蹤評估情況
圖2呈現了來自示范園、一級園和二級園的班級在3年追蹤評估中的質量總分變化情況。示范園班級質量保持持續增長,且均高于總平均分;一級園班級質量相對穩定,僅有小幅波動,且均高于總平均分;二級園班級質量變動較大,且均低于總平均分。
在此基礎上,研究者通過單因素方差分析比較每一年不同級別園所班級質量得分的差異,發現第一年和第二年存在顯著的組間差異(p=0.001)。具體而言,在小班階段,示范園、一級園班級質量顯著高于二級園(plt;0.05,plt;0.001);在最后一輪測評的大班階段,示范園、一級園的班級質量再次顯著高于二級園(plt;0.01,p=0.001),但均值差相比第一年均縮小了。在3年的追蹤測評中,示范園與一級園均不存在顯著差異。由此可見,這3年間示范園和一級園的班級質量保持相對穩定,而二級園班級質量存在一定波動,但與另兩級園所的差距呈現縮小趨勢。
3.不同質量子領域幼兒園班級質量3年追蹤評估情況
圖3呈現了樣本班級3年來6個質量子領域的變化情況。總體來看,各質量分項均呈現出先小幅上升、后持續上升或小幅波動的變化態勢。質量水平最高的為個人護理常規,3年均達到良好水平(5分)并持續增長;空間與設施、互動、一日活動結構得分均達到合格水平(3分),尤其是最為核心的質量要素——互動的得分逐年提高;語言與早期閱讀、學習活動得分3年來有小幅增長或保持基本穩定,但均未達到合格水平(3分)。當然,這一結果在一定程度上受到量表適宜性的影響,但同時也反映了樣本幼兒園的質量水平,應當著重予以關注。
(二)幼兒園班級質量分項的典型表現
1.空間與設施質量
從各項目的表現(見表2)來看,得分最高的室內空間項目的平均分為5.817,達到良好以上水平,說明樣本幼兒園室內空間的大小、修繕等能較好滿足兒童需求。與兒童相關的展示項目的得分最低,僅有1.942分,尚未達到合格水平。該項目得分低的主要原因并不是室內缺少與兒童興趣和需求相關的物品、墻飾等展示(各類展示不僅豐富而且形式多樣),而是觀察者在3年60次、每次3小時的隨機持續觀察中,有43次未發現教師就展示與兒童進行任何互動(1分,不合格)。
從各項目質量的園所級別差異來看,研究者僅發現在游戲與學習的空間安排項目上存在極其顯著的組間差異(F=8.576,p=0.001)。在樣本園中,示范園和一級園得分顯著高于二級園(plt;0.05,plt;0.001),主要表現在數量合理、設施適宜的區角安排以及教師充分的視覺督導等方面。
2.個人護理常規質量
從各項目的表現(見表3)來看,如廁/盥洗、健康行為、安全行為3個項目的3年平均分均達到良好以上水平,尤其是安全行為項目得分接近優秀,是所有項目中得分最高的。這說明樣本園普遍重視班級設施設備、活動安排等方面的安全與健康管理。相較而言,餐/點項目3年的平均分未達到良好水平,主要囿于“較為嚴格、不夠輕松自由的用餐氛圍”,以及“教師對兒童的過度幫助如喂飯”等。例如,通過對某幼兒園中班午餐時段教師的言語分析,研究者發現教師以單方面指令為主,主要涉及規范行為(占55.6%)、詢問需求(占18.5%)、管束紀律(占14.8%)、催促速度(占7.4%)4個方面。在平均35分鐘的用餐環節中,教師與保育員的上述指令不間斷出現,然而并未有效提高兒童的用餐效率和整體教育質量。
從各項目質量的園所級別差異來看,研究者發現健康行為項目和安全行為項目存在極其顯著的組間差異(F=7.910,p=0.001;F=18.972,plt;0.001)。具體而言,這兩項的差異均表現為示范園、一級園班級的得分極其顯著高于二級園班級(pslt;0.001),示范園與一級園之間無顯著差異。由此可見,示范園和一級園在個人護理常規工作質量上要顯著優于二級園。
3.語言與早期閱讀質量
從各項目的表現(見表4)來看,鼓勵兒童使用語言項目3年的平均分最高,為3.408分,主要表現為教師在一日生活中具有“鼓勵兒童通過語言表達自己的需要、溝通交流、解決問題”的意識和能力。幫助兒童拓展詞匯項目的3年平均分接近3分,主要表現在部分教師在日常活動中能注意總結、拓展兒童的詞匯。例如,在個別化游戲總結環節,教師詢問有什么好辦法把玩具放整齊。有兒童回答:“按顏色分,把橙色和綠色分開放到小盒子里。”教師回應道:“把不同的玩具分開來放,這叫分類。”此外,研究者還發現教師與兒童一起使用書籍項目的得分最低,僅有1.492分,尤其是“教師運用書籍幫助兒童解答隨機出現的感興趣的問題”指標的得分低。這主要是因為教師與兒童一起讀書較常發生在計劃好的集體活動中,而非非正式學習環節中。
從各項目質量的園所級別差異來看,研究者發現鼓勵兒童使用語言項目存在極其顯著的組間差異(F=12.371,plt;0.001),幫助兒童拓展詞匯項目和熟悉書面語言項目存在顯著的組間差異(F=4.039,plt;0.05;F=4.318,plt;0.05)。具體而言,在前兩項上,示范園和一級園顯著高于二級園,而示范園和一級園之間無顯著差異;在第三項上,一級園和二級園得分均高于示范園,且一級園得分顯著高于示范園(plt;0.01)。這可能是因為這一項目考察的是班級環境中的印刷文字及其匹配圖片,以及教師就這些文字與兒童的交流情況,而“不能出現文字”在諸多示范園貫徹得比較徹底。這一做法的恰當性值得研究者進一步探討。
4.學習活動質量
從各項目的表現(見表5)來看,學習活動各項的平均分普遍較低,不足3分。主要原因如下。一是“各類學習活動材料的種類不足”,如精細動作項目的合格等級要求班級有4大類、至少10種不同的材料,自然/科學項目的良好等級要求班級有5大類、至少15種相關材料,而研究者發現大部分班級沒有達到相關要求。二是“持續從事某項活動的時間不足”。例如,5分(良好水平)是指兒童持續活動1小時以上。研究者發現大部分班級未達到這一要求。三是“教師在日常生活和非正式學習中對兒童關注和支持不足”。研究者發現以上各項目的得分點主要體現在教師有計劃組織的活動中,而較少存在于日常隨機活動或非正式活動中,如“教師把數學學習作為每日例行的常規活動”“非數學區角與兒童開展數學對話”等指標得分低。因為班級規模、師幼比和文化差異等因素的存在,我國幼兒園學習活動開展的形式、內容、時長等均有自身特點,所以我們對學習活動子領域的得分應當批判性地看待。不過,本追蹤評估中發現的諸如教師對非正式學習中兒童的支持不足等問題仍然值得關注。
從各項目質量的園所級別差異來看,研究者發現精細動作(F=3.372,plt;0.05)、角色游戲(F=6.610,plt;0.01)、數學材料和活動(F=4.230,plt;0.05)、日常事件中的數學(F=3.391,plt;0.05)4個項目存在顯著的組間差異,其中角色游戲項目的差異尤為顯著。具體來看,以上項目均表現為示范園和一級園的質量顯著高于二級園,而示范園和一級園之間無顯著差異,尤其是在“教師在兒童使用精細材料時是否關注并給予適當支持”“角色游戲中教師適時引導而非主導或強制”“教師組織的數學活動多大程度上引發兒童的深度思考”“是否有意識及有效地利用機會與兒童開展數學對話”等方面。
5.互動質量
從各項目的表現(見表6)來看,互動子領域的各項目得分均達到合格,并趨向良好水平。研究者通過質性分析梳理出樣本班級中師幼互動的6種不同水平,由低到高依次為無所作為、被動回應、頻繁的單向指令、頻繁但有效性低的交流、教師主導的問題解決式互動、滿足兒童需要的參與式溝通。〔3〕在同伴互動項目中,研究者主要從“同伴互動的機會與頻率”“教師對同伴互動的指導”“教師對負面行為的干預”“教師的榜樣作用以及同伴互動的效果”等方面進行評估,較為全面、準確地涵蓋了同伴互動質量的主要方面。依據這一評估框架,研究者清晰地記錄了某兒童從剛入小班時“教訓”同伴、到中班時能自覺管理好自己并幫助同伴、再到大班時被推選為代表參加活動的發展變化,從一個側面反映出教師在同伴關系改進中發揮的重要作用。
從各項目質量的園所級別差異來看,與其他子領域不同的是,互動子領域的所有項目都存在極其顯著的組間差異:大動作的指導(F=9.758,plt;0.001)、個別化的教與學(F=10.786,plt;0.001)、師幼互動(F=14.987,plt;0.001)、同伴互動(F=9.545,plt;0.001)、規則(F=15.089,plt;0.001)。具體而言,以上5個項目均表現為示范園和一級園與二級園質量存在極其顯著的差異,而示范園和一級園之間無顯著差異。這些差異集中體現在“關系的親疏、輕松或嚴苛的程度”“教師對兒童需求的敏銳觀察及提供支持的有效程度”等方面。
6.一日活動結構質量
從各項目的表現(見表7)來看,一日活動結構子領域的各項目得分均達到合格,并趨向良好水平。以過渡環節和等待時間項目為例。該項目主要考察“過渡環節的平順程度”“教師為下一環節做好準備的程度”“教師提供的有效支持”“消極等待的時長”。研究者通過質性分析梳理出樣本班級中過渡環節質量的6種不同水平,由低到高依次為兒童長時間被動消極等待、由教師規定任務活動但兒童不感興趣、教師組織活動且大部分兒童感興趣、教師隨機且自發地就兒童相關問題進行交流、兒童自然且自由地完成各項任務、兒童根據需要自主選擇活動。〔4〕
從各項目質量的園所級別差異來看,該子領域的3個項目都存在顯著的組間差異:過渡環節和等待時間(F=5.204,plt;0.01)、自由游戲(F=5.398,plt;0.01)、游戲和學習的集體活動(F=4.203,plt;0.05)。具體而言,在自由游戲項目上,示范園和一級園與二級園存在極其顯著的差異;在過渡環節和等待時間項目、游戲和學習的集體活動項目上,一級園與二級園存在極其顯著的差異。以上各項中示范園和一級園間均不存在顯著差異。研究者發現,呈現出的這些差異主要體現在“過渡環節中教師有效支持的程度”“自由游戲可選擇性大小”以及“集體活動中對個別化需求的滿足”等方面。
三、討論與建議
(一)堅持落實《評估指南》基本原則,營造積極評估文化,以保障質量穩步提升
通過對12所幼兒園20個班級連續3年的追蹤評估,研究者發現樣本班級的總體質量呈現穩步的小幅上升態勢。與間隔幾年開展一次的外部督導評估相比,這種由獨立第三方每年開展一次的外部評價相對客觀,與評等、晉級等沒有高利害相關,由此獲得的班級質量發展路線圖更加真實。上海自2010年開始啟動“上海市提升中小學(幼兒園)課程領導力行動研究項目”,〔5〕為全市幼兒園以課程領導力為核心的提效增質營造了良好的保障環境,形成了有效的運行機制。同時,隨著國家和地方層面連續幾期三年行動計劃的推進,上海市各區域、各類別幼兒園質量實現穩步增長,教師隊伍的總體專業水平不斷提高。被追蹤評估的12所幼兒園很好地體現了這樣的變化。
《評估指南》)明確指出幼兒園教育評價應當注重“過程性、發展性評估”,“關注幼兒園提升保教水平的努力程度和改進過程”。這一評估原則在本研究中得到了很好的體現,即通過追蹤設計連續評估同一班級3年的發展變化,以不斷積累“過程性證據”,為園所自我診斷和自我評估提供重要的外部參照。這種共同指向園所改進與發展的內外相結合的評價模式有助于形成一種新的積極評估文化,最終促進園所質量持續提升。
(二)保持示范園和一級園的優質資源優勢,建立精準輻射機制,以帶動二級園質量提升
通過對不同級別園所班級質量的差異性比較,研究者發現不論是3年來的總體質量變化,還是6個子領域的分項表現,示范園和一級園班級質量總體高于二級園,示范園和一級園在不同項目上各有高下,但不存在顯著差異。這一結果深化了兩方面的認識。第一,本研究在一定程度上印證了上海市幼兒園等級評估結果的合理性與有效性,被評為示范和一級的幼兒園質量較好。這一研究結果支持上海市教委等12部門發布的《上海市學前教育三年行動計劃(2019—2021年)》提出的政策目標,即通過提升“公辦示范性幼兒園比例從5%到10%、公辦一級幼兒園比例從36%到50%”,以擴大優質資源。第二,本研究發現三種級別園所在各質量子領域中有顯著性差異的項目占比不同,依次為互動(100%)、一日活動結構(100%)、語言與早期閱讀(60.0%)、個人護理常規(50.0%)、學習活動(44.4%)、空間與設施(16.7%)。換句話說,二級園與示范園、一級園的質量差距更多體現在更為內在與核心的過程性質量方面。當然,此方面的質量提升受到更多復雜因素的影響,不可能一蹴而就。
基于此,建議示范園和一級園在保持自身資源優勢的同時,進一步完善質量輻射機制,以帶動二級園質量提升,如集團化協同發展、區域對口聯動、管理與骨干人員輸出等。〔6〕優質園可基于本研究所發現的在質量子領域、項目、評估指標上的差異,精準定位所應重點帶動的干預點,從而實現人力和物力的有效投放,不斷更新和優化質量輻射機制。
(三)重視幼兒園全過程質量建設,以兒童需求為核心,以互動關系為抓手,實現園所質量提升的可持續發展
幼兒園教育質量包括結構質量與過程質量兩大類。〔7〕這兩者不是相互割裂的,而是相互融合的。這一點在《幼兒學習環境評估量表(第三版)》中得到了很好的體現。作為2015年的最新版,它與2005年的《幼兒學習環境評估量表(修訂更新版)》(ECERS-R updated)最大的區別之一是將關系與互動的理念滲入每個子領域的每個項目中。例如,2005年版更關注的是可獲得材料的數量與質量本身,而最新版對此要求有所降低,更加關注“教師如何運用這些材料與兒童互動”。〔8〕基于此,我們對研究結果的認識也應有所更新。例如,空間與設施子領域的得分及其變化并不僅僅反映了空間大小或設備多少這類硬件問題,更反映了教師在空間中是如何運用材料與兒童互動的。從這個意義上來說,基于《幼兒學習環境評估量表(第三版)》所開展的評價是一種全過程的質量評價,每一個子領域均滲透著過程質量的內核,不應割裂看待。
當然,這種全過程質量理念對評估與改進均提出了更大挑戰。基于《評估指南》的基本原則,開展全過程質量評估的關鍵是堅持“以兒童為本、滿足兒童需要”,并將其作為評價所有教育行為的基點;在此基礎上,最關鍵的不是自上而下地“空降”評價標準,而應當由園所管理者和實踐者在自我評估的研究范式下,達成內部一致的質量觀、評價觀,深入挖掘隱藏在園所內部、班級中、具體情境里的隱性質量標準,逐漸形成適宜每一個園所的顯性標準,以不斷提升教師評估的專業自覺,〔9〕將全過程質量評估落到實處。
囿于追蹤研究本身的特點和現實情況,本研究存在一定局限。一是研究樣本雖然盡量覆蓋上海市不同區域、不同級別的園所,但數量有限,因此有關不同級別園所的結果與判斷僅限于對樣本園所的分析。二是《幼兒學習環境評估量表(第三版)》雖然具有較強的研究優勢,但在文化適宜性,尤其是本研究中的適宜性還有待探討,未來研究需要結合國家和上海政策研制本土評估工具。三是本研究的發現反映的是數據采集期的情況。近幾年上海市在幼兒園內涵建設方面出臺了許多新的舉措,邁出了更大的步伐。這使得本研究中呈現的某些問題可能趨于消弭,但也有新的問題開始呈現,有待持續推進跟蹤研究。
參考文獻:
〔1〕經濟合作與發展組織(OECD)教育團隊.強壯開端Ⅳ:早期教育與保育的質量監測〔M〕.胡文娟,等,譯.北京:北京師范大學出版社,2019:56-57.
〔2〕〔8〕HARMS T,CLIFFORD R M,CRYER D.Early childhood environment rating scale,third edition〔M〕.New York:Teachers College Press,2015:2-4.
〔3〕李琳,范潔瓊.基于ECERS-3評量表的師幼互動質量分析及改進策略〔J〕.學前教育,2018(11):4-9.
〔4〕李琳.幼兒園一日生活過渡環節質量分析及其改進策略〔J〕.福建教育,2018(3):17-19.
〔5〕高敬,周洪飛,陳雪.上海市幼兒園課程領導力的現狀與思考〔J〕.上海教育科研,2014(11):47-50.
〔6〕馮婉楨.雁行發展與區域學前教育資源微觀配置效率的提升研究〔J〕.基礎教育,2018(2):40-46.
〔7〕PHILLIPS D,MEKOS D,SCARR S,et al.Within and beyond the classroom door:Assessing quality in child care centers〔J〕.Early Childhood Research Quarterly,2001,15(4):475-496.
〔9〕劉昊.幼兒園教育質量自我評價的學理邏輯與實踐路徑〔J〕.教育測量與評價,2020(1):17-22.
The Longitudinal Evaluation of Kindergarten Class Quality and the Improvement Exploration: Taking a 3?year Longitudinal Evaluation of 20 Classes of 12 Shanghai Kindergartens as an Example
Li Lin 1,2, Fan Jieqiong 1,2, Ren Lixin 1,2
(1 Faculty of Education, East China Normal University, Shanghai, 200062)
(2 Collaborative Innovation Center of Assessment for Basic Education Quality, East China Normal University Center, Shanghai, 200062)
【Abstract】Evaluation and raise of class quality is essential in improving kindergarten education quality, and plays an important role in implementing Guidelines for Early Care and Education Quality Evaluation. Adopting the longitudinal research design, this study evaluated the quality of 20 classes from 12 kindergartens for three years. The findings revealed that the overall quality of the classes showed a trend of gradual improvement the top and first level kindergartens performed significantly better than second level ones in overall quality and some dimensions. The quality in language, early reading, and learning activities deserves more attention. Based on the research, the researchers put forward some suggestions from the perspectives of creating active evaluation culture, establishing efficient mechanism to help second level kindergartens, and attaching great importance to the process quality construction.
【Keywords】class quality; longitudinal evaluation; Shanghai; kindergarten; improvement exploration