魏 易 羅 濱 林秀艷 楊智君 王 夢
(1. 北京大學中國教育財政科學研究所,北京 100871;2. 海淀區教師進修學校,北京 100195)
教師是提高學校教育質量和學生學業成績的關鍵因素,為此,各國政府都致力于提高教師素質和教學水平,從而提高學校的教育質量和學生的學業成績。世界銀行2018 年的全球發展報告指出,許多國家和地區存在一種學習危機:學生盡管在上學,但卻沒有進行有效的學習(World Bank,2018)。造成學習危機的主要原因包括:兒童早期教育和學前教育準備不足,學校教育資源投入不足、使用效率低,教師缺乏有效教學的知識、技能和動力等。尤其是在基礎教育階段,教師的人員支出占學校經費的四分之三左右,這是影響學生在校學習效果的關鍵因素。提高教師隊伍質量,不僅需要吸引和留住有才能的人從事教學,還需要為在職教師提供專業發展的機會。教師專業發展活動是被廣泛認可的提高教師知識技能、教學實踐和學生學習成績的關鍵途徑,也是課程和教學改革得以落地和實現的基礎(National Commission on Teaching and America’s Future,1996;Day and Sachs,2005;European Commission,2005;Darling-Hammond et al.,2009)。隨著各國對教師專業發展的重視,政策制定者越來越重視教師專業發展的有效性,以促使有限的公共資源能夠得到更好的分配和使用。教師專業發展的最終目的是改善和提高學生的學習,因此教師專業發展對有效提高教師教學水平和學生學習成績至關重要。
自從1966 年《科爾曼報告》分析了學生學業成績的差異來源之后,教育實證研究一直致力于打開教育生產的黑箱,分析學校、家庭和社會環境對學生學業成就的影響(Glewwe et al.,2011)。教師作為其中最重要的一個因素,受到了高度的關注。早期的研究在分析教師對學生學業成就的影響時,主要聚焦于教師的個人和專業背景,例如教師的教齡、學歷、資格、工資和職稱等。隨著人們對學校和教師效能的關注,以及對教師專業發展的重視,越來越多的研究逐漸聚焦到了教師專業發展對教師和學生的影響上(Desimone,2009;Hill et al.,2013)。另一方面,隨著TIMSS 和PISA 等國際測試項目的開展,學生成績名列前茅的中國、日本、韓國、新加坡等東亞國家受到了高度的關注。在研究了這些國家的教育體系和教學組織方式之后,學者們認為這些國家的學生之所以能夠取得較好的成績與教師專業發展的組織和制度安排密切相關。例如師徒帶教、集體備課、相互聽課、磨課以及教學研究小組等,使教師不僅在入職階段可以得到融入專業共同體的機會,在入職之后也能夠有組織地參與到持續的專業發展活動中(Darling-Hammond et al.,2017;World Bank,2018)。
在中國,省(自治區、直轄市)、市、縣(區)教研室和學校教研組的四級教研體系自建立之初就與基礎教育的建設和發展緊密相連,長期以來在保障教學秩序、支持課堂教學、組織教學研究、推進課程改革等方面起到了不可替代的作用,是極具中國特色的基礎教育教學研究制度。在關鍵時期,教研組織承擔了培訓教師、提高教師專業水平的重要任務,保證了我國中小學教學的基本質量。隨著我國基礎教育改革和中小學課改的不斷發展,教研體系越來越成為推進課程教學改革、提高教學質量和教師專業發展的核心力量(叢立新,2011;梁威等,2011)。在這一過程中,教師專業發展也經歷了從單一化、學歷補償式培訓模式向以教師為主動學習者的教師專業發展模式的轉變。學者和實踐者越來越倡導以學校為本,通過教學實踐和教師反思性學習實現專業發展(盧乃桂,2006;宋萑,王恒,2019)。而另一方面,相對于國外的教師專業發展活動的實證研究,目前國內相關領域的研究,尤其是教師專業發展有效性的研究相對較少。現有研究對教師專業發展活動的各方面因素有所涉及(張文靜等,2010;趙健等,2013;托馬斯等,2015),但尚未有研究將區域教研活動作為一個整體,將包括區級和校級在內的各類教師專業發展活動與學生的學業成績聯系起來,探討其對學生學業成績影響。本文基于教師專業發展的實證研究框架,以北京市海淀區為例,采用增值模型、多層線性模型和結構方程模型,分析區級和校本教研活動對教師的教學實踐、自我效能和學生學業成績的影響。
本節首先回顧了國外尤其是美國從20 世紀80 年代開始的教師專業發展的實證研究如何定義、衡量和評估高質量、有效的教師專業發展活動。目前國外教師專業發展活動的實證研究主要包括三類:一是通過更加“客觀”的標準,例如學生成績,來衡量教師專業發展活動的效果;二是收集和分析教師專業發展活動的某類“特征”及其效果;三是采取“隨機實驗”的方法評估專業發展的效果。其次,我們對國內教師專業發展活動的實證研究進行了梳理。目前國內對于教師專業發展活動的實證研究大致可分為三類:一是描述和分析教師專業發展活動現狀,包括教師專業發展活動的供給、教師的需求以及專業發展活動的地區和城鄉差異;二是探討影響教師參與專業發展活動的個人層面和組織機構層面的因素,提出教師的自我意識、教師專業共同體、學校的組織因素以及教師專業培訓和教研體系特征等對教師專業發展的影響;三是檢驗教師專業發展是否有效影響了教師自身的知識、態度、實踐以及學生的學習結果。最后,在回顧國外和國內教師專業發展活動的實證研究的基礎之上,形成本文的基本分析框架。
自《科爾曼報告》發布之后,學校投入作為教育投入的重要組成部分,首先受到了關注,形成了一系列學校效能(school effectiveness)的研究成果。早期的研究較為關注學校的類型、辦學條件(例如,經費、班級規模、生師比等)的影響,而對教師的研究則主要聚焦于教師的學歷、經驗、工資等方面(Glewwe et al.,2011;Hanushek,1997,2003)。隨著對學校和教師效能的關注,以及對教師專業發展的重視,越來越多研究逐漸聚焦到教師專業發展的投入對教師和學生的影響上。
早在20 世紀20 年代,就有學者對教師的教學活動和教師培訓的要素進行研究(Charters & Waples,1929),但在如何描述教師的工作以及教師所需的知識和技能方面,并未達成共識,也未采用同一套概念進行對話。從20 世紀70 年代開始,評估教師專業發展活動有效性的實驗研究開始出現(Carpenter et al.,1989)。隨著對教師專業發展的重視,相關研究呈現出爆炸式的增長,但仍然只有部分研究關注教師專業發展活動對學生學習過程或結果的影響,其中采用較為嚴格的因果推斷或者實驗方法的研究則更少(Kennedy,2016)。直到1990 年,對教師專業發展活動有效性的評估還主要依靠教師自我匯報的滿意度、態度和觀念等方面的變化,較少關注專業發展活動的結果以及產生結果的機制和關鍵因素(Desimone,2009;Hill et al.,2013)。一方面,觀察、訪談等質性研究方法和教師的滿意度調查仍舊是評價專業發展活動效果的重要工具,基于民族志和深度案例研究的方法能夠全面深入地研究教師在專業發展活動中的經歷和經驗。另一方面,隨著政府對教師專業發展的重視和公共財政投入的增加,以及政策制定者對可復制、可推廣的教師專業發展活動的需求,推動了通過教師專業發展活動提高教師教學水平和學生學習效果的趨勢性、相關性和有效性的研究。
發展到現在,有關國外教師專業發展活動的實證研究主要包括三類:第一類是通過更加“客觀”的標準,例如學生成績來衡量教師專業發展活動的效果。隨著標準化考試被全球各國的教育系統采納,越來越多的國家開始采用學生的考試成績為教育政策的制定、學校的問責、教師的考核和日常行政管理工作提供數據支持(Lingard et al.,2013)。20 世紀60 年代就有國家和地區使用增值評估的方法來評價學校教育對學生學業的影響。隨著西方國家教育問責制的普遍實施,教育增值模型從學術領域進入了政策實踐領域,已經成為教育問責的重要工具。例如,2002 年美國通過《不讓一個孩子掉隊》法案,要求各州測試學生閱讀和數學成績并對學校進行問責。于是,美國許多州開發了自己的教育增值模型,州政府采用模型評估結果對公辦學校乃至教師實施問責。再例如經濟合作與發展組織(OECD)主導的教育系統國際指標項目(Indicators of Education Systems)也將增值評估的方法納入國際教育指標系統中。
第二類是收集和分析教師專業發展活動的“特征”及其效果。面對各類正式和非正式的教師專業發展活動,部分研究者主張聚焦于高質量的、有效的專業發展活動特征,進而收集相關的數據,對專業發展活動與教師教學和學生學習之間的趨勢性、相關性和有效性進行描述和分析(Kennedy,1998;Garet et al.,2001;Penuel,2007;Yoon et al.,2007;Desimone,2009;Darling-Hammond et al.,2017)。盡管目前對高質量的、有效的專業發展活動的特征暫無明確統一的定義,但支持者認為根據以往的理論、質性和實證研究,已經能夠總結出得到廣泛認可的特征。其中,Kennedy(1998)根據專業發展活動的內容特征進行分類,分析了不同類型的專業發展活動對學生學習的影響①。此后,Yoon et al.(2007)回顧了1300 多項教師專業發展活動對學生成績影響的研究,采用了Kennedy 對專業發展活動的分類,對其中9 項符合有效教育策略資料庫(What Works Clearinghouse)標準的實驗研究的有效性進行了分析。此外,也有一部分研究對某個大型的教師專業發展活動的有效性進行評估(Garet et al.,2001;Penuel,2007)。例如,Garet et al.(2001)基于對高質量專業發展活動的共識,設計了一套問卷對全國1027 名參加聯邦艾森豪威爾專業發展項目(Eisenhower Professional Development Program)的教師進行調查,分析該專業發展活動的結構和核心特征的有效性②。在前期綜述研究的基礎上,Darling-Hammond et al.(2017)回顧了過去三十年聚焦于教師專業發展對學生學業成績影響的實證研究,尤其是那些發現教師專業發展對學生學業有積極影響的研究,從中提煉出了七個被廣泛認可的特征,包括聚焦課程內容、融入主動學習、支持協作、示范和模范、專家指導和支持、反饋和反思以及具有持續性③。
然而,此類研究存在一定的局限性。首先,由于專業發展活動的實施是有選擇性的(例如,項目會選擇更加積極和配合的學校和教師,或選擇更加有需要的學校和教師),同時教師也會根據自身的基礎和需求選擇更加合適的項目,因此專業發展活動的實施效果因學校和教師本身的特質而有差異,最終的結果不完全是由專業發展活動所帶來的。其次,大部分研究是基于教師自我匯報的結果,而非基于課堂觀察、測試、活動日志等更加客觀得出的結果,會對效果的估計造成偏差。因此,更加準確的估計就需要對同一項專業發展活動在不同學校、不同培訓者和接受培訓的群體之間進行比較。然而大多數有效的專業發展活動的研究項目規模不大,因此缺乏大規模推廣的結果對比,也就可能導致對項目的評估結果截然不同。
第三類研究是為了解決第二類研究的局限性,采取“隨機實驗”的方法評估教師專業發展的效果。隨機實驗原本是醫學研究監測藥物效果的手段,其基本方法是將研究對象隨機分組,對不同組實施不同的干預,以對照效果的不同。社會學領域的隨機實驗核心在于利用實驗的操作技巧(如隨機化被試、控制相關變量),來評估變量之間的因果效應,從而對現實世界所發生的事件之間的聯系給出科學的檢驗(羅俊等,2015)。20 世紀30 年代,隨機實驗方法被用于農業生產領域。20 世紀下半葉,一些國家的政府開始推動大規模的社會實驗。最早的一項教師專業發展活動的隨機實驗是20 世紀70 年代末Good et al.(1983)對美國教育學會(National Institute for Education)支持的密蘇里州有效數學教學項目的評估。隨后,也有其他研究者開始采用隨機實驗的方法評估專業發展的效果(Carpenter et al.,1989)。這些研究通過實驗的方法,部分證實了之前經驗研究認為的有效的教師專業發展活動特征確實起到了積極的作用。2002 年美國聯邦政府通過的《不讓一個孩子掉隊》法案提出教育政策需要有符合科學標準的研究支持(scientifically based research),并強調優先考慮采用隨機實驗研究的成果。教育科學研究學會也在其教育研究基金的申請標準中加強了對教育實證研究和實驗研究的導向(U.S. Department of Education,2002;IES,2012)④。受此影響,后來涌現出了一大批教師專業發展活動的研究,致力于采用隨機實驗的方法發現有效的、可推廣的專業發展活動。
總的來說,教師專業發展有效性的實證研究方法在不斷發展,研究者和實踐者不滿足于僅評估單個教師專業發展的效果和關鍵特征,還想要對項目的外部有效性以及不同項目之間的有效性進行比較。Borko(2004)在其具有較大影響的一篇文章中將教師專業發展有效性的研究分為三個階段。第一階段的研究主要關注單一地點實施的某一項教師專業發展活動,其主要目的是確認該專業發展活動是否具有可行性,是否有效提高教師的教學水平和學生的學習效果。第二階段的研究主要關注多個地點同時實施的某一項專業發展活動,其主要目的是確認該項專業發展活動在不同的情境中由不同的培訓者實施的時候是否能夠保持有效性。第三階段的研究關注的專業發展活動開始擴展到對多個地點實施的多個項目進行比較,其主要目標是對不同類型的專業發展活動的實施過程、效果以及所需要的資源進行比較,其結果為相關政策的制定和公共資源的配置提供支持。
為了對單項和多項教師專業發展活動進行評估和比較,需要對項目各要素和環節有更加清晰的定義,建立一個將項目各要素、過程和結果聯系起來的邏輯框架。很多學者嘗試構建教師專業發展如何影響教師知識、技能、觀念和態度并最終影響學生學習效果的理論框架。Kennedy(1998)將專業發展活動的影響路徑分為三類:第一類路徑注重改變教師特定的教學行為,從而改變學生的學習;第二類路徑注重改變教師的知識,從而改變教師特定的教學行為和學生的學習;與第二類路徑相似,第三類路徑也注重改變教師的知識和教學行為,但對教學行為不做過多詳細要求。與Kennedy 歸納的第一類專業發展活動的邏輯類似,Supovitz(2001)提出高質量的專業發展活動是通過改變教師的課堂教學行為,從而促進學生的學習。Guskey & Sparks(2002)認為有效的教師發展活動不僅改變教師的行為,也改變教師的知識。Yoon et al.(2007)的研究認為教師的專業發展分兩步影響學生成績,即教師的專業發展首先是提高教師相關的知識技能,然后是提高教師課堂教學實踐,最后才能提高學生成績。在回顧以往研究的基礎之上,Desimone(2009)提出了一個教師專業發展有效性研究的概念框架,該框架概括了教師專業發展的關鍵特征、教師知識和理念、課堂實踐與學生成績之間的相互影響的關系(圖1)⑤。

圖1 教師專業發展有效性研究的概念框架
首先,教師參加專業發展活動;其次,專業發展活動增長了教師的知識和技能,改變其態度和理念;再次,教師用新知識和技能或轉變了的態度和理念來改善教學內容或教學方法,或兩者兼而有之;最后,教學改變促進了學生的學習。該框架可以從教師的轉變(如專業發展改變教師知識、理念或實踐)和教學改進(如改進教學實踐影響學生成績)兩方面來檢驗專業發展的有效性,而這兩個方面對理解專業發展如何產生影響均不可或缺。除了教師專業發展的關鍵特征、教師知識和理念、課堂實踐與學生成績以及這四部分要素之間的相互關系之外,框架中還包括一些個人、機構和環境因素:(1)學生的個人和學術特征;(2)教師的個人、專業背景特征,也包括教師的經驗、知識、信念、態度等;(3)班級、學校、學區等環境因素;(4)各層級政府和相關政策環境。
盡管對什么是有效的教師專業發展沒有統一的定義,大量關于教師專業發展如何影響教師自身和學生學習的實證研究也并沒有使用完全一致的影響路徑,圖1 的概念框架也沒有囊括所有可能影響專業發展有效性的要素,例如教師專業認同、專業團體協作、校長領導力等要素在支持專業發展中的作用,但圖1 的框架仍舊提供了研究之間相互探討的基礎。首先,該框架基本上包含了教師專業發展活動有效性研究的基本要素,使得研究觀察和測量的指標相對一致和穩定,并為相關的實證研究提供了討論和對話的基礎。其次,該框架為聚焦教師專業發展有效性研究的計劃和時間線的制定提供了一定的指導,即從教師專業發展活動到活動對教師知識、信念、態度的影響和改變,進一步改變了教師的教學實踐,從而影響了學生的學習和學業成就。最后,在共同的框架和研究基礎之上總結的有效專業發展的要素、特征和影響機制能夠為實踐者提供更多的信息,可以幫助學校和教師設計更加有效的專業發展活動。
目前國內對教師專業發展活動的實證研究大致可分為三類:一是描述和分析教師專業發展活動現狀,包括教師對專業發展活動的需求和評價、專業發展活動的供給情況以及專業發展活動的城鄉和地區差異;二是探討影響教師參與專業發展活動個人層面和組織機構層面的因素,提出教師的自我意識、教師專業共同體、學校的組織因素以及教師專業培訓和教研體系特征等,都會影響教師的專業發展活動;三是將教師專業發展活動與教師知識技能、課堂教學實踐以及學生學業成績的變化聯系起來,檢驗教師專業發展是否有效影響了教師自身的知識、態度和實踐以及學生的學習結果。
1. 教師專業發展活動的需求情況
(1)教師的類型
不同類型的教師對專業發展活動的需求程度不同,穆洪華(2018)基于2014 年中國基礎教育質量監測7 個省市的數據,對公辦小學教師培訓情況進行分析后發現:從學歷來看,學歷越低的教師,其對專業發展活動的需求越高;從教齡來看,新教師對培訓的需求更高;從學科來看,不同學科教師的需求度也不同,就主科(語文、數學、英語、科學)而言,科學教師的需求要遠遠高于其他三科教師;從城鄉來看,我國鄉村教師對教師專業發展迫切需求的比例要高于城鎮,鄉村教師更加需要專業發展活動(李瓊等,2018)。
(2)培訓內容
大量研究表明,教師最需要的培訓內容是學科教學方法。越貼近教師實踐的知識與技能,越被教師認為是最需要的。李瓊等人(2018)的研究發現,城鄉教師對學科教學法知識方面的培訓需求更大。李瓊等人(2013)對北京市教師的調查發現,學科教學法與學科前沿知識是教師最需要研修的內容。同樣,趙明仁等人(2009)對北京市中小學教師專業發展活動的調查發現,超過半數的教師認為自己目前最需要進修的內容是學科教學方法。陳向明和王志明(2013)對全國9 省中小學教師的調查發現,教師最希望從培訓中所學到的內容是教學方法及策略。朱小虎和張民選(2017)對TALIS 數據的分析也發現,上海教師最為需要的兩個專業發展內容分別為個性化學習的教學方法和學科教學能力培訓。
除了學科教學方法外,教師對學生發展相關內容培訓的需求也十分強烈。陳向明和王志明(2013)的研究發現,教師對學生發展和心理健康培訓的需求僅次于教學方法和策略。蔡金花和曾文婕(2018)對初中教師的調查也發現,教師對于深入了解學生發展特點的培訓需求相對較強。柯政和洪志忠(2011)對中學教師的調查發現,教師參加培訓意愿最高的是有關學生學習和發展的專業發展活動。
(3)培訓形式
教師對培訓形式也存在明確的需求指向性。教師更愿意接受通過團隊研討性的活動來提升專業發展水平,教師需求最強烈的培訓形式是教學觀摩研討和同事間的交流。蔡金花和曾文婕(2018)的研究發現,觀摩他人教學并在課后進行研討、與同事分享經驗以及討論問題是初中教師認為最想參加的教研活動形式。李瓊等人(2013)的研究也發現,從教師對日常教研活動形式的滿意度與有效性來看,教師感到最有效的是跨校、跨區教學觀摩研討,其次是同事之間的隨時交流。
需要注意的是,不同階段教師對培訓形式的需求可能存在差異。蔡金花和曾文婕(2018)發現5 年以下教齡的教師對觀摩他人教學、與同事分享和討論的需求特別強烈。相比之下,5—10 年教齡的教師對于專家講座和課題研究的需求比其他教齡的教師要強烈。這與崔允漷(2011)的研究發現一致:中高職稱教師對聽專家報告和做課題研究這兩項專業發展活動持有較高水平的認可。
2. 教師專業發展活動的供給情況
教師最需要的專業發展活動內容是學科教學方法和學生發展,最需要的專業發展活動形式是教學觀摩和研討。而在實際供給上,從培訓內容來看,供給最多的也是學科知識和教學方面的相關培訓。朱小虎和張民選(2017)對TALIS 數據的分析發現,所教學科領域的知識和理解以及教學能力是上海教師專業發展活動中最為重要的內容。薛海平和陳向明(2012)通過全國范圍的調查發現,教師認為自己接受最多的培訓內容是教育教學理論、學科教學、教學方法及策略、班主任工作和學校及課堂教學管理。培訓內容的供給基本上滿足了教師需求。從培訓形式來看,李瓊等人(2018)的研究發現,城鄉教師參與率最高的教研形式是“工作坊或日常備課和公開課研討”。朱小虎和張民選(2017)對TALIS 數據的分析發現,上海教師參與率最高的教研形式是課程工作坊、帶教和相互觀摩。薛海平和陳向明(2012)通過全國范圍的調查發現,在被調查者接觸的培訓中,最常見的幾種培訓方法是集中講授、聽課評課與錄像觀摩。培訓形式的供給也能夠滿足教師的需求。
限于調查數據所覆蓋的范圍,大部分針對教師培訓和專業發展的差異分析僅局限在部分省市。例如李瓊等人(2018)基于5 個省的項目市縣的鄉村學校教師調查,采用TALIS 中的教師專業發展工具,分析教師對專業發展的需求以及影響發展有效性的因素。穆洪華(2018)基于2014 年中國基礎教育質量監測7 個省市的數據分析了這些地區教師專業發展活動是否具備有效教師專業發展的特征要素。薛海平和陳向明(2012)調查全國9 省市中小學教師培訓現狀,采用多階段分層隨機抽樣對中小學教師以及教師培訓者進行了問卷調查。王艷玲和胡惠閔(2020)、謝晨和尹弘飚(2021)是少數基于全國各省的教研機構和教師調查的數據,對教研和教師專業發展活動的開展情況進行分析的研究。其中,Yin et al.(2020)基于全國范圍內教研員的抽樣調查,對作為教師專業發展活動的主要提供者教研員的工作特征和專業發展需求進行了分析。謝晨和尹弘飚(2021)基于全國30 個省級行政區47620 位中小學教師對本區縣教研工作開展的評價,構建并計算了各省的教研工作質量指數和教研發展均衡指數,發現基于教師評價的教研和專業發展活動在地區之間存在較大差異,既有以上海、浙江、遼寧等為代表的高質量、高均衡省份,也有北京、天津、山東等高質量但均衡較低的省份,此外中西部地區還存在大量低水平、低位均衡的情況。
3. 影響教師參與專業發展活動的因素
教師參與專業發展活動面臨著各類主客觀因素的挑戰,大致可分為教師個人因素和組織機構因素兩類。例如,王雙龍(2017)的研究發現,教師的自我意識會顯著影響教師的專業發展水平,教師的自我意識程度越高,投入自身專業發展的積極性越高。李瓊等人(2018)發現,“與工作時間沖突”是阻礙城鄉教師參與專業發展活動的最重要的兩個因素之一,而“項目或課程過于昂貴”是鄉村教師參與專業發展活動的最大障礙。也有研究表明,個人所在的情境因素,例如學校支持氛圍也會影響教師參與專業發展的意愿和程度(王雙龍,2017)。謝晨和尹弘飚(2021)則從教研機構的設置、教研隊伍、經費保障和工作方式等分析影響一個地區教研和專業發展活動的因素,發現教研員隊伍的經驗和規模以及更加專業化的領導對教研和專業發展的質量提升有顯著的影響。
4. 教師專業發展活動有效性的實證研究
與國外的研究相似,針對教師專業發展活動效果的研究較多以教師本身的知識、技能、觀念和自我效能為衡量效果,較少關注對學生學習效果的影響。目前,在專業發展活動有效性的研究中與本文較為相關的有三項:托馬斯等人(2015)基于中國東西部三個地級市2009—2012 年303345 名普通高中畢業生、任課教師和校長的數據,檢驗了專業學習共同體和教師發展因素對學生學業成績的增值影響。結果顯示,教師專業發展因素和學生學習成績之間具有正向相關性,尤其是“參加正式專業發展培訓活動”“同事間非正式的改進教學的交流”“參加相關課題研究”和“參加主要教授科目教學策略和方法培訓”。張文靜等人(2010)以房山區42 所小學的1238 名四年級學生和42 名數學教師為研究對象,考察教師的特征變量、教學方式和教師培訓三個方面對小學四年級學生數學學業成績增長的影響。教師培訓包括是否參加過新課程培訓、教師間是否經常討論教學問題、教師共同準備材料或者備課、教師間相互聽課/評課、教師參與教研活動的頻繁程度。結果顯示,與教師培訓相關的變量和學生學業成績的增長幾乎沒有顯著關系。趙健等人(2013)基于對我國教師專業共同體導向的專業發展實踐的關注,在5 個城市的59 所學校、119 個班級、5066 名學生的成績和問卷數據以及581 名教師問卷數據的基礎上,考察教師專業發展實踐特征及其與學生學業成績的關系。基于“教師專業發展即參與學習共同體”的假設,作者主要關注備課、培訓參與、聽評課和教科研參與四個方面的教師專業發展實踐⑥。研究通過描述性統計揭示了教師參與教科研的總體狀況,但沒有對教科研參與情況與學生成績之間的關系作進一步分析。
除了以上三項研究之外,還有部分研究基于國際大型教育質量監測項目,例如國際學生評價項目(PISA)、國際數學與科學趨勢比較研究(TIMSS)和教師教學國際調查(TALIS)對教師專業發展活動的有效性進行國際比較分析。例如謝敏等人(2008)采用TIMSS 數據比較了日本、瑞典、美國、中國香港地區的教師資格和職業發展對學生成績的影響;陳純槿(2017)基于TALIS 數據分析了教師參與專業發展的影響因素,發現影響教師專業發展有效性最主要的因素是教師的合作文化;李勉等人(2018)基于PISA、TIMSS和PIRLS 數據,分析教師特征和專業發展與學生成績的關系。但由于數據的限制,以上國際比較分析并沒有涉及中國大陸地區。
綜上,在目前國內有關教師專業發展活動有效性的研究中,尤其是檢驗教師專業發展活動對學生成績的增值影響的研究中,對教師專業發展活動的各方面因素都有所涉及,但尚未有研究將區域教研作為一個整體,將包括區級和校本在內的各類教師專業發展活動與學生的學業成績相互聯系起來,探討區域教研活動對學生學業成績影響的實證研究。
本文嘗試在Desimone(2009)研究總結的理論框架的基礎上(圖1),結合國際教師調查對教師專業發展活動的概念框架和指標,構建針對區域教研對教師和學生成績影響的分析框架。目前全球通用的有關教師專業發展、教師效能、教師教學實踐及課堂行為等相關數據的調查問卷主要包括:TIMSS、PIRLS、TEDS-M 和TALIS 等⑦。其中TALIS 是經濟合作與發展組織(OECD)研發的對教師專業發展、教學理念及實踐和教師工作環境進行調研的國際項目。該項目力圖通過問卷方式了解各國和地區教師的專業準備、入職培訓、專業發展、教學信念與實踐、教師評價、校長領導力、學校氛圍與支持等方面的情況。上海是中國內地首個參加2013 和2016 年TALIS 調查的地區。根據研究目的,本文主要采用了TALIS 作為教師專業發展問卷的基本框架(表1)。

表1 TALIS 調查問卷基本框架
根據教師專業發展有效性研究的概念框架和TALIS 調查問卷基本框架,圖2 構建了本文“投入—過程—產出”的概念框架。其中投入主要包括教師專業特征和教師專業發展兩大主題。教師專業特征主要包括教師受教育背景、工作滿意度和動機、自我效能。教師專業發展主要包括區級教研活動和校本教研活動。過程包括教師知識技能、教學實踐以及相應的課堂環境和學校環境。在產出部分,本文主要關注的是學生學業成績。區級和校本教研活動對學生學業成績的影響路徑如下:(1)在投入端,教師參與不同類型的區級和校本教研活動;(2)在過程端,教研活動提升了教師的知識技能,而知識技能的提升影響了教師課堂教學實踐,提升了教師的自我效能,這一過程在相應的課堂和學校環境中發生;(3)在產出端,過程端的教師知識技能、教學實踐的提升促進了教師自我效能與工作滿意度的提升,也促進了學生學習和學業成績的提升。
此外,各主題之間存在大量潛在的關系,這些關系可能是單向的,例如我們可以預期受教育背景會影響教師的教學實踐,但教師入職之后的教學實踐不大可能反向影響受教育背景。而另一些因素之間的關系則可能是雙向的,例如教師參與教研活動會影響教師的實踐,但這些實踐也會影響對教研活動的需求、設計和實施。教師的課堂教學實踐在課堂和學校環境中發生,同時也影響了課堂環境和學校氛圍,學校環境既塑造教師專業實踐,也由教師專業實踐塑造。
表2 為教師問卷的基本框架。問卷包括6 個部分:(1)教師背景信息包括教師的年齡、性別等個人背景和學歷、專業訓練等教育背景;(2)工作情況包括職位、工作經歷、教學及非教學時間安排;(3)教學情況包括課堂教學實踐、與同事交流合作和與教學實踐相關的自我效能;(4)教師專業發展包括教師參加的區級常規教研活動、區級專題教研活動和校本教研活動;(5)評價與反饋包括教師自身、同事、學校管理者和區教研員的評價,以及評價對教學實踐和學生成績的影響自評;(6)學校氛圍和支持包括學校對教師發展的支持、對教研活動的支持,教師的職業認同感、學校歸屬感、工作壓力和倦怠感。

圖2 本文概念框架圖

表2 本文調查問卷基本框架
本文使用的數據主要分為三個部分:一部分是2016—2019 年參加高考的42127 名高中學生成績和選課數據。表3 為樣本學生的分布情況,每一屆在10000 人以上,其中文科為2500—2700 人左右,理科為7700—8100 人左右⑧。除了學生成績和選課數據之外,本文使用的第二個數據為教師問卷數據。2019 年2—3 月課題組向參與教研活動的數學、語文、化學三科教師發放區域教研參與情況調查問卷。此次調查共有1974 名教師提交了問卷,其中語文教師占47%,數學37%,化學16%。第三,本文基于學生選課信息將教師數據與學生數據進行匹配,建立了包含學生基線成績、出口成績和相應學科任課教師信息的數據。

表3 樣本學生的分布情況
基于學生成績和教師問卷數據,本文主要關注三個方面的問題:首先,對數學、語文和化學三科教師參與教研活動,包括區級和校本教研活動的情況進行描述統計和回歸分析,在此基礎上采用結構方程模型對教師參與教研的作用進行分析;第二,采用增值評估的方法分析2016—2019 屆高三學生的成績,估計學校和教師對學生成績的增值作用;第三,基于學生成績和教師問卷匹配數據,采用增值評估的方法,分析教師專業發展活動參與情況對學生成績的影響。
增值估計是基于教育生產函數模型衍生出來的增值評價方法,其理念是建立在一個前提假設的基礎上,即學校和教師在能夠在原有的基礎之上增加學生的學業成績,超出原本期望的部分即學校和教師的增值效應。目前在對學校和教師進行評價的時候,主要使用中考和高考升學率、上線率等指標。雖然中高考等高利害測驗在篩選學生方面具有專業性,但僅使用中高考成績評價學校質量和教師水平存在一些弊端。主要原因之一在于,中高考成績是學生在初中和高中階段學習的累積,如果不考慮學生入學時的學業水平,那么結果性評價就不能準確反映學校和教師的作用。增值估計則通過學生基線學業成績,將學生開始成績中學校無法作用的因素,如學生的遺傳、性別、家庭背景等個人因素進行一定的控制,從而估計學校和教師對學生作出的“增值”影響。此外,增值評價可以在一定程度上分離學校、教師和學生自身因素對學業發展的影響,因此也有助于對學校和教師的影響進行更客觀的評價。
具體來說,傳統的教育生產函數為分析學生學業成績產出提供了一個包含學生個人能力、家庭背景、學校和教師投入、同伴效應等各類因素在內的完整分析框架。在研究學校和教師的增值性效應時,我們在教育生產函數中加入了上一學期學生的學業成績:

其中,An是第n 學期時的學業成績。C、F、S、T、P 分別代表社區、家庭、學校、教師和同伴的影響, α代表學生個人能力。上標n 的引入意味著第n 學期學業成績是從初始到當下全部教育投入要素共同作用的結果。A0是初始學業成績,它的引入在很大程度上緩解了缺乏家庭背景信息、過去教育經歷造成的遺漏解釋變量問題。
目前,教師增值估計模型被廣泛用于中小學階段教師對學生成績的增值評估(Jacob & Lefgren,2008;Kane et al.,2008;Hanushek & Rivkin,2010)和教師培訓項目和教師專業發展項目的有效性評估(Boyd,et al.,2009;Harris & Sass,2011;Goldhaber et al.,2013)。根據Meghir & Rivkin(2011)對教師增值研究的梳理,增值模型主要分為獲得分數(gain-sacore)和滯后分數(lagged-score)兩類。本文采用的是滯后分數,也就是將學生的出口成績作為結果變量,學生的入口成績則作為控制變量之一。本文的增值分析分為三個部分:第一部分基于學生成績數據分析不同學校對學生成績的增值影響,即學校的“打包”增值影響(模型一);第二部分基于學生和教師匹配數據分析教師的“打包”增值影響(模型二);第三部分基于學生成績數據和教師數據,分析教師參與專業發展活動與學生成績增值的關系(模型三)。本文的計量模型如下:
1. 學校增值估計


3. 教師專業發展的增值估計
基于學生學業成績的教師增值模型估計的是教師“打包”增值效果,提供的是教師相對水平信息,因此主要用于探索是否一些教師比另外一些教師有相對更多的進步,但無法進一步識別教師的哪些特征對增值的貢獻更大。為了進一步分析教師參與專業發展活動對學生學業成績的影響,本文采用考慮了學生滯后分數(lagged-score)以及學校固定效應的增值估計模型,此外還包括教師個人和專業背景特征,具體模型如下:

在實際分析中,由于數據的限制,增值估計往往攜帶有大量的干擾因素,理想的情況應該是分別控制學生的個體特征和學校的資源環境特征。學生的個體特征包括性別、年齡等個人特征,也包括父母受教育程度、職業、收入等反映家庭經濟背景的因素,通常根據學生問卷獲得相關數據。學校的特征包括學校規模、基礎設施等投入和辦學條件數據,也包括環境、氛圍和管理等數據,通常根據校長問卷獲得相關數據。在缺乏相應的數據時,研究常用的處理方法是采用學校固定效應,以控制學校層面不隨時間變動的影響因素(Aaronson et al.,2007;Boyd et al.,2009)。在有多科成績數據時一些研究還采用學生固定效應,以控制學生層面(例如成績、家庭背景等)的影響因素(Clotfelter et al.,2010;Goldhaber et al.,2013)。在下面估計教師對學生成績的增值影響時,我們先嘗試采用學校隨機模型,然后再采用學校固定模型。
基于本文所關注的區域教研體系下的教師專業發展活動與學生學業成績的關系假設,我們重點采集區級教研活動和校本教研活動的相關數據。其中,區級教研活動又可分為區級常規教研活動、蘊含有效教師專業發展特征的教研活動和專題教研活動三類。
首先,根據活動的組織形式,區級常規教研活動包含8 個子問題:教材教法、研究課、專家講座、課題項目研討、中心組活動、跨學科教研、學術會議、優秀經驗和成果分享。根據活動的內容,區級常規教研活動包含9 個子問題:學科課程的整合與開發、學科核心知識與思想方法的理解、學科教學關鍵問題的確定和解決、單元整體教學、深度學習活動的設計與實施、促進學習的持續性評價、中高考命題方向和命題思路、分析和使用學生評價數據、跨學科能力的教學(如STEAM、批判思維、問題解決等)。我們對每位教師參與區級教研活動的頻率做平均值處理,得到每位教師區級常規教研活動的平均參與程度。其次,本文根據Darling-Hammond et al.(2017)總結的有效教師專業發展活動特征,將區級常規教研活動進行了歸類,分為聚焦課程內容、融入主動學習、示范和模范、專家指導和支持四項蘊含有效專業發展特征的教研活動⑨。
表4 為教齡5 年以上的教師和教齡5 年以下的教師在各區級常規教研活動組織形式上的參與情況。總體來看,教師參與率較高的包括教材教法分析、研究課、專家講座、課題項目研討及分享。教師參與率較低的包括中心組成員活動、跨學科教研、各級學術會議以及優秀經驗分享。從教齡5 年以上和教齡5 年以下的教師對比來看,老教師在大部分教研活動形式的參與率上要高于新教師,其中在參加各級學術會議和優秀經驗分享上的差距更加明顯。這可能是因為老教師從教經驗長,經驗更加豐富,同時也有更好的資源參與學術會議。

表4 區級常規教研活動參與情況(形式)
表5 為教齡5 年以上的教師和教齡5 年以下的教師在各區級常規教研活動內容上的參與情況。總體來看,教師參與頻率較高的教研活動內容為單元整體教學、學科教學關鍵問題的確定和解決、學科核心知識與思想方法的理解。教師參與頻率較低的教研活動內容為跨學科能力的教學、學科課程的整合與開發。對比來看,教齡5 年以上的教師在大部分教研活動的參與率上要高于教齡5 年以下的教師,其中在分析和使用學生評價數據、中高考命題這兩項與評價相關的培訓內容上差距尤為明顯。

表5 區級常規教研活動參與情況(內容)
區級專題教研活動包括“基于學科能力表現的教學改進”“考試評價研討”和“深度學習”三項專題教研項目。表6 為區級專題教研活動參與情況。“基于學科能力表現的教學改進”項目是地區教師進修學校與師范大學合作開展的項目。該項目基于學科能力構成模型,開發出指向核心內容主題的學科能力發展水平診斷工具,對學生的學科能力發展水平現狀進行診斷,聚焦問題、反思教學、開展教學改進實踐研究。在參與調查的教師中共1118 名教師參加過“基于學科能力表現的教學改進”項目,總體參與率為57%,教齡在5 年以上的教師有62.4%參加過該項目,教齡在5 年以下的教師僅34.6%參加過該項目。“考試評價研討”專題教研活動基于評價數據的分析和反饋,幫助教師改進課堂教學,幫助學校改進教學管理,同時促進教研內容和方式的改進。在參與調查的教師中共866 名教師參加過“考試評價研討”項目,總體參與率為44.2%,老教師參與率顯著高于新教師。“深度學習”則是教育部基礎教育課程教材發展中心的教學改進項目。在參與調查的教師中共1105 名教師參加過“深度學習”項目,總體參與率為56.4%。同樣,老教師的參與率顯著高于新教師。
校本教研包含7 個子問題:校內聽評課、集體備課、參與校本課程及其他教學輔助材料的開發、就教學中遇到的問題與同事進行研討、與同事討論某類學生的學業發展問題、與同事分享教學經驗與資源、接受專家指導(包括教研員、大學教學專家等)。首先,本文對每位教師參與校本教研的頻率做平均值處理,得到每位教師參與校本教研活動的平均參與程度。其次,根據以往的文獻,以上校本教研活動又可分為正式和非正式校本教研兩類。本文進一步將校內聽評課、集體備課、參與校本課程及其他教學輔助材料的開發以及接受專家指導歸為正式的校本教研,將就教學中遇到的問題與同事進行研討、與同事討論某類學生的學業發展問題、與同事分享教學經驗與資源歸為非正式的校本教研。

表6 區級專題教研活動參與情況
表7 為教師校本教研活動的頻率。總體來看,教師參與頻率最高的正式教研活動為集體備課,有76.5%的教師經常參加(平均值未在表中顯示),教齡5 年以上的教師參與頻率高于新教師。其次是校內聽評課,有51%的教師經常參加,新老教師沒有太大差異。相對來說,教師在學校接受專家指導的機會較少,19.8%的教師從不或較少接受專家指導,新教師接受專家指導的機會更少。此外,29%左右的教師從未或較少參與校本課程及其他教學教輔材料的開發,新教師的參與頻率低于老教師。從教師與同事的非正式交流來看,頻率最高的是與同事討論教學中遇到的問題,77.7%的教師經常與同事討論,其次是與同事分享經驗和資源以及討論某類學生的學業發展問題。
本節主要是從區域教研活動,包括區級常規教研、區級專題教研和校本教研對教師的課堂教學實踐、教學評價策略的使用以及與教學相關的自我效能的影響來檢驗專業發展有效性,此外還探討了區級教研與校本教研之間的關系。
基于上述完成調查問卷的教師,我們通過OLS 回歸,分析教師的區級教研活動參與情況和課堂教學實踐之間的關系。具體模型如下:

TEj為教師j 相關教學實踐活動的頻率,包括教師課堂教學組織行為、評價策略使用以及與教學相關的自我效能三個部分。問卷中描述教師課堂教學組織行為頻率的問題包含13 個子問題,分別是:“總結近期學過的內容”“明確學習目標”“建立新的知識點和以往知識點的聯系”“結合日常生活問題或工作來說明新知識的用處”“提出沒有明確答案的問題”“要求學生自己決定解決復雜問題的步驟”“歸納、小結課堂學習內容”“組織學生深度參與的體驗性、探究性學習活動”“布置學生做需要批判性思維的作業”“布置需要至少一周時間才能完成的大作業”“讓學生使用信息技術完成作業”“讓學生以小組合作的方式解決問題或完成作業”“讓學生不斷練習直到掌握學科內容”。選項為幾乎不會、偶爾、經常、總是,內部一致性系數(alpha 系數)為0.82。我們將每位教師對13 個子問題的選項求平均值,用以衡量課堂行為的頻率,值越大表明頻率越高。

表7 校本教研活動參與情況
評價行為包含4 個子問題,分別是:“自行設計單元和學期測試并使用”“除了分數,我還給學生評語反饋”“讓學生反思和評估自己的進步”“現場觀察學生在特定任務上的表現并提供及時反饋”,內部一致性系數為0.72。
教學相關的自我效能包含11 個子問題,分別是:“讓學生相信他們能夠學好”“讓學生意識到學習的價值”“提出挑戰性的問題”“注意培養學生的批判性思維”“激勵學習積極性低的學生”“讓學生遵守課堂紀律”“明確表達對學生行為的期望”“給學生思考、討論和表達的機會”“使用多種教學策略”“使用多種評價策略”“使用信息技術輔助學生學習”,內部一致性系數為0.89。我們也對每位教師的評價行為使用頻率和自我效能求平均值,值越高表明評價行為使用頻率越高、越多樣化,與教學相關的自我效能也相應越高。此外,我們也對各個具體的子項目分別進行回歸分析。
模型中的 PDj為教師j 參加教研活動的頻率,包括區級常規教研、蘊含有效教師專業發展活動特征的區級常規教研以及區級專題教研。 Tj為一系列教師個人和專業特征,包括性別、學歷、與學校的勞動關系、職稱、教齡、學校職務、獎勵和榮譽等。附表A1-A3 為參與問卷調查的教師區級教研活動參與程度和課堂教學組織行為、評價策略的使用以及教師自我效能之間的關系分析結果(參見http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)⑩。
1. 區級教研活動參與程度和教師的課堂教學組織行為的關系
首先,教師區級教研活動的參與程度與整體課堂教學組織行為水平以及各項課堂教學組織行為之間存在較為顯著的正向關系。整體來看,教研活動參與度高的教師,其開展各項課堂教學組織活動的頻率也相對較高,尤其是在教學過程中更頻繁地“組織需要學生深度參與的體驗性、探究性的學習活動”和“布置學生做需要批判性思維的作業”等更加需要學生進行探究性、批判性思考和學習的活動。
其次,就蘊含有效專業發展特征的常規教研活動來看,四類教研活動與大部分教學組織行為都有顯著的正向關系,尤其是對“組織學生深度參與的體驗性、探究性學習活動”的教學實踐的促進。具體而言,參與具備“聚焦課程內容”要素教研活動較多的教師在教學過程中更加頻繁地“歸納、小結課堂學習內容”以及“明確學習目標”;參與“融入主動學習”較多的教師更傾向于“布置學生做需要批判性思維的作業”,更多地“結合日常生活問題或工作來說明新知識的用處”;參與“有效示范及模范”和“專家指導和支持”較多的教師在教學中則更多地對課堂學習內容進行歸納小結,并“結合日常生活工作來說明新知識的用處”;而參與“專家指導和支持”較多的教師對“歸納、小結課堂學習內容”和“結合日常生活問題或工作來說明新知識的用處”的影響較大。此外,教研員的個性化指導與接受教研員指導的教師課堂教學實踐水平也存在正向關系,尤其是提升了受指導教師“組織學生參與體驗性、探究性學習活動”的教學實踐。
最后,三類專題教研活動與各項教學組織行為之間存在較為顯著的正向關系。參與專題教研的教師更加傾向于組織學生進行探究性的學習活動以及布置學生做需要批判性思維的作業。
2. 區級教研活動參與程度和教師的評價策略使用的關系
分析結果顯示,參與程度高的教師更加傾向于選擇“讓學生反思評估自己”和“現場評估并給予反饋”的評價方法。從區級常規教研活動的參與來看,參與程度較高的教師不僅更加傾向于給予現場反饋、讓學生進行自我反思,同時也能夠更好地通過傳統的評價策略,如設計單元學期測驗來對學生的學習效果進行評價。從蘊含有效教師專業發展特征的區級常規教研活動的參與來看,參與此類活動的教師也更加傾向于給予及時反饋,促進學生自我的反思和評估。
3. 區級教研活動參與程度和教師自我效能的關系
首先,就區級域教研的整體參與程度來看,參與程度較高的教師更傾向于認為自己在教學過程中能夠向學生提出挑戰性的問題、使用多種評價策略以及培養學生的批判性思維。而接受更多教研員個性化指導的教師則更傾向于認為自己能夠使用多種教學策略。
其次,就蘊含有效專業發展特征的常規教研活動來看,四類教研活動參與水平與教師整體的自我效能之間存在較為顯著的正向關系。參與水平較高的教師在使用多種評價和教學策略、提出挑戰性問題、培養學生批判性思維方面具有較高的自我效能。
再次,針對三類專題教研活動分析結果顯示,參與“學科能力”項目較多的教師更加傾向于在教學過程中使用多種教學策略以及使用信息技術輔助學生學習;參與“考試評價研討”項目較多的教師認為自己能夠更多地使用多種評價策略和教學策略;參與“深度學習”項目較多的教師則認為自己能夠更多地提出挑戰性問題,并且讓學生意識到學習的價值,給學生更多思考、討論和表達的機會。
4. 區級教研活動的影響路徑分析
我們通過結構方程模型來構建教師參與區級教研活動的程度對教學組織行為、評價策略和自我效能的影響路徑。圖3 構建的模型控制了教師年齡、性別、學歷、職稱、教齡等的影響,擬合良好(RMSEA=0.056,CFI=0.930,TLI=0.910)。模型對教學組織行為、評價策略、自我效能的解釋率分別為27.6%、10.6%和22.1%。根據結構方程的分析結果,區級常規教研對教師教學實踐有積極影響。基于活動組織形式衡量的區級常規教研活動對教學組織行為和自我效能的影響系數分別為0.333 和0.324;而基于活動內容衡量的區級常規教研活動對教學組織行為和評價策略的影響系數分別為0.205 和0.246。此外,也可以看出教師的教學組織行為、評價策略和自我效能之間存在著較強的相關性。
圖4 構建了蘊含有效專業發展特征的區級教研活動對教學實踐影響的結構方程。在控制了上述教師背景特征后,模型擬合良好(RMSEA=0.047,CFI=0.962,TLI=0.949)。模型對教學組織行為、評價策略、自我效能的解釋率為19.5%、9.6%和14.9%。結果顯示,蘊含有效專業發展特征的區級常規教研活動對教學組織行為、評價策略和教師自我效能三個方面有顯著的正向作用,分別為0.383、0.286 和0.343。

圖3 區級常規教研活動對教學組織行為、評價策略和自我效能的影響路徑

圖4 蘊含有效專業發展特征的區級教研活動對教學組織行為、評價策略和自我效能的影響路徑
圖5 為區級專題教研活動對教學實踐影響的結構方程。控制了上述教師背景特征后,模型擬合良好(RMSEA=0.025,CFI=0.987,TLI=0.980)。模型對教學組織行為、評價策略、自我效能的解釋率為16.5%、6.7%和8.4%。結果顯示,“考試評價研討”對教師的教學組織行為、評價策略、自我效能有顯著影響,其標準化后的影響效應分別達到了0.293、0.191、0.184。可見,“考試評價研討”相對其他兩項活動,更能夠積極影響教師進行各類教學組織行為、評價行為的頻率,有助于提高教師的自我效能。
根據調查問卷對教師專業發展活動參與情況的描述統計,不同類型的教師專業發展活動,例如區級常規教研、專題教研由于活動開展的目的和目標群體不同,參與的教師存在差異。本節基于教師問卷數據,分析教師的個人、學術和專業背景與區級教研活動參與情況之間的關系,建立模型如下:

模型中的 PDj與上文分類相同,包括區級常規教研、蘊含有效教師專業發展特征的常規教研活動和專題教研活動。 Tj為一系列教師個人和專業特征,包括性別、學歷、與學校的勞動關系、職稱、教齡、學校職務、獎勵和榮譽。本節采用OLS 回歸分析。
1. 區級常規教研(形式)
總體來看,學科帶頭人和獲得市/國家教學設計、教學展示獎勵的教師的參與度顯著高于其他群體,而高級職稱教師的參與度則顯著低于其他群體。就不同年級的教師來看,參與度總體上不存在顯著差異。就學科來看,語文和化學學科教師的平均參與度都高于數學教師。

圖5 區級專題教研活動對教學組織行為、評價策略和自我效能的影響路徑
具體而言,教師個人專業特征與各項教研活動參與頻率之間的關系如下:(1)擁有碩士或博士學位的教師更多參與中心組活動、跨學科教研、學術會議和分享自己的教學經驗和成果;(2)師范院校畢業的教師相對于非師范院校畢業的教師,非事業編制的教師相對于事業編制的教師,在其他個人和專業背景相似的情況下,在區域常規教研活動的參與上沒有顯著的差異;(3)與其他教師群體相比,資深教師更多參與教材教法研討,而更少參與課題項目研討和跨學科教研;(4)高級職稱教師相對于其他群體教師較少參加區域教研,主要在研究課、課題項目討論和跨學科教研等幾個方面與其他教師群體相比顯著偏少;(5)學科帶頭教師以及獲得教學設計、教學展示獎勵的教師則更多地參與到課題項目研討、中心組活動、跨學科教研、學術會議及成果分享等區域教研活動中。
2. 區級常規教研(內容)
在參與的區級教研活動的主要內容方面,資深教師和獲得市/國家教學設計、教學展示獎勵的教師的參與度顯著高于其他群體,而高級職稱教師的參與度則略低于其他群體。各年級教師的參與度總體上不存在顯著差異。就學科來看,語文教師的平均參與度高于數學教師,而化學教師則沒有顯著差異。
具體而言,教師個人專業特征與各項教研活動參與頻率之間的關系如下:(1)在其他個人和專業背景相似的情況下,本科生或研究生、非師范生或師范生、非事業編或事業編教師在各類教研活動的參與程度沒有顯著的差異;(2)高級職稱教師相對于其他群體教師較少參加教研活動,在單元整體教學、深度學習活動的設計實施、促進學習的持續性評價幾類活動的參與度上顯著低于其他教師;(3)與高級職稱教師不同的是,在理解學科核心知識思想方法、確定與解決學科關鍵問題、單元整體教學以及中高考命題等幾類活動的參與上,教齡長的教師參與度相應更高;(4)獲得教學設計、教學展示獎勵的教師在幾乎所有類型的教研活動的參與度上都顯著高于其他教師。
此外,在教師個人專業特征與蘊含有效專業發展特征的教研活動參與頻率之間的關系上,與專題教研活動類似,最相關的教師個人專業特征是教齡和教師獲獎情況。
3. 區級專題教研
除了常規性的區級教研活動,本文還針對“基于學科能力表現的教學改進”“考試評價研討”和“深度學習”三項專題教研項目的參與情況進行分析。總體來看,與專題教研活動參與程度最相關的教師個人和專業特征是教齡和教師獲獎情況。在其他個人和專業背景相似的前提下,教齡和專題教研活動的參與度之間呈現倒U 型分布,教齡越大的教師參與度越高,但隨著教齡逐漸增加,參與度重新回落。而獲得市或國家研究課、教學設計、教學展示等獎勵的教師在三項專題活動的參與頻率上都顯著高于其他教師群體。從教師的職務來看,除了學科帶頭教師更多地參與到考試評價的項目中外,骨干教師和學科帶頭人參與專題教研活動的程度與其他教師不存在顯著的差異。而沒有任何學校職務的教師較少參與到各類專題學科教研活動中,其中深度學習和學科能力兩個專題項目的參與程度更是顯著低于其他有學校職務的教師。此外,就學科來看,相對于數學教師而言,語文和化學教師參與三類專題教研活動的程度明顯更高,而化學教師除了考試評價項目的參與度要低于語文教師外,在學科能力和深度學習方面的參與度都要顯著更高。
除了常規性、專題性教研活動,我們還詢問了教師接受教研員對課堂教學的個性化指導的頻率。結果顯示,教齡較長的教師、骨干教師和學科帶頭人接受個性化指導的頻率顯著更高,而沒有擔任學校職務的教師、非事業編教師獲得區教研員個性化指導的機會和頻率都顯著少于其他教師群體。
根據本節的分析,在區級常規教研活動中參與度較高、較為活躍的幾個群體包括擁有研究生學歷的教師、資深教師、學科帶頭人以及教學設計、展示等獲得市及以上獎勵的教師,而骨干教師、高級職稱教師相對于其余教師而言不存在太大的差異。在教師群體中,就研究生學歷的教師而言,在常規教研活動中,具有研究生學歷的教師更多地參與到需要參與、融入和研究性質的教研活動中。就教齡而言,在常規教研活動中,教齡相對較長的教師更多參與教材教法研討,而更少參與課題項目研討和跨學科教研;在專題教研活動中,教齡越大的教師參與度越高。就學科帶頭教師而言,在常規教研活動中,他們更多地參與到需要主動參與和研究性質相關的教研活動中。而獲得教學設計、展示獎勵的教師在幾乎所有類型的教研活動的參與度都顯著高于其他教師。
根據參加過專題教研活動的教師對效果的評價,我們對“基于學科能力表現的教學改進”“考試評價研討”“深度學習”對教師知識技能提升的效果進行了描述統計(見圖6)。其中,參與了“基于學科能力表現的教學改進”項目的教師對該項目提升知識技能的效果評價較積極,超過80%的教師認為項目效果較好或非常好。但需要注意的是,有17.2%的教師認為項目對把握學生能力發展的進階情況(年級、水平)的效果一般。

圖6 “基于學科能力表現的教學改進”項目知識技能提升效果評價
圖7 表明,參與了“考試評價研討”項目的教師對該項目的知識技能提升效果的評價較積極,超過80%的教師認為項目效果較好或非常好。在這些評價標準中,項目對幫助教師命制較高質量的階段測試試題的效果相對其他方面的評價更低一些,16.3%的教師認為效果一般。
圖8 顯示,參與過“深度學習”項目的教師對項目提升知識技能效果的評價較積極。相對來說,“深度學習”項目對持續開展促進學生學習的評價和持續開展與學習活動融合的評價這兩方面的效果較一般,分別有20.3%和20.5%的教師認為效果一般。

圖7 “考試評價研討”項目知識技能提升效果評價

圖8 “深度學習”項目知識技能提升效果評價
首先,本節基于教師問卷數據,分析教師的個人、學術和專業背景與校本教研活動參與情況之間的關系。其次,本節進一步分析了區級教研與校本教研活動參與情況之間的關系。最后,本節通過結構方程模型來構建校本教研在區級教研和教學實踐、自我效能之間起的中介作用模型。

其中, S ch_PDj為校本教研,包括校內聽評課、集體備課、參與校本課程及其他教學輔助材料的開發、就教學中遇到的問題與同事進行研討、與同事討論某類學生的學業發展問題、與同事分享教學經驗與資源、接受專家指導(包括教研員、大學教學專家等)。 Dis_PDjφ 為區級教研活動。 Tj為一系列教師個人和專業特征,包括性別、學歷、與學校的勞動關系、職稱、教齡、學校職務、獎勵和榮譽。本節采用OLS 回歸分析。
1. 校本教研參與情況
首先,我們將教師校本教研活動參與頻率作為結果變量,分析教師的個人和專業背景特征與校本教研活動參與頻率的關系。總體來看,非事業編教師相對于事業編教師、沒有學校職務的教師相對于有一定職務的教師,其校本教研的平均參與程度顯著更低。另一方面,學科帶頭人、獲獎教師以及研究生學歷的教師相對于其他教師群體,其平均參與程度顯著更高。
具體到教師個人專業特征與各項校本教研活動參與頻率之間的關系上,師范院校畢業的教師和學科帶頭人更多地參與到聽評課活動中,而研究生學歷教師、骨干教師和獲獎教師更多地參與校本課程、教輔材料的開發。就與同事研討教學問題、學生發展問題、分享經驗和資源等非正式的專業交流活動來看,男教師和非事業編教師的參與度要低于女教師和事業編教師,教學經驗更豐富的教師會更多與同事分享經驗和資源,而學歷、學校類型、職稱、是否骨干教師或學科帶頭人等都沒有顯著差異。不過沒有擔任任何學校層面的職務(例如班主任、年級組長、備課組長、教研組長、主任、校長等)的教師在校本課程材料開發以及與同事交流方面都要低于擔任職務的教師,這從側面說明了校本教研活動不僅受到個人性別、受教育程度等影響,也受到學校組織安排的因素影響。
2. 區級教研與校本教研的關系
附表A4 為區級教研活動和校本教研活動參與情況之間的關系(參見http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)。結果顯示,在區級教研活動與校本教研活動的參與程度之間存在著十分顯著且穩定的正相關關系。這種關系不僅體現在校本教研的平均參與程度上,體現在聽評課、集體備課、接受專家指導等各項正式的校本教研活動的參與程度方面,也體現在與同事研討教學問題、學生問題、分享教學經驗等各項非正式的交流活動中。尤其是在接受專家指導和參與校本課程、教輔材料開發這兩項活動方面,與區級教研活動的關系尤為緊密。
3. 校本教研的中介作用
我們構建了校本教研在區級教研活動中對教師教學實踐影響的中介模型。我們將區級教研活動分為區級常規教研、蘊含有效專業發展特征的教研和專題教研三類,將校本教研分為正式的校本教研和非正式的校本教研,根據分類對各子項進行平均值處理。圖9 構建了校本教研活動在區級常規教研和教學實踐間的中介模型,模型擬合可以接受(模型擬合結果為RMSEA=0.060,CFI=0.912,TLI=0.888),模型對校本教研、教學組織行為、評價策略、自我效能的解釋率為18.4%、52.3%、28.9%和49.3%。采用偏差校正的非參數百分位Bootstrap 法抽樣1000 次計算校本教研在區級常規教研(形式)和教學實踐間的中介效應,表8 顯示其95%的置信區間分別為[0.035, 0.313]、[0.032, 0.446]、[0.045,0.435],表明校本教研在區級常規教研(形式)和教學實踐間起中介作用,不同組織形式的區級常規教研活動參與率會首先影響校本教研,進而間接影響教師的教學組織行為、評價策略和自我效能。
圖10 為校本教研活動在蘊含有效專業發展特征的區級教研和教學實踐間的中介作用(模型擬合結果為RMSEA=0.056,CFI=0.939,TLI=0.919),模型對校本教研、教學組織行為、評價策略、自我效能的解釋率為9.0%、50.0%、29.0%和48.0%。采用偏差校正的Bootstrap 法直接對校本教研在區級常規教研與教學實踐間的中介效應進行檢驗,表9 顯示其95% 的置信區間分別為[0.046, 0.111]、[0.039,0.103]、[0.062, 0.140],校本教研在其中起著部分中介作用,即區級常規教研通過影響教師校本教研的參與程度,間接影響教師教學實踐。其次,區級常規教研對教師教學實踐和教師自我效能存在直接的正向的作用,區級常規教研對教學組織行為、評價策略、自我效能標準化后的直接影響效應達到了0.195、0.136 和0.146。
圖11 為校本教研活動在區級專題教研和教學實踐間的中介作用(模型擬合結果為RMSEA=0.048,CFI=0.949,TLI=0.922),模型對校本教研、教學組織行為、評價策略、自我效能的解釋率為11.1%、49.8%、27.7%和45.9%。可以發現,校本教研在其中起著中介作用,“基于學科能力表現的教學改進”“考試評價研討”“深度學習”三項區級專題教研活動,首先影響教師參與校本教研活動的頻率,進而再影響教師的教學組織行為、評價行為以及教師的自我效能。采用偏差校正的Bootstrap 法抽樣1000次,以此來對校本教研在區級專題教研和教學實踐間的中介效應進行直接檢驗,檢驗結果見表10。

圖9 校本教研對區級常規教研活動影響的中介作用

表8 校本教研對區級常規教研活動影響的中介作用Bootstrap 檢驗

圖10 校本教研對蘊含有效專業發展特征的區級教研活動影響的中介作用

表9 校本教研對蘊含有效專業發展特征的區級教研活動影響的中介作用Bootstrap 檢驗

圖11 校本教研對區級專題教研活動影響的中介作用

表10 校本教研對區級專題教研活動影響的中介作用Bootstrap 檢驗
對學校和教師增值效能的分析分為三個部分:第一部分基于學生成績數據分析不同學校對于學生成績的增值影響(模型一);第二部分基于學生和教師匹配數據分析教師“打包”的增值影響(模型二);第三部分基于學生成績數據和教師問卷數據分析教師專業發展活動與學生成績增值之間的關系(模型三)。
1. 學校增值的估計
在評估學校對學生增值成績帶來的影響時,我們使用的是模型一,選取2016—2019 屆高三學生數學、語文和化學三門課的模考成績作為結果變量,并將各科模考成績與相對應的2013—2016 年的中考各科成績進行鏈接,建立包含學生中考和模考成績的數據庫。其中,所有考試得分均經過標準化處理(平均分為0,標準差為1)。
首先,我們根據學生嵌套于學校的數據結構,建立學校和學生的兩層零模型,將學生模考成績的變異分離為學校之內的變異和學校之間的變異;其次,加入學生的中考成績,看控制了學生的入口成績之后,學校之間的變異情況。此時學校間的變異就是學校對于學生成績的增值,這個增值可能為正,也可能為負。根據零模型,樣本學生在語文、數學和化學的一模成績差異有48%、57%和62%為校際間的差異,在考慮了學生的入口成績之后,可以由學校之間的差異解釋的部分降低17%—18%。語文、數學和化學的二模成績差異有43%、55%和59%為校際間的差異,在考慮了學生的入口成績之后可以由學校之間的差異解釋的部分降低19%—21%。
圖12—14 按照各學校數學、語文、化學三科標準化后的學校平均分從低到高依次排列,以及根據模型一估計的學校增值的比較。不難發現,采用增值估計的方法與采用模考平均成績的方法得出的結果存在一定的差異,盡管斯皮爾曼系數(Spearman correlation)顯示兩者之間存在高度而顯著的相關。首先,各學校之間增值分數的差異要小于模考標準分的差異。增值估計的最大和最小值之間相差2.5 個左右標準差,而模考標準分則相差3.2 個左右標準差。即根據學校對學生增值成績的影響來看,各學校之間的差異要小于根據一次性考試結果得出的評價。尤其是在高中階段,在評估學校效能的時候,必須要考慮不同學校的生源差異和原本的教育積累。其次,一部分模考成績在平均水平之下的學校,其對學生成績增值帶來的影響在平均水平之上。例如,根據數學學科的分析,一部分學校標準化后的平均成績低于0,而相應的學校增值估計則要高于0。這一類學校為學生帶來了比單純的出口成績排名更高的增值影響。

圖12 模考分數與增值評價的比較(數學)
一般而言,學校的增值分和平均成績之間存在顯著的相關性,但不一定是十分一致的強正向相關。本文根據區域內學校的模考成績得出了增值分數與最終成績之間存在著十分強的正相關關系,模考平均分較高的學校給學生的增值成績帶來的正向影響也相對較高,這在一定程度上說明了相對優質的學校最終成績較高不僅僅是因為這些學校能夠篩選出入口(中考)成績較高的學生,還因為在初始成績的基礎之上給學生帶來了相對更大的增值影響。

圖13 模考分數與增值評價的比較(語文)

圖14 模考分數與增值評價的比較(化學)
表11 和表12 是四類學校的學校增值估計和標準化之后的平均成績,第1—4 列為增值估計,第5—8 列為模考的標準分。一組學校歷年數學、語文和化學一模總體成績分別為0.76、0.67 和0.67,總體的增值估計分別為0.88、0.82 和0.99。二組學校歷年一模總體成績分別為0.21、0.20 和0.21,總體的增值估計分別為0.48、0.46 和0.62。三組學校歷年一模總體成績分別為?0.34、?0.32 和?0.53,總體的增值估計分別為0.08、0.06 和0.01。四組學校歷年一模總體成績分別為?1.30、?1.17 和?1.52,總體的增值分別為?0.65、?0.61 和?0.71。根據二模成績計算的四類學校的學校增值估計和標準化的平均成績的情況與一模類似。
圖15 和圖16 的趨勢顯示得更加清晰,可以看出三組學校盡管模考成績低于平均水平,但學校對學生成績的增值大于零。
2. 不同增值學校的教師參與教研的情況
根據2016—2019 年學校對學生的平均增值情況,我們將學校分為兩類:在相應學科上增值大于0 的學校、在相應學科上增值小于0 的學校。表13 反映了來自增值大于0 和增值小于0 的學校的不同學科教師的區級教研(形式)參與情況。結果表明,對于語文老師來說,高增值學校的語文教師參與“分享自己的優秀經驗及成果”的活動頻率要顯著高于低增值學校語文教師。對于化學和數學教師而言,他們在“中心組成員活動”上的參與率差異達到顯著,高增值學校教師的參與率更高。

表11 2016—2019 四類學校的增值估計和標準分(一模)

表12 2016—2019 四類學校的增值估計和標準分(二模)

圖15 增值估計與一模標準分

圖16 增值估計與二模標準分

表13 學科與各增值學校教師參與率的交叉分析(區級教研—形式)
根據2016—2019 年學校對學生的平均增值情況,我們將學校分為兩類:在相應學科上增值大于0 的學校、在相應學科上增值小于0 的學校。表14 反映了來自增值大于0 和增值小于0 的學校的不同學科教師的區級教研(內容)參與情況。可以發現,高增值學校和低增值學校的教師在各項活動的參與率上無顯著差異。我們分析了不同組教師參與三類區級專題教研活動的差異,結果顯示學校增值大于0 和小于0 的教師,在各項上的參與率和參與程度都沒有顯著差異(結果沒有在正文中呈現)。

表14 學科與各增值學校教師參與率的交叉分析(區級教研—內容)
我們將校本教研分為兩個部分,一部分為較為組織化、結構化的校本教研活動,包括校內聽評課、集體備課、參與校本課程及其他教學輔助材料的開發以及接受專家指導(包括教研員、大學教學專家等);另一部分是非正式的教師個人交流,包括就教學中遇到的問題與同事進行研討、與同事討論某類學生的學業發展問題、與同事分享教學經驗與資源。表15 呈現的是來自增值大于0 和增值小于0 的學校的不同學科教師參與校本教研活動的情況。結果顯示,若單獨看校內聽評課、集體備課等校本教研活動的參與情況,兩類學校的教師沒有顯著差異。從正式和非正式兩類校本教研活動的平均參與水平來看,增值大于0 的學校的教師參與水平顯著高于增值小于0 的學校的教師。
1. 教師增值的估計
在評估教師對學生增值成績帶來的影響時,我們使用的是模型二。首先,我們根據學生嵌套于班級和學校的數據結構,建立學校、教師和學生的三層零模型。其次,加入學生的前測成績、學生畢業年份、文理科等來看變化情況。表16 為調整前零模型和調整后增值模型的ICC 變化情況。根據零模型,樣本學生數學和語文模考成績差異有54.9%和47.2%可由校際間的差異來解釋,有65.7%和55.2%可由包括學校差異在內的教師間的差異來解釋,有10.9%和8.1%可由學校內部教師間的差異來解釋。在加入了學生前測成績等控制變量之后,可以由學校之間的差異解釋的部分降低13.4%和15.5%,可以由包括學校差異在內的教師間差異解釋的部分降低14.5%和15.1%,可以由學校內部教師間差異解釋的部分降低20.3%和12.7%。

表15 學科與各增值學校教師參與率的交叉分析(校本教研)

表16 調整前零模型和調整后增值模型的ICC 變化情況
表17 是四類學校的教師增值評價結果和標準化之后的平均成績。第1、2 列和4、5 列為四組學校平均的教師增值分,第3、6 列為模考的標準分。根據有效分析樣本,一組學校2016—2019 年平均數學一模成績為0.771,根據學校隨機效應模型估計的教師增值分為0.010,根據學校固定效應模型估計的教師增值分為0.056。二組學校歷年數學一模總體成績為0.206,學校隨機和固定效應模型的教師增值分估計分別為0.006 和?0.001。三組學校包括歷年數學一模總體成績為?0.274,學校隨機和固定效應模型的教師增值分估計分別為0.002 和?0.004。四組學校歷年數學一模總體成績為?1.225,學校隨機和固定效應模型的教師增值分估計分別為?0.022 和?0.011。

表17 2016—2019 四類學校的平均成績和教師增值估計
學校隨機和固定效應模型估計存在一定的差異,其原因在于學校固定效應模型是基于學校內部同一門學科的教師所教學生增值成績的差異來估計教師增值分。從圖17 和圖18 來看,兩種模型估計的教師增值分趨勢更加明顯。根據學校隨機效應模型分析的結果,三門學科趨勢較為相似:前三組學校的平均教師增值為正,第四組為負。根據學校固定效應模型分析的結果,三門學科存在一定差異。就數學來看,第一組學校的平均教師增值為正,其他幾組學校都小于零,且第一組學校校內的數學教師增值分差異較大,超過根據學校隨機效應模型分析的同一組各學校平均的教師增值分。語文、化學學科存在著類似的情況:第一組學校和第三組學校內部語文教師增值分的差異要超過同一組各學校平均的教師增值分,而化學學科則出現在第三組。在第四組學校,根據學校隨機效應模型估計的教師平均增值分與根據學校固定效應模型估計的教師平均增值分在?0.01 到0.02 上下,趨勢較為接近,校內教師之間的差異要小于同一組的學校之間的差異。由于學校固定效應模型可以排除學校層面以及學生群體層面(例如平均成績)的干擾因素,因此,在估計教師專業發展對學生成績的增值作用時,我們最終選擇了帶學生前測成績的學校固定效應模型。
2. 教師增值估計與專業特征之間的關系
首先,基于調查問卷中的教師個人和專業背景特征,我們分析了教師增值分數和教師個人、專業特征之間的關系。表18 根據上文不同類型教師參與區級教研活動的差異分析結果,選擇與教學實踐和教研參與程度較為相關的一組教師個人和專業特征,分析這些教師個人和專業特征與教師增值估計之間的關系。結果顯示,骨干教師、學科帶頭人,市/國家研究課、教學設計、教學展示獲獎教師與教師增值分顯著正相關,也即這幾類教師給學生帶來的增值影響高于其他教師群體。

圖17 教師增值評價(一模)

圖18 教師增值評價(二模)

表18 教師個人和專業特征與教師增值估計的關系
3. 不同增值教師參與教研的情況
根據教師增值分數的高低,我們將教師分為增值分大于0 和增值分小于0 的兩組,然后再根據不同學科和考試類型將教師增值分作五等分,進一步將教師分為最低20% 組、中等60% 組和最高20%組,分析不同組教師教研活動的參與程度。表19 為不同增值組的教師參與區級常規教研活動的情況。

表19 教師增值與區級常規教研活動參與情況
整體來看,按照增值分大于0 和小于0 分成的兩組,兩類教師群體參與度不存在統計上顯著的差異。就兩個群體教師區級常規教研活動的參與率來看,增值分高于0 的教師在幾乎所有活動類型上的參與率都要高于增值分低于0 的教師。根據增值最低20%,中間60%和最高20%分為三組,三類教師在研究課、課題項目研討、中心組成員活動、學術會議和分享經驗及成果幾類區級常規教研活動的參與率上具有顯著的差異,高增值的教師組參與率高于中、低增值的教師組。在其余各類活動的參與率上,三組教師不存在顯著差異。從參與率的數值來看,高增值的教師組在各類區級教研活動的參與率基本都高于中、低增值的教師組。
表20 為不同增值組的教師參與專題教研活動的情況。結果顯示,增值分高于0 的教師在基于學科能力表現的教學改進和深度學習兩類項目的參與率上顯著高于增值分低于0 的教師。盡管不顯著,但增值高分于0 的教師參與考試評價的程度也相對較高。在將教師分為三組后,結果顯示中、低增值組教師的參與率較為相近,在考試評價和深度學習上中間組略低,而高增值組教師在三項活動中的參與率都高于中、低組教師。

表20 教師增值與區級專題教研活動參與情況
表21 呈現的是增值大于0 和增值小于0 的兩類教師的參與校本教研活動的情況。由結果可知,不同增值的教師在各校本教研具體項目上的參與率沒有顯著差異。但從數值上看,在個別項目上大于0 的教師要比小于0 的教師略高,高增值的教師參與率也更高。

表21 教師增值與校本教研活動參與情況
表22 將校本教研分為正式和非正式的校本教研兩類,結果顯示,增值分大于0 的教師在兩項上的參與程度都要大于增值分小于0 的教師,而高增值教師在參與度上略高于中、低增值教師,但不存在顯著的差異。

表22 教師增值與校本教研活動參與情況(正式和非正式)
本節我們通過學生的選課信息將教師問卷數據與該教師所教授的學生的成績數據進行匹配,建立了包含學生中考、模考成績和任課教師信息的數據。根據這個數據,我們可以在考慮了教師個人和專業特征信息的情況下,探索教師專業發展活動參與情況與學生的成績增值之間的關系。在“模型三”的基礎之上,我們建立模型四如下:

其中, Yijst是s 學校中j 教師所教的t 屆畢業學生i 的出口成績(模考成績), Yijst?1是學生i 的滯后分數(中考成績)。 PDjst為學校s 的教師j 參加教研活動的頻率,其系數 β2也是本節關注的核心估計值。在回歸分析中,本文對每位教師參與區級教研活動的頻率做平均值處理,得到每位教師參與教研活動的平均參與程度。教研活動仍舊分為區級教研活動和校本教研活動兩類。區級教研包括區級常規教研活動、區級專題教研活動以及有效的教師專業發展活動,其中常規教研活動組織形式和內容包括平均參與程度以及每一項活動的參與程度;校本教研包括校本教研平均參與程度、正式和非正式校本教研的參與程度。
表23 中每一個系數都是回歸分析結果中我們所關注的自變量(區級教研活動參與頻率)與結果變量(學生成績增值)的關系,括號中為標準差。每一個回歸都控制了教師個人和專業特征,包括性別、學歷、與學校的勞動關系、職稱、教齡、學校職務、獎勵和榮譽等。結果顯示,區級常規教研、蘊含有效專業發展特征的區級常規教研、專題教研以及獲得教研員個性化指導的頻率與學生的成績增值有顯著的正向關系。其中,專題教研活動中的“基于學科能力表現的教學改進”和“考試評價研討”項目與學生成績的正向關系尤其顯著。而蘊含有效專業發展活動的要素都不同程度地起到了積極的作用,尤以“聚焦課程內容”和“專家指導支持”最為穩定。表24 是基于二模成績為出口成績的回歸結果,其整體趨勢與表23 基于一模成績為出口成績的回歸結果接近。

表23 區級教研參與程度對學生成績增值的影響(一模考試)
表25 同樣也顯示了每一個回歸分析結果中我們關注的區級常規教研活動參與程度和學生成績增值之間的關系。分析采用的是學校固定效應模型,將一模考試、二模考試成績作為結果變量,中考成績作為前測成績,控制變量不變,主要關注區級常規教研活動每一項活動與學生成績增值之間的關系。總的來看,“學科課程整合開發”“學科核心知識和思想方法的理解”“學科關鍵問題的確定與解決”以及“單元整體教學”幾項聚焦于學科內容的教研活動對學生成績的增值作用尤其顯著。
表26 為校本教研參與程度與學生成績之間關系的分析結果,同樣只顯示了每一個回歸結果中專業發展活動參與頻率的系數。第1、2 列為OLS 分析結果,第3、4 列為學校固定效應模型分析結果。結果顯示,校本教研活動的平均參與程度、教師之間正式和非正式的交流與學生的成績增值有顯著的正向關系。根據問卷中7 項校本教研活動的結果來看,參與校本課程教輔材料開發和接受專家指導對學生成績增值有積極作用。同時,非正式的交流也不容忽視。教師與同事研討教學問題、學生發展問題、分享教學經驗和資源等都對學生成績的增值有顯著且較為穩定的積極影響。

表24 區級教研參與程度對學生成績增值的影響(二模考試)

表25 區級常規教研參與程度對學生考試成績增值的影響(分項目)

表26 校本教研參與程度對學生考試成績增值的影響
本研究聚焦具有中國特色的區縣基礎教育教學研究體系,基于北京市海淀區2016—2019 年高中階段學生及其任課教師、所在學校相匹配的數據,通過建構教師專業發展對學生成績影響的概念框架,采用增值模型、多層線性模型和結構方程模型,將區域教研活動分為組織、內容、有效性等多個維度,從教師個人特征、教學實踐、自我效能、學生成績等角度分析區域教研對教師和學生學業成績的影響。研究結果顯示,教研活動參與和教師的教學實踐、自我效能、學生的成績等存在多維度和多層面的關系,同時我們也可以發現,目前的教研活動對教師和學生的影響朝著探究性和以學生為中心的學習方式變革的方向轉變。
首先,本文從教師專業發展活動對教師影響的角度出發,分析了教研活動的參與程度與課堂教學實踐、學生評價策略的使用和教師自我效能評價的關系。總體上,區級教研活動參與度較高的教師,在其課堂教學過程中組織學生深度參與體驗性、探究性學習活動的水平更高,更傾向于在教學過程中向學生提出具有挑戰性的問題、培養學生的批判性思維以及給學生更多思考、討論和表達的機會,在評價學生的時候更多地使用讓學生反思評估自己和現場評估并給予反饋的評價策略。
其次,考慮到不同類型的教師專業發展活動所開展的目標群體有差異,因此參與不同類型教研活動的教師也存在差異,因此本文進一步分析了教師的個人、學術和專業背景與區級教研活動參與情況之間的關系。結果顯示,整體上擁有研究生學歷的教師、資深教師、學科帶頭人以及獲得教學設計、展示等獎勵的教師參與區級常規教研、專題教研和校本教研活動的程度較高。其中,獲得教學設計、展示獎勵的教師在幾乎所有類型的教研活動的參與度上都顯著高于其他教師。對教師特征與教師教學實踐、自我效能和評價策略使用的分析結果顯示,學科帶頭人和獲得教學設計、展示獎勵的教師在多種教學實踐和學生評價策略的使用上顯著高于其他教師群體。
再次,作為我國三級教研中的重要一級,校本教研是基層學校應用最為廣泛的教師專業發展制度之一,因此區級教研與校本教研活動之間的關系也值得關注。本文的分析結果顯示,區級教研活動與校本教研活動的參與程度之間存在著十分顯著且穩定的正相關關系,尤其是在接受專家指導和參與校本課程、教輔材料開發這兩項活動上。在與同事研討教學問題、學生發展問題、分享教學經驗與資源等非正式交流活動方面,則區級教研活動的參與程度相關性較低。
此外,對校本教研中介作用的分析顯示,校本教研本身對教學實踐有顯著的正向作用,而且能夠起到中介作用,即區級教研通過影響教師校本教研的參與程度,間接影響教師教學實踐。值得注意的是,一些區級教研活動與教學實踐之間的直接路徑并不顯著,但能夠通過校本教研表現出中介效應(如學科能力、深度學習等)。對此,以往研究認為的可能解釋:一是可能存在遮掩效應(suppressing effects),即間接效應的方向和直接效應的方向相反,使得總效應被遮掩;二是可能存在另外的中介路徑,其間接效應大小與校本教研的間接效應接近但方向不同,從而造成總效應不顯著(MacKinnon,Krull,& Lockwood,2000;Zhao et al.,2010)。由于數據限制,我們無法對更多可能的中介變量進行考察,進一步的原因有待今后研究進一步厘清。
根據學生成績與學校、教師的匹配數據,我們分別估計了學校和教師對學生成績的增值作用,在此基礎上根據學校和教師增值估計結果進行分組,分析不同組別教師教研活動的參與程度。首先,基于學校增值估計結果分為在相應學科上增值大于0 的學校、在相應學科上增值小于0 的學校,分析不同組別教師的教研活動參與程度差異。結果顯示,高、低增值組學校的教師在大部分區級常規教研、專題教研和校本教研活動的參與程度上均較高。其中,高增值學校教師在中心組成員活動、各類學術會議等研究性活動以及分享經驗成果方面的參與度較高,同時高增值學校教師參與正式和非正式兩類校本教研活動的程度較高。
其次,基于教師增值估計結果分為增值最低的20%、中間的60%和最高的20%三組教師,分析不同組別教師的教研活動參與程度的差異。結果顯示,高增值組的教師在以下活動的參與程度上高于中、低增值組教師:研究課、課題項目研討、中心組成員活動、學術會議和分享經驗及成果等區級常規教研活動;學科能力和深度學習兩類區級專題教研活動;正式和非正式校本教研活動。
再次,從學生成績增值估計的結果來看,聚焦于學科內容的教研活動對學生成績的增值作用尤其顯著。就常規教研活動來看,學科課程整合開發、學科核心知識和思想方法的理解、學科關鍵問題的確定與解決以及單元整體教學等聚焦于學科內容的教研活動對學生成績的增值作用尤其顯著。就蘊含有效專業發展特征的活動來看,四類教研活動都不同程度地起到了積極的作用,尤以聚焦課程內容、專家指導支持這兩項最為穩定。就區級專題教研活動來看,學科能力和考試評價項目與學生成績的正向關系尤其顯著。就校本教研活動來看,校本教研活動的平均參與程度,尤其是參與校本課程及教輔材料開發和接受專家指導對學生成績增值有積極作用。同時,教師之間非正式的交流也不容忽視,教師與同事研討教學問題、學生發展問題、分享教學經驗和資源都對學生成績的增值有顯著且較為穩定的積極影響。
調查問卷中關于教師問卷的分析結果給予我們如下的啟示:一是教師所參與的教研活動主要集中在傳統的教學及學科領域,相對而言教師對信息技術和跨學科能力等方面內容的職前準備和職后培訓需求較弱,這可能與學校目前的需求和考評方式相關。在教研方面預先規劃相關內容有助于推動信息技術背景下分層、跨學科、多元和個性化教育教學的推進。二是隨著越來越多高學歷非師范專業的人才進入教師行業,如何充分利用高學歷人才優勢,在夯實教學技能基礎的同時發展研究型教學力量,這是教研當前面臨的現實挑戰。三是教師問卷數據顯示,學校層面在資金補償、根據教研活動適當減少工作量這些方面支持不足。此外,多數教師認為學校的考核、評價、晉升、職業規劃等方面未能很好地銜接教師專業發展。OECD 國家教師專業發展的相關分析顯示,大部分OECD 國家的教師專業發展均與教師職稱晉升、薪酬等激勵掛鉤或相關,許多歐洲國家打通了教育相關部門、社會福利部門及服務機構、慈善機構及協會、地方政府及學校等渠道,全流程為教師專業發展提供特定的如人際關系、心理健康等方面的支持。這為我國教研系統的發展提供了參考。
1. 研究方法的反思
由于本文的核心數據是學生成績、選課等行政管理數據和教師問卷數據,因此只能夠采用事后回溯的方式,對教師專業發展活動進行影響評價,最終形成的分析數據除了以學生中考成績為前測數據外,其余衡量教師知識技能、價值態度、教學實踐策略的變量皆為橫截面數據,即同一個時間點采集的數據。因此,本文雖然能夠估計學校和教師對學生的增值影響,但只能夠基于橫截面數據分析教研活動參與度、課堂教學行為、教師自我效能與學生成績之間的相關關系,而不是因果機制。如果條件允許,最佳的方式是從項目開始時就進行跟蹤評價,采集項目開始前的基線數據、項目開始之后的過程數據以及項目的結果數據。為了能夠準確評估教師專業發展活動對學生學習和學業成績的影響并揭示其機制和影響路徑,未來的研究可考慮以教師專業發展活動的實驗研究為設計框架,由學科教師、教研員、學科教學專家以及項目評估專家共同參與,對項目進行基線、過程以及結果全程跟蹤,嘗試收集多維度的教師數據(例如教研活動的日志、課堂錄像、課例分析記錄等),結合學生和教師基線和結果測評數據,更好地探索教師專業發展活動是如何影響學生學習和學業成績的問題。
如果按照Borko(2004)的三階段分類,本文還處于第一階段,并嘗試向第二階段過渡。第一階段的研究聚焦于項目本身和作為學習者的教師之間的關系,主要目的是確認項目專業發展活動是否有效。從第二階段開始,研究主要目的是確認同樣的專業發展活動在不同的情景下由不同的培訓者實施的時候是否能夠保持有效性。這一階段可以加入隨機實驗設計的元素:(1)為了能夠更加客觀地評價某一類教師專業發展活動給學生帶來的影響,最佳的方式是采用實驗組和對照組的方式,也就是控制實驗的方式,將參與此類專業發展活動的教師與不參與的教師自身的情況及其授課學生的情況進行比較,以得出專業發展活動的真正效果;(2)為了能夠評估不同的組織方式的有效性,可以保持專業發展活動的一部分要素不變(例如項目內容),在不同的學校和教師群體采用不同的培訓方式(例如線上和線下),以測試不同的學習組織方式的有效性。
2. 分析框架的反思
Desimone(2009)在回顧以往研究的基礎上梳理總結的“教師專業發展通過影響和改變教師知識、技能、觀念和態度,最終影響學生學習”的分析框架能夠幫助研究者更加清晰地定義有效專業發展活動的要素,并基于該定義進行數據收集,以便進一步分析和比較不同專業發展活動的有效性。該分析框架被廣泛接受的原因之一是,20 世紀90 年代末到21 世紀初開始的學校問責制度改革以及對符合科學標準的研究(scientifically based research)的重視,使得20 世紀八九十年代更加強調情境、背景和體系的教師專業發展研究轉向了更加強調影響和因果分析的實證研究。然而,教師的角色是多樣的,教師的工作是多方面的,并且受到相互沖突的理想和觀念的驅動,因此某一項專業發展活動往往只能解決其中一個方面的問題,并沒有一個單一或統一的教師教學和學習理論能夠全方位解釋專業發展活動的影響機制。
有許多研究者認為,依據“過程—產出”的邏輯建立起來的框架過于線性,無法充分反應專業發展活動如何促進和實現教師學習和變化的復雜性。Opfer et al. (2011)認為,基于該框架的專業發展有效性研究僅簡單地將可見、可測的專業發展活動要素(例如活動的組織形式、結構、內容、強度等)直接與可測量的教師和學生的變化聯系在一起,并沒有真正解釋其因果。作者認為專業發展活動研究應該圍繞“教師專業學習”(teacher professional learning)來展開。教師學習是一個同時發生在教師個人層面、教師群體層面和年級、學校機構層面的復雜的、系統的過程,而不是一次性的事件。因此,研究不僅需要關注什么樣的專業發展活動是有效的,也需要關注教師個人的知識、信念、實踐和經歷對專業發展活動有效性的影響,以及從教師參與專業發展活動到其信念、知識、實踐的轉變這一過程并非線性發生的,而是相互作用和影響的。
Kennedy (2016)則認為,“行動理論”(theory of action)能夠更好地分析和解釋專業發展活動的影響機制。作者回顧了從1975 年至2015 年的教師專業發展有效性研究,發現一些被廣泛認可的專業發展活動特征并不一定始終有效,有時候過度強調某一個方面反而會產生消極的影響。專業發展活動是否有效還取決于其他維度。基于行動理論,作者將專業發展活動按照要解決的教學實踐問題和通過什么策略促使教師去改變這兩個方面進行了重新歸類,并將行動目的和策略這兩個維度與項目特征相結合,發現能夠更好地解釋專業發展活動如何影響教師的學習,進而改變其教學實踐。盡管基于不同的理論,但是強調專業發展需要圍繞“教師專業學習”和圍繞“行動理論”的兩派研究者都強調教師的動機和對專業發展抱持的態度,對最終的效果有關鍵的影響。就目前的教師專業發展有效性的實證研究框架來看,大部分研究著重于專業發展活動本身的設計和實施對教師教學和學生學習的影響,而并未考慮教師個人的動機和意愿、專業共同體的觀念和行為對專業發展有效性的影響。
無論是基于“過程—產出”的有效性分析,還是圍繞“教師專業學習”或“行動理論”解釋其作用機制,目前教師專業發展的實證研究更加關注學生和作為學習者的教師是如何學習的,以及如何支持和實現學習,但卻很少關注教師培訓者。國內關于教師培訓者包括教研員和教研體系在內的研究已有一定積累,能夠為其他國家在這一方面的研究提供經驗和借鑒。而另一方面,有學者在回顧我國教研制度的相關研究之后指出,我國教研制度所發揮的實際功能與對它的理論解釋比照懸殊,關于教研組織的“本體論”研究稀缺(叢立新,2011)。也有學者指出,盡管建國以來我國基礎教育發展的研究文獻積累豐富,但缺乏對教研制度的關注。為數不多的教研專題研究更加偏向于對教研工作中存在的問題和如何發揮作用進行闡述,缺乏對教研制度發展和特點的全面系統的研究(梁威等,2011)。隨著我國基礎教育改革和中小學課改的不斷發展,教研體系越來越成為推進課程教學改革、提高教學質量和教師專業發展的核心力量,對教研制度的專業化、規范化和科學化的需求在不斷加強,而這也將促進對教研支持教師專業發展的實證研究,推進與國際教師專業發展研究的接軌。
(本文的研究團隊成員包括:海淀區教師進修學校羅濱、林秀艷、姚守梅、王夢、張榮慧、王帥鳴、王思南、楊智君;北京大學中國教育財政科學研究所黃曉婷、魏易、黃珍;溫州市教育評估院劉舒暢。在此感謝所有團隊成員所作的努力和貢獻。)