王志國
問題背景
教育質量綜合評價改革是一項涉及面廣、專業性強的系統工程。提高教育質量是《國家中長期教育改革和發展規劃綱要(2010-2020年)》的戰略目標之一。2013年6月教育部發出文件《教育部關于推進中小學教育質量綜合評價改革的意見》(教基[2013]2)(下簡稱《意見》)中提出了教育質量綜合評價的5個方面20項關鍵性指標。不僅有學業水平發展的,還有非學業水平發展的。學業發展水平的評價是大家比較熟悉的領域,但也是綜合評價改革的一個重點和難點。學業發展水平不僅僅是學業成績,還包括學生的情感、態度與價值觀;不僅僅只有知識和技能,還要能測量出學科思想方法、實踐能力、創新意識。綜合評價著眼于整體而非單個方面的教育質量狀況,評價結果涵蓋了學生的德智體美等各個方面的發展狀況,以及影響學生發展的相關因素,如學校師資狀況、課程教學狀況、學校管理狀況等。這次改革的指導思想,就是要貫徹黨的教育方針,落實立德樹人根本任務,遵循學生身心發展規律和教育教學規律,促進素質教育深入實施。改革的總體思路,主要是“強化導向,促進發展,協同推進”。《意見》強調要改革評價方式,要通過直接考查學生群體的發展情況評價學校的教育質量,注重全面客觀地收集信息。我們知道,教育質量評價要做兩件事:一是建立健全中小學教育質量綜合評價體系,包括建立綜合評價指標框架、健全評價標準、改進評價方式方法、科學運用評價結果等;二是運用一定的方法進行評價。從培養學生全面發展的角度出發,為了實現對學校的全面客觀公正的評價,本文嘗試構建科學的、綜合的中小學教育質量評價指標。一方面,加強并充實對素質教育重要方面的評價,為評價提供多元的參照標準,建立健全教育質量評價指標體系;另一方面,使用研制出的指標對東城區及區域內各中小學校教育質量進行全面、深入的評價,認識教育質量現狀,了解教育中存在的問題,引導社會、學校、教師和家長更加關注學生綜合素質的培養,促進學生德智體美各方面的全面發展。
綜合評價指標
首先將教育質量綜合評價的指標框架的5大方面20個關鍵指標,進行了整合,分為學業發展水平、非學業發展水平和學業負擔三大方面,形成具有東城區特色的評價指標體系。并圍繞該指標體系設計六項指數。
1. 學業水平指數
首先我們必須承認,中高考是教育質量評價的重要方式,知識技能素養是衡量學生質量的一個重要方面,即使教育質量觀在不斷更新,教育質量評價內容越來越全面、廣泛,我們也不可否認,學生的學業成績始終是評價教育質量的關鍵內容。國際測評項目如 PISA、TIMSS 等都對學生進行了學科測試。但是其主要以單一的考試分數、學校升學率作為評價學生、評價學校的依據。在簡捷有效地選拔人才的同時也引發了一系列的問題。在新的高考改革方案中,改革的重點是高考錄取實行“兩依據、一參考”綜合評價方案。為了突出學業水平發展狀況,并扭轉長期以來單純使用學生學業考試成績作為教育質量評價的唯一指標的弊端,本文設計學業水平成績,并僅作為教育質量評價的指標之一,反映教育質量的一個方面。學業發展水平又細分為知識技能、學科思想方法、創新意識、實踐能力。前三項我們通過考試成績來量化,實踐能力我們將研發問卷,達到量化的效果。考試成績數據我們將會利用現有中高考成績,會考成績或是一模成績,不再單獨設置考試,以減輕學校和學生負擔。學業水平指數是將考試成績轉化為 T 分數后的各學科 T 分數的加權平均數(其中權重設置為課時比)的90%和實踐能力維度T分數的10%構成。學業水平指數高,代表學生的學業成績好,學科素養高,學校重視學科教學,關注中高考成績。
2. 非學業素養指數
教育改革發展的重點是促進學生全面發展,著力提高學生服務國家服務人民的社會責任感、勇于探索的創新精神和善于解決問題的實踐能力。在全面發展的教育質量觀指導下設置非學業素養指數,是為了衡量學校對學生除學業素質以外所有素養的提升所做的努力程度。非學業素養指數是將學生品德發展、身心發展和興趣特長養成三個維度的得分轉化為 T 分數后的算數平均數(或加權平均數)。這三個方面的發展,關注的群體有所不同,比如品德可能是社會最關注的,身心發展應該是家長最關注的,而興趣特長可能是孩子自己比較關注的,三者的比重是否應該一樣,我們還需要探索。本指數的設計是想引導社會、對學校和家長,不僅要關注學生的學業成績,也要重視學生的非學業素養,打破單一考試論英雄的狀態。非學業素養指數高,代表學生的全面發展水平高,學校關注學生的全面發展,重視學生除學業素養以外的整體素質提升。
3. 學業產出指數
學業負擔本身不是教育質量的組成部分,而是取得教育質量的付出。《意見》倡導“減輕中小學生過重的課業負擔”,倡導“高質、低負”的教育教學模式和經驗,提高課堂教學效率,使學生以輕松飽滿的狀態投入到日常學習中。學校教育不僅要使學生獲得良好的學業成績,還要減輕學生的學業負擔和學習痛苦,促進學生健康、快樂的學習與成長。現在我們都在提倡減負,那么是不是學生負擔越輕越好?肯定不是,自古就有“書山有路勤為徑,學海無涯苦作舟”“一分辛勞一分才”等說法。當然過重也不行,不能損害學生的身心健康。既不能太輕也不能太重,所以我們關注在同樣的付出下,學生獲取成績的效率,設置學業產出指數。學業產出是將兩者相結合,既關注學生的學業產出,也關注其時間投入、學生的學習壓力和感受。學業產出指數是學生的學業水平指數與學業壓力水平維度分數轉化為 T 分數后之比。學業產出指數大,代表學生在每個學業壓力上所得的學業成績高,意味著學生是在快樂的學習,輕松的學習,幸福的學習。
4. 相關指數
《意見》指出,綜合考查學生發展情況,既要關注學業水平,也要關注學生的品德發展、實踐能力提高、身心發展和興趣特長等學生綜合素質的考查。在引入非學業素養后,它與學業水平之間會產生什么樣的關系?促進了還是拖后腿了,或者是沒什么關系,要用數據說話。不能強調了非學業素養,就忽略了學業成績。目前二者是什么關系還不能確定,應該還不至于到負相關,但是這也很難說,因為學習時間是有限的,非學業類也需要花費時間,那就要看產出效率。如果通過非學業發展,身心健康了,精神愉悅了,產出效率自然就高了,那么學業成績就會提高。我們需要證據,來對學業和非學業之間進行平衡,于是設置相關指數。相關指數就是統計學中的相關系數。根據相關系數值的大小,一般相關系數值在-1到1之間,可確定相關關系。系數大于零是正相關,系數小于零是負相關,系數等于零則是零相關。系數的絕度值越接近于1,相關性就越強。
5. 分化指數
兩極分化對大部分教師來說是個永恒的話題,隨著東城區“就近入學”和“校額到校”等一系列招生制度的改革不斷推進,很多教師已經感覺到了分化越來越嚴重,分化起始年級越來越低的現象。防止兩極分化,促進學生均衡發展是學校教育任務之一。那么到底分化到了什么程度,我們需要數據來呈現,于是設置分化指數。借用經濟學中的洛倫茲曲線來定義分化指數。將橫軸設為累計學生百分比,縱軸設為累計學生學業成績百分比。洛倫茲曲線與完全不分化的直線型的洛倫茲曲線構成的面積和完全分化的折線型的洛倫茲曲線與完全不分化的直線型的洛倫茲曲線構成的面積之比,定義為我們的分化指數。一般來講,洛倫茲曲線彎曲程度越大,分化越嚴重。
6. 進步指數
2005 年《全民教育全球監測報告》中提到:評估教育的輸出質量,即學生的質量,如果忽略了學生最初的差異可能會產生誤導。陳玉琨教授也曾建議在基礎教育質量監控體系當中,要關注學校給學生作了多少貢獻,而不是學生的絕對水平。因此,在評價教育的輸出質量,應考慮學生的基線水平,設置進步指數。進步指數是當年學業水平成績指數與基準年份學業水平成績指數比值和當年非學業素養指數與基準年份非學業素養指數比值的算術平均數(加權平均數)。進步指數以本校已有的教育質量為基線,通過縱向數據比較,考查教育質量的提升,學生整體發展狀況增量的指數。進步指數是學校對學生提供需要的能力及其變化的工具。進步指數越大,意味著學校教育的增量越大,學校提供學生需要的能力越強。
評價結果
以學業發展水平、非學業發展水平和學業負擔三個方面為核心,用六個指數來衡量,從綜合的角度出發,關注學校發展的整體水平。難點在非學業水平測試工具的研發。核心的技術就是數據分析。我們是從學校和學區兩個層級來進行。本評價指標能有效扭轉單純使用學業成績作為評價教育質量的唯一指標現象,可以很好的區分這三類學校。第一,有的學校不僅學業成績高,在其他多個指標上結果都很好,這樣的學校是全面提升教育質量的結果,要引導、鼓勵學校辦這樣的教育。第二,有的學校學業成績優異,但在其他指標上結果呈現并不好,這樣的辦學理念不是正確的教育質量觀,單純學業成績高的學校更加沒有必要炫耀。第三,有的學校學業成績僅處于中等水平,但是其他指標結果卻很好,這樣的學校是高教育質量的,如果單純使用學業成績評價教育質量,這些高質量的學校只能被失誤地排除在外。
教育質量綜合評價的最終目的不是對各學校過去所取得成績進行甄別和排序,而是幫助各學校認清自身的教育現狀、發現教育教學中亟需解決的問題和自身發展的瓶頸,找到未來發展的方向,是為教育決策部門提供科學的依據和有針對性地改進建議,引導正確的教育質量觀。切實做到以評價促發展的宗旨,推動了中小學提高教育教學質量以及特色辦學。
(作者單位:北京市東城區教育研修學院督導評價中心)