張 娟 許志勇
(天津市教育招生考試院,天津 300687)
教育評價事關教育發展方向,是教育辦學的“指揮棒”,其中教學質量評價是教育評價的重要組成部分。實施教學質量評價,一是指導學校教育教學管理,對學校發展具有積極作用;二是調動各學科教師的積極性,對教師團隊發展具有督導作用;三是促進學生綜合發展,對學生全面發展具有導向作用。
目前,許多學者和研究機構都在積極探索教學質量評價,研究方向主要集中在三個方面:一是以政策落實為目標,探索教學質量評價抓手。郭朝紅和王彬(2021)[1]基于國際經驗及國家對普通高中教育評價改革的政策目標和要求,探討了普通高中教育評價的質量標準,提出了關注差異、強化過程,探索增值、聚焦進步的建議,設計了數據驅動、滾動評估的評價思路。雷新勇(2020)[2]認為教學評價要考慮學生的成績和綜合素質,綜合素質評價是對學生在思想品德、身心健康、興趣特長、社會實踐、勞動實踐等方面的行為評價。二是以解決問題為導向,探索教學質量評價指標維度。喬春江和張靜(2010)[3]探索構建區域初中教學質量評價體系,通過對學校教學實施綜合過程管理、會考和中考成績、學校報考率的量化考核來評價教學質量。三是以客觀評價為依據,探索教學質量評價方法。在評價方法的探索上,裴少婧和蘇雅(2021)[4]構建高校教學質量評價指標體系,并采用層次分析法對評價指標進行量化,使用模糊綜合評判法完善高校教師教學質量的評價問題。
綜上,可以看出傳統的學校教學質量評價主要以學業成績和升學率為衡量標準,忽視了學生綜合素質和個性發展,也忽視了學校的努力,且計算方法傾向于分維度評價,對綜合評價模型的探索研究較少。本文旨在結合灰色關聯理論和TOPSIS 方法構建學校教學質量評價模型,運用相對距離衡量學校教學質量。
灰色關聯分析模型是灰色系統理論的核心之一,其基本方法是觀測序列曲線的幾何形狀,并依據幾何形狀的相似度判斷事物的聯系程度。幾何形狀越接近,說明序列之間的關聯度越大,反之越小。該方法自1982 年提出以來,在各行各業得到廣泛應用。
TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)法是一種逼近理想解排序法,常用于多目標決策分析。TOPSIS 法對數據分析資料要求低,且易于理解計算,因此在各領域拓展迅速且應用廣泛。TOPSIS 法的實質是根據實際情況與理想狀態之間的距離衡量被測事物的發展水平。但是,僅以距離作為尺度只能反映數據之間的位置關系,無法體現數據的動態變化。
基于此,將以上兩種方法結合使用,建立基于灰色關聯度法和TOPSIS 法的學校教學質量評價模型,綜合灰色關聯程度和歐式距離判斷理想和現實狀態的接近程度,從而對學校教學質量進行評價。
由于各指標的單位和含義不同,評價指標通常具有不同的量綱。為了消除不同量綱對分析結果的影響,建模前對所有指標進行無量綱化處理。

其中,xij表示第i 個評價對象的第j 個指標,m 表示參與評價對象總數,n 表示評價指標總數。
對指標進行無量綱化處理的公式為:

接著,對“成本型”指標進行正向化處理,正向化的處理公式為:

其中,x'ij為標準化后的值,x'j為需處理變量的所屬列值,max(x'j)表示該指標所屬列的最大值。
指標權重的確定方法主要有兩種:一是主觀賦權法,主要有德爾菲(專家調查)法、層次分析法(AHP)等,依賴于評價者的知識、經驗、直覺。二是客觀賦權法,主要有相關系數法、熵權法。主客觀賦權法各有優劣,主觀賦權法帶有很強的主觀性,客觀賦權法僅依賴于數據信息,得出的結論可能與經驗相悖。因此,本文在確定指標權重時使用主客觀賦權結合的方法。分析過程中,首先使用層次分析法、熵值法分別計算各指標權重,隨后將兩者乘積結果歸一化處理作為最終權重。
1.層次分析法
層次分析法(AHP)是將復雜問題分層,將其分解成多個目標,在此基礎上進行定性和定量分析。其依據專家主觀判斷,將所有變量兩兩互相比較,采用相對重要性排序尺度,構造重要性程度為1—9 的判斷矩陣,最終得出該方法確定的權重τ,構造方法如表1所示。

表1 判斷矩陣
2.熵值法
熵值法(Entropy Method)是很常用的客觀賦權方法。其通過計算信息熵,得出變異系數,評估變異程度,從而判斷指標權重的大小。一般來講,信息熵越大,差異系數越大,則權重越小。權重計算步驟如下:首先使用公式(2)、公式(3)對數據進行標準化和正向化處理,并確定比重;接著計算熵值ej=,并得出變異系數δj=1-ej;最后計算出客觀權重向量矩陣ν=(ν1,ν2,ν3,…,νj),1≤j≤n,其中νj=。
3.確定組合權重
通過上述方法分別得出主客觀權重后,將其進行歸一化處理,得出最終權重向量矩陣ω =(ω1,ω2,ω3,…,ωj),1≤j≤n,其中。



其中,ρ 為分辨系數,取值范圍為ρ ∈[0,1],通常取值為ρ=0.5。


根據灰色關聯度的相對貼近度大小,評價各學校的教學質量。
高中教育包含普通高中、成人高中和職業高中教育。其上承初中義務教育階段教育,下啟以大學教育為主的高等教育。同時,高中教育也承擔為社會培養合格人才的職責。因此,普通高中教育教學質量不能僅僅以升學率考量,更應注重學生的全面發展,承擔起提高全體公民素質的責任,因此用單一的變量和標準來評價學校的教學質量,不僅缺乏科學性、客觀性與公平性,還缺少對培養學生全面發展的引導。2020年《深化新時代教育評價改革總體方案》提出普通高中主要評價學生全面發展的培養情況。為了對每所學校做出更公平的評價,需要構建科學、合理的評價指標體系。
教學質量評價不僅需要計算學生的考試成績和升學率,還要衡量學生的成長和綜合素質,因此可以將教學質量評價劃分為學業考試成績和非學業問卷調查兩個子系統。本文依據《關于推進中小學教育質量綜合評價改革的意見》,對學校教學質量評價指標進行分析,建立了學業和非學業兩個一級指標,在兩個一級指標下建立若干個二級指標和三級指標(見表2)。

表2 教學質量評價指標體系
1.數據來源
本文以某地區2020 年高考考生為研究對象進行實證研究,剔除缺失的考生信息,共有6 所學校739名考生計入實證分析范圍。中、高考考試數據為高利害數據,為了保證考試數據的真實性,文中涉及的中、高考考試數據來源于該地區教育考試院。非學業問卷調查數據來源于該地區教育質量評估監測中心普通中小學辦學質量綠色評價項目。本文分析時使用了該項目的部分問卷數據,使用前檢驗問卷數據的信度系數克隆巴赫α =0.862,效度系數KMO=0.895(sig≈0.00<0.05,說明問卷數據的信度和效度較高,評價結果具有穩定性和可靠性)。
2.數據預處理
建模之前,數據預處理時將中、高考成績標準化,一方面可以解決中、高考成績滿分值不同的問題,另一方面可以消除兩次考試難度不同帶來的分析難題。將中、高考成績均標準化為均值為70、方差為10 的標準成績,處理后的成績數據均分布在0—100 之間,易于理解。
(1)學生中、高考成績處理
按照上述方法,將學生中考和高考成績作標準化處理,標準化計算公式如下:

(2)學生增值成績處理
學生增值成績主要衡量經過三年學習,學生是否獲得了學業進步。長期以來,我國學者積極探索增值評價,并取得很大進展。探索過程中,多層線性模型、殘差模型、SGP 學生成長模型等專業教育統計模型逐漸被熟知。但不同模型都有相似的衡量標準,即通過計算得出學生“出口成績”(高考成績)和“入口成績”(中考成績)的差值,用以判斷學生學習成長情況。本文將標準化高考成績與標準化中考成績的差值算作學生的增值成績,同時將增值成績也做均值為70、方差為10 的標準化處理,標準化計算公式如下:

(3)非學業問卷調查數據指標處理
非學業問卷調查數據主要以問卷調查的方式收集,該項目的問卷采用李克特五級量表形式設計,題目選項按照符合程度排序,“非常不符合”“比較不符合”“一般”“比較符合”“非常符合”五級量表分別使用1—5 代替。處理問卷數據時,將其轉化為數值型數據,并將每個二級指標中的三級指標作為該指標的作答結果。
數據預處理完成后,使用公式(2)、(3)進行指標無量綱化和“成本型”指標正向化處理。使用層次分析法確定主觀權重時,構造如表3 所示判斷矩陣,檢驗系數CR=0.088<0.1,一致性檢驗通過。同時使用熵值法確定客觀權重,最終得出最終權重矩陣,如表4 所示。確定權重后出按照上述建模步驟計算得出灰色關聯相對貼近度,分別計算各考生的綜合得分,評估各學校教學質量。

表3 層次分析法判斷矩陣

表4 各指標權重
使用上述建模方法,計算出每位考生的綜合得分及每所學校的綜合得分,如表5 所示。由表5 可知,該地區綜合評價得分為0.466,標準差為0.064。D、E兩所學校的平均分低于區域平均分,教學質量較差;B、D、E 三所學校的標準差大于區域標準差,說明該三所學校考生綜合得分離散程度較大。使用每所學校學生綜合得分的最小值、25%分位數、中位數、75%分位數和最大值作箱線圖,如圖1 所示。從圖1 可以看出,除D 學校外,其他五所學校的箱體位置相當,說明學校D的教學質量較差。F 學校的箱體長度小于其他學校,說明F 學校離散程度更小,成績更加均衡。C 學校和E學校箱體位置和長度相當,但E 學校成績上下限均大于C 學校,說明C 學校較E 學校成績更加均衡。同理,A學校、B 學校成績離散程度相當,但A 學校成績比C學校均衡。結合表5 數據也可驗證以上推論。

表5 不同學校綜合得分情況

圖1 不同學校綜合得分箱線圖
通過建立基于灰色關聯度法和TOPSIS 法的學校教學質量評價模型,綜合各維度教學數據評價學校教學質量,探索評價學校教學質量的新方法。新評價方法的應用為教學質量評價提供了新思路,該方法在評價教學質量過程中不僅計算了高考成績、增值成績等學業成績,還引入學生非學業數據,將各維度教學質量評價結果進行量化,一定程度上避免了傳統的“唯升學”“唯分數”的評價方法,能促進學校構建體現學生全面發展的教學體系,為推進“立德樹人”和“五育”全面發展教學目標提供動力。
此外,本文首次使用綜合評價法評價學校教學質量,存在一定缺點和不足。第一,從表4 最終指標權重數值可以看出,“增值成績”“人格品質”“科學素養”這三個指標權重值較小,不符合傳統認知。其原因可能有:①研究中雖然使用組合權重的方法確定最終權重,但實際計算的權重仍受數據客觀規律和客觀權重的影響。②“增值成績”的計算方法較為簡單,“人格品質”“科學素養”兩個指標收集的原始數據可能存在瑕疵。第二,由于此類評價方法的應用需要數據積累,因此在實際分析和計算時,缺少結果對比分析。以上缺點和不足,在接下來的研究中亟待解決。