任延青, 魚先鋒
(1.商丹高新學校,陜西,商洛 726000;2.商洛學院,數學與計算機應用學院, 陜西,商洛 726000)
中小學教學質量評價是師生教學的指揮棒,它直接決定師生教學行為。科學的教學質量評價可以充分調動師生的積極性,促進學生全面協調發展和教師教學水平提高,也可作為教師考核的重要依據。近年來,無論在理論還是實踐上,對課堂教學質量評價都有了較大的進展。2002年教育部《關于積極推進中小學評價與考試制度改革的通知》和《基礎教育課程改革綱要(試行)》是學生綜合素質評價的直接的政策依據[1]。2013年6月,教育部出臺《關于推進中小學教育質量綜合評價改革的意見》,規定包括學生品德發展水平、學業發展水平、身心發展水平、興趣特長養成、學業負擔狀況等五大方面20項關鍵指標的中小學綜合素質評價內容,并明確了評價的程序[2]。2014年9月3日國務院《關于深化考試招生制度改革的實施意見》明確了綜合素質評價與考試招生制度實行“硬掛鉤”。從上述政策的發布可見,我國對中小學生綜合素質評價的目的和定位由不明確變明確[3]。教學質量評價始終是學生綜合素質評價的核心內容之一。評價方法是評價體系的重要組成部分,在評價實施過程中扮演著重要的角色。如果說理念是評價的靈魂,決定著評價的性質和取向,那么技術和方法就是評價的骨骼,支撐和架構起評價的各相關因素,決定著評價完成的質量[4]。所以近年來很多教師和學者在中小學課堂教學評價方面進行了大量的研究工作[5-8]。但是,這些研究多重于定性分析缺少定量計算,多偏于手工評價沒有給出自動化實現模型與方法。現實評價中既有定性信息也有定量信息,人工評價費時費力且容易出錯。模糊評價可以有效地綜合定性與定量信息對評價對象進行更自然、客觀的描述和評價[9-12]。作者在充分研習國家教育方針政策、教育評測標準的基礎上,結合自身多年從教經驗,設計了中小學課堂教學評價指標體系,基于模糊計算基本理論建立了中小學課堂教學質量的模糊多級評價模型,結合定性與定量信息,自然、客觀地對課堂教學質量進行評價。結合實例做了課堂教學質量評價,結果顯示該模型客觀、高效且自動化程度高。
先給出模糊綜合評價的一些基本概念包括模糊集、模糊評價矩陣、權重、評價算子等。在此基礎上對模糊多級評價形式化建模給出一個普適的評價模型。
定義1[13]設X為經典集合,稱映射,A:X→[0,1]為X上的模糊集(Fuzzy set),?x∈X,A(x)稱為x對A的隸屬度,函數A也稱為模糊集A的隸屬函數。
在模糊評價過程中X是評價指標之集,A是評價等級,?x∈X,A(x)是指標x隸屬于評價等級A的可能性測度。隸屬度在[0,1]上取值,取值越大表明隸屬可能越大,即?x1,x2∈X,A(x1)≤A(x2)表示指標x1對評價等級A的隸屬程度不超過指標x2。一般地,隸屬度函數刻畫了評價對象對評價等級隸屬程度和隸屬程度相對大小2個屬性信息。
定義2 在一次模糊評價中,有m個評價指標,n個評價等級,則模糊評價矩陣為
(1)
其中,?rij,rij∈[0,1]表示第i個評價指標對第j個評價等級的隸屬度。初級評價矩陣一般由原始評價數據模糊化得到。原始評價數據為
(2)


權重可以通過特爾斐法、層次分析法、二項系數法、變異系數法、主成分分析法等方法獲得[14]。
定義4 在一次模糊評價中,有m個評價指標n個評價等級,則模糊評價矩陣為
(3)
各指標對應權重之集為W=(w1,w2,…,wm),記E′∈[0,1]m為此次評價結果,定義評價算子“*”如下。
(1)樂觀評價算子(max-product),
(4)
(2)悲觀評價算子(min-product),
(5)
(3)綜合評價算子(sum-product),
(6)
命題1 樂觀模糊評價算子(max-product)刻畫評價對象對每個評價等級最大隸屬程度,體現了最大隸屬原則;悲觀觀模糊評價算子(min-product)反映評價對象對每個評價等級最小隸屬程度,是一種保守考慮;綜合評價算子(sum-product)體現了評價的期望結果,符合概率統計規律。
沒有采用模糊計算理論的經典模糊合成算子max-min運算, 有兩方面考慮。首先,max-min運算已被證明將權重(wi)和評價值(rij)取小的結果不合理[15],因為wi∧rij只是單方面權重wi或此級評價值rij,不能客觀反映出高一級評價結果。其次,權重wi較小時,對應評價值rij的信息會被淹沒。權重與評價值的乘積(product)才體現了乘法原理和統計學基本規律。
下面對模糊多級評價模型進行形式化建模。約定k表示評價等級數。g1,g2,…,gk∈N+,gi表示第i層每個指標的指標個數。
max{g1,g2,…,gk}=n為各層指標個數最大值。?k∈N+,定義I(k)={1,2,…,k}則,
im∈I(gm),j∈I(n),m∈I(k)
(7)
序列i1,i2,…,ik∈N+k,gi標識第im個m級指標的位置。i1,i2,…,ikj∈N+k,gi標識第im個m級指標的第j個等級的測度(樣本分布數、隸屬度)的位置。用序列#gi,…,gk∈N+ω,標記k,k-1,…,i+1層評價已經做完正要做第i層評價。
定義5 一個模糊多級評價模型(Fuzzy Multilevel Evaluation Model,FMEM)E是一個六元組,E=(AP,R,D,W,δ,S),其中記號意義說明如下。
(1)AP={λ1,λ2,…,λn}表示評價等級之集,?λi∈AP是結構體數據,封裝了第i個評價等級的標識及其對應的特征區間或特征值。特征區間和特征值一般取百分制區間和百分制實數,是去模糊化時對各等級打分要用的數據。
(2)原始數據矩陣D存儲記錄初級指標的初始評價值,D=Dg1g2…gkn是一個k+1維的矩陣,?di1i2…ikj∈Dg1g2…gkn表示第im個m級指標在第j個等級λj的樣本分布個數。

(4)權重矩陣W存儲記錄初級指標的初始評價值,W=Wg1g2…gk是一個k維的矩陣,?wi1i2…ik∈Wg1g2…gk表示第im個m級指標在m層評價時的權重。
(5)映射δ:W×R→R是模糊評價函數,根據定義4關于模糊評價算子的定義有,
(8)
(6)得分矩陣S存儲記錄每一級指標評價得分,S=Sg1g2…gk是一個k維的矩陣,則,?s#imgi+1…gk∈Sg1g2…gk,表示第im個m級指標的得分。則有
(9)
其中,r#(imj)gm+1…gk表示第im個m級指標對第j個等級的隸屬度,λj表示第j個等級的特征值。一般我們只計算一級評價的最終得分,其他等級不做計算。
定理1E=(AP,R,D,W,δ,S)為FMEM,若需要k級評價,每一級指標個數不超過m,每個指標的評價等級分n級,則做k級模糊多級評價的時間和空間復雜度都為o(mkn)。

定理1指出FMEM的復雜度隨評價等級數k呈指數增長,但現實中評價等級數一般較小,常見的k∈I(5)。所以FMEM是易于在計算機上實現的。
下面以中小學課堂教學評價為例,對FMEM進行應用。
量化評價的核心是指標體系的建立和權重的確定。在充分研習國家教育方針政策、教育評測標準的基礎上,結合自身多年從教經驗,設計了中小學課堂教學評價指標體系如表1所示。表中第1列給出了“教學目標”“教學內容”“課堂結構”“教學方法”“教學效果”“教學基本功”等6個一級評價指標,第2列對每個一級指標細分共給出了“符合大綱、教材要求”等23個二級指標,并根據特爾菲法確定了每個指標的權重。
表2截取了表1中部分,其中第2個一級指標“教學內容R2”對應的第2個二級指標“難易適度,容量適當R22”,R223=1是沒有模糊化之前指標R22分布在等級λ3=“及格”的樣本數,其模糊化后實際存儲為0.1。w22=20%=0.2表示第2個一級指標“教學內容R2”對應的第2個二級指標“難易適度,容量適當R22”在二級評價時所占權重為0.2。

表2 R存儲記錄各級指標與評價值示例
作者將表1中的23個二級指標列到表上,在學校期中教學檢查集體聽課時發給11名聽課教師,對作者所帶某門課程進行評價。聽課教師只需要在各指標對應等級“優秀、良好、中等、及格、差”下打“√”即可。收回10張打分表,統計結果為表1中最后5列所示各指標對應不同等級選擇人數。

表1 指標體系與原始評價數據
對應于定義5給出的FMEM模型對模型參數初始化,并用模型進行課堂教學質量的模糊多級評價。樣本數H=10,評價等級數k=2,評價等級劃分在表3中給出,

表3 各評價等級的特征值
AP={λ1,λ2,…,λ5}=
(優秀/95,良好/85,一般/75,及格/65,差/50)
(10)


(12)

(14)
類似地可計算得到
(15)
依據定義5的(6)計算最終得分計算一級指標評價得分為
(16)
類似算得,
S2=90.10,S3=87.20,S4=85.50,S5=83.44,S6=87.00
(17)
S2∈[90,100]=λ1說明該教師在所評價課堂上第2個一級指標“教學內容”評價為“優秀”;S1,S3,S4,S5,S6∈[80,90)=λ2說明該教師在所評價課堂上除了第2個一級指標外其余5個一級指標評價均為“良好”。

一級評價計算如,
sum(E′)=1,所以,
(19)
依據定義5的(6)計算最終得分,
(20)
因為84.96∈λ2=[80,90),所以對該教師這堂課的評價結果是“良好”。
設計了中小學課堂教學評價指標體系(表1)。定義了3個模糊評價算子(定義4),討論了評價算子的合理性(命題1)。基于模糊計算基本理論建立了中小學課堂教學質量的模糊多級評價模型(定義5),結合定性與定量信息,自然、客觀地對課堂教學質量進行評價。討論了用FMEM進行模糊多級評價的復雜度,證明了該模型高效且自動化程度高(定理1)。結合實例進行了課堂教學質量評價,結果顯示所評價教師本節課教學質量“良好”。
后續工作考慮:①模型加上時間維度,考慮被評價對象在時間變化上教學質量的變化,以發展的眼光看待被評價對象;②課堂評價打分不限于同行教師,可考慮領導、學生打分,進行3級綜合評價;③將FMEM應用與其他背景,比如水質評估、旅游景點滿意度評估、礦井安全評估等。