摘 要 首先對教育教學測量方法進行分類,然后重點介紹行為測量和統計測量,并通過教育教學中質量監測的實例,說明S-T分析、Flanders課堂互動分析、數據包絡分析、主成分分析、馬爾可夫分析等測量工具使用方法。
關鍵詞:S-T分析;Flanders課堂互動分析;數據包絡分析;主成分分析;馬爾可夫分析
中圖分類號:G423.04 文獻標識碼:A 文章編號:1671-489X(2008)06-0001-08
Research on Measurement Tool for Quality Monitoring and Evaluation of Basic Education//Ai Lun, Ai Jiye
Abstract This paper classifies the methods of teaching measurement, and then emphatically introduces behavior measurement and statistical measurement. The methods of measurement tools such as S-T analysis, FIAS, DEA, PCA, and Markov's analysis are illustrated through a case of quality monitoring of teaching.
Key words S-T analysis;FIAS;DEA;PCA;Markov's analysis
Author's address
1 Capital Normal University of China,Beijing 100037
2 Cold Spring Harbor Laboratory of USA
1 教育質量監測的基本要求與特點
任何一項研究都應該明確3個基本問題,即研究目的、研究對象和研究方法。基礎教育質量監測作為一項研究,它的研究目的是希望通過質量控制達到教育的優化;它的研究對象既有學生和教師,也有管理和教學環境等;它的研究方法則主要是測量方法問題。可將測量方法按表1所示,從測量手段上進行分類。
其中紙筆測量和心理測量在目前的質量監測中使用最為廣泛。生理測量因受到設備條件的限制不能廣泛使用,僅用于研究。這些測量方法的對象主要為學生,而且需要對學生進行抽樣。行為測量和統計測量的主要對象是教師、管理和教學環境等,測量時一般不需要對對象進行抽樣。
從新課程標準三維目標的角度審視教育質量監測,測量的重點應該是除“知識”以外的其他各個目標。三維目標中的“知識”,被稱為“顯性知識”;而“技能”(能力)、“過程與方法”、“情感、態度和價值觀”則被稱為“隱性知識”。顯性知識是通過閱讀和聽講獲得的知識,可以用常規的考試對其進行測量。而隱性知識恰好反映了素質教育的內容,是教育質量監測的主要測量目標。對于學生能力的測量,國際上通用簡稱為PISA(Programmer for International Student Assessment,“國際學生評價項目”)的大型國際性教育成果比較、監控項目。評價對象是處于義務教育階段末期的15歲學生,以紙筆測驗的形式測量學生的閱讀能力、數學能力和科學能力[1]。所以“知識與技能”都具有較為完整的測量工具,而“過程與方法”“情感、態度和價值觀”的測量還存在如何有效量化的問題。
教育質量監測的測量目標具有以下特點:
1)多元性:影響測量目標的因素不是單一變量。
2)模糊性:影響測量目標的諸因素之間沒有明顯的界限。
3)度量水平低:測量指標不易量化。
4)樣本空間小:被試抽樣點數不能太大。
另外,目前教育質量監測與評價的標準還沒有建立起來,測量手段和測量工具剛剛開始研究。下面對行為測量和統計測量的工具和方法進行舉例說明,希望對測量手段和工具的研究做一些貢獻。
2 教育教學測量的量化
下面介紹的2個測量工具都屬于行為測量,測量對象為教師。特別要說明的是,其中的“S-T”分析可以對教學的“過程與方法”進行測量和評價,而Flanders課堂互動分析可以對教學中的“情感、態度和價值觀”進行測量和評價。
2.1 “S-T”分析“S-T”分析的基本思想是將課堂教學中的行為分為學生(S)行為和教師(T)行為。教學過程以S行為和T行為隨時間的變化圖形表示。采用這種可視化的方法研討教學,可以增加分析的客觀性,減少盲目性和模糊性。其主要內容和步驟 [2]: 1)課堂教學過程中教師(T)和學生(S)的行為分類與定義(表2);2)播放教學錄像,將一個教學單元的時間按30秒的間隔進行劃分和編碼;3)建立和填寫S-T表;4)根據S-T表繪制S-T曲線;5)根據S-T表計算教師行為占有率Rt和行為轉換率Ch;6)建立Rt-Ch圖;7)用S-T曲線進行教學過程分析,用Rt-Ch圖進行教學方法(模式)分析。
觀察教學過程中的行為,每30秒鐘的內容進行一次編碼,填入S-T表中。填寫時注意每個單元格占30秒時間;教師行為填T,學生行為填S;將教師與學生交互對話的行為填D(或T’),但計算時當作T處理。一個填寫好的S-T表如表3所示(50分鐘課程,100個數據)。
根據S-T表繪制S-T圖(圖1)。S-T繪圖區的縱軸為S,橫軸為T。各軸的長度均為50分鐘,教學的起點為原點。從原點開始,根據S-T表的數據順序將數據轉換成對應的線段;一個T對應0.5分鐘的水平線段,一個S對應0.5分鐘的垂直線段,而一個D對應0.5分鐘的45度傾角的線段。
S-T圖的形狀可以客觀地反映教學過程情況。一條幾乎與T軸平行的S-T曲線說明該教學過程基本是滿堂灌的(圖2);而一條幾乎與S軸平行的S-T曲線說明該教學過程是自習課(圖3)。
為了進行教學方法(模式)分析,需要對S-T表中的數據做統計(圖4)。
2.2 Flanders課堂互動分析Flanders課堂互動分析也是對課堂教學行為進行記錄。但與S-T分析相比,數據采樣和處理更加精細,抽樣時間間隔為3秒(而不是30秒),行為類型分為10個(而不是S、T、D 3個)。一節課的數據量可達近千個。主要步驟:1)將整節課堂教學過程全程錄像;2)將全程錄像以3秒為單位進行分析編碼(表4);3)將所有編碼按時間順序排列成坐標序列;4)將所有出現的坐標序列次數填入課堂行為矩陣(遷移矩陣);5)對矩陣數據進行分析。
根據表4,順序對每3秒鐘一段的教學行為進行編碼,形成一個編碼序列。假設形成的編碼序列為:6、10、5、1、4、8、8、2、3、6、4、8、9、5……則下一步是將這近千個數據進行組合,形成坐標序列。組合的原則是2個相鄰數據分別當作橫坐標一次,再當作縱坐標一次,即:(第1數據,第2數據),(第2數據,第3數據),(第3數據,第4數據)……前面的編碼序列形成坐標序列后為:(6,10)、(10,5 )、(5,1)、(1,4)、(4,8)、(8,8)、(8,2 )、(2,3)、(3,6)、(6,4)、(4,8)、(8,9)、(9,5)……將每個坐標出現的次數記錄在一個矩陣中,稱為課堂行為矩陣或遷移矩陣。圖6是一個實際的課堂教學行為矩陣[3]。
矩陣中第1~3行與第1~3列交叉處的數據量比較大,反映了教師與學生之間情感氣氛比較融洽。第7~8行與第6~7列相交處的數據為0,反映教師和學生之間情感交流不存在隔閡。第2~3列的數據總數為“47+42 = 89”,第6~7列的數據總數為“30+0=30”,兩項之比稱為積極影響與消極影響的比率,約為297%。說明教師對學生的講話以接納、鼓勵為主,使課堂的氣氛比較寬松,調動了學生的參與積極性。
3 教育質量評價的量化
教育質量的評價是一個多元化的測量問題。反映教育質量的元素是眾多的,影響教育質量的因素也是眾多的。我們可以從教育教學效益的角度,去評價一個教育教學單位的教育質量。一般認為效益是投入產出比,即:效益=產出量/投入量。但是教育教學效益測量沒有一個絕對的指標,僅能得到相對比較的結果。處理這種問題的方法稱為數據包絡分析(簡稱DEA,Data Envelopment Analysis)。首先,將各單位投入、產出的數據填入表5。
DEA分析屬于統計測量。我們可以使用被稱為C2R模型的DEA基本模型對數據進行分析[4]。C2R模型的數學表述為:
這是在數學表達式中以下面三行的條件求第一行表達式的最小值問題。而真正的求解過程,實際上是通過一個計算機軟件來完成的,并不關心表達式中各個變量的取值和計算。最常用的軟件是DEA Solver Pro,這是一個專業軟件。其他還有DEA Excel Solver和xlDEA,這是2個插件,與電子表格Excel配合使用(圖7)。
表6是某地區20個初中校的投入和產出數據。其中“師資力量X1=2×特級教師數+1.5×一級教師數+1.2×二級教師數+其他人員數”;教育經費和設備圖書的單位為萬元。
上面的數據經DEA Excel Solver處理后得到表7給出的結果。其中市1、8、9、17、18中的DEA檢測有效,意為這5個學校的效益相對比較滿足要求,其他學校則不滿足要求。
4 教育質量控制的決策
為了對教育質量進行控制,找出影響本單位教育質量的主要因素,從而采取改良措施,或者對本單位教育的發展進行預測,都是我們所關心的問題。而這些都依賴教育測量技術。下面介紹的主成分分析和馬爾可夫分析就是這樣的測量工具,它們屬于統計測量。
4.1 主成分分析主成分分析的思想是找出影響80%以上質量效果的20%的主要因素(圖8),在質量管理上被稱為“二八定律”。
主成分分析簡稱PCA(Principal Component Analysis),是多元分析的一種。當影響質量的原因是諸多因素時(每一因素占據一維),PCA的目的是降低影響因素的維數。但需要注意的是主成分并不等于就是主要因素,而是全部因素的線性組合。通過找到主要成分,可以間接找到主要因素。表8是一個PCA分析的實際例子。
表中的師資力量、教育經費、圖書冊數、設備件數、競賽次數和學生身體素質是影響教育質量的6個因素。對表中數據進行PCA分析可以借助統計軟件SPSS的因子分析來實現(圖9),選擇“Analysis”→
“Data Reduction”→“Factor”。
表9(Total Variance Explained)中列出了全部成分對質量的貢獻,以及累計貢獻超過85%的3個主成分。第1、2、3主成分各自的貢獻分別是41.797%、26.043%、19.181%;它們的累計貢獻是87.020%,于是確定了該系統有3個主成分。
表10(Component Matrixa)中列出3個主成分與原來的6個影響因素之間的比例關系。其中X1~X6分別表示原表中的6個影響因素(師資力量~身體素質)。但是,在建立主成分與6個影響因素線性組合表達式時,還不能直接使用這個表格中提供的系數。這是因為SPSS軟件是做因子分析,而不是直接的DEA分析。
根據這個系數表,就可以建立主成分與6個影響因素之間的線性關系表達式:
這個表達式中的系數反映了3個主成分與6個影響因素之間的關系(表12)。根據表中主成分與影響因素的相關程度,定義第1主成分為辦學條件指標,第2主成分為學生活動指標,第3主成分為學生身體素質指標。將一個學校的影響因素數據帶入上面的表達式,便可以計算出該校的3項指標,從而找出影響質量的主要成分。
4.2 馬爾可夫分析馬爾可夫(Markov)分析又稱為蒙特-卡羅(Mote-Carlo)法,是用于分析隨機事件發展趨勢的工具。在這里,用它對教育教學中我們所關心事物的發展情況進行預測,屬于統計測量工具。使用馬爾可夫分析的前提是假設研究的隨機過程為馬爾可夫過程[4]。下面用一個最簡單的例子說明馬爾可夫分析的使用過程:
設3個地區A、B、C的初中學校在2006年至2007年聯考時,成績前1 000名排隊的情況如表13所示。因為前1 000名的名次是經過排隊的,所以可以根據公布的名次列表還能夠知道:A地區減少的40個名次中有20個被B地區得到,20個被C地區得到;B地區減少的50個名次中有35個被A地區得到,15個被C地區得到;C地區減少的45個名次中有25個被A地區得到,20個被B地區得到。現在要求預測到2008年,3個地區聯考成績前1 000名分配情況。
于是有:
2007年三個地區的名次占有率為:1)A地區2007年的名次占有率為“220/1000 = 0.220”;2)B地區2007年的名次占有率為“490/1000 = 0.490”;3)C地區2007年的名次占有率為“290/1000 = 0.290”。
則對2008年的預測情況為:
即:2008年A地區的名次數為234,B地區的名次數為483,C地區的名次數為283。
以上介紹的例子僅作為開發基礎教育質量監測與評價測量工具的啟發和參考,不當之處請指正。
參考文獻:
[1]楊希潔.PISA對我國基礎教育評價制度改革的啟示[J].科研與決策,2007(7)
[2]傅德榮.教育信息處理[M].北京:北京師范大學出版社,2006
[3]薛小明.對一堂高中歷史課課例的分析[J].教育科學研究,2006(2)
[4]吳育華.管理科學基礎[M].天津:天津大學出版社,2006
[5]林海明.主成分分析法與因子分析法應用辨析[J].數量經濟技術經濟研究,2004(9)
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。