艾 倫
1.教育信息化協同創新中心 湖北武漢 430079 2.首都師范大學 北京 100048
?
資產管理與設備采購
教育裝備績效評價技術研究(1):變量選擇與處理
艾 倫1,2
1.教育信息化協同創新中心 湖北武漢 430079 2.首都師范大學 北京 100048
摘 要:績效考核是教育裝備管理部門必須面對的實際問題,其中績效評價屬于管理學的范疇。重點討論了教育裝備的績效評價技術中對教育教學產出變量的選擇與處理方法。
關鍵詞:教育裝備;績效評價;產出變量;顯變量與隱變量;數據挖掘
教育裝備的績效評價屬于教育裝備管理學中的概念,同時也是目前各個教育部門和單位在每個財政年度都必須面對的實際問題。我們在這里系列地討論績效評價技術是想為學校及其管理部門在績效考核時提供有效的測量方法。教育裝備應采用科學化管理,所以對教育裝備績效應使用科學評價,科學評價是“價值無涉”的,就是不能通過價值判斷(主觀判斷)而必須依據科學判斷,即客觀和量化的評價方式。客觀、量化的測量評價需要確定變量和具有數據支持,這是在評價階段不可回避的現實問題。
教育部門屬于政府機關或事業單位,它們在進行項目建立和績效考核時必然會遇到對教育裝備的貨物、服務以及工程采購項目中預期目標的闡明和評價問題,這就必然要涉及對教育教學產出變量的選擇、確定、量化以及詳細描述。本文將重點討論對教育教學產出變量的處理方法。
在正式討論績效評價技術之前,必須將有關的概念進行界定,從而使我們的討論不偏離方向且更加具有針對性。
1.1教育裝備績效
績效(performance)是管理學中的一個概念,單純從語言學的角度來看,績效包含有成績和效益的意思。用在經濟管理活動方面,是指社會經濟管理活動的結果和成效;用在人力資源管理方面,是指主體行為或者結果中的投入產出比;用在公共部門中衡量政府活動的效果,則是一個包含多元目標在內的概念[1]。
可以看出,在不同的語境下對績效有著不同的理解。但是教育裝備的績效卻是一個復雜問題,它幾乎涉及了上述定義中的所有方面。教育裝備的投入是經費,而做管理工作的是管理人員;教育裝備的產出其實就是教育的產出[2],而教育的產出就是人才培養;教育裝備的投入是由學校的上級單位做決策的,而這些上級單位又是政府部門。所以,教育裝備績效就是反映教育裝備投入后的成績和效益,在其項目實施方面要關注結果和成效,在管理方面要計算的就是投入產出比,作為學校的上級單位就必須綜合考慮上述問題。我們在這里規定,教育裝備科學化管理中的績效就是考查其效益,而這個效益就是教育裝備的投入產出比。
1.2評價與評估
一般情況下“評價”與“評估”這兩個詞是可以混用的,人們不把它們做嚴格的區分。但是為了使我們的討論更加具有針對性且不偏離方向,就必須給出一個嚴格的概念界定。本文采用“評價”一詞而沒有使用“評估”是具有充分理由的?!督逃筠o典》中對評價和評估的解釋如下。
評價(evaluation)是對事物價值的判斷。如對教育目標的實現程度做出的價值判斷。這類判斷有時只依據由測驗提供的測量值,更多的則是綜合各種測量、關鍵性事件、主觀印象以及其他各種證據[3]。
評估(evaluation)指評議和估價,是對事物和過程的一種判斷。是一個包含一系列的步驟和方法的連續性的系統過程。其一般程序是:規定目的,確定目標,系統地采集信息,分析資料,運用包括數學在內的科學手段,對某一對象進行綜合的評議和估價。它為決策者提供信息和資料,為決策服務[3]。
雖然評價和評估的英文名稱完全相同,但在漢語解釋中卻有著根本不同的涵義。顯然,評估是在一個項目執行前對該項目目標和可能產生的結果進行預測和估計,而評價則是在一個項目執行后對該項目在初期建立的目標和項目執行后所產生效益進行測量和評判。教育裝備績效考核是考查項目執行完成后的效益問題,所以在本文和以后的序列討論中將一直使用績效評價這一稱呼。
1.3績效評價技術
人們對事物的評價,由判斷依據的主體區分可分為主觀評價與客觀評價,而由判斷依據的強度區分可分為定性評價與定量評價,于是就存在4種不同的評價方式:主觀定性評價、主觀定量評價、客觀定性評價以及客觀定量評價。其中,主觀定性評價與主觀定量評價屬于價值判斷,客觀定性評價屬于認知判斷,客觀定量評價則屬于科學判斷,科學判斷的評價方式應該是“價值無涉”的??茖W研究一般應避免使用屬于價值判斷的主觀評價方式,因為這種評價方式受到評價者知識背景、閱歷大小、經驗多少、文化習俗、價值取向等主觀條件的限制,甚至評價者評價時的社會關系、身體狀況與心理情緒等都會成為重要的影響因素。
績效評價可以采用上述定義中的價值判斷,但是也可以采用認知判斷或科學判斷。教育裝備管理應該是科學化管理,須采用科學評價,而科學評價一定要使用客觀、量化的方法??陀^、量化的方法通常需要依靠數學模型、數據計算實現,于是便形成了各種相關技術,這就是我們在這里討論的教育裝備績效評價技術。
績效評價需要對項目的效益進行計算,效益的具體體現就是投入產出比,客觀、量化的評價應首先確定投入變量和產出變量。
2.1投入變量
投入變量亦稱輸入變量,教育裝備績效評價的投入變量反映出投入成本,是教育成本的一部分。在《教育大詞典》中對教育成本(Education Cost)的定義是:培養學生所耗費的社會勞動,包括物化勞動和活勞動。其貨幣表現為培養學生由社會和受教育者個人直接和間接支付的全部費用[3]。其中物化勞動是指教育資源中的人工資源部分,也就是教育裝備;而活勞動則是指教育在資源中的人力資源部分,包括教育教學的實施者(教師)、管理者(各級領導、各種管理人員)、生活服務人員等。教育裝備投入成本中的物化勞動其實就是教育裝備本身,活勞動則是指教育裝備的管理人員。所以教育裝備績效的投入變量應選擇以貨幣形式呈現的教育裝備投入(即購置費用)和管理人員的人數、水平(學歷、職稱)、工作量等內容。
2.2產出變量
產出變量亦稱輸出變量,教育裝備績效的產出變量其實也反映了教育的產出,它們是相同的概念。教育效益是指教育投入的產出效果,包括直接效益和間接效益、經濟效益和政治文化效益。教育產出變量的選擇是一個非常復雜的問題,它與企業的產出不同,不是僅用貨幣量就可以反映的,并且討論教育的效益時并不是關注其經濟效益,而是注重它的社會效益、政治文化效益。
一般情況下,人們多選擇以下可量化的變量作為教育或教育裝備績效的產出變量。
(1)培養學生人數。這是一項直接效益的產出變量,反映了一個教學單位培養人才的能力。但是由于在計算教育效益時常用“生均投入”作為投入變量,而且培養人數與教學單位規模一起被規定下來,一般不隨教育投入發生變化,所以這個產出變量不能夠很好地反映教育效益,很少被采用。
(2)學生學業水平。這也是一項直接效益的產出變量,它直接反映了一個教學單位的教育教學水平。學生的學業包括知識的獲取、能力的提高和道德的養成,于是這個變量還需要進一步細分。知識也被稱為顯性知識,是通過紙筆考試進行考核的,這個產出變量可以使用學生的卷面成績。能力屬于隱性知識,不易進行量化測量,卻可以通過造詣測驗(亦稱成就測驗)針對學生獲得的成果或獎勵確定產出變量。道德的養成就是德育,德育作為產出變量是最不容易量化的,可以考慮通過社會對該教學單位學生道德水平的總體評價進行賦值。應該注意,在較大空間范圍內進行績效評價使用學生學業水平作為產出變量時,由于不同地區會有不同的測量標準,所以將一些成績(如:各地高考成績、中考成績等)作為產出變量就會帶來問題。但是可以通過下文介紹的變量變換方法來解決。
(3)學生身體素質。對于非體育教育的普通教學單位,學生身體素質雖然屬于人們關注的一個重要問題,但與學生學業水平這個產出變量要求不同,它一般只與教育或教育裝備在體育鍛煉相關的投入部分有關。有時,學生身體素質甚至還會被設定為影響學生學業水平的輸入變量。
(4)畢業生中的成功人士數量與水平。這是一項間接效益的產出變量,因為它雖然與原教學單位的教育有關,但還與成功人士其他的經歷與奮斗有關,通常它只是一個參考變量。
顯然,能夠反映教育效益的產出變量是非常少的,還會出現測量標準不統一而使得變量沒有使用意義的情況。所以尋找、發現和定義教育裝備效益的產出變量是一個技術含量很高的科學問題。
教育裝備績效產出變量的尋找和發現可以通過數據挖掘技術實現,下面通過實例介紹這些技術。
3.1顯變量與隱變量
教育裝備績效評價中的變量一般都可以賦予明確的社會科學或教育學意義,如前面提到的學生學業水平等,我們稱這樣的變量為顯變量。其實在教育裝備問題研究中還存在著大量的隱變量,它們并沒有明確的社會科學或教育學意義,甚至沒有一個確切的名稱,而只能用F1,F2等變量名代替。有時我們不得不使用隱變量進行測量和評價。例如,由于學生創新能力是一個復合型能力,一般不具有直接進行測量的方法,但是我們可以通過數據挖掘和統計分析找到一些隱變量,它們與創新能力具有一定的關系,并且能夠側面反映創新能力水平的高低。通常,投入變量一般都表現為顯變量,而產出變量則在很多情況下只能去挖掘那些隱變量。
3.2變量變換
3.2.1 空間變量與時間變量變換
空間變量與時間變量確切的叫法應該是空間序列變量和時間序列變量,在教育裝備績效評價問題研究中經常會存在它們之間的轉化應用。例如,我們希望知道教育裝備投入是否會使得學生的學業水平有所提升,其輸入變量容易獲得,它們無非都是反映裝備投入實施情況的一些顯變量,而在采集學生學業水平情況時,由于不同地區測量學業水平的標準不同,如果使用空間序列變量的學業水平進行對比研究將沒有實際意義。但是,如果使用時間序列變量的學業水平,在當地進行逐年對比,研究結果就具有實際意義了。此時得到的是各地區學生學業水平隨時間逐步提高的曲線,而各地區這個曲線的斜率是不同的,通過斜率比較就能夠很好地體現教育裝備投入的效益。
3.2.2 變量功能變換
變量功能變換就是將一個可測量的變量功能引申,使得它可以反映另一個變量的水平值。例如,我們可以認為學生參加網絡答題的速度能夠反映該生信息技術水平,從而設定該水平為一個評價產出變量。但是,能否真的當作產出變量使用必須做相關性驗證。一般,如果該變量與投入變量相關,則有可能成為產出變量,否則不能作為產出變量。說“有可能成為”是因為兩個變量之間具有相關關系但不一定就是因果關系,要得到因果關系還需要進一步推演證明才行(兩個變量不具有相關性則必然不會具有因果性,而具有相關性時則有可能會具有因果性)。以下是一個使用真實數據的實際例子。
某市6個區縣(用DMU1至DMU6表示)小學生的生均教育信息化投入經費數如表1所示。學生信息化水平用網絡答題時間代替,平均答題時間長被認為信息技術水平低,反之則認為水平高,于是得到表2中的信息技術水平指數。變量變換方法采用了計算公式:信息技術水平指數 = 10 / 平均答題時間。

表1 生均信息化投入數

表2 學生信息化水平指數
將生均教育信息化投入經費數(作為投入變量)和學生信息技術水平指數(作為產出變量)填入統計分析軟件SPSS中,選擇相關分析選項,可以得到表3所示輸出結果。該結果顯示出這兩個變量的相關系數為0.545,它們似乎具有一定的相關性。但進一步考查可見顯著性值ρ= 0.264。在相關分析時規定為0假設(H0),當ρ< 0.05時才能夠認為兩個變量具有相關性,所以我們開始設定的投入與產出變量不具有相關關系,當然就更不會具有因果關系。于是得出的結論是:該變量變換可行(即可將答題時間變換為信息技術水平),但是在該項目中使用這個產出變量不可行。在該項目中,在這個城市的6個區縣之間,不能夠將上述兩個變量用作為投入和產出的對應變量來進行小學校的教育信息化績效考核。

表3 SPSS相關性分析結果:相關性
3.3隱變量的挖掘
在產出變量十分稀少的情況下利用數據挖掘技術設定一些變量作為產出變量是一個不錯的選擇,這里介紹用主成分分析法(Principal Components Analysis,簡稱PCA法)進行隱變量挖掘的實例。主成分分析是多元分析中一種常見的變量降維和賦權方法,在盡量不丟失信息的情況下將多個變量轉換成少數幾個變量(稱主成分變量)。這些主成分變量具有正交性(統計獨立、無相互依存性),而每個主成分中所包含的變量之間一般具有較強的相關性(同質)。我們可以將主成分變量認定為隱性產出變量,其依據主要出于以下幾點。
(1)趨同特點。與其他領域不同,教育在裝備投入上有著配備標準,人們多依標準進行投入,即使在沒有建立標準的地方也根據經驗盡量選擇一致性的配備,這種現象稱為趨同性。
(2)全局預測。在能夠獲得大范圍(全省市甚至全國范圍)投入數據的情況下,根據上述趨同性特點進行產出隱變量的挖掘是有意義的。局部地區或該地區教學單位的教育裝備績效的產出指標可根據這些隱變量進行測量和評價。
(3)同質聚類。主成分分析就是將趨同的變量聚類在一起。在進行主成分分析時應盡量提供一些已知的產出變量數據參與,這樣對于隱變量的有效性更加有利。
表4是某市小學校教育裝備投入變量(X01~X13)的名稱對照。將全市這些變量對應的數據填入SPSS軟件,選擇主成分分析,可以得到表5和表6所示的結果。

表4 變量名對照表

表5 各主成分的最大特征值與對系統的貢獻率

表6 前3個主成分與各變量的關系
表5中的“Total”一欄為各主成分對應的最大特征值,“Cumulative”為主成分累計貢獻率百分比,最大特征值大于1的主成分有3個,它們的累計貢獻率已經達到82%以上。表6顯示的是前3個主成分與各變量(X01~X13)的關系。從表5中可見主成分F1的最大特征值λ1=7.036,主成分F2的最大特征值,主成分F3的最大特征值。根據以下公式計算綜合評價函數[4]。根據綜合評價函數F和表6中各個變量的系數確定出F的各個變量系數如表7所示,寫成百分數形式(各個系數之和等于100)如表8所示。


表7 綜合評價函數各變量的系數

表8 綜合評價函數各變量的百分度系數
最后得到的隱性產出變量有兩個,分別為主成分F1和F2。主成分F3因只與X13(圖書資料)有關,不予考慮。計算兩個產出變量時,其對應的各個投入變量和投入的權值由下面的表達式決定。

參考文獻
[1] 百度百科.績效[EB/OL].http://baike.baidu.com/ view/122994.htm.
[2] 艾倫,艾霽野.也談教育裝備的成本:效益研究[J].中國教育技術裝備,2008(20):1-2.
[3] 顧明遠.教育大辭典:增訂合編本上、下[M].上海:上海教育出版社,1998.
[4] 艾倫,艾霽野.主成分分析在教育裝備管理評價指標體系建立中的應用[J].中國教育技術裝備,2008(18):3-4.
收稿日期:2016-03-06
作者簡介:艾倫,教授,本刊特約撰稿人。
Performance Evaluation Technology of Educational Equipment (1):Selection and Processing of Variable
Ai Lun1,21. Collaborative & Innovative Center for Educational Technology, Wuhan, 430079, China 2. Capital Normal University, Beijing, 100048, China
Abstract:Performance evaluation is an actual problem that the educational equipment management department must face, and the performance evaluation is the category of management. This paper focuses on the selection and processing method of the output variables in the performance evaluation of educational equipment.
Key words:educational equipment; performance evaluation; output variables; explicit and implicit variables; data mining