彭順緒
(梧州學院 文法學院,廣西 梧州 543002)
教育評價是引導學校、教師和學生行為的一種外在機制,它對于規范學校辦學行為,衡量教師教學成就,激勵學生成長有重要的現實意義。教育評價機制的改革是教育體制改革的重要組成部分,如何在當下復雜的教育現實中尋求教育評價方式的變革和突破,這是值得研究的重要問題。從系統論的觀點來看,教育評價方式的選擇既關系教育系統內部的發展,又受制于社會大系統對人才培養的訴求。增值評價模式,契合了教育現實與社會需求兩者發展的需要,為我們研究教育評價方式變革提供了一個備選的方案。
在傳統的教育評價領域,對學生認知能力的評價是一個主流方向,無論是從泰勒的評價觀還是布魯姆的教育目標分類來看,評價都是依據目標的實現程度來展開的,是一種目標指向型的結果性評價。這種早期的教育評價模式對教育的發展產生了廣泛而深遠的影響。
對我國而言,目標指向型評價在操作中已經簡單化為結果性評價,大家過分注重教育結果,這已經成為當前教育生態中眾多混亂現象的原因之一。以高考為例,這種結果性評價最直接的結果就是導致了不同學校升學率、重點率的簡單攀比,更極端的是直接比較考上北大清華等重點高校的學生數,以此來衡量學校的辦學水平和獲得社會認可的程度。學校之間如此,在學校內部,不同班級之間也存在這種以成績的簡單比較來衡量班級水平高低的情況。與這種評價機制相契合的是,入學前班級間存在以學生入學成績為依據的分班現象,在教學中,教師對重點班與非重點班學生給予“差異化”(1)的關注。這樣發展的結果就導致了學校間生源競爭,以各種優惠政策吸引優質生源和優秀教師,以少部分的優秀成功者替代了對大部分學生成長的關注。另外,這種評價機制也容易引發家長盲目讓學生“補課”,通過增加資源投入來提高成績,而忽略了學生的全面發展。
現實情況往往是,那些在將來的事業中能夠做出開創性工作的人也并非完全是在學校中學業成績最突出的。一些極端的例子是,有些杰出的人士可能并沒有接受過更多的學校教育,甚至早早地選擇離開學校。正如有學者指出,創新性拔尖人才或許根本不是學校能培養出來的,只是在一種有利的環境中自動“冒”出來的(3),這反而引起了我們對當前教育正在“扼殺”潛在杰出人才的擔憂。
隨著社會的轉型升級,中國經濟發展需要以創新來驅動,這就需要各種創新和杰出人才的不斷涌現作為支撐。這條道路從以美國為代表的發達國家的發展歷程中足以見得。新世紀初,美國《不讓一個孩子掉隊》法案的頒布,通過增進教育公平,讓每一個孩子都能夠具備基本的閱讀能力與數學能力。差不多同時,我國于1999年啟動了新一輪基礎教育課程改革,強調關注每一個學生的發展,讓學生積極主動地建構學習,改變傳統學習中的應試趨向,落實素質教育。一個真正的人才首先應該是一個人,教育應該首先著眼于人的發展,關注人的基本需求和基本能力的培養,為人的成長成才提供條件。
過分注重結果型的教育評價體制,容易引發教育中的功利主義傾向,從而讓學校、教師和學生將教育當作是一種可供交易的產品,而不是一種從人性發展中萌發出來的自我需要。有專家指出,我國本土難以涌現出諾獎級的創新成果與我們現行的評價體制有關??蒲协h境不再純凈,名氣和官階意味著項目和資源,這容易打擊那些廣大踏踏實實做科研的人員的積極性。而且,我們的資源往往向那些能沖擊各種獎項的項目和人員身上傾斜,很難想象我們能對一些缺乏短期現實回報的項目和人員進行投入。這種評價的方式可能會在短期形成很好的成果效應,但是真正的創新級成果是基于對現實規律和整個社會發展長期的探求得來的,這種短平快的評價體制對培養真正創新型人才來說顯得明顯不足。因此,從國家的長遠發展來看,改革目前的教育評價體制顯得尤為必要。
通常,我們將現代意義的教育評價的原點追溯至泰勒(Ralph Tyler)。泰勒的評價觀與當時學生學力的檢測活動有著緊密的聯系。在19世紀末到20世紀初的美國,測驗主要還是圍繞教科書來編制的,測驗的內容注重對知識的識記,這種片面的測驗并不能反映學生實際的發展情況。泰勒針對這種情況,提出了一套以教育目標為核心,依據課程和測驗編制的原則,以此將社會和學生的需要通過課程和測驗反映出來。正如泰勒所說:“評價過程實質上是一個確定課程與教學計劃實際上達到教育目標的程度的過程”[1]。但是,這種目標達成式的評價模式漸漸被人們過分關注評價結果所取代。所以,人們更多地將泰勒評價模式看成是一種總結性評價模式。
科隆巴赫(Cronbach,L.)是教育評價模式發展的重要推動者。他針對泰勒模式中過分關注結果的弊端,強調“評價能完成的最大貢獻是確定教程需要改進的方面”[2],將評價的重點放在了教育過程中,通過對過程的評價來改進教育工作。通常,人們將科隆巴赫的評價模式看成是一種形成性評價模式。
科隆巴赫的評價觀已經實現了對泰勒模式的超越,他將評價的內涵擴展到對活動的改進上。斯塔佛爾比姆(Stufflebeam,D.L.)繼承了科隆巴赫的評價觀,他也強調“評價最重要的意圖不是為了證明,而是為了改進”,于是,他將評價界定為“為決策提供有用信息的過程”[3]。為了達到改進活動的目的,他將評價擴展到實施的整個過程中,界定了背景—輸入—過程—成果,簡稱CIPP模式。通過這四種評價提供的決策來實現工作的改進,所以,人們又將CIPP評價模式看成是決策導向型評價模式。
目前,教育評價學界已經有“第四代評價”的說法。每一代評價都有各自相對獨立的特征。在第一代評價中,主要體現了“測量”的純技術性特點,如阿爾弗雷德·比奈(Alfred Binet)設計的心理測驗,就是一種測量心理特質的技術。又如《斯坦福成就測試》(Stanford Achievement Battery)第一次評估了學生在多種學科中的相對名次,也體現出了技術應用的特點。在第一代評價中,有學者指出,學生被看作是學?!肮S”中由學?!爸鞴堋背浞挚刂乒芾淼男枰凹庸ぁ钡摹霸稀?。測試通常被看作是學生是否達到學校制定的“規范”的方法。所以,第一代評價通常是針對那些能夠被測量的事物,對那些無法測量的事物則無法做出評價。同時,測量工具的選擇也很重要,如果沒有合適的工具,評估者還需要開發相關的測量工具[4]。
1) 碎末率。碎末率為茶葉加棒做形后碎茶所占比例。茶樣稱重(M茶樣)后用篩子篩出碎茶,并稱碎茶重量(M碎茶)。
第二代評價體現出了“描述”的特點,它將評估者的角色塑造成了描述者。盡管第二代評價依然延續了上一代評價中技術性的特點,但是,評估已不再等同于測量,而只是將測量作為評估使用的一種工具。如泰勒(Ralph Tyler)所領導的“八年研究”試圖突破當時評價學生的卡耐基學分體系(指定畢業所要求的課程單元的類型和數量)的束縛,而要向世人證明,只要有設計合理的目標,開發精選的課程并確保其發揮作用,即使沒有經過傳統學校正規的學業訓練的學生依然可以在大學中取得成功[5]。
第三代評價則將評估者置于評判員的角色,但同時也延續了評估的技術性和描述性的功能。正如有批評家指出,評估不能忽視對事物的判斷,描述和判斷都很重要,它們是評估的兩個基本方面[5]。如CIPP模式和鑒賞力模式等都或多或少主張將評估者界定為評判員。
前三代評價的發展是一脈相承的,沒有第一代評價測量技術的積累,就不會有第二代評價對客體的清楚描述,沒有前兩代評價的發展,也不會有第三代評價對于價值判斷的關注。但是,從公共政策的角度來看,也有批評家指出前三代評價中存在一些理念上的問題,比如過分強調管理主義,將評估置于一種特定的活動場域中,通過評估聯系不同相關利益者,在這種場域中所理解的評估先天帶有利益的關系,難以消除管理主義的趨向。同時,由于教育評估的活動主要是在美國等發達國家興起和發展,對于評估的價值取向也為人們所注意。隨著多元化價值觀的確立,人們開始反思前三代評價中缺乏對多元價值的關注。再者,前三代評價中過分強調了研究方法的科學范式。也就是說,看似科學的方法所得到的評估結果未必是真實有效的?;谇叭u價中存在的問題,目前正在形成關于“第四代評價”的理念,那就是基于響應式的建構主義評估理念。這種理念認為,“真理”存在于建構者達成的共識中,而不存在于客觀事實[6],關于“第四代評價”的理念還在不斷形成中。
“增值”原本是一個經濟學中的術語,又稱為“附加值”,是經濟主體新創造出來的產品價值??梢岳斫鉃樵谏a經營過程中,附加在原有價值上的新價值。研究“增值”這一概念之所以有意義,在于它衡量了生產者有效勞動的價值。關于“增值”的來源,也是一個頗有意思的話題,知識、技術、管理等要素都可能構成有效勞動的組成部分,從而帶來產品的“增值”。
“增值”概念引入教育領域的時間并不算太長。在上世紀60年代的美國,以詹姆斯·科爾曼為首的學者開始調查美國學校的效率問題,并提出了著名的《關于教育機會平等性的報告》,簡稱“科爾曼報告”(Coleman Report),這一報告指出了學校對學生成就的影響程度很低的事實,進一步印證了人們對學校普遍缺乏效率的擔心是有根據的。
這股對學校質量關注的熱潮,引發了世界范圍內對學校效能的關注,同時,也催生了學校效能增值性評價的出現。由于對統計技術的依賴,增值評價的研究和運用率先在英美等國出現并得到了長足的發展。隨著技術的完善,這種評價方式已經在不少國家和地區得到了推廣和實施。
增值評價其實也是面向過程的一種評價模式。首先,它著眼于發展性評價。強調活動對參與者發展程度的影響,但是這種發展不是對參與者達到的絕對程度的衡量,而是一種相對衡量,是對活動帶來的發展增量的衡量。其次,它著眼于探索性評價。在教育系統中,教育問題大多屬于“灰黑系統問題”[4],這本身源于教育活動的復雜性,企圖為教育評價構建一個“決定模式”本身是行不通的,也是不科學的。教育系統本身也在隨著社會的發展而變化,對于教育評價模式的選擇也是一個發展變化的過程。增值評價模式試圖通過探索影響教育產出的因素,構建起一個探索性的評價模型,在這個模型中,分析學校行為、教師行為和學生行為及其交互效應,客觀化地去接近教育發生的影響機制,從而提供一種可供參考的評價標準。從某種意義上說,增值評價不是一種評價手段,更多體現的是一種科學探索過程,評價只是這個過程的一種副產品。再次,增值評價著眼于全面的發展。它的基本理念是學校和教師應該保證所有水平的學生都以幾乎相同的速率取得學習上的進步,即每一個學生在某個時間段內的學業增值幅度應當差不多。或許這一點是增值評價帶給評價理念上的一大突破。它關注了每一個人的進步,而不僅僅是優生,能夠在更加微觀的教育層面上實現教育的公平。
增值評價的出現和發展,源于社會的發展對教育的需要,是社會對人的差異性、獨立性、發展性和價值性的尊重在教育中的體現。人生來是千差萬別的,智力水平、家庭背景、生活環境等彼此不同,這就決定了每一個人的發展基礎并不一樣。但一個人一出生,就已經成為這個社會中的獨立個體,需要面對生活的一切,誰也不能代替誰去過屬于自己的生活。同時,每一個人也面臨著能達到的不同的發展階段,教育就充當了這樣一種外在的力量,促進個體生命的發展和完善。對社會來說,不同個體的價值可能并不一樣,但這并不否認普通大眾價值的存在,個體價值的存在源于個體的獨立性。
按照布魯姆的說法,學校的責任是尋找能使每個學生達到最高學習水平的條件。學校的存在,應該為每一個個體的發展提供條件,讓他們在原有的起點水平上取得應該取得的進步。這是學校教育存在的價值和意義。與其說增值評價是一種教育評價的技術,不如說它創新了一種新的評價理念。
增值評價理念也是對其他評價理念的繼承和發展,差異性主要體現了第一代評價中“測量”的特點,個體的差異是測量的基礎,沒有差異性也就無法測量。發展性最能體現增值評價理念,它將教育對促進人的發展融入到評價中,教育的意義也就是促進人的全面發展,而評價也為著這一目標而努力,也就是第二代評價中對不同評價模式的優劣進行“描述”。同時,發展性也體現了第三代評價中“判斷”的特點,這里的判斷是對人的價值實現的判斷,也包括物對人的價值貢獻的判斷。而增值評價的價值性則體現為正在建構中的“第四代評價”的理念,“增值”不僅是一種量化的物,能佐證人在受教育過程中的進步,同時,這種“增值”也體現了一種價值和意義,這就促使我們不斷建構和豐富它的價值內涵。
增值評價觀立足于教育的過程性和發展性,是對當前教育評價中結果型評價取向的扭轉。它能推動學校或教師從關注少數優秀學生發展到關注每一個學生發展的轉變,讓每一個學生的價值都得到體現,同時也有利于激發學校的管理效能,調動老師的積極性,實現學校的內涵式發展。更重要的是,能為我們評價學校的效能提供依據,為最終打開教育的“黑箱”提供一種可能性。所以,改革我國目前的教育評價體制,需要樹立先進的評價觀,才能做到正本清源。通過引入增值評價模式,來促進當前我國教育評價體制的改革,不失為一條可選之路。
1.需要方法的不斷改進
美國學者格朗蘭德(Gronlund,N.E.)在1971年將教育評價簡單描述成,評價=測量(定量描述)或(和)非測量(定性描述)+價值判斷,這一表述方法也構成了我們對教育評價直觀的理解。所以,進行評價判斷的前提是客觀的描述現實,由于教育現象本身的復雜性,我們很難像研究自然科學一樣定量化地得出精確的規律。但是,這并不否認社會科學的科學性。著名社會學家謝宇說,社會科學的研究結果依然具有客觀性和永恒性,通過運用實證方法可以更加具體地描述現實,在保持其他條件不變的前提下,依然可以確保現象的重復性。這就說明,不斷改進和完善技術手段可以讓我們更加接近客觀的現實。目前,在增值評價的方法上,包括簡單描述性統計分析,線性回歸模型和多水平模型。每一種方法對實現評價結果的要求是不一樣的,這種要求更多的體現在數據和技術手段上。未來在方法上的改進需要來自教育學、心理學和計量方法的推動。
2.需要統計數據的不斷完善
長期以來,我國的社會科學研究的主流方法是理論分析,對于實證分析重視不夠,表現為缺乏數據意識。隨著科學的發展,尤其是統計理論的發展,加上大家對經濟領域的關注,刺激了經濟學研究的發展,使得經濟學講求數據和實證的思維方式不斷滲透到其他學科中,催生了很多與經濟學相關的交叉學科。同時,互聯網、大數據和信息技術的發展與交融,使得對于數據信息的挖掘成為不可逆轉的趨勢,這種影響已經開始在教育領域中顯現出來。學校、教師、家庭和社會對于個體的教育影響到底如何,需要從大量個體的追蹤數據庫中來獲得解釋。
3.需要理論和現實的結合
教育現實的復雜性決定了我們在使用任何一種評價模式上都必須小心翼翼。同樣地,增值評價也不是唯一或者完美的評價模式,它需要不斷在技術手段上進行改造以適應現實發展的需要。同時,它也不是一套固定的評價程序和模型,同樣需要與教育理論相結合,激發出能夠更好地解釋現實的建模創意。所以,教育建模不僅是一門技術,更是一門藝術。只有將教育理論和現實結合起來,才能真正地發揮增值評價的功能。
增值評價,以其新的評價理念順應了社會對于人才培養的需要,體現了教育對個體的差異性、獨立性、發展性和價值性的尊重,是教育評價觀在新的社會現實中的發展和完善。從技術操作層面上講,增值評價需要不斷改進統計方法,運用更豐富合理的數據,增強與教育理論的互動,同時,結合教育現實的需要完善分析技術,做到“教育建?!奔夹g性和藝術性的統一。隨著教育走內涵式發展的道路,學校問責將會打破學校既有的平衡,使得績效評價更加凸顯出來,通過增值評價觀的再審視,為推進我國教育評價體制的改革提供一種選擇的可能,最終實現營造符合當前和未來教育發展的制度環境。
[注釋]
(1) 這里的“差異化”不是因材施教,而是一種功利化的對待,一部分學生由于升學無望就被學?;蚪處煼艞壛?。
(2) 這里的不公平有入學機會的不公平,接受教育的過程不公平,最后教育的結果也不公平。
(3) 來自錢穎一在2014年12月14日“中國教育三十人論壇”首屆年會上的演講。
[1] 泰勒.課程與教學的基本原理[M].施良方,譯.瞿葆奎,校.北京:人民教育出版社,1994:85.
[2] 科隆巴赫.通過評價改進教程[M]//教育學文集.教育評價.陳玉琨,趙中建譯.北京:人民教育出版社,1989:164.
[3] 斯塔佛爾比姆.方案評價的CIPP模式[M]//教育學文集.教育評價.陳玉琨,譯,施良方,校.北京:人民教育出版社,1989:301.
[4] 查有梁.教育建模[M].南寧:廣西教育出版社,2003:11.
[5] Egon G.Guba,YvonnaS.Lincoln.第四代評估[M].秦霖,蔣燕玲,譯.楊愛華,校.北京:中國人民大學出版社,2008:5.
[6] Worthen B R, Sanders J R.Educational evaluation : theory and practice[M]// Educational evaluation: theory and practice.C.A.Jones Pub.Co.1973.p109.