摘要:高中學業水平測試如果不與高考掛鉤,各高中學校對此不會有太多重視,教學會集中精力于高考科目;如果與高考掛鉤,卻又被過度“重視”而加劇應試之風,影響正常教學。比較發達國家學業成就評價改革的理論與實踐研究成果,或許可為解決此兩難困境、為學業水平測試的正確走向提供一些借鑒。
關鍵詞:高中;學業水平測試;學業成就評價
中圖分類號:G40 文獻標志碼:A 文章編號:1673-9094(2011)09-0008-04
一、問題的提出
按照教育部的要求,考生的綜合素質評定、高考總分以及學業水平測試(簡稱“學測”,俗稱“小高考”)將成為高校選拔錄取的依據。因此,全國已公布“新高考”方案的省份中,越來越多地把學業水平測試逐漸和高校錄取實行“掛鉤”,有的是硬掛鉤,有的是軟掛鉤,還有的是暫不掛鉤。硬掛鉤即學測等級作為高校錄取硬條件,錄取依據看高考成績和學測等級,并且某些省的學測等級優異可在高考中加分。將學測與高考選拔掛鉤,是為了加強高中學校對考生的綜合素質評定和學業水平測試的重視,在一定程度上有效遏制了學校“非考不教”的現象,但是其對高中教學的矯枉過正的負面影響也必須引起重視。以江蘇為例,實行新的高考方案以來,為了促進各個學校不打折扣地開展學業水平科目的教學,在高考方案中確定了學業水平科目測試A等級在高考總分中加分的政策,前后有兩種加分方法,最先的方法是,學業水平科目測試四科均得A等級在高考總分中加10分,后來的方法是,學業水平科目測試每科A等級加1分,四科均為A等級加5分。顯然,現行的加分方法相對前一種加分方法要合理一些,然而,其弊端仍然是存在的。概而言之,背后的問題是學測在性質和功能上是否應當跟高考掛鉤,在重視學習評價改革的今天,重視基礎達標的學測與以選拔為第一要務的高考掛鉤,是否已背離了學測的本質屬性?
二、問題的成因
學業水平測試與高考掛鉤能夠盛行一時,而學業成就評價實踐舉步維艱,其背后的原因是復雜的,可以說囊括一切課程改革深入推進受牽制的文化、社會因素。既受到西方近百年測量運動本身不足的影響,也來自于我國千余年科舉考試的文化傳統,更受制于政策設計者本身的有限理性等。
1.西方近百年的測量運動和我國千余年的科舉應試傳統:余波未減,又有新浪
從國際發達國家來看,學業成就評價的發展是從簡單的數量化測驗開始的,經過教學目標為中心的階段,從單一數量化測量的漩渦中走出來并逐漸轉向較為全面意義上的評價①。后期人本化評價的出現,也使評價從注重學生內在的學業能力走向更加重視學生微觀的學習進程,以開發學生的潛能、促進學生的發展為目的的學業成就評價。
但學業成就評價作為教育測量與評價的主要內容,受到近百年測量運動本身主要的缺陷——管理主義傾向、忽視價值的多元性、過分依賴科學范式的影響??梢哉f其在教育史上一出現就遵循一條科學與客觀之路,這種科學與客觀在學生評價的標準化階段由于過分強調與突出而有所扭曲。另外,中國有著千余年的科舉考試傳統,以致現在提到評價,人們腦中出現的就是“考試”二字。比如,今年“兩會”期間,全國政協委員杜玉波表示,近期將成立國家考試指導委員會,研究制定考試招生改革方案[1]。其實,國家考試指導委員會是需要的,畢竟我們目前的考試還很不專業化。但相對而言,我們國家對于考試改革已積累了較為豐富的實踐經驗,更需要的是評價指導專業委員會。如果只在考試內部改革,全面多元化的評價改革便很難有真正推進。
有考試,就有對應試的重視。無獨有偶,美國在“不讓一個孩子掉隊”法案出臺之前,很多州都沒有自己的考試?,F在除了一個州沒有,其它所有的州都有自己的“成就考試”。在這一法案頒布之前,僅有Harcourt,CTB,Riverside和ETS四個公司為學校設計相關的考試。但是現在涌現出大量的公司,致使有時孩子們的學習只是為了考試。在上世紀70年代美國開始實行“教育責任制”后,要求以考試成績為依據來評判學校的好壞,各州對最低能力測試提出了許多要求。不過,這些最低能力要求很快成為學校努力的最高要求。為了克服這種弊端,各種標準化測驗應運而生,其后果則是為了獲得基本技能測試分數的提高,犧牲了學生高級思維能力和問題解決能力的培養。教育責任制需要收集足夠的有關學校質量、學生學習效果的信息,而標準化測驗所測量的能力范圍是有限的。在美國的基礎教育領域,不管是州級、學區級還是校級的學生評價,都突現出兩個特點:測量運動的思想依舊占據很重要的地位;評價與績效責任緊緊聯系在一起。測量運動的余波與績效責任之風在學生成就評價領域掀起了新的應試風浪。美國基礎教育正在面臨“我要成為第一”的危機,大家都在尋找辦法證明自己的孩子比他人的聰明,自己的學校比他人的好,自己的工作比他人的重要,直到自己成為第一為止。
人人想在考試中爭分奪優,而考試被認為是最具有公信力、最客觀的評價方式,最能被大家所接受,以致人人痛恨現今的考試高壓,卻又人人不自覺地對各種訓練、各種考試身體力行。作為學業成就評價主要方式的學業水平測試,它本應是對學業的評定,但因各省逐漸與高考掛鉤,擔負了選拔任務,其本體功能被扭曲,進入了學業水平測試為高考服務、為升學和選拔服務,教育教學為考試服務的惡性循環。在提高學校教育質量的改革中,學校管理者首先關注的將是如何提高學生的成績,追求的是學生的成功而不是學生的成長。我們習慣于將測試成績視為學校、區域成功與否的指標,而遺忘了評價是一種促進學生發展與完善的工具,忽略了評價可以成為學校成功的原因。與高考硬掛鉤的學業水平測試正受到社會、學校、師生的抱怨。
美國當前教學實踐中的應試情況和我國的“應試教育”背景不同。美國最近一輪的改革是在提高標準,由原來的低標準走向高標準。而解放以來我國在教學方面的指導意見都是提出要降低教學要求,降低標準。因此,我們不能盲目地參考美國的測量與績效辦法,而應該借鑒其評價內容的寬泛和評價方式的創新。我們應當做的是讓測試走向評價,促進學生的全面發展。
我們的確需要考試,但不能為了考試而學,如果這樣的話就失去了學習的真正意義??荚嚳梢詼y量和評價學生對知識或者過程的重現和回憶,但無法評價學生的創造性,不能培養終身學習者。美國“不讓一個孩子掉隊”法案確定了考試的重要地位后,隨之而來的便是更多的考試,人們對考試需求似乎也越來越多,而課程與教學在其它方面更值得關注的問題被掩蓋了。
2.初衷在于全面檢測學生達標情況的學業水平測試:始料未及,矯枉過正
學業水平測試是我國普通高中綜合評價的重要組成部分,是在國家指導下以國家普通高中課程標準為考核內容,由各省組織實施的全面檢測普通高中學生學業水平的標準參照性考試。事實上,在國家制定了課程標準后,如何評價學生是否達到課標所規定的標準便是研究要務和工作重點,這也是學測之基本任務。而中國的普通高等學校招生全國統一考試(簡稱高考),是中華人民共和國的重要的全國性考試之一。普通高等學校招生全國統一考試的定義是:合格的高中畢業生和具有同等學力的考生參加的選拔性考試。因此,高考應具有較高的信度、效度,必要的區分度和適當的難度。高考的本質屬性是選拔性。
由學測與高考的界定可知,學測與高考是兩種完全不同性質、不同種類的考試。但是,當下實踐中的學測已逐漸迷失了它的方向。比如江蘇提出,實行學業水平測試的目的是“為了加強對高中的課程管理和質量監控,同時,向高校提供更多有效的考生信息。有利于促進高中學生全面發展,有利于高校更加科學、自主地選拔人才?!边@樣,學測也就被賦予了選拔性。難道高考本身還不具有很好的選拔功能嗎?為何非得把學測跟高考捆綁?向高校提供更多有效信息、促進高中學生全面發展的目的是否可以實現?學測與高考掛鉤、學測成績在高考中加分是否合適不僅可以由其本質屬性來考量,還可以通過實踐來檢驗。學測的等級是由考試的絕對分數決定的,而目前的測試命題仍然屬于經驗型命題,每年同一學科的測試難度不具有可比性,因此,這種加分就存在著事實上的不合理性,且會挫傷不同學科教師的積極性與學生學習的積極性。更為嚴重的后果是從根本上影響了學測對高中課程管理與質量監控目標的達成,更不利于高中學生的全面發展。正如江蘇“兩會”期間,某名校副校長指出:這種學測與高考硬掛鉤加分政策的存在,造成的最大問題是,學校為了讓更多的學生在高考中加分,就可能違背教學的客觀規律去組織學業水平科目的教學,事實上,這種現象已經普遍存在。這也就是中國的高中教育現實。對此,不少學校、教師和學生也很有意見?,F在的高中學生學業負擔明顯加重了,這是一個不爭的事實。學校通常要求保證等級“絕D”、“滅C”。鑒于“學測”在高考中可以加分,學校還要求學生考試成績“保B”、“爭A”。為了切實減輕學生的學業負擔,深入推進素質教育,有必要對這一“加分”政策進行反思。
3.評價主體對學業成就評價的實踐認識和理論研究:認識偏差,實踐忽視
首先,評價主體的評價觀有問題。維根斯(G.P.Wiggins)認為之所以產生標準化測驗統治學生評價的狀況,是因為教育管理者傾向于評價一些易于測定的知識和技能,而非那些作為課程核心或標準的以及在課堂中真正有價值的真實而復雜的問題與任務。在做這樣的選擇的同時,學校層面的學生評價忽視了學生的智能發展需求,追求所謂的評分的準確與評價的效率。換言之,真正阻礙學生成功地達成教育目標的不是倍受指責的標準化測驗,而是教育管理者的評價觀:認為學生評價不是教與學的驅動器而是計量器,由此而制定了標準化測驗;反過來,這種測驗的普遍應用又進一步造成了學生評價的僵化。
在大多數學校中,教學管理人員包括校長同樣非常缺乏新的學生評價知識,所使用的評價模式仍然十分傳統,因此不能調動廣大教師改革學生評價的積極性和創造性。即使教師被要求進行改革,他們也不愿意去做那些認為是“份外”的事情。所以,往往在強行花了大量的時間和人力之后,教師們又都回到原來的老路上去[2]。以上問題在發達國家與發展中國家呈現普遍性。國內有研究者對上海市浦東新區的130名中小學教師進行了有關調查,發現:約58%的教師沒有嘗試過改變以往對學生的評價方式,在改變過評價方式的教師中也有部分認為條件不夠成熟,如升學指揮棒不變、家長和學生不支持、學校重視不夠、各方面協調不夠等而造成效果不理想,難以實現預期目的。有的教師甚至感到很沮喪:當自己的評價方式改變后,所教班級在考試時與那些沒有改變評價方式的班級相比,在成績上沒有任何優勢,而不管學校還是社會在衡量教師的優劣時,首先還是看所教學生的分數?。郏常菀虼?,評價主體對學生評價的正確認識是個根本問題。
其次,教學一線人員的評價理論知識和實踐技術十分欠缺。教學一線人員,尤其是中小學教師,十分缺乏教育評價的理論知識和支持性的資料與信息,他們不適應先進的學生評價理念,更不知道應當如何進行新的評價操作,非常需要在學生評價的程序與方法上得到及時、有效的指導。雖然教師的這些需求從20世紀60年代開始就一直被呼吁,美國教育界也為此做過一些努力,但始終沒有真正解決好;因為大學的教師教育,無論是對本科生還是研究生,幾乎都沒有把教育評價作為必修內容,很多學校未開設過評價與測量課程,沒有教給學生如何在教學工作中開展學生評價,高校教師也很少強調這方面知識的重要性。這是導致目前在職教師嚴重缺乏教育評價理論和技能的重要原因。
此外,在學生評價改革的許多方面,教育評價人員和測量專家的觀點不一致,提出了不同的程序與要求,而且他們所使用的專業術語和教師的個人理解又不一樣,理論上的要求與教學中的評價相差很大。這種評價理論和實踐之間難以溝通的局面,使教師們感到非常困惑,無從應對,最后便自作主張走老路。由于評價的標準不統一,也由于廣大教師沒有掌握開展學生評價的必備知識和技能,不能正確地實施評價,所以在許多情況下給學生帶來了不應有的損失。例如,評價信息不全面或不真實,評價結論不正確,使得學生、家長以及其他使用評價信息的人,往往對學生的身心發展和學業成就做出錯誤的判斷,從而選擇了不恰當的教育方法和策略,影響了學生的健康成長;造成了評價的具體實施在不同學校和不同教師之間的變化太大,評價結果無法作為學生學習成就的有效指標。因此,評價要有明確的標準可參考,并且在實踐中具有可操作性。
注釋:
①學業成就評價從20世紀初的教育測量運動開始到現在近百年里,基本經歷了較為清晰的四個階段,即:教育測量階段、以目標為本的教育評價階段、目標參照的教育評價階段和人本化的教育評價階段。從各階段的特征上看,教育測量階段主要把心理測量技術應用到教育當中,側重測量技術和教育測驗。以目標為本的教育評價階段是以泰勒的“八年研究”為代表,把教育評價直接與教學目標相聯系,評價教學目標的達成度。目標參照的教育評價研究通過教育目標的分類,在認知心理學信息加工理論的基礎上突出了學生的信息加工過程。到了20世紀末,在人本主義思想的影響下,人本化的教育評價更加注重學生的人性化因素。
參考文獻:
[1]郭少峰.國家考試指導委員會年內成立[N]新京報.[EB/OL]http://news.ifeng.com/mainland/detail_2011_03/05/4985146
_0.shtml,2011.3.5
[2]蔡敏.美國《學生評價標準》評析[J].外國中小學教育,2003(11).
[3]張惠.陜西省普通高中學業水平考試與澳大利亞高中教育證書考試比較研究[D]. 中國優秀碩士學位論文全文數據庫,2009(07).
Academic Proficiency Test: Predicament and Solution
NI Juan
(Jiangsu Institute of Educational Science, Nanjing 210013, China)
Abstract: If senior high school academic proficiency test is not related to the college entrance examination at all, no school will attend to the test. Consequently the subjects necessary for the college entrance examination will be the greatest concern. If it is closely related to the entrance examination, it will be overrated. To solve the dilemma, we may draw lessons from the theories and practice of developed countries.
Key words: senior high school; academic proficiency test; academic achievement assessment