南紀穩
自2002年教育部《關于積極推進中小學評價與考試制度改革的通知》發布以后,各省市教育廳局,為全面深化高中學業評價改革,相繼出臺了關于普通高中學生綜合素質評價的實施方案。中學生綜合素質評價就成為實施素質教育和新課程改革的主要保障措施之一和新課程改革的主要領域。迄今為止,實施綜合素質評價已近十年,雖然取得了一些成效,但人們普遍感到,學生的綜合素質評價實際被虛化,陷入了一種困境。這種困境主要表現為教育行政部門要求的必然性與學校師生應付的虛化現象。由于綜合素質評價的結果在高校招生中幾乎不起作用,所以,中學常常不重視,僅停留在應付的層面上,使得學生綜合素質評價的功能難以發揮,促進學生多方面素質發展的課改目的難以達到。
教育部《關于積極推進中小學評價與考試制度改革的通知》(以下簡稱“通知”)指出:“中小學評價與考試制度改革的根本目的是為了更好地提高學生的綜合素質和教師的教學水平,為學校實施素質教育提供保障。充分發揮評價的促進發展的功能,使評價的過程成為促進教學發展與提高的過程。”“高等學校選拔方式的改革要進一步探索建立在文化考試基礎上綜合評價、擇優錄取的辦法。”“高中應探索建立綜合性的評價體系,增加反映學生在校期間參加研究性學習、社會公益活動及日常表現等真實、典型的內容,為高等學校招生工作提供更多的學生成長信息,逐步使中學對學生的評價記錄成為高等學校招生擇優錄取的重要參考之一”。
從《通知》可以看出,中學生綜合素質評價的主要目的是為素質教育提供保障,促進學生多方面的素質全面和諧發展。但是,這并不是學生綜合素質評價的目的和功能的全部。綜合素質評價的另一個目的和功能是為高等學校招生擇優錄取提供重要的參考。但是在理論觀念上,人們常常以一種二元對立的思維方式,一味強調綜合素質評價的發展功能,忽視或遺忘了它的選拔功能。擔心學生綜合素質評價成為新的應試工具。這種二元對立的思維認識在理論上是錯誤的,對實踐是有害的。
從實踐的邏輯來看,中學生綜合素質評價的選拔功能是發展功能的動力源。選拔功能對于中學開展學生綜合素質評價具有“四兩撥千斤”的杠桿作用。綜合素質評價首先是一種評價。評價是一種價值判斷,這種價值判斷要變得有意義,就需要得到社會的認可。在當前,社會對學生綜合素質評價是否認可的主要的、直接的方式就是綜合素質評價的結果是否作為高校招生的直接依據。設想一下,中學的教師和學生,花費了大量的時間和精力進行過程性評價的綜合評價,促進了學生多方面素質的發展,評價結果在高校錄取時卻沒有發揮什么作用,得不到高校的承認,甚至由于加強其他方面素質的發展,而使得高考成績有所降低,而影響學生進入優質大學,那么學生和教師會對綜合素質評價有積極性嗎?
有人擔心把學生綜合素質評價的結果進行量化,直接與高考掛鉤,會使綜合素質評價淪為應試教育的工具。這種擔心和認識也是一種誤解。高考對中學的指揮棒作用,或者說高校招生對中學的指揮棒作用,是一種規律性作用。無論你承認不承認,這種規律性作用都始終存在著。對于高考的改革,不是取消不取消的問題,而是怎么考和考什么的問題。是把招生的指揮棒指向何方的問題,而不是要不要這個指揮棒的問題。中學生綜合素質評價也是一種考評,也是一種“考試”。如果把綜合素質評價的結果直接計入高考總分,促使中學師生在思想上重視綜合素質評價,把學生綜合素質評價落在實處,通過綜合素質評價真正促進學生多方面素質的發展,而高校又招收到了高分數和高素質的學生,我們又何樂而不為呢?
中學把學生的綜合素質評價結果提交給高校,但高校在錄取學生時卻幾乎沒有參照學生的綜合素質評價結果。致使中學生綜合素質評價與高校招生說起來掛鉤,其實并沒有掛鉤,是一種虛掛鉤、假掛鉤。導致這種狀況的主要原因有兩個方面:一是綜合素質評價結果的有效性和公平性存疑;二是綜合素質評價結果沒有區分度。
在實踐層面,從各省市的高考方案和中學生綜合素質評價方案可以看出,綜合素質評價和高校招生的關系是一種軟掛鉤的關系。所謂軟掛鉤,就是從表面或形式來看,兩者是有關系的,中學生綜合素質評價結果和高考成績共同構成高校招生的依據,綜合素質評價結果作為高校招生的參考依據之一。但實際上綜合素質評價并沒有起到這樣的作用。如,2012年江蘇省高考方案中規定:在綜合素質評價中,考生“學習能力”、“運動與健康”、“審美與表現”單項達到A級且其他三項均為合格的,高校在同等條件下可以優先錄取;均為D級的,高校可以不予錄取。但由于綜合素質評價的結果采用A、B、C、D的等級計分方式,有些一級指標僅為合格和不合格兩個等級。這種等級計分方式導致大量考生的綜合素質評價等級相同,區分度極低,當有考生的高考成績相同時,綜合素質評價的結果也難以發揮作用。(況且由于一所大學的某個專業在一個省市常常只招收幾個或十幾個學生,同一專業的考生,很少有相同分數的情況出現。)另外,高中會考成績或學業水平測試成績一般也以等級計分方式,進入綜合素質評價或單列進入考生的高考檔案。會考成績同樣缺乏區分度,對高校錄取考生沒有什么貢獻。為了提高綜合素質評價和會考成績在高校招生中運用的可能性,必須提高其區分度。
要提高綜合素質評價結果的區分度,就必須改變當前的計分方式。把等級計分改為數字分數。例如,假定綜合評價有五個一級指標,每個指標可按2、4、6、8、10計分,每個指標的滿分值為10分,綜合素質評價的總分為50分。對特長不計分,進行具體描述。這種計分對每個一級指標來說,仍然是等級計分(每個指標仍然是5個等級),但這樣就可以計算每個學生綜合素質評價的總分。這就明顯擴大了分數的分布區間,有利于提高區分度。另外,為真正提高綜合素質評價的區分度,還必須在對每個一級指標評價時,按照教育與心理測量理論確定每個等級的人數或比率,避免絕大多數學生在同一個指標上都得5分或4分。測量學指出,人的許多品質特性都是正態分布的,應當按照正態分布理論來確定每個分值(每個等級)的人數和比率。這樣學生的綜合素質評價結果的總分也就符合正態分布,其必然具有較高的區分度。將其計入高考總分,在高校招生錄取時,綜合素質評價結果就能真正發揮作用。這自然會以杠桿的作用,推動中學的師生積極、認真地對待綜合素質評價,使綜合素質評價真正落在實處,取得實效,而不再虛化。
此外,高中會考成績,卷面原始分數本來是百分制計分,具有較高的區分度。但各省市的考試主管部門,卻把會考成績轉化成了A、B、C、D的等級。這一方面把比較精細的分數,變成了粗糙的分數,丟失了許多信息,這在測量學上是不科學的。另一方面,這種粗糙的等級分數也大大降低了會考成績的區分度。所以,要想使會考成績在高校招生中真正發揮作用,應當以原始分數乘以某個系數(如0.1)后計入高考總分。這樣就可以提高會考成績的區分度和其在高校招生中的重要性。
中學生綜合素質評價在高校招生中被虛化的主要原因就是綜合素質評價的效度和公平性存疑。關于效度問題,主要應當解決好內容效度。“綜合素質評價”主要是一個政策術語和實踐術語,是由教育部關于中小學評價和高考改革的有關政策文獻提出和衍生的。其具有較大的概括性和模糊性。什么是綜合素質?中學生綜合素質的結構是什么?綜合素質評價的指標如何設置?有效的評價方法和手段是什么?這些都需要教育評價理論工作者進一步研究,為提高綜合素質評價的效度提供理論基礎。
當綜合素質評價與高校招生硬掛鉤時,關于綜合素質評價的公平問題,就成為社會和學校最為關心的問題。綜合素質評價的公平涉及兩個方面:一是技術公平;二是倫理公平。綜合素質評價的組織實施機構是學校。當我們要求學校按照正態分布理論,確定綜合素質評價各個等級人數時,即在各個學校各個等級人數所占各校畢業生人數的比例是相同的。這樣,由于各個學校的整體教育質量有差異,各個學校的學生素質有明顯差異,對于教育質量總體偏高的學校就會產生技術不公。一流學校的A(5分)和三流學校的A(5分)顯然是不一樣的。解決這一不公可以由省、市級教育督導部門,定期(如3年)對轄區的高中學校進行綜合素質教育質量評估。把轄區內的高中學校分為A、B、C、D四個等級,各等級學校數符合正態分布理論。規定學校系數K分別為A=1;B=0.8;C=0.6;C=0.4。一個考生計入高考總分的綜合素質評價分數(Z)為:校評分數(X)乘以學校系數(K),即Z=X*K。
綜合素質評價中的倫理公平是指,少數評價主體在評價中不能客觀公正地進行評價,為謀取私利而弄虛作假所造成的不公。對于倫理不公的問題,應當把綜合素質評價打造成陽光工程,通過建立完整的評價機制和制度給予保障。建立合理的評價實施機構、監督機構,實行公示、申訴制度等。更為重要的是要把學校實施綜合素質評價的制度、過程和結果,作為省市教育督導部門對學校綜合素質教育質量評估的重要內容,對學校的綜合素質評價工作進行元評價。這樣可以極大的降低或避免倫理不公。
中學生綜合素質評價結果與高校招生實行硬掛鉤,是走出中學生綜合素質評價困境的唯一出路。我們不能因噎廢食,因擔心極少數人弄虛作假,使得高校招生有失公平,而使得中學綜合素質評價長期虛化,最終導致新課程改革的失敗。正確的邏輯應當是把中學生綜合素質評價結果與高校招生硬掛鉤,在實踐中暴露問題、發現問題、解決問題,而不是等一切問題都解決了,再硬掛鉤。為了積極穩妥,硬掛鉤應當漸進實施,最初可以把評價結果的滿分折合成10分,計入高考總分,以后逐步提高到50分或更多。