董鋼鐵 王 峰 王國祥
課程考試是學校最經常、最重要的考試,它是科學評價學生對所學知識掌握程度的主要手段。能夠完整準確地反映學生真實水平的課程考試,對正確評價人才、評價教學質量、衡量辦學水平、反饋教學質量信息,有著十分重要的意義。但是,現行的課程考試多數是近百年來的經驗作法,遠不能適應形勢發展的需要,特別是教育測量理論日臻完善和計算機技術迅猛發展,使課程考試的問題日益突出:一是考試成績的客觀性缺乏準確判斷的科學依據。學生課終成績的評價,由不同教師命題,將得到不同結果,哪個結果更能準確地描述學生的課終成績,只能憑經驗和感覺認定。二是不能科學地量化評價試卷質量,已成為命題現代化的重要障礙。當前,各類各級考試主管部門都非常重視利用計算機技術使考試命題科學化、現代化。但是,國內外尚無符合教育測量理論的科學的量化評價試卷質量的數學模型,無法使計算機準確地把握試卷質量,嚴重制約了其發展。圍繞上述問題,我們緊緊把握課程考試的測量特性,以命題質量為主要研究對象,在廣泛吸收、借鑒國內外教育測量方面的理論成果,認真總結提煉傳統考試的有效做法的基礎上,建立了一個科學性、可行性良好的課程考試科學化命題體系。
一、科學化命題研究的基本思路
考試作為教育測量的主要手段,對其結果的評價與其它物理測量具有相同的共性,這就是測量的穩定和有效性。按照考生觀測分數是由真值和誤差組成的基本假設,經典測驗理論對測量穩定性的控制就是要減小測量誤差,力爭觀測分數與真值的接近。教育理論認為,用與考生水平相適應的試卷測量學生將取得最小的測量誤差,這一點在經典理論中有定性描述,而項目反理論卻明確給出了測量誤差與項目難度、考生水平的數學關系表達式,證實了定性描述的正確性。經典測驗理論的設計思想就是控制測量誤差,用與考生水平相適應的試卷組織施測,這樣就把試卷與考生的作用結合在一起,提出評價考試質量的指標體系及一整套計算方法,形成了自己的理論體系。
課程考試是水平考試,不同于選拔性考試,有其自身的特點。考試目的是要考查學生達到教學大綱要求的程度,它要求不同時間、地點的考生掌握相同、穩定的考核標準。這個標準就是教學大綱對教學目標的要求。照搬經典測驗理論用于學校的課程考試必然使命題水平受試測樣本的影響,不能把握穩定的考試標準,違背教育測量特性。
我們開展課程考試命題的研究,按課程考試的測量特性,從真值是達到測量標準程度的反映,嚴格把握測量標準入手,建立科學的試卷質量評價體系。其基本思路是:引入模糊數學的思想方法,把教學大綱對教學目標的要求看作是一個模糊集合,試卷作為抽樣是一個樣本集合,用模糊貼近度描述試卷與大綱的_致性程度,達到控制試卷質量的目的。
二、科學化命題試卷質量的評價體系
按照我們科學化命題研究的基本思路,需要計算試卷與大綱一致性程度。試卷與大綱的一致性程度表征為兩個方面,一是由試題難易程度及其搭配所表征的試卷水平,二是試卷所反映的考試內容,前者我們稱之為水平貼近度,后者稱之為內容貼近度。
(一)試卷水平貼近度
我們首先引進標準試卷的期望均值和期望方差的概念。
假設存在一份能準確反映考試目標要求的標準試卷,在測量實施者正確地掌握并能夠正確地使用測量工具的情況下,對理想的考生組(在正常的教學環境下,經過正常的教學過程)進行測試,所得結果(即分數),反映了考生的實際水平(真值)。如果用幾份不同的、但與標準試卷完全等價的試卷對上述考生組進行測試,所得結果對某個考生來說應相同,而對于一個總體來說其平均分應一致、方差應一致,都應等于理想考生組真值的均值和方差。
我們稱理想考生組真值的均值和方差,為試卷的期望均值和期望方差。它們是在理想情況下引入的衡量試卷測量結果的兩個指標,與平常考試的統計測量考生的總體均值與方差很相似,但在本質上二者不僅數值不同,概念也不同。前者是用等價試卷對理想考生組反復測試的統計量,是對考生總體均值和方差的數學期望,后者只是一次測驗樣本的統計結果。
期望均值與期望方差是在試卷作用于考生之前就客觀存在的,是通過考試表現出來的,是描述學校課程考試學生真分數分布理想模型的兩個統計量,是試卷準確反映教學大綱要求程度的期望值。其現實意義在于為編制試卷確立了一個客觀的參照標準。試卷的均值和方差越趨近于期望均值和期望方差,說明試卷與教學大綱的要求越貼近。這樣,試卷的水平貼近度就可以理解為編制試卷與標準試卷的一致程度。
下面我們用量化的形式描述兩試卷的一致性程度。(略)
(二)試卷內容貼近度
我們把教學大綱的要求看作是一個模糊集合,試卷反映教學大綱要求的程度看作是另一個模糊集合,用模糊貼近度來定義試卷的內容貼近度。(略)
采用兩曲線距離描述試卷水平貼近度和采用兩向量距離描述試卷內容貼近度,突破了考試命題質量評價的難點,為考前綜合評價試卷質量提供了依據。它能根據同一教學目標,制定復份等價試卷,實現不同時間、不同地點的考生使用不同的試卷(復份等價),其成績等值可比。特別是為計算機題庫建設提供了評判試卷質量的專家智能,使得計算機能產生高質量試卷。
三、課程考試科學化命題的主要環節
按照課程考試測量特性及試卷質量指標計算的要求,課程考試科學化命題應包括以下主要環節:
(一)制定學科考試大綱,將教學要求轉化為測試要求
考試大綱是聯系教學大綱與試卷的橋梁,這個作用決定了這一工作應根據教學大綱的要求緊緊圍繞教學大綱的教學目標制定,即教學大綱一考試大綱相互配套。考試大綱在內容上一般應包括:考試目標、考試內容和考試標準。另外,鑒于考試大綱與教學大綱的不同,在考試大綱中還應對考試方法做明確規定,如考試時限、所用題型、作答要求、樣卷等。
考試目標就是檢查學生實現教學目標的程度。考試目標原則上應與教學目標相同,考慮到教學大綱確定的有些教學目標難以通過考試來測量,因此應認真分析教學目標的要求并使之轉化為可測的,以實現檢查學生實現教學目標的程度。
考試內容就是教學內容。為了能為考試命題提供具體、清晰的標準,需要將教學大綱規定的教學要求轉化為具體的測試項目。鑒于目前的教學大綱中,對傳授知識與培養能力分別提出了明確的要求,因此,考試內容可按學科知識的部分和心理能力的層次,分別確定試題的占分比例:
1.將教學大綱中教學內容的要求轉化為主要教學內容考查點,根據各考查點內容在教學大綱中的地位,確定考試分數比例。
2.根據學科特點確定能力層次比例。一般情況下能力層次可分為識記、領會、簡單應用、綜合應用、靈活應用等,也可根據學科的特點按教學大綱中培養能力的要求分類。
3.考試標準就是根據考試目標規定的關于考試范圍、深淺程度等方面的具體要求。這里應盡可能減少使用“理解”、“了解”、“掌握”、“領會”等描述性語言,應該以判斷學生在所要求的行為方面所發生的變化程度為標準,如考生應能做什么,或具備哪些特征等。
(二)建立學科試題庫,確定試題要求度
試題要求度是根據試題所屬的考核能力層次、知識面和深度、解題技巧等諸多因素綜合加以評定的指標,是相對教學目標而言,是試題內容重要性和復雜性的體現。
試題要求度通常由專家組綜合評判得出。
(三)確定學科大樣本情況下的統計常數(略)
(四)配制試卷,計算質量指標
1.試卷水平貼近度的計算。(略)
2.試卷內容貼近度的計算。(略)
至此,從理論研究設計到實際操作運行,形成了一個較為完整的體系,為學校這種大量的、經常性的考試提供了一個科學性、可行性良好的樣本。隨著實踐不斷深入,理論逐步完善,科學化命題的理論和方法必將產生較大的社會效益。
第一作者系空軍第二航空學院院長(長春130002)
責任編輯:邵英