


高中學業水平考試是目前教育改革的熱點,但討論的話題往往局限于它在高校招生中如何發揮作用,而忽視了它更重要的功能。教育部《關于實施普通高中學業水平考試的指導意見》(送審稿)這樣闡明普通高中學業水平考試的功能:其結果是衡量學業是否達到畢業標準的主要依據,是反映普通高中學校教育教學質量和辦學水平的重要指標,是高校招生錄取的重要依據,也是各級教育行政部門進行普通高中課程管理,督促學校認真執行課程方案和課程標準,規范教育教學行為的重要手段。
顯然,為高校招生提供依據僅是其中的一個功能,高中學業水平考試還有管理與監控、診斷與指導功能。管理與監控功能主要體現于教育行政部門的政策制定和學校的規范執行,而診斷與指導功能的應用途徑值得探討。
一、充分利用學業水平考試的標準參照性優勢
以經典考試理論為基礎的常模參照性考試,它是以考試群體的平均水平作為參照標準,以個體得分的高低來說明其在該群體中的相對位置。它注重學生個體之間的比較、區分和鑒別,主要適用于區分學生的學習水平,供選拔用。這種考試要求測得的分數變異性大,分數分布梯度大,試題有較強的區分度和鑒別力,以便充分鑒別測試對象的差異,目的是對測試對象進行區分和排隊,但它缺少診斷的效用。
而標準參照考試是按照具體的表現(學業)標準水平對被測對象的測量結果作出直接解釋的考試,它直接判別測試對象是否達到某種學業標準或要求。其特點是學生成績的高低是絕對的,不表示學生在同類集體中的相對位置。換言之,它是基于教學目的,為考查學生是否“掌握”某種知識或技能而設計的,而不是為了給學生排隊。
可見,若要用來考查學生的基礎知識與技能的學習情況,常模參照性考試是不理想的。因為了解學生哪些內容學得較好,哪些知識需要補救,哪些學生需要個別指導,哪些教師在教學中存在著某些缺陷等等,這些都需要直接識別學生掌握的程度,需要用標準參照考試來評定和診斷。
相比較而言,標準參照考試的命題程序較復雜,需要與預先規定的學業標準加以細致比較,試題必須正確地反映課程標準規定的學習目標,方可作為學業水平評價的標準,而且題目在數量上和質量上要與測定的內容和范圍一致,不然就會“差之毫厘,謬以千里”。由于要求很高,這需要經驗豐富的能正確理解課程標準要求的專家團隊精心編制標準參照性考試試題作為檢測工具。區域統一的學業水平考試就是按照這一思路應運而生的。
學業水平考試是普通高中綜合評價的重要組成部分,是依據國家統一標準,在國家指導下由各省市組織實施的全面檢測普通高中學生課程學習水平的標準參照性考試。
學業水平考試不僅能較為準確地評價學生的學業水平,綜合檢測學生的知識水平和能力結構,而且能為教學狀態分析提供大量數據和信息,我們要充分利用學業水平考試的標準參照性優勢為教學診斷服務。從大處講,教學診斷是政府監測區域或學校教學質量的重要手段,是發現區域或學校教學薄弱環節的精細化管理舉措,是調整區域或學校資源配置、課程管理、師資培訓等措施的重要依據。從小處講,教學診斷是提出改進教與學建議的一種行為,是教師對教學活動中各種現象進行檢查、分析、反饋、調節,使整個教學活動、教學行為日趨優化的過程。
由于學業水平考試的權威性,它在區域或學校的教學診斷中將起著綱舉目張、舉足輕重的作用。我們應該充分利用學業水平考試的標準參照性,充分發揮它的教學診斷功能。
二、根據學業水平標準確定學生學習結果的項目和要素
學業水平標準是建立在課程標準基礎上的,重點包括了學業內容及表現標準。因此,命題者除了考慮知識結構與能力結構的合理分布之外,還要為以后的學習結果分析作準備,對學科因素與學習水平作科學細致的編排。由于學業水平考試試題考查的技能和能力與整個目標領域的技能和能力基本一致,在命題完成后,我們將所有試題按照知識結構、能力結構、學習水平和學科因素進行分類,以便統計數據能直接反映出學生技能和能力在各要素上的反映。并且只有這樣,我們才能基于課程標準科學地分析、歸納、梳理、總結,充分了解學生學業的詳細情況,再回到課堂教學實踐中發現問題,查找問題根源并提出診斷方法和教學建議。如何根據學業水平標準確定學生學習結果分析的項目和要素呢?
由于學業水平考試的表現標準與目標領域的內容標準和能力標準的一致性,學科學習結果的構成要素就直接與課程學習領域的目標體系相聯系。浙江省根據布盧姆教育目標的分類理論,在研究教學目標、學科能力的基礎上,結合學科特點和教學要求,構建了物理學科學生學習結果分析和診斷的基本框架。
1.學習水平
根據高中物理課程的教學目標,以現代教育理論與認知心理學研究為基礎,我們將高中學業水平考試學習水平分為4個層次,從低到高依次稱為識記、領會、應用和綜合。
2.能力結構
根據物理課程標準,學生通過高中階段的學習,可達到的基本能力歸納為6個方面:觀察實驗、識別記憶、感知領會、情景概化、系統整合和信息處理。
觀察實驗——指對物理現象進行正確觀察和獨立完成實驗的能力:在明確實驗目的和理解實驗原理的基礎上,能運用所學的物理方法,進行簡單的實驗設計,正確選擇和使用儀器、器材,合理安排實驗步驟;會控制實驗條件,正確觀察研究對象發生變化的過程和特征;能正確測量和讀數,處理實驗數據,并獲得正確結論;能初步分析產生誤差的原因,獨立寫出簡要的實驗報告;具有良好的實驗修養和習慣。
識別記憶——指能表述或再認所學物理知識的能力。物理知識包括物理學的重要史實(現象、實驗)、術語,重要的物理常量,概念的定義、符號、單位和規律的表達式等。
感知領會——指掌握物理概念和規律的能力,包括了解物理概念、規律的引入背景,明確它們的物理意義、文字表達、圖像表述、數學表達式、適用范圍和條件,并能解決較為簡單的物理問題。
情景概化——指運用物理方法對實際問題進行分析處理,并將其轉換成簡單、典型的物理情景(狀態、過程或圖像、圖示)的能力。物理方法包括理想方法、等效方法、對稱方法和模型方法等。
系統整合——指能對一個復雜的物理問題進行系統分析,將其分解為若干個簡單過程,分別找出它們的特點、異同和聯系,靈活地運用相應的物理規律進行判斷、推理和組合,從而獲得結論的能力。
信息處理——指能閱讀、提取與物理學有關的信息,理解其文字、圖表的主要內容和特征,結合所學的知識和方法,運用數學工具進行加工處理。
3.學科因素
根據物理學科的特點進行分類的學科因素包含史實、概念、規律、圖表和實驗。
4.知識結構
按照物理學科的知識體系進行分類,其知識結構包含力學、熱學、電學、光學、原子物理、綜合運用6個部分。
我們把4個項目21個要素用矩陣形式排列,形成學習結果分析和診斷矩陣,表示如下(圖1)。
矩陣中各項目之間以及各要素之間都存在著內在的聯系,學科因素和知識結構反映的都是學科的知識體系和學科特征,學習水平和能力結構則反映知識與能力的雙重因素之間的聯系。多因素、多角度的分析和歸納,目的在于從不同的角度全面反映學生的學習結果。
三、對學生學習結果的分析和診斷
1.發布浙江省學業水平考試成績與學業質量分析報告
這幾年浙江省利用學業水平考試數據發布了全省一年兩期的《普通高中學業水平考試質量分析報告》和《普通高中學業水平考試成績報告》。內容包括各地、市、縣甚至學校各學科不同等第的學生比例分布,及格、良好和優秀的教學水平評級,學生對客觀題各選項的選擇比例分布情況、主觀題應答情況以及學生應答信息中與診斷項目矩陣中各要素的對應關系。
在學業水平考試命題時,我們先以項目矩陣中的各要素建立相應的指標體系,并列入命題細目表的各個維度要求。在命題完畢后,及時組織專家對試題所涉及的項目要素進行分析歸類,以便準確確定試卷中各題所對應項目的各要素矩陣位置。試卷在全省測試后,選取全省標準化樣組學生,獲取他們對各類試題的答題信息,并按照矩陣中的各要素進行統計,建立各要素的全省信息,這樣我們就可以詳細分析學生對各學科因素的掌握情況。但限于我省的學業水平考試尚未實行全省網上閱卷,閱卷登記表格設計時沒考慮到小題分應按矩陣圖中學習結果分析項目和要素分拆,加之全省數據的敏感性及其他原因,浙江省的學業水平考試成績與學業質量分析報告都是偏宏觀的,側重區域性的評估,對學生個體的診斷尚未真正開發。
2.建立全省測試常模進行區域教學診斷
全省學業水平考試是有幾十萬考生規模的標準參照性考試,樣本量十分巨大,因此每年按標準參照的及格率、良好率和優秀率是比較穩定的,相當于建立了一個穩定的常模參數,并保證了它有一定效度和信度。如果我們能夠獲取樣本群體所對應的教學分析和診斷矩陣的基本數據,就可通過統計篩選分析對象所需要的學生答題信息,按各要素進行統計的參數與相應的常模逐一比較,對被測群體的學習結果進行初步的分析,并利用圖表和矩陣反映測試群體在各要素上的表現與常模的相對差異以及被測群體在各項目要素上的表現。
為了驗證上述的設想,在目前還無法應用全省學業水平考試數據進行學生個體學習結果診斷的情況下,我們在某學校選取了一個剛參加過全省物理學科學業水平考試的學生樣本,進行了小樣本的試驗。我們重現了樣本學生的所有小題分,明晰其與診斷項目矩陣中各要素的對應關系,然后進行群體間項目要素的差異比較,并針對群體的學習水平進行分析和診斷。以下我們簡要對操作過程作個介紹。
(1)群體間項目要素的差異比較
為了直觀反映被測群體在各個項目、各要素中表現出的相對差異,將樣本群體各要素的分數轉化成標準分Z,Z=(P-P。)/SP。若Z分數為正值,表明該群體在該項目要素的表現上高于常模;Z為負值,則表明該群體在該項目要素的表現上低于常模;Z值為零,則表明該學生群體在該項目要素的表現上與常模持平。
我們選取了該校高二年級理科、文科共4個群體為研究對象,各群體在理論上其物理學習的起點和學習能力的起點相當。4個群體在完成高中階段的必修課學習后,參加了全省的學業水平考試。我們以該成績為樣本,4個群體在各分析項目的表現如下一頁圖2、圖3、圖4、圖5所示。
從4個項目的比較中,可以看出被測群體的整體優勢或薄弱要素,如:理1、理4在4個要素上都處于優勢,其中“綜合、系統整合、信息處理、綜合運用”等要素明顯優于常模。具體分析每一張圖也可以發現,優勢群體存在著相對薄弱的要素,薄弱群體存在著相對優勢的要素。如:在能力結構圖(圖3)中,理4群體在觀察實驗、識別記憶、感知領悟、系統整合和信息處理5個要素上都表現出相對其他群體有明顯的優勢,在情景概化這一要素上理1群體比理4更有優勢。
根據圖表呈現的優劣,結合學業水平標準和命題時對試題所做的分類,可以進一步地分析學生的學習情況,從學生的學和教師的教兩個不同的角度進行教和學的診斷。
(2)針對群體的學習水平分析和診斷
就像醫生看病一樣,根據獲得的綜合信息,對病理作出診斷,然后開具治療處方。由此,我們設想,教學診斷也應該出具簡明扼要的診斷結果和建議,為此,可將反映某一被測群體在各項目要素上的表現的Z分數,再進行分級,用符號“+”或“-”的多少來表示層級的高低。帶符號“+”的為優勢,帶“-”的為劣勢,并且以符號的多少分別提示差異“十分顯著”“非常顯著”和“顯著”,“/”則表示與常模無差異。圖6給出了理科1的學習結果在各項目要素上的表現分布矩陣圖,根據符號“+”或“-”的多少,即可獲知矩陣圖中的各項目要素水平和學生的學習情況。
整體來看,該群體的多數要素都高于參照的標準,特別是學習水平中的“領會”、學科因素中的“實驗”、能力結構中的“信息處理”、知識結構中的“力學、原子物理、綜合運用”等明顯優于參照標準。相對薄弱要素表現在:學習水平中的“識記”、能力結構中的“系統整合”、知識結構中的“電學”。根據學習結果矩陣圖提供的信息以及試卷編制過程對試題的分類,結合問卷調查、訪談等方法,可對被測群體的強項和弱項進行分析和歸因,為學校的教學診斷提供基礎。
總之,無論是區域性的學業質量檢測,還是學校的教學質量反饋,都需要準確分析學生的學習結果,這是提高教學診斷功效的前提。學業水平考試的標準參照性、命題的嚴謹性、試題的高效度和高信度保證我們有了一把很好的診斷學生學業質量的標尺。本文初步探索的“學業水平差異分析法”和“學習結果分析項目和要素矩陣圖、群體學習結果矩陣圖法”直觀明了,便于計算機的編程和分析。
(作者單位:浙江省教育廳教研室)
(責任編輯:李奇志)