周紅霞 梅冬輝



學(xué)業(yè)水平測試又稱教育測驗、學(xué)績測驗,它是對學(xué)生在一段時間學(xué)習(xí)或訓(xùn)練之后的知識、技能的發(fā)展水平的測定。2019年,包頭市進行了小學(xué)學(xué)業(yè)水平測試,此次測試以課程標(biāo)準(zhǔn)為參照,著重考查學(xué)生通過課程學(xué)習(xí)而形成的學(xué)科能力,整體評價區(qū)域內(nèi)教學(xué)質(zhì)量狀況,以促進本區(qū)域教育教學(xué)發(fā)展。
一、學(xué)業(yè)水平測試的流程
嚴(yán)謹(jǐn)、規(guī)范的標(biāo)準(zhǔn)化流程是保證學(xué)業(yè)水平測試質(zhì)量的關(guān)鍵因素。包頭市學(xué)業(yè)水平測試緊扣測試目的,嚴(yán)格按照科學(xué)的測試編制流程,確保測試科學(xué)、高效。
(一)確定測試的目的
確定測試目的、對象和作用是整個測試流程的頂層設(shè)計,后續(xù)的一切活動都要圍繞這個環(huán)節(jié)展開。 2019年,我市小學(xué)學(xué)業(yè)水平測試依據(jù)“義務(wù)教育課程標(biāo)準(zhǔn)”(2011版)和《包頭市義務(wù)教育辦學(xué)質(zhì)量“優(yōu)質(zhì)學(xué)校”評估驗收工作方案》,科學(xué)評估包頭市參評市級義務(wù)教育辦學(xué)質(zhì)量優(yōu)質(zhì)學(xué)校的20所小學(xué)六年級學(xué)生學(xué)業(yè)發(fā)展水平,了解國家“義務(wù)教育課程標(biāo)準(zhǔn)”(2011版)的落實情況,摸清包頭市小學(xué)教育教學(xué)質(zhì)量狀況,為優(yōu)化行政決策、改進教育教學(xué)提供參考,引導(dǎo)和促進學(xué)校和教師全面落實課程標(biāo)準(zhǔn)所設(shè)立的課程目標(biāo),優(yōu)化教學(xué)方式,培養(yǎng)學(xué)生的能力素養(yǎng)。
(二)制定學(xué)業(yè)測試的方案
1.確定測試的科目、分值和測試形式。
本次測試依據(jù)我國義務(wù)教育課程設(shè)置的基本要求,并借鑒國家義務(wù)教育質(zhì)量監(jiān)測的做法,確定測試的學(xué)科為語文、數(shù)學(xué)、英語、科學(xué)、音樂和美術(shù)(表1)。測試形式分為紙筆測試和上機測試。其中,音樂、美術(shù)首次利用信息技術(shù),通過計算機測試的方式進行。信息技術(shù)測試方式的使用,解決了紙筆測試無法測評學(xué)生的音樂聽辨、賞析和演唱能力的難題。
2.確立測試指標(biāo)。
此次測試是從學(xué)生應(yīng)具備的學(xué)科核心素養(yǎng)中關(guān)鍵能力的角度,衡量評價學(xué)生的學(xué)業(yè)水平。如語文學(xué)科重點測評識字寫字能力、古詩文誦讀能力、文學(xué)類文本閱讀能力、實用類文本閱讀能力、書面表達能力。數(shù)學(xué)學(xué)科著重測評運算能力、邏輯推理能力和空間想象能力。以數(shù)學(xué)為例,各能力指標(biāo)的內(nèi)涵如下(表2)。
(三)抽取測試的樣本
此次測試以學(xué)生抽樣的方式對學(xué)校的整體狀況進行評價,而不對學(xué)生個體進行評價。每所學(xué)校抽取樣本量為90個,從樣本數(shù)量而言,具有代表性。由于分層抽樣比隨機抽樣的平均誤差小,此次測試在抽樣方式上選擇了不重復(fù)分層抽樣,步驟為:①將每所學(xué)校的六年級全體學(xué)生按照平時學(xué)業(yè)綜合表現(xiàn),平均分為五個等級;②在每個等級中抽取18名學(xué)生,在抽取的過程中按照班級、性別進行等比例抽取。此次分層抽樣工作使用spss軟件進行統(tǒng)計分析,抽樣平均誤差控制在2%以內(nèi)。
(四)制定學(xué)業(yè)水平評價標(biāo)準(zhǔn)
為使學(xué)業(yè)測試命題有所遵循,并能更好地指導(dǎo)今后的教學(xué)工作,在測試時依據(jù)課程標(biāo)準(zhǔn)制定了學(xué)業(yè)水平評價標(biāo)準(zhǔn),分為水平Ⅳ(優(yōu)秀)、水平Ⅲ(良好)、水平Ⅱ(合格)和水平Ⅰ(待提高)四個等級,并對各個等級學(xué)生的表現(xiàn)進行了描述和界定。以語文為例,各水平等級的內(nèi)涵描述如下(表3)。
(五)編制雙向細目表
雙向細目表是測試考查目標(biāo)(或能力)與內(nèi)容之間的列聯(lián)表,由內(nèi)容維度和認(rèn)知維度構(gòu)成。在此次測試命題時,將雙向細目表增加為三個維度:內(nèi)容維度、認(rèn)知維度和能力維度。以數(shù)學(xué)試題為例。
這道題目的內(nèi)容維度、認(rèn)知維度和能力維度如下表(表4),題目“先求外角和,再找規(guī)律”需要被測試者綜合運用相關(guān)知識解決問題,既能很好地考查學(xué)生的綜合運用能力,也能較好地考查學(xué)生分析、歸納、推理能力。
(六)組織命題
選聘學(xué)科專家進行試題命制,編寫題目過程中充分考慮到題目內(nèi)容與相應(yīng)考查能力的匹配性、題型選擇、題目語言的規(guī)范性等。編制完成后選擇不同類型的3所學(xué)校進行試測。試測后,通過分析試卷難度以及學(xué)生的作答表現(xiàn),對試題進行調(diào)整,尤其是對于難度在0.3以下的題目進行了調(diào)整。測試結(jié)束后分析試卷難度在0.6~0.8之間。以能力為導(dǎo)向的試題命制流程為:課程標(biāo)準(zhǔn)→ 行為目標(biāo)→ 指標(biāo)體系→ 試卷→ 審查→ 試測→ 修訂→ 試卷(定稿)。
(七)學(xué)業(yè)水平標(biāo)準(zhǔn)劃定
此次測試以課標(biāo)作參照,以學(xué)業(yè)水平等級來分析學(xué)生基本能力水平,能使教師更了解學(xué)生形成的能力程度,較過去的只給分?jǐn)?shù)更具體,更有指導(dǎo)性。學(xué)業(yè)水平標(biāo)準(zhǔn)劃定采用的是安哥夫法,安哥夫法的核心概念是估計臨界組答對測試題目的比例。安哥夫法操作程序嚴(yán)格,是目前使用最廣泛的標(biāo)準(zhǔn)劃定方法。
以此次學(xué)業(yè)測試六年級語文學(xué)科“合格水平”的標(biāo)準(zhǔn)劃分為例,根據(jù)安哥夫法,首先將試卷及答案給各位專家,讓專家獨立進行第一輪評審,公布評審結(jié)果后,專家結(jié)合各水平等級的內(nèi)涵及教學(xué)一線的實際情況討論,以此類推進行二、三輪評審。三輪結(jié)束后,公布按三輪結(jié)果計算的學(xué)生比例,然后讓專家進行最后一輪評審,當(dāng)作最終結(jié)果。將最終結(jié)果進行有效性分析(表5),各位評委評分的內(nèi)部一致性系數(shù)都在0.9以上,說明各評委的評分內(nèi)部一致性高,有效性強。
(八)數(shù)據(jù)分析
此次測試數(shù)據(jù)分析主要采取描述性統(tǒng)計分析,即對各變量發(fā)展?fàn)顩r進行描述分析,包括對數(shù)據(jù)的基本統(tǒng)計、集中趨勢分析(平均數(shù))、數(shù)據(jù)的離散趨勢分析(標(biāo)準(zhǔn)差)等。如對學(xué)生各學(xué)科得分分布進行分析(圖1),對合格率與標(biāo)準(zhǔn)差的散點圖分析(圖2),對綜合成績的分析(圖3)等。
(九)報告的撰寫
報告撰寫時以文字+圖表的形式進行,做到了學(xué)科數(shù)據(jù)分析指標(biāo)與能力分析指標(biāo)相結(jié)合、測試數(shù)據(jù)分析指標(biāo)與教學(xué)經(jīng)驗相結(jié)合、市與校分析指標(biāo)相結(jié)合。報告包括市級總報告和各學(xué)校分報告。總報告的總體表現(xiàn)部分從不同等級上的人數(shù)比例、各學(xué)科得分分布和各科均分、得分率、合格率、優(yōu)秀率、標(biāo)準(zhǔn)差以及各學(xué)校的合格率、標(biāo)準(zhǔn)差等方面進行描述,又分學(xué)科提出具體的問題和改進建議,主要供教育行政領(lǐng)導(dǎo)了解全市的學(xué)業(yè)質(zhì)量狀況,為全市教育決策提供參考;分報告主要供學(xué)校了解本校的學(xué)業(yè)質(zhì)量狀況、主要優(yōu)勢及存在的問題、今后的改進方向,為學(xué)校改進教學(xué)提供依據(jù)。
二、對學(xué)業(yè)水平測試的思考
(一)提高學(xué)業(yè)測試的理論和技術(shù)水平
學(xué)業(yè)水平測試是一項復(fù)雜的工作,單純采用某一種評價理論或方式來評價學(xué)生和學(xué)校,難免有所偏頗,應(yīng)根據(jù)不同的評價目的采用相應(yīng)的評價方法。測評人員在理論和技術(shù)水平上也需要不斷提高,例如,標(biāo)準(zhǔn)劃定應(yīng)該選擇安哥夫法還是標(biāo)簽法,抽樣方法應(yīng)該選擇分層抽樣還是整群抽樣,推斷總體應(yīng)該選擇點估計還是區(qū)間估計……只有具有夯實的理論和技術(shù)水平,才能不斷提高學(xué)業(yè)測評的質(zhì)量。
(二)提高測試工具的質(zhì)量
測試工具是測試科學(xué)性和有效性的前提,學(xué)業(yè)水平測試質(zhì)量的高低很大程度上決定于命題專家研發(fā)的測評工具的優(yōu)劣。如何優(yōu)化工具開發(fā)流程,怎樣根據(jù)測評指標(biāo)更有針對性地設(shè)計測評工具,怎樣提高并審核工具的專業(yè)性和可靠性,是今后繼續(xù)努力的方向。
(三)加強測試結(jié)果的運用
測試結(jié)果反映出本區(qū)域及學(xué)校的教學(xué)情況,應(yīng)加強結(jié)果的運用,以不斷提高教學(xué)質(zhì)量。如根據(jù)測試結(jié)果反映的問題應(yīng)提高教師的學(xué)科素養(yǎng),深刻認(rèn)識本學(xué)科的核心素養(yǎng),明晰學(xué)科知識體系;轉(zhuǎn)變教師的教學(xué)觀念,注重引導(dǎo)學(xué)生開展指向核心素養(yǎng)的深度學(xué)習(xí);增強教師的課標(biāo)意識、課程意識等。
總之,本次學(xué)業(yè)水平測試操作流程規(guī)范、測試工具質(zhì)量較高、數(shù)據(jù)分析精準(zhǔn),測試結(jié)果所呈現(xiàn)的問題與學(xué)校實際情況高度吻合,得到了學(xué)校教師、行政管理部門的一致好評。此次學(xué)業(yè)水平測試為日后學(xué)業(yè)質(zhì)量監(jiān)測工作明確了方向和路徑,為學(xué)業(yè)質(zhì)量監(jiān)測的高水平實施,奠定了扎實的基礎(chǔ)。