史加祥
【摘? ?要】國際數學測評聚焦數學學科核心素養發展,強化測評對教學的反饋、促進與改進作用。對于數學學科核心素養的理解差異會導致評價上的差別,而通過對小學數學測評卷的比較與分析,能夠透析其中的差異。以中國、新加坡、英國和美國五年級數學測評卷為比較對象,利用“SEC”為主要研究工具,建立了“內容”和“認知”兩個維度的比較框架,對測評卷的整體一致性和具體分布進行了比較,發現其中存在的相似與不同,對我國小學數學課程改革提供一定的借鑒與方向指引。
【關鍵詞】小學數學;學科核心素養;測評比較框架;評價分析
“中英數學交流”使得我國的數學教育成為世界關注的焦點。我國的數學教育水平到底如何?我國的數學評價與其他國家之間的差別在哪里?是否可以從測評卷的比較上判斷不同國家之間數學教育的一致性程度及具體差異表現?
一、基于測評卷的一致性研究概述
(一)研究對象
選擇中國(以上海為代表)、新加坡、英國和美國(以俄亥俄州為代表)小學五年級的數學測評卷為研究對象。
(二)研究工具
本文采用由美國學者安德魯·帕特(Andrew Porter)和約翰·史密森(John Smithson)共同開發的“SEC”(Surveys of Enacted Curriculum)一致性分析范式為主要研究工具,Porter一致性系數公式如下:
P=1- [i=1nXi-Yi2]
公式中的P值是介于 0 到 1 之間的數,一致性系數P和一致性程度成正比,P值越大說明兩者的一致性程度越高。當P=1 時,表示兩者完全一致;當 0.8≤ P<1 時,表示兩者強一致;當P=0 時,表示兩者完全不一致。[1]很多專家和學者利用“SEC”一致性來分析試卷與試卷間的一致性,“SEC”具有很強的靈活性和實用性,可以作為本文的研究工具。
二、二維矩陣建構一致性分析編碼框架
二維矩陣建構首先需要對“內容”和“認知”兩個維度進行梳理與確定,兩個維度主要參照數學課程標準和數學教學與評價的要求等。
(一)二維矩陣“內容維度”的確定
《上海市中小學數學課程標準(試行稿)》中將課程內容劃分為“數與代數”“圖形與幾何”“數據處理”“專題研究與實踐”四個主要部分;《義務教育數學課程標準(2011年版)》中的四個部分內容為“數與代數”“圖形與幾何”“數據處理”“綜合與實踐”,兩者之間有很大的相似性。在對上述課程內容統一分析與整理之后發現,它們的內容基本相似,只是表述和呈現方式存在一定的差異。本文的內容維度劃分采用上海市《小學數學學科基于課程標準評價指南(征求意見稿)》中的主題模塊劃分方法,分為“數與運算”“方程與代數”“圖形與幾何”“數據整理與概率統計”,該劃分方式更為科學與合理,比較符合本文的研究方向。
(二)二維矩陣“認知維度”的確定
在對文獻進行梳理之后,研究使用課程標準中的認知維度劃分方法,將學生的學習結果目標分為“了解、理解、掌握、運用”四個層次,四個層次包括記憶與理解水平。上述認知水平劃分與布魯姆教育目標、新目標分類學都有著相似之處,目標從簡單到復雜,有一定的層次性和區分度,可以作為二維矩陣“認知維度”的具體認知水平,編碼具有很強的可操作性。以上所述,形成了“SEC”一致性分析的二維矩陣,如表1所示,包括“內容”和“認知”兩個維度。
三、二維矩陣編碼框架的試卷分析
為了使得編碼相對客觀與科學,邀請了6名區域小學數學骨干教師參與分析與編碼,在對“內容”和“認知”兩個維度的劃分與編碼有著統一的認識之后,對比較的試卷分別分析與編碼,判讀每道題目的考點及所屬的內容知識維度和認知水平維度。在對所有教師的編碼匯總統計之后,對編碼差異較大的進行了討論和適當的調整與修正,在對數據進行處理與分析之后,形成中國、新加坡、英國、美國四國最終比較的比率值數據,如表2所示。
四、基于“SEC”一致性的測評卷分析
(一)“內容維度”的分布分析
在對中國、新加坡、英國和美國小學數學測評卷進行比較之后,對測評卷中的內容差異有了比較清晰的認識,為了直觀顯示差異,根據表1中的數據制作了內容權重情況分布圖,如圖1所示。
從圖中可以看出,新加坡和中國測評卷中的內容分布整體比較相似,而英國與美國測評卷中的內容分布則比較相似。在“數與運算”主題上,英國最高(為0.55),美國其次(為0.47),新加坡最低(為0.14),英國是新加坡的3倍多。在“方程與代數”主題上,中國與新加坡都為0.53,并列第一,英國最低(為0.21),美國為0.32。由上可見,中國與新加坡相對比較重視“方程與代數”,而英國和美國則比較關注“數與運算”。中國與新加坡在“圖形與幾何”主題上的占比也較高,分別為0.19和0.25,美國為0.16,高于英國(為0.1)。在“數據整理與概率統計”主題上,英國與美國的占比高于中國和新加坡,可以看出,英美相對重視數據分析與數學應用表現。
(二)“認知維度”的分布分析
在對中國、新加坡、英國和美國小學數學測評卷進行比較的基礎上,對測評卷中的認知維度進行統計并根據比率值占比權重繪制成折線圖,如圖2 所示。
從圖2可以看出,四份測評卷中,中國與新加坡的認知分布比較相似,近乎一致,而在內容維度上比較相似的英國和美國在認知維度上卻存在一定的差異。在“了解”的認知層級上,英國最高(為0.19),最低的則是中國(為0.02),新加坡與美國差異不大,分別為0.06和0.08。由此可見,英國測評卷相對重視對數學知識的了解。在“理解”的認知層級上,英國也最高(為0.3),美國緊隨其后(為0.27),中國與新加坡分為0.13和0.1,占比相差不大。中國、新加坡和美國測評卷在“掌握”的認知層級上相差不多,都在0.4以上,英國最低(為0.32),是所有認知層級中占比最高的。在“運用”認知層級上,新加坡與中國分別為0.43和0.42,美國為0.36,高于英國(為0.19)。
(三)總體一致性系數統計與分析
使用Porter一致性系數公式對中國、新加坡、英國和美國四份測評卷的比率值進行兩兩計算比較,得出一致性系數P值,如表3所示。在比較之后發現,中國與新加坡測評卷的P值最高,為0.905,屬于強一致。英國與美國測評卷的一致性排在第二,為0.665,屬于一定程度上一致。新加坡與英國和美國測評卷的一致性分別為0.5和0.525,屬于一定程度上一致,但一致性低于英國與美國測評卷的P值。中國與美國測評卷的P值為0.625,高于與英國測評卷的0.52,屬于一定程度上一致。
除了比較整體一致性,還針對各個主題內容進行了比較。圖3就是“數與運算”“方程與代數”兩個主題的雷達圖。在“數與運算”主題中,中國、英國和新加坡的認知水平考查力度基本一致,都以“理解”水平為評價重點。而在“方程與代數”主題中,四份測評卷在認知水平考查上的要求基本一致,著重在“理解”的認知水平,而在“運用”層級上,中國和新加坡都遠高于英國和美國。由圖4可見,在“圖形與幾何”主題上,中國與新加坡的考查重點是第四層級的認知水平,美國側重在第三層級的考查。在“數據整理與概率統計”主題上,新加坡與英國的考查水平主要為“掌握”,而中國與美國考查的主要層級為第四層級。在比較之后可以看出,四份測評卷在認知水平的考查上既有相似與一致,又有著各自的側重水平,體現出評價的差異。
(四)其他方面的比較分析
1.試題題型的比較分析
除了“內容”和“認知”維度的差異之外,四份測評卷中的試題類型和所占的比重也有著比較大的差異。按照中國小學數學試卷中常見的情況將題型分為是非判斷題、選擇題、填空題、計算題、操作題、應用題和附加題七種題型,將四份測評卷進行分析匯總之后形成占比數據,繪制成折線圖如圖5。
從圖5中可以看出,中國測評卷的題型最為豐富,七種題型都有分布,英國測評卷中沒有判斷題和附加題,其他題目的占比與中國較為相似,占比最多的都是計算題,均超過40%。新加坡測評卷中以選擇題和計算題為主,總占比接近70%。美國測評卷中各種題型分布相對較平均,沒有超過30%的題型,但操作題占比高于其他三份測評卷。在所有題型中,是非判斷題、選擇題和填空題被認定為客觀題,其他的為主觀題,只有新加坡測評卷中的客觀題占比超過主觀題,其他三份測評卷中主觀題的數量都大于客觀題。
2.具體試題的比較分析
在上述比較的基礎上,我們針對測評卷中的試題內容進行了進一步的比較。首先是測評卷的表達方式與測評方式存在差別。其次在試題情境的創設上,除了數學計算題之外,數學應用題是考查學生“掌握”和“運用”的認知水平,將數學知識和技能進行實際應用。從四份測評卷的應用題的例題可以看出,中國、新加坡和美國應用題的情境都以創設為主,很少與生活實際相結合,而英國測評卷中的情境絕大部分來自生活中的實際問題,將學到的數學知識用于解決真實問題。 如:
[中國:兩個城市相距255千米,甲乙兩輛汽車同時從兩個城市出發,相向而行。甲車每小時行42千米,3小時后兩車相遇后又相距了15千米。求乙車的速度。
新加坡:莎拉和約翰有一些郵票,莎拉的郵票是約翰的5倍,當莎拉給了約翰24張之后,他們的郵票數量一樣多。莎拉和約翰的郵票數量加起來一共是多少?
美國:薇拉有6碼的布料, 她想用[13]的布料做一件襯衫。然后,她還想使用剩下的[38]的布料來給妹妹做一件襯衫。在制作兩件襯衫后,薇拉的布料還剩下幾碼?
英國:杰克購買了[112]千克的土豆和[12]千克的胡蘿卜。杰克用5鎊來購買,請問他還能余下多少錢?(英國)
五、基于數學課程標準的測評改進建議
對四份測評卷一致性的比較的目的是發現各自的特點并能互相借鑒與學習,從而改進和完善我國的小學數學教育,科學建構測評框架和方法等。
(一)借鑒比較優缺點,促進情境中數學實際問題的解決
數學測評框架的建構需要將數學教育與現實生活進行緊密的聯系,現實數學教育強調解決情境性問題,情境性問題是學生數學學習的興趣源泉,真實生活情境中的問題更有助于學生應用和建構數學概念。只有在真實的情境性問題的解決中,學生才能夠發展他們的數學工具理解,也是學生再創數學的基礎。[2]國際大型測評PISA、TIMSS、NAEP等都已經趨向 “情境化”,從上面的測評卷比較中也可以看出英國在小學數學測評卷的命題中情境化程度要高于其他國家,當然對于“情境化”也要進行充分的研究,對試題情境有一個明確的界定,對情境的分類和分配要視不同的學科、不同的測試形式以及參加測試的學生的年齡而定,還要將情境的要素進行分解,將抽象的情境操作化,更好地指導命題。[3]
因此在課程改革深入的時候,我們要把解決情境性問題作為小學數學教學的重要目標,教師在課程教學中就要對情境性問題進行開發,更好地達到課程標準的要求。在學生日常數學學習、常規的測評和學業成果評價中,也應該多創設源自真實生活的情境性問題,對于提升學生數學思維、發展學生數學素養將會起到正向促進作用。
(二)細化一致性評價,強化課程標準轉化落實
圍繞核心素養開展測評的基點就是要將對課程標準的理解進行轉化,基于課程標準建構學生的學習評價體系。由于課程標準的規定是整體性的,是分階段進行系統設計的,是對學生的累積期望,因此不可能面面俱到,不可能直接成為評價標準,需要進行進一步的解讀與轉化。美國在出臺教育改革案之后,每個州都開始對評價與課程標準的一致性進行研究與檢視,形成了在理念上建構“金字塔”形課程內容目標、在內容上確定了四維度(知識種類、廣度、深度、樣本平衡)一致性具體標準的科學、實用經驗。[4]
國內很多學者針對課程標準與評價體系的一致性,課程標準與評價體系之間的轉化,以及試題編制開展了理論和實踐研究。有教師在理論研究和實踐基礎上形成了課程標準解讀—教材比較分析—評價標準建立—命題雙向細目表制訂—試題編制—抽樣實驗的路徑。[5]可見,針對此方面的研究已經非常豐富,我國上海的小學數學教育正在有針對性地進行課程標準與評價體系的建設,開展基于課程標準的教學與評價研究,但在數學課程標準轉化為評價標準,建立更為科學的測評體系上可以進行持續的思考與研究。
(三)測評聚焦發展,圍繞學生數學核心素養
一直以來,數學測評以“知識”為主線,對學生的“能力”重視不夠,隨著課程改革的深入和對數學素養研究的推進,對學生應該學習什么樣的數學知識有了更清晰的認識,同時也明確了學生在數學學習過程中必需和養成的能力。[6]數學測試的一個重要特點是測試內容越來越向數學核心知識集中,關注數學核心知識的測試設計思路也成為各國數學測評的共同取向。測評需要抓住數學核心知識,核心知識是數學課程的核心內容,是學生數學技能的基本體現,是學生進行數學思考的基本載體。[7]
《普通高中數學課程標準(2017年版)》將高中數學學科核心素養分為數學抽象、邏輯推理、數學建模、直觀想象、數學運算和數據分析6個部分。[8]國際大規模測評中對數學素養的定義雖然有著各自的側重,但都展現出越來越重視在數學核心知識的基礎上,強化學生數學認知能力發展的特點,形成對數學素養雙向多維度的測評框架[9],如PCAP對學生數學學習測評的框架清晰,標準統一明確,不僅測評學生在數學學習過程中對數學知識的掌握,也重視解決實際情境中數學問題的能力及學生高認知水平的發展[10]。可見,數學學科核心素養不僅是教學的重要指向,更是建立測評體系的基準與標尺。
對測評卷進行比較能夠了解彼此的優勢,在比較中互相借鑒,在借鑒中改進課堂教學與評價,更好地提升測評的科學性和導向性,更好地增強測評的信度與效度,更好地了解學生的數學學業成果,了解學生的學習情況,發揮評價的導向與激勵作用,改善教師的“教”和學生的“學”,持續有效地發展學生的數學素養。
參考文獻:
[1]張定強,裴陽. 新高考改革背景下數學試卷與課標一致性研究:以2017—2018年全國Ⅱ卷與浙江卷為例[J]. 數學教育學報,2019(4):55-60.
[2]徐斌艷. “現實數學教育”中基于情境性問題的教學模式分析[J]. 全球教育展望,2000(4):28-33.
[3]王湖濱. PISA測試的“情境”及其帶來的啟示:大型國際教育評價項目對“情境”的述評[J]. 外國中小學教育,2014(1):8-14.
[4]劉學智.論評價與課程標準一致性的建構:美國的經驗[J].全球教育展望,2006,35(9):35-39.
[5]沈南山,楊豫暉,宋乃慶.數學學業成就評價測查試題編制研究[J].教育研究,2009(9):59-65.
[6]蘇洪雨,徐斌艷.中德兩國標準中的“數學能力”比較研究[J].數學教育學報,2008,17(2):52-54.
[7]NEIDORF T S, BINKLEY M. Comparing Mathematics Content in the National Assessment of Educational Progress (NAEP), Trends in International Mathematics and Science Study (TIMSS), and Program for International Student Assessment (PISA) 2003 Assessments[J]. National Center for Education Statistics, 2006(18):174.
[8]中華人民共和國教育部. 普通高中數學課程標準(2017 年版)[M]. 北京:人民教育出版社,2018:4.
[9]萬川. 小學生數學素養的文獻綜述[J]. 西部素質教育,2016(17):89-90.
[10]唐恒鈞, 高敏. PCAP數學素養評估框架及啟示[J]. 當代教育與文化,2018(3):74-80.
(上海市金山區第一實驗小學? ?201599)