郝連明
數學演繹推理能力測評研究——以八年級學生為例
郝連明
(吉林師范大學 數學學院,吉林 四平 136000)
數學演繹推理是邏輯推理的重要組成部分,數學演繹推理能力直接影響著學生的數學學業成就.基于數學教育的研究視角,從推理形式、認知水平、推理情境、推理內容4個維度構建了數學演繹推理能力測評框架.結合IRT理論對超過5萬名學生的測試結果進行分析,發現存在顯著的性別差異,女生表現好于男生;城鄉學校學生之間也存在差異,城市學校學生表現明顯好于縣鎮和農村學校學生,這種差異在測試的不同維度上均有所體現.學生在反思維度表現不佳,需要引起重視.數學教學活動中需要關注性別差異和城鄉差異,重視數學演繹推理培養的重要性.
演繹推理;邏輯推理;推理能力;數學推理;測評框架
數學推理能力是學生重要的數學能力之一,從三大能力到核心素養,從教學大綱到課程標準[1–2],再到世界性的大規模數學評價項目,都不同程度地關注了學生的數學推理能力發展情況.數學演繹推理作為數學推理的重要組成部分,一直以來也同樣受到密切關注.回顧以往有關數學演繹推理的研究,可以發現單純以演繹推理為主題的研究并不多,演繹推理往往作為重要的組成部分包含在數學能力、數學推理等研究主題當中.數學演繹推理的研究與數學推理研究思路基本相同,一種是從形式邏輯視角進行劃分,依照演繹推理的不同邏輯形式進行分類.另一種是從認知視角進行劃分,考察學生達到了什么樣的推理水平[3],這種思路在國外更加普遍,一些學者往往借助證明和論證來探索學生的演繹推理表現[4–5].20世紀末期,中國學者徐龍炳、田中等就在全國性的調查中開展了包含演繹推理的研究[6],之后一些學者針對不同年級,使用不同的評價框架繼續開展相關研究.整體看這些研究主要基于CTT測量理論,調查樣本量較小,測試工具更強調知識層面[7–8].最近也有學者開始應用IRT理論開展研究[9],不過并非從純粹的演繹推理能力視角.國外同樣有很多學者開展演繹推理的相關研究,這些研究往往是伴隨著對推理(reasoning)、證明(proving)、論證(argument)的研究而展開.英國在一項有關解釋與證明(justifying and proving)的調查中發現學生在構建證明過程中很少使用演繹推理[10].Reiss應用三水平測試框架,對八年級學生幾何證明進行了調查,發現學生在事實性問題上的表現好于復雜多步演繹證明問題,而應用該框架進行的縱向研究表明七、八、九年級之間差異明顯[11].另外在PISA、TIMSS、NAEP測試中,數學框架中也包含了數學推理內容[12–14],但是并沒有明確給出數學演繹推理的評價框架,只是在數學素養或者能力的評價中將數學推理看成不可分割的部分.從教育研究的發展看,學術研究需要不斷地從宏觀走向微觀,從廣泛走向深化,需要逐漸關注更為細節的內容.這里將從數學教育評價的視角關注數學演繹推理能力的表現情況,開展針對性的測評研究.為此,主要解決兩個問題,數學演繹推理能力的測評框架如何,以及現階段中國八年級學生的數學演繹推理能力表現如何.
數學演繹推理能力(competence)為數學推理能力的一種,是個體在進行數學活動過程中的一種能力表現.結合《義務教育數學課程標準2011年版》中對演繹推理的描述,將其界定為在不同情境下,依據演繹推理形式規則對數學對象(概念、關系、性質、規則、命題等)進行證明、計算等數學活動過程中的心理特征[15].結合對已有研究的分析,研究者嘗試構建一個更加豐富的數學演繹推理能力測評框架,并依托此框架開展大規模測試,進而分析學生的表現情況.
測評框架,也稱測驗框架(framework),從廣義說是對測驗內容的界定與說明,從狹義說是對測驗框架組成維度的說明[16].從具體操作角度看測評框架是開展測評工作的首要任務,只有明確了測評框架才能編制測驗工具,進而開展測試和后續的數據分析.而這個測驗過程并不簡單,所以韋伯(Webb)認為測量學生所掌握的內容既是一門科學也是一種藝術.科學在于其擁有概念性框架、數學模型及可重復的程序方法,藝術則是最終還要以專家判斷為基礎[17].因此,學科專家的判斷在構建測評框架時具有核心作用.在研制測評框架方面主要采用文獻分析和專家評定方法,先后邀請了11位數學教育專家和5位數學教育方向博士生經過5輪討論確定.專家分別來自美國德克薩斯農工大學、北京師范大學、首都師范大學、北京教育學院等單位.研究者認為數學演繹推理能力的評價需要在數學教育研究的范式下,從能力視角進行關注,應該考慮學生在推理內容、推理形式等多方面的表現情況,而不能單純地關注形式邏輯或者數學知識的掌握.通過前期基于文獻的思考,以及多輪專家評定,最終形成了數學演繹推理能力測評框架.框架包含推理形式、推理內容、推理情境和認知水平4個維度,這4個維度并不是推理能力的內在結構,而是考察推理能力的4個評價維度.4個維度之間并不存在從屬、包含關系.為了更好地展現測評框架的結構,通過四面體的形式進行表述,并給出了4個維度的操作性定義.(見圖1和表1)

圖1 數學演繹推理能力表現測評框架
推理形式.推理的表現依賴于對推理形式的掌握[18],這種觀點受到普遍認可.所以,推理形式是研究演繹推理所必須關注的重要內容.從邏輯學角度看,推理形式是演繹推理的最直觀表現.在形式邏輯學中有很多關于推理形式的分類,由于邏輯學關注的是形式本身,導致分類十分龐雜.在有關數學演繹推理形式的研究中學者們往往基于邏輯學的分類進行探究,很多分類并沒有形成嚴格的界限,不同的稱謂可能指代相同的研究內容,相同的稱謂卻可能指代不同的內容.史寧中從數學學科本質角度出發進行了深入討論,認為在數學領域內演繹推理本質上只有兩種類型,一是性質傳遞,二是關系傳遞,并指出“傳遞性”為推理的本質屬性.性質傳遞的最基本形式是三段論,關系傳遞有兩種基本形式,一種是滿足>,>則>的類型,可以稱之為“關系推理”,另外一種是數學中最常見的數學運算[19].運算在數學中是確定的,也是嚴格的,并且是應用了數學的定義、法則等進行的一種關系推演,滿足數學演繹推理的定義.為此,將數學演繹推理形式維度分為三段論、關系推理、數學運算3個維度進行測評.
認知水平.認知方面的關注開始于認知心理學對教育的影響,很多測評框架都被應用于對評價任務認知要求的評價分析[20].現階段眾多的測評研究中出現了不同的認知測評框架,有類似布盧姆的學習過程分類[21],也有針對數學學科內部的認知測評框架,像威爾遜、青浦實驗等[22],也有更適合大規模測評的框架,例如PISA.研究中主要是針對數學演繹推理能力進行評價,因此希望能夠讓評價框架與測評目的更加契合.通過與多位專家的討論,最終確定采用再現、聯結、反思的認知分類,該框架在一些有關數學推理的研究中均有應用[23].
推理情境.根據Weinert(2001)的觀點,能力被定義為認知能力和技能,個體可以通過學習獲得.這種能力可以使他們能夠解決特殊的問題,包括動機、意志品質和社會準備,以及應用能力成功的、負責的在各種環境去解決[24].Niss認為掌握數學意味著擁有數學能力,而數學能力是指能在不同的數學背景與情境內外理解、判斷、使用數學,能被清晰識別的主要數學能力結構成分即數學能力成分[25].在研究者看來在不同情境下考察學生的表現更符合學生真實的數學能力表現.有關情境的研究以PISA最受關注,PISA的分類原則是情境本身與學生的距離,分為個人、社會、職業、科學4個方面.這種分類受到很多學者的認可,例如在高中數學素養測評中也參考了這個分類方法[26].研究中考慮到測試工具開發等方面的原因,將情境劃分為無情境、熟悉情境、陌生情境.
推理內容.數學演繹推理雖然是依據固定的邏輯形式在進行邏輯推演,但是在推演的過程中呈現的是實實在在的數學內容.這一點往往與心理學的研究不同,心理學中多是去除了推理的內容或者設定特殊的內容,然后關注學生在推理過程中的表現.而從數學教育的視角去研究演繹推理能力,必須要考慮數學內容知識.針對八年級學生而言,數學內容相對較少,處在基礎階段.根據課程標準對初中階段數學內容的分類,可以分成4個方面,數與代數、圖形與幾何、統計與概率和綜合實踐,很多八年級的測評都基于此設計內容分類[27-28].演繹推理在八年級數學中都廣泛存在,具體而言在數與代數和圖形與幾何方面有更多的表現,特別是結合測試的實際開展,最終確定了兩個大的方面,數與代數、圖形與幾何.
該次測試借助了中國基礎教育質量監測協同創新中心的監測平臺,為測試提供了良好的保障.測試主要基于IRT理論進行,采用了錨題技術,提高了測試的精準性和內容的豐富性.測試工具在開發中嚴格按照教育測量學要求,經過了多輪訪談和預測試,最終結合測量學指標刪除部分試題后形成了30道測試題的測試工具,并分別構建了A、B、S幾套試卷,其中S卷為錨題試卷.題型分為選擇題和解答題兩種,3套試卷信度均在0.8以上(A:0.81,B:0.81,S:0.89),利用RASCH模型獲得試題MNSQ值也均處在0.7~1.3的合理區間.另外,所有測試題均得到測量專家的審定,確保良好的專家效度.測試的客觀題為計算機自動閱卷,主觀題采用人工方式閱卷.主觀題閱卷過程中進行二次評分,如果兩位評分者給分不一致將進入第三次評分.通過嚴格的閱卷程序保證了閱卷的準確率,提高了測試結果的有效性.由于軟件輸出分數有負值、小數,不便于比較分析.根據通行做法將測試結果改為CEET分數形式,即將CONQUEST軟件得到的學生數學演繹推理能力值乘以100再加上500.測試地區分別來自中國中部兩個地區,采用分層整群抽樣方法,確保樣本有效性.經數據清理,剔除無效被試后共獲得有效樣本58?532人.
測試工具在開發過程中嚴格按照教育測量的基本規范進行,經過了6人發聲分析、30人測試、300人預測試、外審機構的獨立評審等環節,保證了試題的基本質量.最后,綜合運用經典測量理論(CTT)和項目反應理論(IRT)分別計算試卷(包括試題)的指標參數和學生的能力參數[29].工具在開發過程中不斷修訂,經過了評審專家對測試維度的標定.以M8AO111為例,該題最初畫出了4個相同的矩形,并標識了不同的角度和長度,要求學生判斷哪一個圖形是平行四邊形.在討論中專家們認為雖然4個圖形都標注了不同角度和長度,但從直觀看4個圖形是完全相同的矩形,很容易給學生帶來干擾.因此,在視圖的呈現角度上進行了變化,修改后各個圖形以空間形式呈現,解決了圖形表征與數據矛盾的問題.題干也進一步優化,降低了文字閱讀量.在對試題進行維度標定中,認為該題屬于推理形式中的三段論,推理情境中的無情境,認知水平中的再現水平,推理內容屬于圖形與幾何領域知識.(見圖2)

圖2 試題
通過對數據庫進行清理,獲得了八年級學生數學演繹推理能力表現的完整數據庫,最終有效數據58?532份.利用SPSS20.0軟件從多個角度對數據進行分析,主要包括性別,地域等常規人口學變量.具體情況如圖3和表2所示.

圖3 數學演繹推理能力表現對比情況

表2 數學演繹推理能力表現情況

在該次調查中,其中一個被測試地區獲得了學生是否是寄宿學生,是否是外來務工家庭的變量信息,通過對這兩個變量的分析也發現了值得關注的結果.首先,數據表明外來務工家庭學生的數學演繹推理能力表現明顯弱于非外來務工子女,(11?951)=-5.65,=0.000<0.01.其次,寄宿生的數學演繹推理能力表現明顯弱于非寄宿生,(11?951)=-8.64,=0.000<0.001.不過寄宿生的表現并非在全部群體中保持一致,將兩個變量交叉分析卻發現外來務工子女中寄宿生表現要好于非寄宿生,而在非外來務工子女中非寄宿生表現好于寄宿生.從這一結果可以推測外來務工家庭學生選擇寄宿學習可能更有利于成績提高.至于這種差異形成的原因可能是多樣的,需要結合家庭的內部和外部多種因素進行分析,甚至已經不能是教育內部所能給予回答.這一結果也給開展相關教育研究提供了新的視角,同時也表明了教育系統的復雜性.
從測試結果(表3)可以看出,在數學演繹推理能力測評的各個維度上,表現結果具有一定的一致性.從性別角度看,女生要好于男生,并且這種表現在測試的各個維度上均存在,推理形式、推理內容、認知水平、推理情境4個維度上女生的表現均好于男生.在經過與地域變量的交叉分析后發現這種趨勢仍然存在,無論是城市學校,還是縣鎮學校,亦或是農村學校,在測試的4個維度上女生表現均好于男生,且達到顯著性程度.從學校地域角度看,城市學校學生表現好于縣鎮學校學生,縣鎮學校學生表現好于農村學校學生,且這種差異均達到了顯著性程度.進一步從測試的4個一級維度,以及11個二級子維度去分析,仍然可以發現這種比較明顯的地域差異.例如,在圖形與幾何維度上,城市學校學生的平均分為512.15,縣鎮學校為493.76,而農村學校學生僅為468.23,相差非常大.在初中階段學習中,幾何內容擁有非常重要的地位.平面幾何的學習為高中立體幾何學習具有不可替代的基礎作用,所以這種幾何表現上的差異對學生后面的數學表現將帶來巨大影響.

表3 各維度表現匯總
除了在平均分上所明顯表現出的性別和地域差異外,在標準差表現上也出現了比較一致的結果,男生在各個維度上的得分標準差均大于女生.一般情況下,從統計學視角看標準差可以用來衡量一組數據的變異程度,標準差越大表明數據變異越大.基于此可以發現男生的得分表現變異程度較大,并且這種變異在測試的各個子維度上均有所體現,這說明男生分化較為嚴重.至于產生這種差異的原因應該是多方面的,可能不僅僅是學習習慣、傳統觀念等影響,還可能涉及到生理結構,認知發展周期等因素的影響.
另外,在不考慮性別和地域變量的影響下,通過對測試的二級維度進行分析也發現了一些需要引起密切關注的結果.嚴格意義上同一個一級維度內的不同二級維度不能夠進行能力值比較,因為它們分屬不同維度,所得結果不具有可比性.但是從不同試題的得分率情況還是能夠獲得一些非常有價值的信息.例如在認知維度方面,結果顯示反思維度試題的總得分率僅為0.49,聯結類問題得分率為0.63,表現略好,再現類問題得分率為0.78,表現最佳.從認知角度看,反思類問題主要是對已經學習過的內容進行證明和評價,并在問題解決過程中表現出一定的創造性.顯然,反思水平不是簡單的知識遷移和理解應用,是一種高水平的認知能力.這一結果也可以看出學生在高水平認知能力上的表現并不理想,需要給予加強.另外,除了在認知維度上的表現明顯不同外,在推理情境維度也需要給予一定的關注,從得分率角度看無情境維度得分率表現最好,達到0.74,熟悉情境為0.63,陌生情境為0.55.可見,相比之下學生在陌生情境問題中的表現最弱.情境對學生進行推理時往往會產生重要影響,雖然學生在進行數學推理過程中是一個完全數學內容的推理認知加工過程,而從問題解決的過程來看,學生需要從一個較為復雜的情境過渡到純數學情境,然后再將所得到的結果反饋回復雜情境.因此,從數學演繹推理能力的視角看,需要關注學生對復雜情境的理解和分析能力,這是以往在數學演繹推理培養過程中容易忽視的方面.在推理形式方面,3種形式表現相差不大.運算維度表現略好,平均得分率為0.68,關系推理得分率為0.67,三段論推理得分率為0.64.3種推理形式屬于不同的推理類型,通常情況三段論對學生的要求較高,學生往往需要給出具有一定嚴格性的證明作答,一些學生在作答過程中只能部分作答正確,沒有形成一個完整的推理過程.三段論推理為高中階段非常嚴謹的書面證明、論證提供基礎,這需要在教學中培養學生梳理推理條件的習慣,不斷明確推理過程中大前提、小前提和結論,避免出現錯誤.
在試題M8AO111中,剔除多選和無效作答后剩余有效作答為52?601份.其中選擇A選項有17?484人,選擇B選項有2?280人,選擇C選項有1?245人,選擇D選項有31?459人,正確率為59.8%.從該題的測試維度可知,題目屬于無情境,是學生熟悉的純粹數學背景.認知水平維度為再現,是對平行四邊形判定定理的直接應用.推理形式為三段論,三段論形式可以分成4種格,而后3種格都可以歸為第一種.第一種格又有4種型,全稱肯定型(AAA)、全稱否定型(EAE)、特稱肯定型(AII)和特稱否定型(EIO).上述4種類型的推理在中學數學中非常常見,但是全稱肯定、全稱否定、特稱否定在數學教育的視角下是有意義的,而特稱肯定型并沒有多大意義.因為前3種推理形式都可以進行很好地論證,但特稱肯定型所得出的結論往往不具有很強的有效性,所以在數學論證中較少使用此種類型.事實上,在學生解決具體問題時,往往會多次使用不同型的推理.例如,在該題中學生的主要思維過程是應用全稱肯定型三段論進行判斷,“一組對邊平行且相等的四邊形是平行四邊形,選項A是(或者B、C、D)一組對邊平行且相等,所以選項A(或者B、C、D)是平行四邊形”.如果能夠判斷出某個圖形滿足“一組對邊平行且相等”就可以得到結論.數據顯示有33%的學生選擇了錯誤選項A,學生的主要錯誤在于認為該圖形是矩形或者是正方形,進而通過“矩形是特殊的平行四邊形”得出結論,但是在矩形判斷過程中需要應用“有3個角是90°的四邊形是矩形”這個判斷條件,顯然,學生忽視了90°角的數量,屬于小前提判斷錯誤.在選項B和C中,學生的主要錯誤在于沒有判斷出一組對邊平行這個結論,誤將同旁內角相同看作是兩直線平行的判定前提,大前提判斷錯誤,導致結果判斷錯誤.事實上,在一個具體問題的解決過程中很難判斷出學生究竟使用了多少次推理.因此,該研究在框架設計時并沒有采用一步推理、兩步推理的評價框架,而是依據學生在解決問題過程中所用到的最主要推理形式.
該題在認知維度上屬于再現水平,是將課堂所學內容的重復應用,并且該題的情境并不復雜,屬于無情境維度.但是可以看到學生在該題上的表現并不理想,只有約60%的正確率.一方面說明試題的難易程度和認知水平并沒有絕對關系,即使是低認知水平的問題也可以具有較大難度.另一方面也表明學生在進行推理過程中并沒有嚴格執行三段論的判斷模式,沒有認真思考大前提、小前提是否成立,再進行結果判斷,致使A選項嚴重干擾了學生的作答.結合前期對學生的訪談可以發現,此題中所涉及的主要內容性知識學生完全掌握,并沒有構成認知障礙.這也說明數學演繹推理能力的衡量并不能簡單地用知識掌握程度來判斷,需要在一個綜合性問題解決體系中進行考量.
研究結果顯示,在性別方面存在顯著性的差異,只是這種差異與傳統的男性刻板印象不同,女生的成績表現好于男生[30].不過也有學者得到不同的結論,發現男生表現好于女生[31],或者男生和女生并沒有顯著性的差異[32].可見在一個相同的研究領域結論很可能不同,特別是在以量化研究為主的教育測評研究中,測評的框架、測評的工具、測試的任何一個環節不相同都可能引發結論的不一樣.除了這些在測試過程中產生的不同之外,測試的目的和被試的多樣性也會產生很大不同,一些學者在分析數學成就的差異原因時認為不同的社會文化背景和測試本身的復雜性和目的性都會導致這些差異[33-34].因此,Watt指出,很難發現一個比數學能力上的性別差異更具爭議性的內容[35].對于女生在八年級階段表現好于男生的原因,這可能主要基于兩點,一是在這個階段女生的計算能力普遍好于男生[36].二是這個階段女生在學習中更能夠接受教師的指導信息,在學習中表現得更具有規范性[37],而此時數學的知識內容較為基礎,適合女生獲得更佳的表現.結合一些相關研究的關注角度,除了關注組間的差異外,也要關注性別組內的差異變化.一些學者利用PISA等測試數據發現在不同層次中男女生的數學表現存在不同于整體的分布差異[38-39].從男女生數學演繹推理能力表現看,男生的方差大于女生,說明男生在分布上差異更大,這種變化結合水平標定后將會獲得更加豐富的信息.可見,性別差異的研究不僅僅關注性別之間的比較,也要關注性別內部的變化.
另外,幾乎所有的測評研究、教育監測等工作都關注到性別上的差異,隨著這種差異研究的不斷累積,還需要進一步思考這種研究的價值方向.例如,基本可以確定在初中階段女生表現好于男生,可這在現階段對實際教學活動中難以產生具體實質影響.調查分析的結果需要面向教學,面向提高學生的數學水平.因此,在以班級為群體的整體性教學模式下無法按照性別去劃分不同群體開展教學,那么在性別比較中的諸多信息往往看上去并沒有太大價值.不過,隨著人工智能技術的進步,個性化教學逐漸成為現實.在這樣的背景下,學校面對的將不僅僅是如何開展分層走班教學,如何開展校本課程教學,更將面臨分群體、分能力、分特質的差異化教學.所以,性別上的差異比較研究其意義不僅在當下,更在于未來.雖然對于性別差異上的研究還難以有確定性的結論,不過相關研究的開展將為中國數學教育積累寶貴的基礎性資料,對于數學教育研究的開展有重要價值.
城鄉之間的教育差異是教育研究的重要關注內容,也是國家義務教育質量監測的重要方面.從該次數學演繹推理能力的調查來看,城鄉學校學生在表現上存在顯著的差異,這種差異在調查的多個維度均普遍存在.這種差異與數學學業表現基本一致,城市學校學生表現好于縣鎮學校學生,縣鎮學生表現好于農村學生,3類地域呈現典型階梯型分布.對于城鄉之間的教育差異一些學者進行了較為詳細的分析,試圖解構其中的多種原因.目前來看無論是學校、家庭還是學生個體均有諸多影響因素.例如,家庭的社會經濟地位、家長的教育期望、學生的自我效能、師生關系,等等,有研究表明個體和家庭可以解釋學生77%的成績變異[40],所以,關注個體和家庭對于改變這種差異具有重要意義.從教育的視角看,對學生個體因素的改變是最切合實際的操作措施.因為所討論的個體差異并不是先天認知能力,而是后天的誘導性獲得[41].這是教育系統所能夠達到的領域,對學生進行適當的干預將有助于縮小這種城鄉二元差距.另外,對教師的重視也尤為重要.數學學科并不像語文、外語等學科需要太多的環境支持,較為依賴學生個體和教師,如果教師能夠采取更為契合的方法,同樣會有助于縮小這種差距.
研究中從認知的角度對演繹推理能力設定了3個認知水平,分別是再現、聯結、反思,根據認知類型的界定可以認為反思屬于較高水平的認知要求,而高水平的認知往往是教學中特別希望學生能夠達到的水平.該次測試中共計有10道問題考察再現水平,15道問題考察聯結水平,5道問題考察反思水平.從得分率角度看反思類問題的總平均得分率不足50%,相對較低.學生整體在再現維度表現較好,從作答可以看出學生普遍對公式、定理有較好的掌握,并能夠基于此進行簡單的推理和計算.除了在個別試題上表現不佳外,整體表現較好.從培養學生數學演繹推理能力角度看,關注高認知水平應該是當下的主要任務.高認知水平能夠發展學生的高層次思維,尤其是問題解決、創造性、批判性和自我反思[42],這些思維非常有利于學生進行自我的數學學習建構,進而促進數學進步.對于演繹推理來說,能夠具有較好的反思能力是至關重要的,他超越了對固定公式、定理、法則的簡單應用,是在此基礎上的分析、評價和創造性運用,從這個角度看,高水平演繹推理能力在一定程度上決定了學生能否在數學上獲得較好表現[43–44].因此,培養學生高認知演繹推理能力需要給予格外關注.
在對數據進行分析時發現不僅僅在性別、地域等主要人口學變量上存在差異,在校際之間也存在著差異.即使是相同的城區,不同學校之間學生表現也會出現相差很大的情況.這種校際之間的表現差異無法簡單地用家庭社會經濟地位來解釋,更多的是與學校環境和教師教學有關,但是在研究中并沒有設計教師的教學變量,教師的課堂教學雖然以數學內容知識為載體進行講授,而數學演繹推理能力的培養往往融入這個過程當中.因此,在未來對教師教學過程的關注將更有助于分析學生的數學演繹推理能力表現.
[1] 丁爾陞.九年義務教育初級中學數學教學大綱的審查說明[J].教育學報,1992(5):21–26.
[2] 中華人民共和國教育部.義務教育數學課程標準(2011年版)[M].北京:北京師范大學出版社,2012:6.
[3] 嚴卿,黃友初,羅玉華,等.初中生邏輯推理的測驗研究[J].數學教育學報,2018,27(5):25–32.
[4] STEFAN U, AISO H, KRISTINA R. Mental models and the development of geometric proof competency [C] // TZEKAKI M, KALDRIMIDOU M, SAKONIDIS H. Proceedings of the 33rd conference of the international group for the psychology of mathematics education. Thessaloniki: PME, 2009: 257–264.
[5] KOSZE L. Students’ proof schemes for mathematical proving and disproving of propositions [J]. Journal of Mathematical Behavior, 2016 (41): 26–44.
[6] 徐龍炳,田中.一份衡量演繹推理技能的量表[J].中學數學教學參考,1998(8):49–50.
[7] 朱佳麗.八年級學生數學推理與證明的現狀調查與教學策略[D].上海:華東師范大學,2011:44–58.
[8] 潘宇.對貴州少數民族地區初中學生演繹推理能力的分析與思考[D].北京:中央民族大學,2016:12–16.
[9] 劉鵬飛.義務教育數學課程學段劃分研究[D].長春:東北師范大學,2015:12.
[10] HEALY L, HOYLES C. Student’s performance in proving: Competence or curriculum [C] // SCHWANK I. Proceedings of the first conference of the European society for research in mathematics education. Osnabrück, 1998: 153–167.
[11] REISS K, HELLMICH F, REISS M. Reasoning and proof in geometry: Prerequisites of knowledge acquisition in secondary school students [C] // COCKBURN A D, NARDI E. Proceedings of the 26th conference of the international group for the psychology of mathematics education. Norwich: University of East Anglia, 2022: 113–120.
[12] 董連春,吳立寶,王立東.PISA2021數學素養測評框架評介[J].數學教育學報,2019,28(4):6–11.
[13] IEA. TIMSS 2019 mathematics framework [EB/OL]. (2019–06–01) [2020–05–05]. https://timss2019.org/wp-content/ uploads/frameworks/T19-Assessment-Frameworks-Chapter-1.pdf.
[14] National Assessment Governing Board. Mathematics framework for the 2019 national assessment of educational progress [EB/OL]. (2019–06–01) [2020–05–05]. https://www.nagb.gov/content/dam/nagb/en/documents/publications/ frameworks/mathematics/2019-math-framework.pdf.
[15] 郝連明.八年級學生數學演繹推理能力測評研究[D].北京:北京師范大學,2018:76.
[16] 張詠梅.大規模學業成就調查的開發:理論、方法與應用[M].北京:北京師范大學出版社,2015:71.
[17] CYNTHIA A B S, CATHERINE J W. Test development [M] // BRENNAN R L. Educational measurement. Westport,CT: Praeger, 2006: 307–334.
[18] 史寧中.數學思想概論[M].長春:東北師范大學出版社,2009:171.
[19] 史寧中.試論數學推理過程的邏輯性——兼論什么是有邏輯的推理[J].數學教育學報,2016,25(4):1–16.
[20] MISLEVY R J. Cognitive psychology and educational assessment [M] // BRENNAN R L. Educational Measurement. Westport, CT: Praeger, 2006: 257–305.
[21] ANDERSON L W.布盧姆教育目標分類學[M].蔣小平,譯.北京:外語教學與研究出版社,2015:69.
[22] 周超.八年級學生數學認知水平的檢測與相關分析[D].上海:華東師范大學,2009:10–23.
[23] 綦春霞,王瑞霖.中英學生數學推理能力的差異分析——八年級學生的比較研究[J].上海教育科研,2012(6):93–96.
[24] WEINERT F E. Concept of competence: A conceptual clarification [M] // RYCHEN D S, SALGANIK L H. Defining and selecting key competencies. Seattle: Hogrefe & Huber Publishers, 2001: 45–65.
[25] 斯海霞,朱雁.中小學數學核心能力的國際比較研究[J].比較教育研究,2013(11):105–110.
[26] 王光明.高中生數學素養的操作性定義[J].課程·教材·教法,2016,36(7):50–55.
[27] 綦春霞,張新顏,王瑞霖.八年級學生數學學業水平的現狀及其影響因素研究——以三地測試為例[J].教育學報,2015,11(2):87–92.
[28] 綦春霞,何聲清.基于“智慧學伴”的數學學科能力診斷及提升研究[J].中國電化教育,2019(1):41–47.
[29] 周達,杜宵豐,劉堅.我國東、中、西部地區四年級學生數學學業表現的現狀分析[J].上海教育科研,2017(4):47–50.
[30] 袁柳芳.八年級學生幾何推理能力的調查研究[D].上海:華東師范大學,2012:43.
[31] 孫婷.義務教育階段學生數學推理論證能力測評[D].上海:華東師范大學,2014:46–48.
[32] 周靜.初中生數學推理能力調查研究[D].沈陽:沈陽師范大學,2011:35–36.
[33] ELLISON G, SWANSON A.The gender gap in secondary school mathematics at high achievement levels: Evidence from the American mathematics competitions [J]. Journal of Economic Perspectives, 2010 (2): 109–128.
[34] LUBINSKI S T, ROBINSON J P, CRANE C C, et al. Girls’ and boys’ mathematics achievement, affect, and experiences: Findings from ECLSK [J]. Journal for Research in Mathematics Education, 2013 (4): 634–645.
[35] WATT H M G. Gender and occupational choice [M] // CHRISLER J C, McCREARY D R.Handbook of gender research in psychology. New York: Springer, 2010: 379–400.
[36] ?HYDE J S, FENNEMA E, RYAN M, et al. Gender comparisons of mathematics attitudes and affect: A meta-analysis [J]. Psychology of Women Quarterly, 1990 (14): 299–324.
[37] 楊新榮,李忠如,王洪,等.初中生數學學習觀性別差異的調查研究[J].西南師范大學學報(自然科學版),2006(2):178–182.
[38] YAN Z, GABRIELE, CAI J F. Gender equity in mathematical achievement: The case of China [J]. Educational Studies in Mathematics, 2018, 99 (3): 245–260.
[39] 郝連明,綦春霞.基于初中數學學業成績的男性更大變異假設研究[J].數學教育學報,2016,25(6):38–41.
[40] 趙必華.影響學生學業成績的家庭與學校因素分析[J].教育研究,2013,34(3):88–97.
[41] 彭波.城鄉義務教育階段學生學業差距研究——基于教育公平的視角[J].湖南師范大學教育科學學報,2014,13(5):73–79.
[42] 袁志玲,陸書環.高認知水平數學教學任務的教學意義及啟示[J].數學教育學報,2008,17(6):37–40.
[43] 鄭毓信.數學思維教學的“兩階段理論”[J].數學教育學報,2022,31(1):1-6.
[44] 曹一鳴,宋宇,趙文君,等.面向教育2030的數學課堂對話人工智能評價體系構建研究[J].數學教育學報,2022,31(1):7-12.
An Assessment Study of Mathematics Deductive Reasoning Competence——Taking Year 8 Students as an Example
HAO Lian-ming
(School of Mathematics, Jilin Normal University, Jilin Siping 136000, China)
Mathematics deductive reasoning is an important part of logical reasoning. The competence of deductive reasoning directly affects students’ mathematical academic achievement. Based on the research perspective of mathematics education, the evaluation framework of mathematical deductive reasoning competence is constructed from four dimensions: reasoning form, cognitive level, reasoning situation and reasoning content. Based on IRT theory, the test results of more than 50,000 students were analyzed, and it was found that there was a significant gender difference, with girls performing better than boys. There were also differences between urban and rural school students, with urban school students performing significantly better than county and rural school students and this difference was reflected in different dimensions of the test. The students did not perform well in the reflective dimension, which requires our attention. It is necessary to pay attention to gender differences and urban and rural differences in mathematics teaching activities and pay attention to the importance of mathematical deductive reasoning.
deductive reasoning; logical reasoning; reasoning ability; mathematical reasoning; evaluation framework
G632
A
1004–9894(2022)04–0014–07
郝連明.數學演繹推理能力測評研究——以八年級學生為例[J].數學教育學報,2022,31(4):14-20.
2022–03–09
吉林省社會科學基金項目——吉林省義務教育階段學校自主質量監測指標體系構建及反饋機制研究(2019c73);吉林省教育廳“十三五”社會科學項目——義務教育質量監測背景下中學生數學學科測評框架國際比較研究(JJKH20191036SK)
郝連明(1985—),男,吉林四平人,副教授,碩士生導師,主要從事數學教育研究.
[責任編校:周學智、陳漢君]