楊聰聰 閆芳
[摘要]運用內容分析法、文獻計量法,借助VOSviewer軟件,對國內基礎及高等教育數學試題難度研究的文獻進行綜述。在知網數據庫中搜集并篩選獲得關于數學試題難度研究的期刊文獻130篇,從文獻的期刊來源、年份分布、作者情況、關鍵詞分布、研究內容、評估方法6個維度進行剖析,發現研究總體呈上升趨勢,但期刊較分散、各刊發文量較小、核心期刊文獻較少,近年來多采用比較研究的方法對綜合難度系數模型、數學核心素養等熱點問題進行研究。據此,對未來研究方向提出加強義務教育階段和高等教育階段數學試題難度研究,通過合著提高研究質量、研究內容及預估算法應當更加多樣化等建議。
[關鍵詞]數學試題難度;綜合難度;內容分析法
[中圖分類號]G424.74[文獻標識碼]A
[文章編號]1673—1654(2023)04—040—013
作者簡介楊聰聰,學科教學(數學)碩士研究生,云南師范大學數學學院;閆芳(通訊作者),博士,副教授,云南師范大學數學學院。云南昆明,650500。
一、引言
2019年《國務院辦公廳關于新時代推進普通高中育人方式改革的指導意見》指出,科學設置試題難度,命題要符合相應學業質量標準,體現不同考試功能,建立命題評估制度,提高命題質量[1]。2020年新一輪高考改革啟動,高考數學試題由文理分科逐漸向不區分文理過渡。新高考數學全國卷從2020年在山東省和海南省試用,到2021年使用省份已增加到10個。另外,2021年高考數學還將以往高考的全國Ⅰ卷、Ⅱ卷進行合并,統稱為全國乙卷,全國Ⅲ卷改為全國甲卷。2022年的高考數學試卷類型、使用省份與2021年保持一致。到目前,北京、上海、天津、浙江高考數學科仍然采用自主命題。在此大背景下,高考數學試題的難度越來越受到學生、家長、教師以及廣大數學教育者的關注。不僅如此,鑒于高考制度目前仍然是我國教育的“指揮棒”,高考數學改革也會影響到其他教育階段的考試評價,其試題難度是否也會發生相應的變化?這是目前有待探究的問題。
試題難度是評價試題質量的一個重要指標,無論是對于教學過程中的教學測量,還是最后高考的選拔性考試都有著很大的影響。我國大規模教育考試試題難度的預估和控制非常敏感,既是科學問題,也是社會問題[2]。一份高質量的試題,一定具有良好的信度、效度、區分度以及適當的難度,使之達到教育測量的預定目標。怎樣才能編制出一份高質量的試題呢?毋庸置疑,這首先與出題者的經驗有很大關系,如果出題者有豐富的教學經驗、先進的教育理念,一定能夠讓試題的質量大大提高。但是單純依靠經驗是不夠的,試題質量還必須依賴于試題本身所反映的客觀信息。如果能夠挖掘試題中潛在的客觀信息,提前較為準確地預知試題的各個評價指標,那么命題者就可以根據預知指標有針對性地對試題作出調整,進而提高試題質量。可見,建立客觀、科學、合理的試題難度評價體系及模型十分有必要。本研究基于國內已有的對數學試題難度研究的文獻,總結國內的研究現狀及研究動態,發現需要改進或進一步研究的問題,提出未來研究的方向,以期為數學試題難度研究提供一定的參考。
二、研究方法
通過知網分別以“數學試題難度”“數學綜合難度”為主題詞,搜索期刊論文,共獲得143篇文獻,經過研讀和篩選排除掉關聯性較小的文獻,最后保留130篇研究文獻。運用內容分析法、文獻計量法,并借助VOSviewer軟件對這些文獻進行整理綜述。主要從期刊來源、年代分布、作者情況、關鍵詞分布、研究內容、評估方法6個維度進行剖析,總結國內關于數學試題難度研究的基本狀況,分析尚存的問題,提出未來研究的方向。
三、結果與討論
(一)期刊來源
通過整理和統計發現,130篇文獻分別發表于73種不同的期刊,其中發表相關文獻超過2篇及以上的期刊有19種。130篇文獻中有47篇發表于核心期刊,占總發文量的36.2%。其中有19篇文獻既屬于核心期刊,也屬于CSSCI期刊,占總發文量的14.6%(如表1所示)。由以上數據能夠看出:一方面,目前國內發表有關數學試題難度研究的期刊較多,但是大部分都只是發表1篇相關文獻,連載量較少;另一方面,有關數學試題難度研究的文獻發表于核心期刊的量較少,僅占總發文量三分之一多一點。總體來看,國內發表數學試題難度研究的期刊較分散,載文量較少,發表于核心期刊的文獻較少,相關研究的質量有待提高。
(二)年份分布
為了分析數學試題難度問題研究隨時間發展的趨勢,圖1給出了相關文獻發表年份分布圖,從圖中能夠直觀地看出,國內數學試題難度相關研究開始于1987年,在2008年之前發文量一直較少,只有2001年發文4篇,2008年后相關研究的增加趨勢明顯。究其原因,自2000年以來,中國大范圍地啟動了基礎教育課程改革工作。2004年我國實施新課改,考試內容增加了對知識的綜合理解以及運用知識分析、解決實際問題的能力的考查,剔除了“偏、難、怪”試題,保證了試題具有適當的難度和較好的區分度。特別是從2007年開始,我國首次進行了高中課程標準改革后的科目設置與命題,其主旨是考試科目設置與內容要契合教學目標的改變,符合“三維”教學理念與人才培養目標,考試內容突出了基礎性、時代性、選擇性的特點[3]。2012年,教育部提出在統一高考基礎上,積極探索建立符合高校自身培養目標和要求的創新人才選拔標準,完善多位一體的高校人才選拔綜合評價體系[4]。2016年教育部成立了高考考試內容改革專家委員會,對高考內容改革進行戰略性研究與頂層設計,以保證科學、公平、合理、有效的考試內容,全面突出我國創新人才選拔與培養的目標[3]。2020年實施新一輪高考改革,其中一大變化就是不分文理科。除自主命題省份,高考數學全國卷歷來分文理科,但2020年首次在山東和海南采用不分文理科的數學新高考全國卷。2021年采用新高考全國卷的省份增加到10個,另外將全國III卷改為全國甲卷,將全國I卷和II卷合并為全國乙卷。從以上的相關教育政策或高考改革政策可以發現,這些政策的頒布對試題難度研究的熱度有很大的導向作用,每個政策提出的當年或后一兩年,一般都會成為研究熱度較高的年份。

(三)作者情況分析
1.作者單位類型分布
圖2直觀呈現了作者單位類型分布情況??梢钥闯?,關于數學試題難度的研究絕大部分集中在高等院校(66篇),其發文量達到總發文量的50.8%;然后是中小學(37篇),占總發文量的28.5%;再次是教研機構(17篇),占總發文量的13.1%;最少的是這三類機構間的相互合作發文,僅占總發文量的7.6%。在高等院校的66篇文獻中,有50篇來自于師范類院校。究其原因,師范類院校以培養教師等教育行業從業人員為人才培養目標,其教學、科研等比較關注國家教育政策、高考改革以及試題調整等各方面的變化,因此師范類院校對這方面的信息比較敏銳,進而相關研究也較豐富。
從以上分析可以看出,各機構間的合作研究較少。各高校師生雖然對國家教育政策、高考改革以及試題調整等各方面的變化比較敏銳,但是考慮問題多從理論出發,缺乏一定的實踐基礎。一線教師長期從事中小學教學工作,對政策的實施、試題的變化等有更切實的體會,對學生的實際情況更加了解,這些實踐經驗都有利于數學試題難度的相關研究。另外,相關的教育研究機構可以根據每年學生統考的情況,掌握大數據信息,這對數學試題難度的研究來說是非常重要的資源。因此各機構間若能夠加強合作,相信對于數學試題難度的研究會大有助益。
2.作者合著情況
圖3顯示了作者合著情況??梢园l現,目前相關研究以單人為主(65篇),其次是兩人合著(32篇),接下來是三人合作(25篇),四人及以上合著的較少。另外,在多人合著(3人及以上)中,基本都是高校研究生與導師或研究生與研究生的合著,也有教研單位的多人合作,涉及高校師生與教研人員、高校師生與一線教師的合著很少。
一門學科的發展離不開團隊,尤其是多人(3人及以上)參與的團隊合作,群體成員間的共同努力會產生強大且持久的力量,期待未來的相關研究主體會有更多的“多人團隊”出現,以此壯大和發展該領域的研究實力與學術地位。
(四)關鍵詞分布
關鍵詞頻次可用于判斷數學試題難度研究的熱點、層次、趨勢以及有待探討的方面。利用VOSviewer軟件,對130篇文獻進行關鍵詞分析:
從圖4能夠清晰地看到關于數學試題難度研究熱點,出現頻率較高的關鍵詞依次有(點越大代表該關鍵詞出現的頻率越高):數學試題、高考數學、綜合難度模型、高考數學試題、難度系數、試題難度、區分度、比較研究等。
圖5顏色的變化顯示出關鍵詞按照年份熱度變化的情況,近幾年的研究熱點集中在淺灰色區域,關鍵詞包括綜合難度系數模型、數學核心素養、比較分析,其熱度圖依次如圖6、圖7、圖8所示。
可見,近幾年研究熱度較高的問題是綜合難度系數模型、數學核心素養,采用較多的方法是比較研究。
通過對以上關鍵詞進行分析可以發現:
1.關于數學試題難度的研究,多以高考數學試題為研究對象,詳見表2。
研究對象最多的為高考數學試題,其次是對數學試題難度的整體研究,即未注明具體學段,高等數學試題、中考數學試題和小學數學試題方面的研究基本持平,對于初中和高中平時檢測的試題難度研究則較少。這也反映了相關研究中有待加強之處,一方面高考數學試題和學生平時的檢測試題由于其考查目的不同,所以難度設置等各方面存在差異,將高考數學試題難度的研究結果直接應用于學生平時的檢測試題可能會產生偏差,所以對于學生平時測驗試題難度的研究可以作為后期研究的一個切入點。另一方面隨著減負政策的出臺,中小學生作業負擔和培訓負擔問題得到全面整治,這一政策將如何影響義務教育階段試題難度的變化還有待探究。2009年,《國家中長期教育改革和發展規劃綱要(2010—2020年)》提出要“提高人才培養質量,著力培養信念執著、品德優良、知識豐富、本領過硬的高素質專門人才和拔尖創新人才”。作為當前檢測人才培養成果方式之一的高校課程考試能否有效檢測出學生的水平?其試題難度在發生怎樣的變化?目前與此相關的研究較少。因此,還需加強義務教育階段和高等教育階段數學試題難度的研究。
2.近幾年學者研究較多的內容是綜合難度系數模型與數學核心素養。鮑建生教授于2002年在《中英兩國初中數學期望課程綜合難度的比較》[5]中首次提出了數學題的綜合難度模型,隨后有不少研究者基于此模型對試題或試卷難度展開探究。本研究的130篇文獻中,有20篇引用了鮑建生教授2002年的研究成果,有15篇引用了2014年王建磐教授和鮑建生教授共同發表的《高中數學教材中例題的綜合難度的國際比較》[6],還有19篇引用了武小鵬和張怡2018年共同發表的《中國和韓國高考數學試題綜合難度比較研究》[7],這幾篇文獻都是關于數學試題綜合難度的研究。其中前兩篇發表于《全球教育展望》,第三篇發表于《數學教育學報》,均屬于北大核心和CSSCI期刊,具有權威性。數學試題綜合難度研究使得試題難度的評價更為全面、科學、客觀。
另外,自2017年高中數學課程標準中明確提出高中數學教育要注重培養學生的6大核心素養以來,基于核心素養展開研究的課題較多,試題難度是其中一個。有研究者基于核心素養視角探析數學試題難度,使難度的衡量更加符合時代要求[8]。
3.對于數學試題難度的研究近幾年多采用對比研究的方法,這與數學試題綜合難度的計算方法有很大關系。數學試題綜合難度的研究多是分析影響數學試題難度的因素,然后根據各因素對綜合難度的影響大小,給予不同的權重并進行賦值量化。雖然這種方法使得試題難度評價更為全面,但是利用這種方法得到的難度單獨呈現出來時,其意義比較模糊,綜合難度系數本質上反映的是試題的絕對難度,它能夠在多大程度上反映相對難度(事后難度)則難以明確,只有當幾套試題放在一起進行比較時,其優勢才能夠體現出來,即較為清晰地比較出幾套試題的難度差異。由此可見,進一步探究絕對難度與相對難度的關系十分必要,只有明晰二者的聯系,才能夠更好地利用絕對難度來預估相對難度。
(五)研究內容分析
通過對130篇文獻進行整理,可將其研究內容劃分為8大類(如圖9所示),分別是絕對難度(試題本身的客觀難度,即指從試題的背景因素、知識點含量等客觀角度對試題難度進行評價)、試題整體分析、相對難度(試后的統計難度)、絕對難度與相對難度二者結合、影響因素、試題庫、數學試題難度文獻綜述,以及其他的相關研究。其中研究較多的是絕對難度(57篇),其次是試題整體分析(24篇),然后是相對難度(12篇)、二者結合(11篇),影響因素的相關研究有8篇,試題庫、文獻綜述的研究較少。
在絕對難度研究方面,研究者多對影響數學試題難度的因素進行水平劃分,然后針對具體試題進行絕對難度的計算。王秋海教授結合實踐并吸收國內的先進經驗,得到了一種數學試題客觀難度測量方法——EQR法,對知識點類型和應用方式進行賦值[9]。林雪明以潛在傾向理論為基礎,結合區分度算法,提出了一種新的建立和實現試題難度系數數學模型的方法[10]。李二霞、邵志芳在前人設計的對試題難度進行事前評定的框架和實施程序的基礎上,將試題的事前難度進一步劃分為基準難度和解決難度,使得評價更為科學合理[11]。曾建國應用SOLO分類理論,從知識點考查的視角來評價高考數學題,并以三角函數模塊為例進行評價分析[12]。張碧霞等人結合核心素養,對綜合難度模型進行改進,分析在背景因素、認知水平、運算水平、推理能力、知識含量和數據分析的不同水平上的差異[13]。張玉環等人采用定性和定量相結合的方法,對2015年至2019年中國高考理科數學全國Ⅰ卷與法國本土業士考試(也稱畢業會考)試卷進行難度和典型案例分析[14]。韓金璇等人運用綜合難度模型對美國大學入學考試試題與中國高考試題進行對比分析,發現中國高考試題的推理因素難度較大,美國大學入學考試試題的背景因素難度較大,二者在參數因素上相差不大[15]。
對于相對難度的研究往往以學生試后成績為基礎,結合經典測量理論或項目反應理論,對試題進行難度、區分度等指標的分析。昌國良分析了2002年至2006年部分高考數學試題的相對難度,發現部分高考數學試題的難度偏離國家規定的標準,由此對高考數學試題的編制提出相關建議,以便更好地體現新課程改革的理念和創新精神[16]。李瑛基于經典測量理論,通過設定標準選擇當年參加高考的少量學生入圍進行試測,結合對試測生實測數據的分析,達到預測試卷難度的效果[17]。張天德等人利用雙向細目表分析了2021年新高考數學I卷的知識點、關鍵能力、學科素養、情境等考查情況,另外結合山東省高考數學學科的成績統計,分析了題目的難易程度,并在此基礎上提出2022年新高考的動向以及備考策略[18]。
將相對難度與絕對難度進行結合的研究,一般是先結合評價框架進行絕對難度預估,然后再結合相對難度,分析二者的關系。周華輔采用累加點表估計難度,并將預估難度和實測難度進行比較,預估效果較好[19]。王曉華提出采用基于AHP的模糊綜合評判方法對試題難度進行預估,并將該方法應用于大規模教育考試數學試題的難度預估和控制,取得了顯著的成效[2]。王煜等人在CAT事前難度評定與綜合難度評定的基礎上,給出了事前綜合難度的概念,建構了事前綜合難度評定框架,并對2013年至2017年的全國高考數學Ⅱ卷(理科)試題進行了事前綜合難度評定,擬合出預測事后難度的回歸方程[20]。呂世虎等人在試卷相對難度和絕對難度的基礎上提出了試卷綜合難度的概念,結合中考數學試題,構建了6個要素刻畫的數學試卷綜合難度指標體系[21]。宋慧媛等人基于深度神經網絡模型,利用試題文本信息,同時結合考生作答記錄,建立試題文本信息與實際難度間的關聯性,進而解決測試中試題難度參數的預估等問題[22]。
對于試題的整體分析,多從試題的整體考試范圍、考試內容、試卷結構、整體難度、命題趨勢、復習建議等方面進行綜合分析,一般不會涉及測量理論或算法模型,研究者根據自己的經驗對試題做出分析評判。黎郭凱對2017年美國SAT試題數學部分和全國高考理科乙卷試題,從試題形式、題量以及答題時間、試題考查內容、試題考查特點等方面進行對比分析,發現我國的高考試題在各個維度上都比SAT試題難度更高,但是SAT試題中豐富的現實情境素材、直觀的圖像表征方式和新穎的題型,以及試題與生活的緊密聯系等都值得借鑒[23]。李志敏通過對比2016年全國新課標卷與廣東卷數學試題在試卷結構、考試范圍、題型、知識點考查等方面的差異,發現全國新課標I卷數學試題重視基礎知識、突出重點知識、不忘“新增”內容和“邊緣”知識,試題有機滲透了“函數方程思想”等多種思想,對學生的抽象與概括等多方面能力進行了全面的考查,作者在此研究基礎上對高三數學復習提出了建議[24]。由于試題的整體分析不涉及復雜的測量理論或是算法模型,以經驗判斷為主,所以此類的文章作者多為一線教師。
試題難度的影響因素有多個方面,研究者對其水平的劃分也有不同的標準,經過對文獻的研讀和整理,得到如圖10所示的難度影響因素統計圖。從總體來看,借鑒較多的是鮑建生教授的5因素難度模型,該模型提出影響數學試題難度的因素包括探究、背景、運算、推理、知識含量[5]。張怡等人在此基礎上添加了是否含參、思維方向,使綜合難度系數模型更加適應數學標準化試題的比較研究[25]。薛歡等人對武小鵬團隊的綜合難度模型進行調整,增加條件含量、閱讀量(字符)兩個因素,以凸顯高考試題的命題變化[26]。李保臻等人認為高考數學解答題一般涉及到幾個子問題,子問題之間是否有關聯會影響試卷的綜合難度,故而在武小鵬高考試題綜合難度模型的基礎上增加“梯度”因素[27]。呂世虎教授等人構建用試卷題型及其順序、試卷題量與考試時間、試題難度分布、試卷閱讀量、試卷新穎性、學生實際水平等6個要素刻畫的數學試卷綜合難度指標體系[21]。宋霜霜等人基于綜合難度模型,以2015年至2020年大慶市中考數學試題為例進行研究,發現隨著新課程改革的深入,背景類試題增多成為發展趨勢,并根據這一變化規律為學生備考提出建議[28]。
還有研究者從試題難度角度出發建立數學試題庫。李捷等人研究了網絡考試系統設計中利用遺傳算法進行智能組卷的問題。針對試卷的難度指標,采用模糊數學方法和項目反應理論對試題庫中每一小題進行綜合評價試題難度的數學建模[29]。
文獻綜述的相關研究主要從試題難度的影響因素探討,或是試題難度評估方法的發展方面進行綜述。魯慶云、宋乃慶2009年對我國數學試題難度影響因素進行研究綜述,提出已有研究存在的問題,如提出的影響因素多基于思辨分析,缺乏實際數據支持,以及各因素對難度的貢獻率有待商榷等[30]。羅瑪等人對試題難度的影響因素和試題難度評估方法進行綜述,發現難度評估方法正在向綜合化、科學化發展[31]。
綜合以上分析可以發現,目前國內關于數學試題難度的研究內容較為豐富,但是無論哪種研究都要回歸研究的本質。之所以研究數學試題難度,其出發點是服務于教學和考試,而教學和考試又是培養和選拔人才的不同方式,歸根結底,數學試題難度研究的最終落腳點要放在培養學生的能力和素養之上,這樣的研究才是真正有意義的。
(六)難度評估方法分析
試題難度分為相對難度和絕對難度,對于相對難度的分析大多以經典測量理論和項目反應理論為理論基礎,基于學生的實測成績進行分析,而對于絕對難度的預估方法則多種多樣,進一步整理文獻得到如圖11所示的難度評估方法統計圖。周華輔利用影響試題難度因素的累積點換算得到試題的絕對難度[32]。毛競飛運用命題教師主觀評估、多元線性回歸分析和BP神經網絡建模三種預測方法,對高考命題過程中試題的難度進行預測,并對三種方法的預測性能進行比較,得出BP神經網絡預測模型對試題難度的預側準確度相對更高,誤差相對更小[33]。王曉華利用AHP方法和模糊數學原理對命題專家的經驗進行科學化總結和提煉,通過定性分析和定量分析相結合的方法對試題難度進行綜合評判[2]。曾建國應用SOLO分類理論,從知識點考查的視角來評價高考數學試題[12]。王煜等人不僅給出了事前綜合難度評定框架,還擬合出預測事后難度的回歸方程,明確了事前、事后難度的關系[20]。佟威等人提出了分別基于卷積神經網絡和循環神經網絡的數學試題難度預測模型,以及二者的混合模型,以實現高效、準確的試題難度評估[34]。
如圖11所示,研究者對數學難度模型的構建方法不斷改進,其目的是使難度模型更加全面客觀、科學合理。例如AHP雖然集合了眾多專家的意見,但是主觀性較強;多元線性回歸雖然較為客觀,但是假定影響因素與難度間呈線性關系,這是有待商榷的;BP神經網絡算法很好地解決了非線性關系,但是這種算法的預測能力和訓練能力有時會出現矛盾,即出現所謂的“過擬合”現象,導致預測能力下降。基于卷積神經網絡和循環神經網絡的數學試題難度預測模型,以及二者的混合模型,均直接對試題文本進行理解和語義表征,可保留試題描述的局部語義和語序信息,并且解決了不同考試中學生群體具有不可比性的問題,使得評價模型具有更好的性能[31]。
四、結論與展望
(一)研究結論
1.從研究趨勢來看,國內對于數學試題難度的研究從2008年開始整體呈現遞增的趨勢,在2022年達到研究高潮,究其原因,與國家出臺的教育政策緊密相關;研究對象以高考數學試題為主,義務教育階段和高等教育階段的數學試題難度研究較少。
2.從發表期刊和作者單位來看,國內發表關于數學試題難度研究的期刊較分散,載文量較少,發表于核心期刊的文獻較少,相關研究的質量有待進一步提高。對于數學試題難度的研究絕大部分集中在高等院校,特別是師范類院校,各機構間的合作研究較少。從作者合著情況來看,以單人為主,其次是兩人合作,多人合作的研究較少。
3.從研究熱點來看,關鍵詞集中在數學試題、高考數學、難度系數、高考數學試題、試題難度、綜合難度模型、區分度、高考、綜合難度。近幾年研究的熱點問題是綜合難度系數模型、數學核心素養,采用較多的方法是比較研究。
4.從研究內容來看,關于數學試題難度的研究內容可以劃分為六大類,分別是絕度難度、相對難度、二者結合、試題整體分析、影響因素、試題庫研究。其中研究較多的是絕對難度,其次是試題整體分析,相對難度、二者結合與其他研究的文獻數量持平,影響因素、試題庫的研究較少。
5.從難度預評估方法來看,目前采用的評估方法包括經典測量理論、項目反應理論、SOLO分類理論、累積點換算法、層次分析法(AHP)、多元線性回歸、BP神經網絡算法、卷積神經網絡算法、循環神經網絡算法。
(二)展望
結合以上分析可以發現,目前國內關于數學試題難度的研究已經取得了一定成果,但在某些方面還有待進一步提高。
1.對義務教育階段和大學階段的數學試題難度研究有待加強。從相關文獻來看,目前關于高考數學試題難度的研究較為豐富,這顯然與高考的指揮棒作用密切相關,隨著減負政策的落實及義務教育階段新課標的頒布,相應學段數學試題的難度是否會發生一些變化?這還有待研究。
2.通過合著,提高研究質量。這里所說的合著包括兩層含義,一是同單位間可以多人合作展開研究,二是不同單位間進行合作(高校、中小學、相關教研機構等)。通過整理文獻發現,有24.19%的文獻屬于數學試題整體評析,即研究者只需要有一定的實踐經驗,就可以展開對試題內容、結構、特點等方面的評析。此類論文大部分只是憑經驗給出關于試題難度的簡單結論,缺乏客觀數據的支撐,內容淺顯,質量相對較低,參考價值較小。數學試題難度的研究若要有所突破,就必須深挖試題難度的本質,不僅要有定性的分析,更要定量與定性相結合。通過不同單位之間的協作,可以將理論、實踐、大數據信息相互結合,這樣才能透過現象看到本質,在相關領域獲得突破。
3.研究內容還應更加豐富、多元。目前的相關研究多是從單獨的試題難度出發,但是對于試題的評價遠不止難度這一個指標,如區分度、信度、效度等指標,它們之間有著怎樣的聯系?能否通過難度有效預估區分度、信度、效度?目前對這些問題研究較少。另外,試題的評價還要符合時代的發展與要求,目前已經有研究者關注到將難度與數學核心素養結合,能夠與教育政策緊密聯系,這是一個很好的思路。當然也不止數學核心素養,隨著高考評價體系的頒布,后期的相關研究還可以將高考評價體系作為試題難度研究的切入點。
4.預估算法應更加多樣化、綜合化。目前研究中用到的算法模型多是單個應用,但是每個算法其實都有其利弊,一種算法可能難以實現較好的預估效果,能否將不同算法的優勢進行結合,使評價模型更為科學、合理?這還有待研究者繼續探討。
參考文獻:
[1]國務院辦公廳.關于新時代推進普通高中育人方式改革的指導意見[EB/OL].(2019–09–02)[2019–10–11].https://zhuanlan. zhihu.com/p/80842215.
[2]王曉華.基于AHP的數學試題難度模糊綜合評判[J].教育科學,2013,29(05):38-43.
[3]鄭程月.我國考試招生政策演進研究(1977—2017)[D].天津:天津師范大學,2018.
[4]王火生.高考制度改革的道與術——新中國高校招生考試制度改革歷程的回顧與思考[J].教育學術月刊,2018,(02):22-33.DOI:10.16477/j.cnki.issn1674-2311.2018.02.003.
[5]鮑建生.中英兩國初中數學期望課程綜合難度的比較[J].全球教育展望,2002,31(09):48-52.
[6]王建磐,鮑建生.高中數學教材中例題的綜合難度的國際比較[J].全球教育展望,2014,43(08):101-110.
[7]武小鵬,張怡.中國和韓國高考數學試題綜合難度比較研究[J].數學教育學報,2018,27(03):19-24+29.
[8]劉清,胡典順,張莘鈿.核心素養視角下的高考試題難度探析——以2019年高考數學全國卷(理科)為例[J].數學通報,2020,59(12):34-40.
[9]王秋海.如何測量數學試題的難度[J].數學通報,1993,(07):
26-27.
[10]林雪明.試題難度系數確定數學模型的建立與實現[J].杭州應用工程技術學院學報,2001,(01):47-51.
[11]李二霞,邵志芳.試題難度多項指標的認知任務分析[J].心理科學,2009,32(06):1342-1344+1317.DOI:10.16719/j.cnki.1671-6981.2009.06.058.
[12]曾建國.基于SOLO分類理論的高考數學試題評價研究——知識點考查的視角[J].贛南師范大學學報,2016,37(06):130-134. DOI:10.13698/j.cnki.cn36-1346/c.2016.06.031.
[13]張碧霞,李琪,蘇淑華,等.素養導向的數學試卷綜合難度比較研究——以2018年高考全國卷Ⅰ、Ⅱ卷為例[J].科教導刊(上旬刊),2019,(19):60-61.DOI:10.16400/j.cnki.kjdks.2019.07.027.
[14]張玉環,周俠.綜合難度視角下中法高考數學試題的比較研究——基于2015—2019年中國和法國高考數學試卷[J].數學教育學報,2020,29(03):43-50.
[15]韓金璇,楊澤恒,王彭德.中美高考數學試卷比較研究[J].數學教育學報,2022,31(02):13-20+76.
[16]昌國良.新課程改革背景下高考數學題的教學導向[J].湖南師范大學教育科學學報,2007,(06):29-30.
[17]李瑛.試測在高考命題試題難度調控中的實踐研究[J].中國考試,2013,(03):23 - 30. DOI:10.19360 / j. cnki. 11 -3303 / g4.2013.03.004.
[18]張天德,張召生,岳峰等.牢記立德樹人教育使命助力數學教育和人才培養——2021年高考數學試卷分析與2022年高考新動向展望[J].中學數學雜志,2022,No.389(03):26-32.
[19]周華輔.關于會考數學試題難度預估的實踐與探討[J].數學通報,1999,(02):34-36+33.
[20]王煜,黃驍.全國高考數學試題事前綜合難度分析研究[J].青海師范大學學報(自然科學版),2018,34(01):1-5.DOI:10.16229/j. cnki.issn1001-7542.2018.01.001.
[21]呂世虎,于麗芳,王尚志.數學試卷綜合難度的內涵及其指標體系建構[J].數學教育學報,2020,29(04):1-6.
[22]宋慧媛,徐行健,孟繁軍.基于題目關聯知識的試題難度預測研究[J].內蒙古師范大學學報(自然科學漢文版),2022,51(03):305-311.
[23]黎郭凱.2017年美國SAT試題數學部分與全國高考理科乙卷試題的比較分析[J].中學數學雜志,2018,(05):28-30.
[24]李志敏.全國新課標卷與廣東卷數學試題對比研究報告[J].中學數學研究(華南師范大學版),2016,(03):25-30.
[25]張怡,武小鵬,彭乃霞.綜合難度系數模型在2016年高考數學試題評價中的應用[J].教育測量與評價,2016,(12):47-53.DOI:10.16518/j.cnki.emae.2016.12.009.
[26]薛歡,杜劍南,路江江.2016—2020年高考數學(理科)全國卷“統計與概率”試題探析——基于綜合難度模型[J].教育測量與評價,2020,(12):30-40.DOI:10.16518/j.cnki.emae.2020.12.005.
[27]李保臻,石燁.中國大陸與臺灣地區高考數學試題難度比較研究——以2016—2018年大陸全國卷Ⅰ與臺灣指考試題為例[J].數學教育學報,2020,29(01):58-64.
[28]宋霜霜,陳建強.基于綜合難度模型的中考數學試題背景分析——以2015—2020年大慶市中考數學試題為例[J].中學教學參考,2022,No.474(06):34-36.
[29]李捷,吳玉田.智能組卷中的試題難度評價建模[J].肇慶學院學報,2012,33(05):10-13.
[30]魯慶云.我國高考數學試題難度影響因素的實證研究[D].重慶:西南大學,2009.
[31]羅瑪,王祖浩.教育考試中試題難度的測評研究——影響因素、評估方法及啟示[J].教育測量與評價,2016,(09):52-57+64.DOI:10.16518/j.cnki.emae.2016.09.010.
[32]周華輔.關于會考數學試題難度預估的實踐與探討[J].數學通報,1999,(02):34-36+33.
[33]毛競飛.高考命題中試題難度預測方法探索[J].教育科學,2008,24(06):22-26.
[34]佟威,汪飛,劉淇,等.數據驅動的數學試題難度預測[J].計算機研究與發展,2019,56(05):1007-1019.
Literature Review on the Difficulty of Mathematics Questions in China
Yang Congcong Yan Fang
School of Mathematics,Yunnan Normal University,Kunming,Yunnan,650500
Abstract:With the help of VOSviewer software,this paper sorts out and summarizes the domestic literature on the difficulty of mathematics questions. 130 pieces of journal literature are collected and screened from the CNKI database,and analyzed from six dimensions:journal source,age distribution,author status,keyword distribution,research content and evaluation method. It is found that the research is on the rise in general,but the journals are scattered,the number of published papers is small,and there are few core journal literature. In recent years,the method of comparative research has been used to study hot issues such as comprehensive difficulty coefficient model and mathematical core literacy. In view of this,some suggestions are put forward for the future research direction,such as strengthening the research on the difficulty of mathematics questions in compulsory education and higher education,improving the quality of the research through co-authorship,and making the research content and prediction method more diversified.
Key words:Difficulty of Mathematics Questions,Comprehensive Difficulty,Content Analysis Method
(責任編輯:吳茳)