徐泓
初中學業水平考試(以下簡稱“中考”)是現階段我國基礎教育階段影響較大、涉及考生人數最多的高利害性考試。試題質量不僅決定了對學生學業評價的客觀性、科學性,而且關乎對義務教育階段教學改革能否產生積極、正確的引導作用。為加強對中考命題質量的監控,1999年至2004年,教育部有關部門對全國各省市的中考進行評價[1]。2019年教育部印發《關于加強初中學業水平考試命題工作的意見》(以下簡稱“意見”)明確提出:開展命題質量評估,建立考試命題評估制度[2]。教育部委托有關機構對各省的部分中考科目進行評價。在此背景下,加強中考命題質量評估標準的研究,成為保障命題質量評估工作科學化和專業化的重要任務。目前,基于情境的教學和考試命題已經成為教育教學及考試領域落實核心素養和測評學科能力的重要手段和實現形式[3]。同時,現行中考仍存在“基于情境的命題以及與學生生活和社會實際聯系的題目比重過少”[4]“情境材料與解題信息相分離、情境空洞、情境虛假”[5]等問題。為此,選擇試題情境這一維度,嘗試構建有關中考化學試題情境質量的評估框架,一方面為完善中考試題質量評估體系提供依據,另一方面為正確引導中考化學命題改革做出探索。
關于試題情境的認識,不同學者有不同觀點。有學者認為:情境是試題的組成要素之一,情境的作用是對考生進行刺激,產生讓考生表現心理結構或能力的環境[6-7]。情境即描述問題的場景,為問題的解答提供具有有機聯系的動態的信息,與立意、設問等要素既相互聯系,又相互獨立。也有學者認為:試題情境即問題情境,既包含了呈現給學生相關信息的“支持工具”,也包含向學生提出答題指示的“命令”,將情境和問題看成一個整體[8-9]。還有觀點認為:試題情境即真實情境,是對現實情境的再現,為呈現信息、提出問題、達成立意(測評目標)提供載體[10-11]。
從上述有關試題情境的觀點不難看出,“把情境視為問題設計的背景或載體,二者都是試題的構成要素”是普遍的共識;但對待情境與問題間的相互關系上,則存在一定的分歧。有的認為情境是試題的獨立要素,有的認為情境與問題應該是一個整體。鑒于中考采取的主要是紙筆測試形式,以及測試對象的年齡和認知特點,很難提供給測試對象一個“身臨其境”的問題與情境交融的真實場景,只能借助一定的呈現方式提供給考生有關問題背景和條件信息,再由考生根據問題解決的需要對情境進行分析和加工,以實現問題解決。故試題結構多以“情境+問題”的方式呈現。基于此,本研究把對試題情境質量的評估和問題質量的評估分開進行。本文只涉及情境質量評估,認為試題情境是根據測試目標,圍繞特定的主題選取事實素材,以文字、數據、圖表等方式呈現的問題背景以及條件等關鍵信息,主要承載考查內容、考查要求和價值引領等功能,體現命題者的認知、情感、態度和價值觀。總之,情境作為試題的要素之一,是實現試題立意的材料和介質,也是進行問題設計的條件和線索。試題情境的質量優劣是衡量試題品質的重要指針。
隨著以發展學生核心素養為標志的新一輪基礎教育課程改革的不斷推進,考試評價改革也日益突出對學生學科或課程核心素養水平的考查。而只有當學生在有意義的情境中運用知識解決問題時,才能體現并考查出學生的素養水平。這已成為專家學者和一線教師的普遍共識。對試題情境的研究更加受到人們的重視,關于試題情境分析模式或框架的研究是其中的一個熱點。
王俊民等根據羅日葉的情境類型理論,以國際五個大規模測試為對象,從辨別參數、內容參數和裝扮參數三個維度構建了國際大規模科學學業測試的試題情境分析框架,其中辨別參數包括情境范圍、情境主題、學科領域、所致力于發展的學生型面、期待作業類型、情境開發等;內容參數包括運用的知識、使用的能力或素養、態度、問題之間的關聯、問題與背景的相關性、問題與具體知識的相關性、是否涉及數學或公式計算等;裝扮參數包括情境的圖形呈現等二級指標。
龔偉等以某市十年中考化學試題為研究對象,從情境來源(包括范圍、陌生度)、呈現方式(包括種類、多樣性)、試題情境的層次、情境的考查功能等角度構建了中考化學試題情境分析模式[12],并對其中試題情境的層次做了“僅提供閱讀性材料,與試題考查內容無直接關系;將要考查的內容融入素材之中,增加試題的可讀性;提供學習性材料供考生考場自學”三個水平的界定。
劉津羽以2017~2019全國和天津高考物理卷為研究對象,從呈現方式、情境主題、情境類型、素養維度設計分析框架對試題情境進行評價[13]。
趙雪以山東省2007~2015年高考化學試題為研究對象,構建了試題情境的選材來源和考查功能的價值層級的情境分析二維框架[14]。還有學者分別從情境的類型[15-18]、情境的關聯度[19,20]、情境的真實性[21]、情境的適切性[22]等角度對中、高考試題情境進行分析。
《意見》明確要求:拓寬試題材料選擇范圍,豐富材料類型,確保材料的權威性,杜絕政治性和科學性錯誤。充分考慮城鄉學生學習和生活實際,增強情境創設的真實性、典型性和適切性,提高試題情境設計水平[23]。義務教育化學課程標準也指出:設計紙筆測驗的試題,要依據“課程內容”把握學習要求……注意聯系生產、生活實際,取用鮮活的情景,體現實踐性和探究性[24]。中考作為義務教育階段的終結性考試,具有科學評價學生學業成就、正確引導初中教學的作用,試題的編制應充分體現上述要求。在試題情境創設上,應注重情境素材的選取要緊密聯系學科內容,關注其真實性、適用性和包容性;應根據題目的預設難度調整素材的復雜度和綜合度,要保證情境的陌生度和復雜度與任務類型匹配。
通過對現有試題情境分析框架的文獻研究,可以發現有的研究對試題情境分析不夠全面,只是從情境的某一個要素進行分析和評估;有的研究雖然能從不同角度對試題情境進行分析,但要么分析框架評價指標有交叉,操作性差,要么未能結合中考特點,針對性差。且大多數分析框架只是從定性的角度進行描述,其評估結果的呈現較復雜。為能較全面、有效地對中考試題情境進行評估,筆者認真學習《意見》、學科課程標準,以及國家教育評價改革的相關政策,把握對中考命題改革方向和紙筆測驗試題編制的總體要求,即由知識立意向素養立意轉變;綜合分析現有分析框架中共性內容,如真實性、關聯性、適切性、公平性等,從中抽離出能體現中考試題特點的因素進行具體描述(見表1),形成初步框架。最后通過邀請相關專家進行論證,形成了包括5個維度、每個維度按三級水平劃分的中考化學試題情境評估框架(見表3)。

表1 中考化學試題情境評估維度及具體描述
在表1基礎上咨詢9名具有市級以上中考化學命題經驗的專家意見。其中,大學教授兩名,具有正高級教師職稱的教研員和中學教師5名,具有高級教師職稱的教師兩名。通過設置四點量表供專家對每個維度的重要性進行獨立評分,其中,4=非常重要,3=比較重要,2=不太重要,1=不重要。計算打分“4”或“3”的專家人數所占比例,即為CVI(content validity index,內容效度指數)的數值。為避免專家對選項的隨機選擇導致影響CVI的判斷,并通過Kappa值的計算對隨機一致性進行校正,調整后的Kappa用K表示,當K>0.74時為優秀,0.60≤K≤0.74時為良好,0.40≤K≤0.59時為一般。專家間的一致性越高,則CVI值越大,Kappa也會越大[25-26]。最終根據專家評分,結合相關公式計算調整出的Kappa值(見表2)。

表2 中考化學試題情境評估維度的內容效度專家評分表
整理專家意見發現,多數專家認為“思想性”這一維度內容與“導向性”中的“學科本質”內容有一定交叉,且對于只經歷一年化學學習的初中畢業生來說,所涉及化學思想與方法有限,同時鑒于中考試題中相當一部分試題承載著水平性考試功能,該維度的要求難以、也無須全面滲透于中考試題中,故“思想性”不宜納入中考化學試題情境的評估要求。專家對該維度的效度統計一致性較差(CVI=0.67),K*值僅為0.20,評價為“差”,而其他五個維度的內容均為“優秀”。此外,有專家建議將“導向性”改為“教育性”更能體現立意和情境價值。綜合考慮,決定舍棄“思想性”這一評估維度,確定關聯性、真實性、適切性、新穎性和教育性五個維度為評估框架的主要內容。
同樣運用上述方法將每個維度按從低到高劃分為“水平1”“水平2”“水平3”三個層次,形成最終的中考化學試題情境質量評估框架(如表3)。該框架從不同維度對中考化學試題情境的質量進行較為全面的刻畫,并可以通過量化的方式呈現評估結果,具有較強的可操作性。

表3 中考化學試題情境質量評估框架
該評估框架包含了試題情境的來源、呈現方式、功能等多個要求,能全面反映試題情境的質量,既體現了現階段教育評價改革倡導的“素養立意”對試題情境的要求,如真實性、關聯性和教育性,也體現了中考作為大規模教育考試應具有的客觀、公正、公平的特點,如適切性和新穎性。同時,通過分項、分級評分可以實現對試題情境質量的量化評價,具有可操作性較強、評估結果的簡潔呈現等優點。
選取2021年安徽省中考化學試卷第16題,應用以上構建的試題情境質量評估框架對該題的情境逐一進行分析和評估。
關于燃燒的研究是一項重要的課題。某小組以“探究燃燒的奧秘”為主題開展項目式學習。
【任務一】認識燃燒
(1)酒精、煤(含硫)、天然氣是生活中常見的燃料,下列不屬于三者燃燒共有的現象是___________(填字母序號)。
A.發光 B.產生刺激性氣味的氣體
C.放熱 D.產生使澄清石灰水渾濁的氣體
(2)寫出酒精(C2H5OH)完全燃燒的化學方程式_________________________________。
【任務二】探究燃燒的條件及質量變化
(3)該小組同學按下列實驗步驟開展探究。
步驟1:室溫下,按右圖組裝裝置,裝入藥品,稱量裝置總質量為m1g。
步驟2:將錐形瓶浸入80℃的熱水中,觀察現象。
步驟3:取出裝置,恢復至室溫并擦干錐形瓶;打開止水夾K1和K2,從K1處緩慢通入約50 mL氧氣,再關閉K1和K2,稱量裝置總質量為m2g。
步驟4:將錐形瓶再次浸入80℃的熱水中,觀察現象。
步驟5:取出裝置,恢復至室溫并擦干錐形瓶,稱量裝置總質量為m3g。
①通過上述實驗,能證明燃燒需要氧氣的實驗現象是___________。
②m1、m2、m3的大小關系是________________。
【任務三】調控燃燒
(4)報道顯示:國內外一些煤田因發生煤層自燃,帶來了資源浪費和環境污染。一旦煤層自燃,請給出一條合理的滅火建議___________________。【任務四】再探鐵的燃燒(5)查閱文獻:顆粒直徑為20~30 nm的鐵粉,在空氣中會發生自燃生成氧化鐵。結合已有知識,回答下列問題:
①影響鐵燃燒的因素有_________(至少回答兩點)。
②鐵與氧氣反應的條件不同,產物不同。若5.6 g鐵與氧氣反應可得a g產物,且鐵無剩余,則a的取值范圍是___________。

該題選擇“燃燒”這一主題以項目式學習的方式,圍繞不同的任務創設若干個小的問題情境,將“燃燒”這一主題貫穿整個試題。現按四個任務為線索對每個任務的情境進行逐一分析;為能更好顯示情境總體質量,對各任務不同維度的水平1、水平2和水平3分別賦值為0、1和2,經加合可得該任務情境的綜合評分(即“情境質量指數”),指數越大說明情境質量越好。
1.任務一的情境分析
任務一以生活中3種常見的燃料——酒精、煤(含硫)、天然氣為研究對象,屬于考生熟悉的日常生活型情境,故真實性處于“水平3”、新穎性處于“水平1”。信息以單一的文字方式呈現,情境內容符合課程標準的學習要求,適切性處于“水平2”。考生回答問題時,需要對所提供的三種物質完全燃燒現象進行回憶和辨識,關聯性處于“水平2”。此外該任務的情境,一方面通過呈現三種常見燃料體現化石能源與人類生活的密切聯系,讓學生感受化學科學對人類發展的重要作用,體現化學學科的社會價值;另一方面通過現象的辨識引導學生體驗“燃燒”概念的形成是尋找不同燃燒現象的共性過程,體現比較、歸納等學科思維的學科本質價值。反映了多重教育價值,故教育性劃歸為“水平2”(見表4)。
2.任務二的情境分析
任務二以白磷燃燒的實驗探究為情境素材,對人教版教材中燃燒的條件和質量守恒定律兩個探究實驗進行了整合和改造,既體現了O2和CO2的理化性質、空氣的組成等學科內知識的綜合,又滲透了氣體密度大小、溫度與壓強的變化等學科間知識綜合,屬于可再現的、虛擬的實驗探究情境;內容雖是學生熟悉的,但以實驗步驟文字敘述和新裝置圖示等較復雜的方式呈現,故真實性和新穎性均處于“水平2”,適切性處于“水平3”。該任務兩個問題的解決需要考生看懂實驗操作步驟并理解實驗的原理,再尋找燃燒條件的實驗證據,運用O2和CO2理化性質(密度相對大小和助燃性)、質量守恒定律等已有知識解決問題,關聯性處于“水平2”層次。該任務情境還體現了控制變量的實驗方法、實驗安全的學科本質價值,在教育性上處于“水平2”。
3.任務三的情境分析
受煤層自身品質等因素的影響,世界各地的煤田常因發生自燃帶來資源浪費和環境污染。我國北方煤田也普遍存在火區較多的特點,受煤火影響每年破壞煤炭資源兩億噸左右。據1996年對621個國有重點礦的統計,共有363個礦井具有自燃發火危險,占礦井總數的57.62%煤礦區發火率也很高,煤炭火災的防治一直是煤炭系統的重要任務之一[27]。任務三以上述文獻素材創設了真實生產環保情境,充分彰顯“通過改變條件調控燃燒的發生”這一化學學科本質價值,以及化學對環境保護、資源利用等方面的社會價值,具有多重教育性,因此在真實性和教育性上都處于“水平3”。該問題的解決需要考生結合情境提供的信息,并綜合相關知識才能給出合理建議,情境雖簡單但較陌生,故在關聯性和新穎性方面都處于“水平2”。由于考生對煤層自燃這一場景缺少實際體驗,加之對碳在高溫下與水反應的事實沒有認知基礎,導致很多學生的回答是“用水澆”這一看似合理但有悖于實際的方法,在內容上有超出課標要求的嫌疑,若為學生提供“碳在高溫下與水反應能生成一氧化碳和氫氣”等相關信息可能更合理,故該情境的適切性為“水平1”。
4.任務四的情境分析
任務四的問題屬于安徽卷特有的“獎勵分”(類似于附加題,即主要功能是甄別優秀學生),該任務情境通過給出“納米鐵粉能發生自燃及產物”的新信息,要求考生將其與已有的鐵絲在氧氣中燃燒和鐵的常見化合價等已有知識進行整合,形成對鐵的燃燒條件、鐵與氧氣反應規律新的認知再用于問題解決,故關聯性方面處于“水平3”。該情境基于真實實驗,屬于實驗探究情境,信息較陌生且復雜,有文字、有數據,故在真實性、新穎性和適切性方面均處于“水平3”。情境的教育價值主要體現的是“反應條件不同反應也不同”的學科本質價值,教育性處于“水平2”。
綜上分析,該題情境設計除了在任務一的新穎性和任務三的適切性方面水平較低外,其他都較好,每項任務情境質量指數都在6以上,說明該題情境質量總體較高。
運用評估框架對中考化學試題的評估,不僅可以從質性的角度對試題情境的質量進行全面評估,還可以通過量化的方式呈現試題情境質量的評估結果。如上述案例中四個任務情境在不同的維度分別呈現不同的水平,任務一和任務三在真實性和教育性、任務二在適切性、任務四在除教育性以外的幾個維度分別呈現較高水平;而任務一在新穎性、任務三在適切性上處于較低水平。此外,還可以在對整套中考化學試卷各題情境進行評估后,再對每一道試題情境指數按一定公式進行累加,得到試卷整體的情境系數[28],用以對全卷試題情境質量進行總體評估。同樣,還可以通過類似的方式對試題的問題等其他要素構建評估框架,形成一套較為完善的試題和試卷質量評估標準,并適當推廣到相關學科,實現中考試題質量評估工作科學化、專業化水平的提升。
隨著高考評價改革的不斷深入,中考改革也逐漸從知識立意、能力立意走向素養導向,而基于情境的教學和考試命題已經成為教育教學及考試領域落實核心素養和測評學科能力的重要手段和實現形式[29]。因此,評估框架的構建對于積極引導中考化學試題情境設計,落實素養導向的命題改革,有著重要的作用。同時,對于提高廣大命題教師的命題水平,提升中考化學試題質量,也提供了具體的指導。在中考化學試題情境素材的選取上應關注真實實驗、生活實際和學術前沿動態,材料的內容應符合初中化學課程標準要求和學生認知水平,體現學科本質價值和學科社會價值等。
在使用本評估框架時,應注意以下幾個方面的問題:一是并非要求每道試題的情境都需要達到框架中所有維度的高水平,才是好的情境。因中考兼有水平性考試和選拔性考試的雙重功能,不同試題在全卷中起到的作用也有所不同,如對于只是用來“衡量考生是否達到畢業標準”的試題,其難度通常不能太大,也就決定了在新穎性和關聯性方面的要求不宜太高,建議評估結論的呈現應采取定性與定量相結合的方式。二是在使用該評估框架對中考試題情境進行評估時,應考慮到不同的評價專家可能對同一道題5個維度的水平劃分存在認識差異,建議評估專家應由2~3名有經驗的人員組成,先統一對框架中各水平劃分的認識,再各自獨立評分,最后對不一致的地方進行討論以達成一致,形成最終評分。
本框架的應用效果還有待于實踐的檢驗,部分內容也有待于在實踐中不斷完善,如開展整套中考化學試卷試題情境的評估時,采取各維度評分簡單加合的方式是否科學?若按不同權重處理時,各自權重比例如何分配?這些問題都還需要進一步的研究。