摘要:以韋伯模式的分析框架為基礎,對2013年安徽省中考化學試題與課程標準的一致性進行了研究,以期更好發揮《課程標準》對教學和命題的指導作用。
關鍵詞:安徽省中考;化學試題;課程標準;一致性研究
文章編號:1005–6629(2013)12–0060–05 中圖分類號:G633.8 文獻標識碼:B
安徽省初中畢業學業考試(以下簡稱中考)旨在全面準確地考查初中畢業生在化學學習方面所達到的水平,其成績既是衡量學生是否達到畢業標準的主要依據之一,也是高一級學校招生的主要依據之一[1],兼有標準參照考試和常模參照考試的雙重特征。2013年中考采取全省統一命題,其中化學與物理以同場分卷的方式組織考試,化學滿分60分。作為一種高利害性考試,考試結果對于學生學業成績評價、學生升學、教師教學成績評價、化學課堂教學等都產生重要影響,考試內容更是對全省初中化學教學改革起到“風向標”的作用,其對實際教學的影響遠遠超過課程標準本身。因此,中考化學試題是否與課程標準保持一致,關系到評價結果能否體現學生達成課程標準規定的期望狀況,關系到課程標準在教學中能否得到有效落實。從這一點上看,中考試題也是對課程標準的一種詮釋和解讀。近年來,受到國際上基于標準的教育改革的影響,考試評價與課程標準的一致性分析模式被逐步介紹到國內[2~6],其中以韋伯模式和“SEC”模式在各學科考試評價中的應用最為廣泛。本文以韋伯模式[7]的分析框架為基礎,借鑒同行的研究經驗[8~13],對2013年安徽省中考化學試題與《義務教育化學課程標準(2011年版)》(下稱《課程標準》)的一致性進行研究,以促進教師對《課程標準》的理解,同時對教學和命題產生積極影響。
1 韋伯一致性分析模式簡介
由美國學者韋伯(Norman L.Webb)研發的學業評價與課程標準一致性分析模式主要關涉知識技能和認知要求兩大維度,分別從知識種類、知識深度、知識廣度和知識分布平衡性[14]四個方面討論二者的一致性。其操作流程通常首先由學科專家和教師對課程標準和評價試卷按主題目標(Topic)和認知要求(cognitive demand)兩個維度分別進行編碼,再根據編碼從上述四個方面進行分析,判斷是否符合一致性標準,最終形成各項一致性可接受水平的報告[15]。
2 資料的分析與編碼
以《課程標準》和“2013年安徽省初中畢業學業考試化學試卷”為研究對象,由兩位教師獨立進行分析和編碼,最終對編碼結果進行信度計算,相關系數為0.85(P<1.000),說明具有良好的內部一致性。
2.1 課程標準的分析與編碼
現行《課程標準》的課程內容由一級主題、二級主題和具體內容標準組成,具體知識目標均以“行為動詞+目標內容”的條目式呈現。為研究方便,本研究中以《課程標準》中一級主題為主題目標(知識內容),即身邊的化學物質、物質構成的奧秘、物質的化學變化、化學與社會發展、實驗基礎與科學探究。對個別具體內容進行了微調,將前四個主題內容中涉及基礎實驗技能的具體內容與科學探究合并到“實驗基礎與科學探究”。另外,剔除了紙筆測驗無法測量的目標,如“認識到合作與交流在科學探究中的重要作用”等內容。這樣最終形成了由112個具體內容目標構成的課程標準的知識內容維度。
對《課程標準》中各具體知識目標認知要求的劃分,原則上以內容標準中每個知識條目其相應的行為動詞為標準,按從低到高分為A(知道、記住、說出、列舉、找到、模仿操作等)、B(認識、了解、看懂、識別、能表示、初步學習等)、C(理解、解釋、說明、區分、判斷、簡單計算、獨立操作等)三個水平。如“空氣的主要成分”對應的行為動詞是“說出”,故認定其認知要求為以記憶為特征的低端認知水平A層次;又如“金屬活動性順序”在課標中的描述是“能判斷置換反應,解釋日常生活中的一些化學現象”,要求在一定情境中應用相關知識解決問題,故其對應的認知要求是較高端的C層次。最終形成的編碼結果如表1所示。
2.2 試題的分析與編碼
由于樣本的數量會影響到統計的可靠性,Webb 模式所分析的測試題一般在 60 題以上,并且它們以選擇題居多[16],而我省中考試題每道選擇題的各選項或每一空所考查的內容大多為不同的知識點。因此,本研究在具體的編碼過程中,以選項或填空中所考核的知識點為測驗的目標,以保證一定的信度,如每道選擇題的4 個選項若考查的是不同的知識點,就記為 4 題;如果考查的知識點相同就記為1題;填空題的每1空格記為1題。對具體知識目標的確定同前面《課程標準》知識內容維度,但由于《課程標準》對認知水平的界定所使用的行為動詞較模糊、抽象,在分析試題的考查要求時操作性不強,而影響對試題認知水平的界定以及后續統計分析。本研究在布魯姆教育目標分類和部分學者研究成果[17~20]的基礎上,將試題的認知要求劃分為記憶、理解和應用三個水平,分別對應了《課程標準》的A、B、C三個水平。具體說明如下:
(1)記憶水平:指對認知要點進行回憶或再認。試題提供的信息與學生學習過的材料相同或非常類似,學生只需從長期記憶中調取相關知識即可解決問題,涉及的知識多為事實性知識。如試卷中第9題的D選項:空氣可分為氮氣、氧氣、稀有氣體、二氧化碳、其他氣體和雜質,就是通過“辨認”來考查“空氣的主要成分”這一目標內容;又如第12題的(2)圖中儀器a(鐵架臺)的名稱,就是通過“再現”回答“鐵架臺”這一儀器,都屬于記憶水平。
(3)應用水平:包括直接應用和間接應用。直接應用是指在問題解決活動中能夠運用所學知識對比較熟悉和比較簡單的具體情境進行分析和判斷,建立起知識和實際的直接對應性聯系。間接應用是指在問題解決活動中能夠綜合運用所學知識以新的、陌生的復雜問題進行運算、分析和說明,提出清晰、完整的觀點和看法。往往涉及多個知識目標,且多為方法性知識和元認知知識,具體包括執行、實施、分析、評價、設計、創造等類型。如16題(1)就是將相關元素性質和質量守恒定律直接應用到問題的解決中,屬于直接應用水平的“執行”層次;又如第15題(5)提供的問題情境對考生而言陌生且較為復雜,需要考生在對數據進行分析得出反應快慢的變化規律,并在此基礎上遷移相關知識,并運用前面小題剛得出的硫酸濃度對快慢影響的結論提出自己的觀點,屬于間接應用水平的“創造”層次。
依據上述標準,對試卷所有試題進行分析形成對試題認知水平的編碼(見表2)。
3 一致性分析
3.1 知識種類的一致性
知識種類的一致性,即評價與課程標準是否陳述了相同的內容范疇。可以根據評價試題是否包含了每一領域的相應內容,來判斷類別一致性標準的達成與否[21]。韋伯模式認為,評價必須至少6道測試題“命中”某一條領域內容的目標,才達到可接受水平。由表3可以看出:擊中5個主題領域相應目標的試題數分別是18、12、12、10、13,每個領域試題擊中數目均大于6 個,說明知識種類達到一致性接受水平。略有瑕疵的是,第9題B選項“有機高分子材料可分為天然有機高分子材料和合成有機高分子材料”考查內容與課程標準的內容目標沒有交集,游離于課程目標之外。
3.2 知識深度的一致性
知識深度的一致性,即評價所要求學生展示的認知水平與課程標準期望學生所應知道和能做的認知要求,二者是否保持一致,解釋與界定每一個內容標準內不同目標的知識深度水平以及試題的知識深度水平,是一致性分析中的核心要求[22]。韋伯的判斷標準是:測驗試題的認知水平至少有50%命中課程標準中的某個領域目標所要求的認知水平。鑒于目前我國學生學業負擔過重和我省中考的特點,筆者以為:在知識深度的一致性判斷上,應以與課程標準的認知要求相匹配為標準。從這個角度和表4的數據看,一致性可接受水平最高的是“身邊的化學物質”,而“物質的化學變化”一致性相對較差。
此外,從表1和表2的由低到高的三種認知水平比例關系看,課程標準的要求約是3:5:2,2013年中考試卷的要求約為3:2:1,顯然在以識記為主的低層次記憶水平考查過多,而理解和應用層次要求明顯低于《課程標準》,這也從考后獲得試卷難度系數偏高的統計得到證實。
3.3 知識廣度的一致性
知識廣度的一致性用以判斷課程標準中希望學生所要學習的知識范圍與學生正確作答評價試題或評價活動所需要的知識范圍是相同的,或者是相當的[23],體現了考試內容的覆蓋面。韋伯認為:判斷知識廣度一致性的可接受水平是,某一學習領域內,測驗試題擊中課程內容標準的具體目標數至少占課程標準總目標數的 50%[24]。根據課程標準和試題在知識廣度方面的編碼分析,各主題領域擊中的目標數統計如表5,從中可看出:在物質構成的奧秘、物質的化學變化和實驗基礎與科學發展的主題領域達到可接受水平,而這些主題內容也是初等化學的核心概念和學科能力較集中的部分,而其他二個主題領域未達到可接受水平。
3.4 知識分布平衡性的一致性
知識分布平衡性標準主要考察評價項目在各個具體目標之間分布的均勻程度[25]。韋伯假定的前提是課程標準中知識的重要程度沒有區別,其一致性水平用平衡性指數進行計算,計算方法如下:
平衡性指數=1-
其中,O=被命中的某內容標準所包括的目標總數,Ik=命中目標的試題數,H=命中該內容標準的試題總數[26]。韋伯模式中知識分布平衡性的一致性可接受水平是:知識分布平衡性指數的平均數大于或等于0.70。從表6顯示的各主題內容的知識分布情況及平衡性指數看,平衡性指數均超過了0.70,全卷總平衡性指數為0.82,說明2013年中考各考題對各知識點考查的分布是均衡的,與課程標準保持了較高的一致性。
4 結論與建議
4.1 結論與思考
總體上看,2013年安徽省中考化學試卷與課程標準具有較好的一致性,體現了“國家課程標準是教材編寫、教學、評估和考試命題的依據,是國家管理和評價課程的基礎[27]”的綱領性要求。在知識種類上的高
度一致性,有利于引導初中化學教學嚴格遵循《課程標準》,不宜任意拓展教學內容,這也與當前“減輕學生不必要的學習負擔”要求相一致,發揮了中考正面、積極的導向功能。在知識深度上的一致性為保證考試的效度提供了保障,試題的認知要求應盡量與課程標準要求具有較高的匹配性,才符合中考水平性考試的特點,顯然2013年試題在理解和應用層次比例相對過高。這既不利于實現“考核的重點要以基礎知識的理解和運用為主,不要放在知識點的簡單記憶和重現上[28]”的要求,也影響到與課程標準的一致性。在知識廣度上的一致性較弱,反映了考試的覆蓋面偏小,特別是對以元素為主的“身邊的化學物質”主題中試題與課程標準的一致性較低,可能會導致元素知識的教學被過分輕視,對學生在進入高年級進一步學習化學產生不利影響。在知識分布平衡性的高度一致性體現了我省中考的穩定性,在一定程度上反映了較成熟的命題技術。
4.2 啟示與建議
4.2.1 進一步完善《學業考試綱要》,充分發揮其對復習教學和命題的指導作用
在實際操作中,《學業考試綱要》是中考的命題依據,它在課程標準和考試評價間起到橋梁作用,《學業考試綱要》是否能準確體現《課程標準》的要求將直接影響到中考試卷與課程標準的一致性,所以制訂并完善《學業考試綱要》有助于幫助命題人員加深對《課程標準》的理解和命題質量的提高。如在《學業考試綱要》中應刪除那些紙筆測驗無法或難以測量、不同主題內容間有重復、學科特征不明顯的知識內容,減少像“水對生命活動的重大意義、水資源和節約用水的意識”等知識點;又如在試卷結構要求中“考試要求”的A、B、C比例應與《課程標準》保持一致,設置為3:5:2。
4.2.2 加強對《課程標準》的研究,準確理解其內容標準的認知要求
韋伯模式一致性分析框架的核心要素是知識深度的一致性,要準確判斷考試評價與課程標準之間在知識深度上的一致性,就必須借助內容標準的具體化水平和核心行為動詞來進行操作。一般而言,內容目標描述得越具體,課程標準和評價暗含的知識深度要求就會越清晰。而我國新修訂的《課程標準》雖然較舊版在對內容標準行為動詞的界定上更加準確,但仍存抽象、模糊的現象,如“認識溶解現象”的“認識”這一要求到底如何把握?直接影響到教學和評價的尺度。所以,廣大教師要認真研究《課程標準》,深入學習教育目標的分類理論,對每一內容標準所對應目標的認知水平進行準確定位,掌握不同認知水平的行為動詞包含的確切涵義,以及達到相應認知水平的學生應該表現出來的學習行為,并運用于指導教學目標的制訂。
4.2.3 提高命題技術,保持安徽中考化學試題的命題特色和風格
有效的評價是以高質量的命題為前提的,基于標準的命題技術有利于保證中考評價和課程標準的一致性。但就當前的評價實踐看,很多考試的命題都是基于教師的經驗,在考試內容的選擇、認知水平的確定、命題設計等方面存在較大的隨意性。因此,通過中考這樣高利害、大規模考試的命題為教師提供基于標準進行命題的示范,顯得尤為必要,而一致性分析也為完善命題技術提供了參照。基于標準的命題技術的核心在于形成“測驗設計框架”(見表7),相對于傳統的教育測量中的“雙向細目表”,測驗設計框架不僅為命題者提供了考試內容抽樣的工具,以確保考試內容不偏離課程內容標準,保證考試較高的效度;而且從考試性質、命題目的、難度、題型、價值取向、評分細則等方面為命題明確了方向,保證了評價與課程標準的內在一致性。命題者在命題過程中應立足于測驗設計框架,以命題目的確定測驗難度;以考試性質選擇測驗內容,并把握各知識點的認知要求和權重;以價值取向挑選素材,設計試題情境;以評分細則反映教師對課程標準和學生表現的把握程度。
參考文獻:
[1]安徽省教育科學研究院編. 2013年安徽省初中畢業學業考試綱要[M].合肥:合肥工業大學出版社,2013:140.
[2][14]劉學智,張雷.學業評價與課程標準的一致性:韋伯模式本土化探究[J].外國教育研究,2009,(12):13~17.
[3]邵朝友,張斌,王少非.論學生學業成就評價與課程標準的一致性[J].教育研究與實驗,2011,(5):50~55.
[4]劉學智,馬云鵬.美國“SEC”一致性分析范式的詮釋與啟示[J].比較教育研究,2007,(5):64~68.
[5]崔允漷,王少非,夏雪梅編.基于標準的學生學業成就評價[M].上海:華東師范大學出版社,2008.
[6][21][22][23][26]諾曼·韋伯著,張雨強編譯.判斷評價與課程標準一致性的若干問題[J].比較教育研究,2011,(12):84~89.
[7][15][25] NormanL.Webb.Alignment of Science and Math-ematics Standards [M]. National Institute for Science Education University of Wisconsin-Madison,1997:14~22.
[8][24]焦傳玲,張雨強.高考化學試題與課程標準一致性初探[J].化學教育,2011,(8):32~33.
[9]許方,王后雄.高中化學學業水平考試與課程標準一致性分析[J].中學化學教學參考,2013,(6):60~62.
[10]李嫩.化學課程標準與上海中考化學試題一致性研究[D].上海:上海師范大學碩士學位論文,2010.
[11]卓利君,元樂天,周益波,王星喬.新課程高考“化學反應原理”試題與課程標準一致性研究[J].教學月刊·中學版(教學參考),2013,(2):70~72.
[12][16]滕瑛巧,王星喬.標準視域下化學課程學生學業評價一致性研究[J].化學教學,2012,(2):57~59.
[13][17]王磊,黃瓊,劉東方.中考命題與化學課程標準的一致性研究[J].基礎教育課程,2010,(3):75~80.
[18]王磊,劉東方.中考化學試卷探究題的評價內容與水平要求設置研究[J].基礎教育課程,2011,(3):76~80.
[19]雷新勇.基于標準的命題技術(一)(二)[J].考試研究,2011,(1)(2).
[20]張欣榮.化學課程標準中認知性目標水平層級的研究[D].西安:陜西師范大學碩士學位論文,2010.
[27]中華人民共和國教育部.基礎教育課程改革綱要(試行)[M].北京:人民教育出版社,2001.
[28]中華人民共和國教育部.義務教育化學課程標準(2011年版)[J].北京:北京師范大學出版社,2012:41.