黃皓燕 陳嫻 蔣敏艷
(1.南京市金陵中學,江蘇 南京 210005;2.南京師范大學教師教育學院,江蘇 南京 210097)
新課程是以提高全體學生的科學素養、促進學生的全面發展為課程總目標,為學生的終身發展奠定基礎.而課程系統中的教學材料、教學過程以及教學評價等能否與課程標準保持一致是實現這一目標的根本保證.所以近年來國內開始有針對性地研究考試與課程標準之間一致性問題,例如物理中考命題、高中物理學業水平測試(必修)(也稱小高考)與課程標準一致性的研究,研究結果表明,中考及小高考的命題與課程標準的一致性均不高.[1-2]
針對這一情況,我們進行了反思.其實在過去的10年中,一些國家的學科專家正在關注和研究課程要素之間的一致性問題,例如美國一直在進行對州標準化測驗間的一致性研究.[2]美國是教育分權型國家,美國有國家科學教育課程標準,各州也有各自的課程標準,美國在政策上引導學校遵循州課程標準進行教學.而我國是教育集權型國家,全國實行統一的《課程標準》,這規定了學生必須達到最低學業要求.[3]事實上我國各省的教育發展情況不盡相同,所以大部分省都在《課程標準》的基礎上根據本省的實際情況制定了本省的教學要求及《考試說明》,相應的考試也是根據《考試說明》來命題的.例如江蘇省教育廳對2005年秋季入學的學生開始實行“全省普通高中學生學業水平測試”的方案,每年出版《考試說明》,對各學科測試的命題指導思想、內容和要求、試卷的結構及題型比例等內容進行了非常詳細地描述.所以實際上教師們教學參考的直接藍本是本省的《考試說明》及考試試卷.如果《考試說明》與試卷之間的一致性較高,就會使教師們自覺地按《考試說明》的要求進行教學,使《課程標準》得以順利實施.
本研究采用美國學者波特(Porter)于2002年提出的二維矩陣法,即從內容匹配和認知程度匹配兩個維度來檢驗考試標準和測驗項目之間的一致性.研究者將《物理學業水平測試(必修)說明》和“物理學業水平測試卷(必修)”用相同的方法分別編碼到一個內容×認知的二維矩陣中,兩者之間的一致性就是以兩個矩形表格中的單元格賦值為依據進行計算.單元格賦值在統計結果的基礎上需要被標準化處理,即被轉換成總和是1的比值.運用波特一致性系數定量計算測試說明標準和測試題之間的一致性程度.波特一致性系數P的定義為

這里的n表示矩陣中的單元格數目,i表示其中一個特定的單元,其數值是從1到n.對一個8×4的矩陣,n=32.Xi代表表格X 的第i個值(如《考試說明》表格),Yi代表表格Y的第i個值(如物理試卷表格),波特系數P的數值介于0和1之間.當P=0時,表示兩者間的差異性最大;當P=1時,表示比較的兩個矩陣之間具有完美的一致性.參照北師大劉恩山的研究,[4]用matlab編程,得到對于8×4的矩陣,為了使顯著性水平在0.05上具有統計意義,一致性指標應該達到0.7328.
在得出兩者一致性系數的基礎上,還可以具體分析兩者之間的一致性水平,從內容維度和認知維度兩個方面分別進行比較,即可得出兩者的一致性差異的具體表現和來源.
本文的研究對象包括3個部分,物理學業水平測試考試說明(以下簡稱《考試說明》和江蘇省2011年物理學業水平測試試卷(以下稱2011年卷)和江蘇省2012年物理學業水平測試試卷(以下稱2012年卷).
2011年和2012年的物理學業水平測試《考試說明(必修)》沒有改變,但相對于往年有較大的變動.具體表現在測試的要求上,之前的《考試說明》對測試要求只分“A”、“B”兩個等級,而今新增了“C”級,并分別對 A(了解)、B(理解)、C(應用)等級作了詳細的說明.另外,新增了“獨立操作”(a)這一層認知要求,單獨列出了對實驗的測試要求,以突出其重要性.
江蘇省2011年、2012年的物理“學業水平測試”依據《考試說明》的要求進行命題,兩者之間的一致性水平對學業水平測試系統的完備性起著至關重要的作用.文章在得出兩者之間的一致性系數后,還將從內容維度和認知維度比較兩者之間的差異,最終綜合得出結論.
《考試說明》對知識點的內容主題劃分和認知要求都很明確,如第1個知識點“質點”屬于物理1中“運動的描述”這一主題,認知深度要求為“A”.以物理選修1系列為準.《考試說明》中總共有60個知識點,認知深度為“A”的有44個,為“B”的有7個,為“C”的有5個,列入(a)的有4個.《考試說明》對物理選修1-1的內容主題分為:(1)電磁現象與規律;(2)電磁技術與社會發展;(3)家用電器與日常生活.考慮到這一分類不符合教學經驗,研究中用選修3-1的分類方式,即對選修1-1的知識點進行分類(分為3類:電場、電路和磁場).見表1所示.

表1
對2011年和2012年物理學業水平測試的試卷分類采取相同的規則,以具體采分點為準,從內容主題和認知水平兩個維度進行劃分.該分析過程的數據由兩位物理教育研究者分別獨立得出,用SPSS軟件計算兩人的數據,得到在P=0.01的顯著性水平上,相關系數分別為0.919和0.967,不一致的地方兩者共同商討最終達成一致.見表2和表3所示.

表2

續表

表3
將表1~表3標準化后,得到比率表,見表4~表6所示.

表4

表5

續表

表6
將比率表4~表6代入Porter公式進行計算.
對表4和表5,根據公式求得2011年卷與《考試說明》之間的一致性指數P1.

對表4和表6,根據公式求得2012年卷與《考試說明》之間的一致性指數P2.

由此得出2011年卷和2012年卷與內容標準的一致性指數均為0.73,8×4矩陣的一致性臨界值為0.7328.根據研究發現,試卷與《考試說明》之間的一致性指數較高,2011年卷和2012年卷雖未能超過臨界值,但已非常接近,一致性水平較好.
下面再從內容主題和認知水平等方面具體進行分析.
將表4~表6中每一內容主題的比率制成圖表,如圖1所示.考試說明與2011年試卷總體看來具有一定的相似性,但也存在明顯的差異.整體看來,《考試說明》最強調“運動的描述”、“相互作用與運動規律”、“機械能與能源”和“磁場”這4個主題.2011年卷和2012年卷在“運動的描述”、“相互作用與運動規律”、“機械能與能源”這3個主題上所占的比例較大,除2011年卷的“相互作用與運動規律”外,其余均高于《考試說明》的要求,對于“磁場”連續兩年考試的比例均低于《考試說明》.而對于其他4個主題,“經典力學的成就與局限性”、“電場”兩份試卷的考核比例與《考試說明》的要求最為接近;其余2個主題情況則各不相同,如“拋體運動與圓周運動”,《考試說明》的比例遠高于2012年卷,卻低于2011年卷;對于“電路”主題,2012年卷的比例均略低于《考試說明》的要求,而2011年卷則完全沒有考到,比例為0.

圖1
試卷與《考試說明》在認知水平上的相似性比內容主題上的相似性要好,如圖2所示.“了解”所占的比重最大,《考試說明》和兩份試卷中“了解”所占的比重均超過了60%,2011年卷和2012年卷在“理解”和“獨立操作”上所占的比重均超過《考試說明》的要求,在“應用”上所占的比重則均低于《考試說明》的要求,但相差都不大.雖然兩份試卷與《考試說明》在認知水平的分布上有所差異,但總體來說分布還是較為一致的.

圖2
《考試說明》對試卷結構的內容比例做了要求,比例規定為物理1占約40%,物理2占約40%,選修1-1(或選修3-1)占約20%,實驗約占15%.根據《考試說明》中的內容要求,我們得到的是物理1約占40%,物理2約占30%,選修約占30%,實驗約占7%.顯然物理2模塊考試的內容要求30%,比考試試卷的結構要求少10%;選修模塊考試的內容要求30%,比考試試卷的結構要求多10%;實驗部分考試的內容要求7%,比考試試卷的結構要求少8%.顯然江蘇省《考試說明》中物理2模塊、選修模塊與實驗部分的試卷的結構要求與《考試說明》的內容要求明顯不一致.我們可以這么認為,江蘇省通過調整試卷的結構要求,加強了對物理1、物理2及實驗的要求.
將《考試說明》對試卷結構的要求與2011年、2012年的學業水平測試卷的內容模塊分布比例進行比較,可以得到表7.
從整體來看,《考試說明》試卷結構要求的模塊內容比例與2011年卷結構比例除實驗外基本吻合,但與2012年卷相差明顯.2012年卷明顯增加了對“物理1”的考試比例,2012年卷“物理1”模塊比例比《考試說明》結構比例增加11%,增加幅度達到27.5%,比2011年卷增加12%,增加幅度達到30.7%.對于“物理2”及“選修”模塊,2012年卷均比《考試說明》結構要求及2011年卷低.對于實驗部分,2011年卷、2012年卷均低于《考試說明》結構要求,只是2012年卷比2011年卷多了3%.總體來說,2012年卷強化了對“物理1”的考察內容,對實驗的考察也比2011年卷增加.2012年卷對“物理2”模塊的內容比例已接近《考試說明》的內容要求,但2012年卷“選修”模塊的內容比例比《考試說明》的內容要求低了14%.

表7 《考試說明》和試卷模塊內容的比率表
根據Porter的研究方法,將內容主題和認知深度的分布制成地形圖,如圖3所示.圖中最左邊是考試說明的內容認知分布,中間的涉及2011年卷,最右邊的涉及2012年卷.根據圖3可見,2011年卷和2012年卷的內容—認知二維曲面圖與內容標準之間有一定的一致性,但也存在較為明顯的差異,結合之前的結論,這種差異主要來自于試卷內容主題的差異及對內容主題的認知要求的比例差異.例如兩份試卷在“運動描述”、“相互作用”、“機械能和能源”、“拋體運動與圓周運動”、“磁場”等5個主題上都與《考試說明》有些不一致,在“機械能和能源”的維度上的認知深度要求高于《考試說明》的要求;兩份試卷在“機械能和能源”的維度上的認知深度要求高于《考試說明》的要求,該情況體現在兩份試卷右上方的黑色區域;又如2011年卷的“電路”部分和2012年卷的“拋體運動與圓周運動”部分出現的“斷層”,是對“了解”深度的比例低于內容標準的規定而造成的.但整體看來一致性水平還較好.2011年卷和2012年卷的一致性指數均為0.73,已經很接近于臨界值0.7328.

圖3
本文的研究結果表明江蘇省《2011年物理學科(必修)測試說明》和2011年、2012年物理學科(必修)學業水平測試卷在主題內容和認知水平上存在一定的一致性.對此,我們作出如下的思考與討論.
江蘇省2011年、2012年試卷與《考試說明》之間的基本一致性,保證了學業水平測試政策的順利實施,上述的P為0.73也驗證了兩年試卷的質量,但兩者之間的一致性依然有提升的空間.實行學業水平測試是為了加強對高中課程的評價和質量監控,《考試說明》的制定為教學指明了方向,對教師和考生都有著十分重要的意義.
江蘇省《考試說明》對試卷的結構難度比例也有相應的要求,易、中、難題的比例要求是7∶2∶1.《考試說明》的內容要求中對認知水平的劃分是逐層遞增的,可以將屬于“了解”層次的題目視為容易題,屬于“理解”層次的題目視為中等難度題,屬于“應用”的題目視為較難題,本文沒有將試卷中的獨立操作部分進行易、中、難的劃分,所得到的易、中、難以及獨立操作題的比例及2011年、2012年試題的比例,見表8所示.

表8 《考試說明》和試卷難度比率表
從實際的考試題來看,獨立操作部分的題目不適宜放到易、中、難題的某一部分,所以試卷結構最好也從了解、理解、應用、獨立操作層次來提出要求.
課程標準是全國統一的標準,而各省的教育教學情況不盡相同,因此,各省在課程標準的指導下根據本省特點制定相應的教學要求和《考試說明》,從本文的研究結果來看,試卷和《考試說明》能達到一致,從而較好的指導了教學,既符合了課程標準的最低要求,又達到了本省的考試要求,實現了一定程度上的因材施教.
《考試說明》與《課程標準》間除了知識點及能力要求的差異之外,最重要的區別表現在《考試說明》是《課程標準》中的內容標準的簡約形式,如新課程理念的三維目標等在《考試說明》中均未能體現.在當今,更多的教師是盯著學生考試分數的提高,《考試說明》的出現可能會引導教師們更多的關注應試的教學,如此反而與新課標背道而馳.筆者建議各省在國家《課程標準》的基礎上制定本省的課程標準,最好能將《考試說明》與本省的課程教學要求統一整合起來.
目前國際上運用較多的認知水平分類標準是修訂后的布盧姆認知目標分類,它包括從低級到高級的6層次認知水平,它們分別是:記憶、理解、應用、分析、評價和創造.而《考試說明》中大都只有2層次認知水平.江蘇省從2011年開始有4層次認知水平,且其層次的劃分也不同于布盧姆對認知目標的分類,因此建議對認知水平的分類要與時俱進,即可以參考布盧姆的分類方法,但也要根據中國各省市的具體情況制定出較合理的認知分類目標.
1 陳嫻,郟璨粲.物理內容標準與考試之間一致性的研究.課程·教材·教法,2010(7):67-71
2 Yuying Guo,Tao Xing,Guiqing Xu,Chaoyang Zheng.Alignment Between Physics Curriculum Standard and Physics Achievement Qualifying Examination of Senior High School in China.2010NARST Annual International Conference.
3 范雙立,劉學智.美國“成功分析模式”的詮釋與啟示——學業評價與課程標準一致性的視角.比較教育研究,2010(8):77-80
4 劉恩山,盧群,張穎之.2010年高考生物試卷與課程標準一致性分析.基礎教育課程,2010(9).