伍亞婷 解凱彬*
摘 要 本研究是在江蘇省實施新課程改革6年的背景下,針對目前實行的生物學業水平測試與生物新課程標準的一致性關系,采用美國學者波特(Porter)于2002年提出的二維矩陣法,對江蘇省2007~2013年的生物學業水平測試試卷從內容主題與認知層次兩個維度進行了數據統計和量化分析。結果顯示六份試卷中有四份與新課標之間存在統計學意義上顯著的一致性,另外兩份試卷雖然一致性系數沒有達到課標規定的標準,但其一致性也比較高。同時也從一致性、內容主題、認知水平這三方面出發,對當前的江蘇省學業水平測試這個評價體系所值得肯定和仍需要改進的地方進行了思考和反思。
關鍵詞 學業水平測試 一致性 內容主題 認知水平
中圖分類號 G633.91 文獻標識碼 B
1 研究過程
1.1 內容與認知水平的分類
首先是采用波特(2002)的通用編碼框架——“內容×認知”水平矩陣來對高中生物課程標準和生物學科學業水平測試卷進行編碼。編碼之前,筆者首先對內容和認知水平進行分類。對內容的分類是采用美國各州首席教育官員委員會(CCSSO,2004)發展起來的課程調查規范(ESC)中關于生物學科內容的分類標準,但是由于學業水平測試只涉及必修的內容,而“科學與技術”這一內容包含在選修模塊,所以本研究在內容上分為9類,分別為:
① 生命系統的組成;② 生物化學;③ 植物學;④ 動物學;⑤ 人體生物學;⑥ 遺傳學;⑦ 進化;⑧ 生殖與發育;⑨ 生態學。
認知水平的分類依據布盧姆教育目標分類學修訂版,將認知分為記憶、理解、應用、分析、評價和創造六級水平。
1.2 內容與認知水平的編碼
根據以上分類將高中課程標準、2007~2013年的生物學業水平測試卷進行內容和認知水平通過9×6(對應9個內容分類和6個認知水平分類)的矩陣表格對應內容和認知水平按照考點分數比例標準化之后進行編碼。關于課程標準的編碼(具體編碼結果參照劉恩山等人的成果)最終編碼數據見表1。
本過程為了確保精確性和科學性,由1位生物學教育副教授、16位生物學科教學專業碩士研究生和3位本科生。編碼者對7份試卷獨立進行編碼后對存在的分歧點一一討論,得到最終的編碼數據見表2(其余年份的編碼過程與此類似,比例不同,結果在圖1、2中呈現)。
1.3 求解具有統計顯著性的P值
筆者采用了美國學者Gavin的思路,利用matlab軟件里的unidmd函數,將69個具體內容標準隨機賦值到一個9行6列的矩陣中,將試卷總分100分隨機賦值到另一個矩陣中,對兩個矩陣標準化處理后計算出一個P值,將這樣的過程重復20 000次,就可以得到關于P的正態分布(表3)。
江蘇省生物學業水平測試卷面總分為100分,在這個正態分布曲線中,要達到0.05水平的統計顯著性,則需要P≥0.6408。
1.4 計算波特一致性系數
本研究采用美國學者波特于2002年提出的二維矩陣法,即從內容匹配和認知程度匹配兩個維度來檢驗內容標準和測驗項目之間的一致性。
為了研究高中生物課程標準和生物學業水平測試試卷之間的一致性,將課程標準和考試題用相同的方法分別編碼到一個內容×認知的二維矩陣中,任意兩者之間的一致性就是以兩個矩形表格中的單元格賦值為依據進行計算。為使表格兩兩之間具有可比性,單元格賦值在統計結果的基礎上需要被標準化處理,即被轉換成總和是1的比值。運用波特一致性系數定量計算內容標準和測試題的一致性程度。
運用如下公式分別求得每份試卷與課程標準的波特一致性系數,此時n=54。
其中,n表示矩陣中的單元格數目,i表示其中一個特定的單元,其數值從1取到n。波特系數P的數值介于0和1之間,當P=0時表示兩者間的差異性最大,當P=1時表示比較的兩組數間具有完美的一致性。
2 研究結果與數據分析
2.1 一致性比較
由表4可以看出,將2007~2013年的江蘇省生物學業水平測試試卷和課程標準的一致性系數與95%水平的P值參考值作比較,發現除了2007年和2010年的P值略低于參考值P值外,其余五年的P值都大于參考值。
2.2 7年學測試卷內容主題與課程標準分布的比較
在內容主題維度上對生物課程標準和江蘇省六份生物學業水平測試卷進行的比較如圖1所示。從圖中可以看出,高中生物課程標準在“生命系統組成”、“遺傳學”、“生態學”與“生物化學”主題上著墨較多。而這幾個主題在六份學測試卷中的表現分析如下:對于“生命系統組成”這一主題,江蘇省2011年生物學業水平測試卷與高中生物課程標準差距是最小的,其余5年的試卷則在這一內容上明顯低于課標的要求;對于“遺傳學”這一主題,從圖中可以看出,2007年和2012年的江蘇學測試卷中這一內容的比重都明顯高于課標的要求;而在“生態學”這一內容主題上,除了2008年的內容比重略低于課標要求外,其他五年的試卷內容分布基本上都大于課程標準的要求;最后 “生物化學”部分尤以2009年最突出,遠遠超過了課程標準的要求,2012年的試卷與課標基本持平,其余四年的江蘇省生物學測試卷都不同程度高于課標要求;同時從圖中還可以看出對于其他五個內容主題,有的高于課標,有的卻低于課標要求,沒有什么規律可循。
2.3 7年學測試卷認知水平與課程標準分布的比較
在認知水平維度上對生物課程標準和兩份試卷進行的比較如圖2所示。從圖2中可以發現無論是7年的江蘇省生物學測試卷,還是生物課程標準90%以上都是以理解和記憶水平為主。但值得注意的是,對于記憶這一認知要求,7年的試卷一律都高于課程標準的要求,但對于理解這一認知水平,7年的試卷竟然無一例外都沒有達到課標的要求。對于其他四個認知水平,無論是課標還是7年的試卷考查的都相對較少,其中2008年的學測試卷對運用水平的分析遠遠高于課標,分析水平的考查在2007、2008、2010、2011、2012年的試卷中均有體現,至于評價和創造,有些年份的試卷也有一定程度的涉及,并且都高于課標的要求。
3 結論與思考
3.1 一致性系數
從表4可以看出,除了2007年和2010年的學測試卷與95%水平的參照值0.6408稍有偏差之外,其余5年的江蘇生物學測試卷都與課程標準有統計學意義上顯著的一致性。這是江蘇省積極響應新課改實施以來基礎教育考試改革的一個很好的證明。眾所周知,學業水平測試是基于國家課程標準的“標準參照考試”,課程標準是由教育部直接制定的,而學業水平測試則是由各個省市依據國家課程標準獨立執行,因此對于學業水平測試各個環節性質的不同理解都可能導致最后的命題結果與課程標準出現一定的偏頗,所以說,江蘇省的學業水平測試從量化的一致性系數這個分析層面上來說,做得還是比較成功的,達到了國家課程標準的要求,沒有違背國家開展基礎教育考試的初衷。
本篇論文是采用量化的方式分析7年的學測試題與課程標準之間在內容主題和認知水平上的一致性程度,雖然最后的結果比較理想,一份試卷在確定給學生使用之前,就應該先去分析它的一致性,這樣才能及時發現問題,調整命題方向。因此這一環節應該被推廣到試題的命制上,引起廣大命題專家的重視,這樣對江蘇省學業水平測試的功能定向、考試建模、命題機制的專業化都是有益的。
3.2 內容主題
對于九大內容主題,其中有六項內容(生命系統組成、植物學、人體生物學、生態學、遺傳學、生物化學)在7年的試題中的比重都不同程度超過了課標的要求,至于其他三項內容,雖然有些年份的試卷沒有達到課標的要求,可是并沒有出現很大的差距,也就是說江蘇省學業水平測試的命題在內容上與課標的要求具有顯著的一致性。這種一致性對于江蘇生物新課程的實施會產生積極的影響。因為試卷內容主題的分布合理與否,會直接影響到廣大一線教師在課堂上如何選擇教學內容,如何合理分配不同生物教學內容在課堂上的比重。
雖然整體上可以看出九大內容主題分布的趨勢和課標基本保持一致,可是具體到每一份試卷來說,無論是同一內容在不同年份試卷的比例還是同一份試卷對于九大內容主題比重的安排上都有很強的隨機性,根本毫無規律可循。如“生物化學”這一內容,課標的要求是10%,可是從2007年~2013年的學測試卷對內容的把握卻大相徑庭,雖然都達到了要求,可是有的年份持平,有的超過課標10%,有的甚至是課標要求的兩倍還多,如此高的內容比重,難免會影響學業水平測試中對其他知識點的把握和考查,這些都暴露出當前江蘇省學業水平測試在對考試性質定位、命題機制的完善、評價體系的理解等等上都是需要進一步反思和改進的。
3.3 認知水平
從圖表可以看出7年的試卷和課標都將考查的認知重點放在了記憶和理解這兩個水平上,但是具體到每一份試卷上也是有很多問題:7年的試卷在記憶水平上都超過課標的要求,而在理解水平上卻無一例外都低于其考查標準;同時在對較高的認知水平的考查上,多份試卷的比重都超過課標要求;不同內容考查的認知水平和課標有出入,如課標對“生物化學”的考察主要體現在理解水平上,可是從7年的試卷中可以看到,大部分都是有關生化記憶性知識的測試……以上諸多問題都反映出當前江蘇省學業水平測試這個評價體系存在的種種缺陷,這些問題的出現都是對推行新課標不利的,一味地降低或者提高試題的難度都是與國家推行新課標的初衷是相違背的,因此無論是從宏觀上的國家考試制度的規范和立法、地方考試組織管理、評價體系的改善,還是具體到各級考試管理機構、命題機構、教育單位對于新課程改革的理解、對于基礎教育的重視程度、對課標的解讀都是需要進一步完善的。
總之,以上只是基于對江蘇省2007年~2013年的學測試卷的量化分析得到的一些啟示和思考,實際上一套完善、成功的評價體系是否能夠順利建立受到很多方面因素的制約和影響的,只有全社會認識到學業水平測試對我國的基礎教育和高等教育的重要性,才能最終真正讓學業水平測試發揮它的高效功用和潛力、才能讓基礎教育真正發揮它督促學校認真執行課程方案和課程標準,規范高中教育教學行為,提高學校教育教學質量以及促進中學生全面發展的重要作用。
參考文獻:
[1] CCSSO,Surveys of Enacted Curriculum,2004. http://www.ccsso.org/projects/Surveys_of_Enacted_Curriculum/.
[2] 劉恩山.盧群.張穎之,2010年高考生物試卷與課程標準一致性分析[J].基礎教育課程,2010:61-67.
[3] Qun Lu & Enshan Liu (2012): Alignment between High School Biology Curriculum Standard and the standardised tests of four provinces in China, Journal of Biological Education, DOI:10.1080/00219266.2011.645855.
[4] X.F.liu,B.H.Zhang,L.L.Ling,Gavin Fulmer,Beaumie Kim,H.Q.Yuan.Allgnment Between the Physics Content Standard and the Standardized Test: A Comparison Among the United States-New York State,Singapore,and China-Jiangsu. Science Education .2008, 93(5):777-797.
[5] Porter,A,C,Measuring the content of instruction: Uses in research and practice. Educational Researcher, 2002.31(7):3-1.