周丐曉 劉恩山
(1 溫州大學生命與環境科學學院 浙江溫州 325035 2 北京師范大學生命科學學院 北京 100875)
學習進階已成為近10 年來國際科學教育研究的重要議題,其研究成果已被納入美國《下一代科學教育標準》(Next Generation Science Standards:For States,By States)。 學習進階是指當兒童在一個時間段內學習某一主題時, 對該主題的一系列復雜思考路徑的描述[1]。 學習進階的研究是建立在科學教育和認知心理學的研究基礎之上,綜合當前兒童學習有關的理論和實證研究, 包括科學概念學習、認知心理學、兒童發展心理學等多個領域的研究成果,以此揭示學生的學習路徑。不同于傳統教學, 學習進階強調圍繞科學領域的核心概念和實踐展開,關注學習的內在連貫性。學習進階為科學教育中的課程開發、 教學設計及學業評價提供了指導性的認知參考模型,將課程、教學和評價統整到一個共同框架模型中, 可幫助教育者更為科學有效地開展科學教育活動。
在科學知識的學習中, 學生不僅要知道學習的總目標,也要知道子目標。教師將這些子目標排成一個序列、 提供一個清晰的理解路徑有利于學習目標的達成。 學生的當前水平與預計的學習目標之前通常存在一定的鴻溝,若鴻溝過大,學生容易放棄學習;若太小,學生會認為自己已經掌握,學習內容沒有挑戰性。 學習序列為學生達成總目標及大概念的學習目標提供路徑和有序的子目標, 這些短期的子目標可縮小學生當前概念水平與最終要求之間的鴻溝[2]。 當教師通過同一課程目標和期望引導學生的學習, 能幫助學生在年級間和學科之間建立連貫有序的學習體驗時, 學生的學習成果較好[3]。
學習進階為這一過程提供了啟示,學習進階可為課程目標的漸進制定、 相應課程資源的開發、教學實踐的循序開展,以及教學評價的有序實施提供依據和指導,是溝通課程、教學和評價的有效橋梁[4],尤其在2007 年的Taking Science to School:Learning and Teaching Science in Grades K-8 中明確提出學習進階研究與課程設計緊密聯系,并指出學習進階是教育研究者、課程設計者、教育決策者及命題人員之間進行有效對話的重要途徑,它為科學教育研究和學校課堂實踐搭建了一座有效的橋梁,聯結并協調課程、教學與評價三者之間的關系,是促進課程連貫性與一致性的有力工具,有助于解決科學教育課程內容零散且缺乏連貫性的問題。
2004 年,Smith 等[5]向 國 家 研 究 委 員 會(National Research Council)提交了一份關于K-12 年級科學測評題目設計的報告, 該報告中提到了學習進階,由此,學習進階開始得到學術界的廣泛關注[6]。 學習進階的研究起源于認知科學對學生如何學習某一特定概念,以及描述這一學習路徑、從初級理解水平到達高級理解水平這一改變的研究。 但當時的研究側重于探測學習者個體概念轉變的軌跡,較為關注個體層面的認知變化,還未將學習進階與課程設計相聯系,因此其在課程層面的巨大價值尚未顯現。 隨后在2007 年,NRC 出版的Taking Science to School:Learning and Teaching Science in Grades K-8 中明確提出學習進階研究與課程設計緊密聯系,指出學習進階是教育研究者、課程設計者、 教育決策者及命題人員之間進行有效對話的重要途徑, 為科學教育研究和學校課堂實踐之間搭建了一座橋梁,可聯結并協調課程、教學與評價三者之間的關系, 是促進課程連貫性與一致性的有力工具, 有助于解決科學教育缺乏連貫性的問題。至此,學習進階引發科學教育者的廣泛關注, 學習進階的研究成為了科學教育的熱點問題,研究成果層出不窮。
鑒于學習進階在科學教育改革中蘊藏的巨大潛力及相關研究的蓬勃發展, 國際科學教育頂級期刊JRST (Journal of Research in Science Teaching) 將2009 年第6 期雜志定為學習進階特輯(Special Issue:Learning Progressions),同年在NRC的資助下美國科學教育者召開了學習進階專題會議(The LeaPS conference),會議就學習進階的內涵、發展評價項目探查學生學習進階的路徑、模擬和解釋學生在學習進階上的表現, 以及學習進階的使用4 個方面進行了深入探討。2012 年,NRC 發布的《K-12 科學教育框架:實踐、跨學科概念、核心概 念》(A Framework for K-12 Science Education:Practices,Crosscutting Concepts,and Core Ideas),以及2013 年正式頒布的 《新一代科學教育標準》,均將學習進階作為課程設計的重要理念之一,利用學習進階可設計聚焦于某一主題K-12 年級的連貫的、遞進的概念理解和技能發展路徑,進而為學生形成深入連貫的理解指明了清晰的方向。 圖1呈現了學習進階相關研究發展時間軸, 并展示了其中較為重要的影響事件。

圖1 學習進階相關研究發展時間軸
學習進階的組成包括進階終點、進階變量、中間水平、學習表現和評價工具5 個要素。學習進階的構建和驗證,是一個反復循環的過程,首先通過對大量文獻資料的梳理和分析之后, 提出一個理論上的假設學習進階, 再透過實證研究進行反復的驗證及修改。 學習進階的構建主要包括學習進階的整體開發流程、學習進階的原始框架開發、學習進階測評工具的開發, 以及學習進階原始框架的驗證提升4 個方面。
3.1 學習進階的整體開發流程 學習進階的開發是一個循環往復的過程,具體過程如圖2 所示。學習進階的開發主要涉及5 個步驟, 首先是根據教育期望(課程標準等)、學科內在邏輯,以及學生的認知規律構建假設的學習進階理論框架,在這個假設的學習進階理論框架中,要有進階起點、進階終點及各中間水平的描述, 將其學習表現外顯化以便后續的工具開發。在第1 步的基礎上,開發相應的測評項目并實施測試, 使用測量模型對實證數據進行擬合分析后, 根據結果對理論框架或者工具進行修改,再進行下一輪的測試,直到實證數據與理論模型擬合度達到較高水平。

圖2 學習進階的開發和修正
3.2 學習進階的原始框架開發 學習進階原始框架的開發需要基于大量的文獻資料、課程標準、實證研究等,對這些資料進行細致的分析后,厘清該主題學習進階涉及的核心概念或能力水平,然后根據已有理論和實證研究確定進階的起點、終點及中間變量后,提出假設的學習進階原始框架。
3.3 學習進階評價工具的開發原理 在提出假設的學習進階原始框架之后, 需要驗證假設的原始框架是否符合實證研究的結果, 這一步需要開發質量較高的評價工具。 Wilson 認為一個好的評價應具有以下4 個特征:具有發展性;能將教學與評價相聯系; 能得到高質量的實證證據及允許適當反饋,便于教學人員使用管理。基于以上4 個基本原理,Wilson 提出了BEAR 評價系統(BEAR assessment system)用于開發評價工具,學習進階的評價工具也可應用BEAR 評價系統[7]。
BEAR 評價系統包括明確心理構造圖、開發測試題目、確定結果空間和分析測量模式4 個相互聯系的環節。這4 個環節分別對應具有發展性;能將教學與評價相聯系; 能得到高質量的實證證據,以及允許適當反饋4 個評價開發基本原理。以下結合學習進階評價工具的設計開發分別介紹BEAR 評價系統的4 個環節。

圖3 BEAR 評 價 系 統[7]
1)明確心理構造圖(construct map)。 明確心理構造圖強調要用發展的視角看待學生學業成績的評估,即隨著時間的發展,能持續評價學生對某一概念或技能在一段時間內的發展情況,關注學生一個時間段內的變化,而不僅僅是一個時間點上的變化。 構造圖可幫助明確學生的學習期望,為了解學生具體如何學習提供理論指導,從而提高評價系統的結構效度,為評價如何整合到教學中,以及學生課堂學習成果的大規模測評提供理論指導。
心理構造圖將為測量的心理構造提供一個明確的內涵界定, 并將這一心理構造劃分為一系列有序的不同水平, 即構造圖定義了學生應該理解什么,以及學生在理解上的進階變化。 因此這一步需要明確測試的心理構造(例如能力、態度、成就、興趣等),即測量目標,定義不同水平的具體內涵,并關注這一心理構造不同水平的外在表現。開發心理構造圖主要來源3 個方面的研究:學生的認知結構,不同層級的期望表現,以及關于學生教學實踐表現的實證研究。 具體來說,可參考課程文件中對學生的期望表現要求、認知方面的研究、學生典型的錯誤概念等勾勒出學生從低水平到高水平的能力(思維等)發展路徑,從而建立心理構造圖。
2)開發測試題目(the items design)。這一步需要設計具體的題目探測學生在某一心理構造上的理解水平。 基于上一步確定的心理構造圖編制相關評價任務, 每一個評價任務和典型的學生作答都與構造圖的某一水平一一對應。 題目的設計可以是封閉式問題,也可以是開放式問題。開發測試題目可聯系教學與評價, 為教師的教學提供反饋信息。
3)確定結果空間(the outcome space)。 結果空間指學生在試題上作答反應的集合, 具體來說,就是學生作答的量規,一套評價標準,通過評分標準即可判別試題的得分。確定結果空間即制定一套評分標準,還可增加一些參考樣例便于評分。 結果空間將心理構造圖與試題相聯系,確定結果空間需要聯系測試的心理構造圖制定具體的評分標準。
4)分析測量模式(Wright maps)。 分析測量模式是指探究學生的作答結果與構造圖中的理解水平之間的關系, 即實證結果與理論假設模型之間的關系。 分析測量模式通常會將原始作答分數轉換為等距量尺以表示測量值,便于后續分析比較。這一環節對應的是提供高質量的實證證據這一測評原理。 高質量的測試對信度、效度、公平性、一致性及是否有偏見等都有一定要求。 為了確保結果之間的可比較性, 需將原始作答轉換成等距量尺,分析學生的作答模式,例如懷特圖可展現學生能力分布、項目難度分布,以及學生能力與項目難度之間的關系。
BEAR 評價系統為學習進階工具的開發提供了理論基礎和實踐指導,通過明確心理構造圖、開發測試題目、 確定結果空間和分析測量模式4 個相互聯系的環節, 研究者可嘗試開發高質量的工具以驗證假設的學習進階。
3.4 學習進階原始框架的驗證提升 目前在學習進階的驗證提升方式上,主要有以下幾種方式:
①試題評價: 通過開發試題分析評價概念的難易程度,由此確定學習進階的等級層次。目前多數研究采用開放性問答題和選擇題作為評價試題形式,開放性問答題耗時較長,不易操作,但能探測更多信息。 選擇題操作簡單,耗時短,結果也易于反饋教學,但研發更為耗時,需要精心設計。 此外,學生的思維方式在不同情境中會有一定差異,缺乏一致性, 當學生的思維能力還處于發展之中的時候,表現通常會受到情境的影響,可能會降低工具的效度。 因此這一方法的關鍵在于開發出信效度較高的工具。
②質性訪談: 通過訪談學生對某一概念的理解過程,梳理厘清學生理解層次的發展過程。
③教學介入:通過比較學生教學前、后思維和理解過程的改變,確定學習進階。 然而當前多數研究采用的是單一組別教學比較學生教學前、后的改變,缺少對照組的實驗,這樣無法獲悉接受教學介入和未接受教學介入的學生改變是否有顯著性差異,由此確定的學習進階信效度有待進一步商榷。
整體來說, 學習進階的驗證主要通過試題評價、質性訪談和教學介入的途徑,多數研究采用的是單一方法研究學習進階,缺乏整合性評價。另一方面,在學生群體的選擇上,一般采用2 種方式:橫向選取不同樣本的評價和縱向追蹤相同樣本的評價。 橫向選取不同樣本的評價選取同一時間段不同年級的學生進行研究; 而縱向追蹤相同樣本的評價選取的是不同時期的同一批學生, 分析比較他們隨著年齡成長在理解水平上的改變, 這種方法相對耗時,周期較長。
當前學習進階的研究主要關注2 個方面:聚焦于科學概念的學習進階研究和聚焦于科學實踐能力的學習進階研究。 目前圍繞學科核心概念以及跨學科概念,已發展的學習進階包括:食物鏈、生物多樣性、遺傳、碳循環、力與運動、物質、能量和天體運動等多個主題的學習進階。此外,在科學實踐領域,也相繼出現了科學建模、科學論證、科學推理等科學實踐能力的相關學習進階研究。 然而,學習進階也面臨著一些問題。學習進階的本質是刻畫學生思維結構變化的階段性發展過程,如何將這一過程外顯化是目前研究的難點問題,工具的開發在解決這一難題中至關重要。
在生命科學領域, 學習進階的研究主要集中在“進化”“食物鏈”“基因和遺傳的分子基礎”“生物多樣性”及“碳循環”等幾個主題。 2004 年,Catley等[8]初 步 開 發 了“進 化”主 題 學 習 進 階;2012 年Lehrer 等[9]根據已有研究成果描述了學習進階的基本原理和結構,并刻畫了K-6 年級學生在進化論概念上的概念發展進階。 在“食物鏈”主題上,Gotwals 和Songer[10]通 過 已 有 研 究 建 立 生 態 學 概念復雜推理能力的學習進階。在“基因和遺傳的分子 基 礎”方 面,2009 年,Duncan 等[11]初 步 提 出5~10 年級學生的遺傳學主題學習進階。 之后,Duncan 等[12]于2011 年 在 其 初 步 提 出 的 學 習 進 階基礎之上通過教學介入, 檢驗學生的遺傳學主題學習進階, 并得出結論中學生具備推理分析3 個遺傳學模塊的能力。 此外,Elmesky[13]基于已有研究、文獻資料等,提出假設的K-12 年級遺傳學學習進階。在“生物多樣性”主題上,Songer 等[14]提出了學生的復雜推理能力學習進階, 并開發8 周的教學實踐活動以收集信息檢驗和修改假設的學習進階,最終確定學生在“生物多樣性”主題復雜推理的學習進階。 Anderson 團隊針對“碳循環”主題的學習進階進行了一系列的研究。 2009 年,Anderson 等[15]借由不同年級學生在開放性試題的答題表現與訪談的回答, 厘清學習進階的各階段內容。 2012 年,通過追蹤分析48 個學生訪談及3 903 份試卷,開發了學習進階的框架[16]。 2013 年,Anderson 等[17]對原有學習進階框架進行了更為精細的描述, 并通過教學介入進一步檢驗了假設的學習進階。
在物質科學領域,學習進階的研究主要集中在“能量”和“力與運動”主題。 Lee 和Liu[18]在知識整合理論指導下,開發和驗證了“能量”主題學習進階,并得出結論:8 年級學生的知識整合水平高于6年級和7 年級,上物理學課的學生知識整合水平明顯高于生物學和地球科學。 2013 年,Neumann 等[19]開發了“能量”主題學習進階,并利用Rasch 模型檢驗了假設的學習進階, 最終得出結論:6 年級學生可以理解能量的形式和能量的來源;8 年級的學生還可以理解能量的轉移和轉化, 但是只有10 年級學生可以理解能量的儲存。 Steedle 等[6]對7~12 年級學生進行了研究,根據課程標準和已有研究開發初步的“力與運動”學習進階,并開發了相應的測評試題,最終構建“力與運動”學習進階。
在化學領域的研究中,學習進階的研究主要集中在“化學的物質概念”“原子結構與相互作用”及“物質的微粒性與分子運動論”主題。 Adadan 等[20]通過多元表征教學的介入,描述和確定11 年級學生在教學介入前、后的PNM(物質的微粒性質)概念路徑,檢驗學生概念理解層次的改變,并探究多元表征教學在提高學生PNM 概念理解方面的作用。 Stevens 等[21]開 發 和 驗 證 了“原 子 結 構 和 電 子運動”主題學習進階。 此外,2005 年,Lesniak 等[22]通過Rasch 模型,確定了“物質”主題的進階序列,解釋學生從小學到高中“物質”概念的進階發展。2006 年,Lesniak 等[23]又對1~10 年級學生“物質”概念的學習進階進行了進一步研究發現: 在不同年級之間未發現顯著的概念跳躍情況, 即不同年級之間存在重疊的概念理解情況。
在地球與宇宙領域的研究中, 學習進階的研究主要集中在“天體運動”主題上。 Rivet 等[24]對164 名8~9 年級學生進行教學前、 后測, 使用Rasch 模型進行分析驗證學習進階。Plummer 等[25]根據已有理論研究、有關教學介入的研究,以及學生的訪談資料,構建學生對天體運動的學習進階。Wilson[7]以天體運動為例,介紹開發學習進階測評項目的原理——BEAR 評量系統。
在科學實踐的學習進階研究方面, 相關研究主要聚焦“科學論證”“科學推理”及“科學建模”能力的學習進階開發。Berland 等[26]開發科學論證的學習進階,了解學生科學論證的過程,以及哪些教學實踐可支持學生的科學論證能力的發展。Schwarz 等[27]提出初步的“科學建模”學習進階,開發6 周的教學活動,通過分析學生在教學前、后分別繪制的模式圖,以及訪談結果最終完成了“科學建 模”學 習 進 階 的 構 建。 Gotwals 等[10]通 過 已 有 研究建立生態學概念復雜推理能力的學習進階,在此基礎上開發20 題的測試工具,并進行教學介入檢驗了“科學推理”能力學習進階。 Songer 等[28]還開發了“科學解釋”能力學習進階,通過教學介入完成了假設學習進階的實證檢驗。
5.1 學習進階提倡“實證研究”的研究范式 學習進階的研究消除理論研究與實踐探索之間的隔閡,將二者相關聯共同尋找更多的“證據”,從而構建信效度良好的學習進階模型。首先,通過理論研究進行解析, 尋找挖掘相關因素之間的潛在聯系和結構,構建初步的學習進階模型。 其次,在理論研究的指引下完成假設進階模型的驗證, 國際上較為認同的方式是采用教學介入等方式驗證進階模型,通過實證研究,收集相關證據和信息,豐富模型并完善理論。學習進階所提倡的“實證研究”范式注重教育研究與實踐的“循證”屬性,可為教育研究和實踐活動的開展提供更多實證支撐。
5.2 關注課程、教學和評價的整合及課程內容在不同學段的銜接 學習進階的出現使得K-12 年級連貫有序的科學學習成為可能, 它聚焦知識或技能在不同年級段之間的進階學習。 這種學習過程強調上下連貫、循序漸進,幫助學生形成一個動態的知識建構過程。 這啟示人們關注科學教育的系統性和發展性,具體包括2 點:關注課程、教學和評價的整合及課程內容在不同學段的銜接。 首先,科學教育需關注課程、教學和評價的整合,通過學習進階促進課程、 教學與評價的一致性。 其次,關注不同學段之間學科內容的銜接。當前我國已開始關注小學和中學之間的學習內容銜接問題,但大學和中學的銜接研究較為匱乏,學習內容的重復或難度跨度較為明顯, 影響了教學的效果和效率。深入挖掘課程內容之間的關聯,通過學習進階實現不同學段學習內容的連貫設計和順暢銜接將有助于解決這一難題。
5.3 以學習進階理念為指導,實現試題的階梯式難度設計 評價是改善教學的重要環節, 基于學習進階的理念和技術實現試題的階梯式難度設計,確定題組內各個試題的水平層次和區分度,更為精準地區分和定位學生的學習水平, 將有助于教學改進和學生學業質量的提高。具體來說,可通過項目反應理論(IRT)和認知診斷理論確定試題的難度和學生作答的水平層次, 以此作為試題評分標準制定的依據, 以便進一步提高試題整體的信效度,從而開發高質量的科學試題。 與此同時,也可通過學生的作答水平確定學生當前的認知狀態和能力水平, 考查學生思維的內在連貫性和進階發展階段, 有方向性地引導學生向期望水平發展。將學習進階理念融入測評工具的開發中,更為科學合理地設置題組內各試題之間的難度閾值,提高試題的區分度和效度, 可促進高質量測評工具的開發。