基于Rasch模型的語文學科能力評價研究

2014-04-29 00:00:00關惠文

現代企業教育·下半月 2014年10期

摘要：在學科教學中，發展學生的學科能力是一項重要的目標，因此，有必要開發測試工具檢測學生的學科能力。本研究結合心理學理論和語文學科特色，對語文學科能力進行了基于學習理解、實踐應用和創造遷移三個能力層級的劃分和描述，以北京市10所中學1679個樣本進行測試，基于Rasch模型，著重探討根據學生能力表現對測試工具進行檢測與評估。

關鍵詞：Rasch模型語文學科能力測試工具評估

中學生學科能力表現及其標準的研究，一直是我國課程教學改革研究的薄弱問題，到底什么樣的測試工具能夠檢測出學生的學科能力是一直被探討的問題。知網中收錄的這一領域的學術論文共12篇，我國關于這一問題最早的討論開始于2008年，2008年3月上海師范大學張明選教授借鑒美國的《學科能力表現說明》來觀照我國的學科課程標準建設。

關于rasch模型方面的學術論文共有158篇，其中涉及到運用rasch模型進行語文測量方面的學術論文共有五篇，其中有四篇是運用rasch模型在作文測量中的應用，有1篇是運用rasch模型在閱讀方面的應用。對于運用rasch模型進行語文學科能力測試方面的研究暫時空白。

《國家中長期教育改革和發展規劃綱要（2010- 2020年）》提出了“堅持能力為重”的指導思想。在學科教學中，發展學生的學科能力是一項重要的目標，因此，有必要開發測試工具檢測學生的學科能力。

語文學科能力是基于語文核心知識認識語文研究對象的能力以及基于核心知識分析和解決語文問題的能力。學科能力測試？2？主要采用中學生樣本。根據語文學科本體的研究對象和中學語文課程內容編排，將語文核心知識分為三個內容領域：文化底蘊、閱讀方法和表達策略。對于每個內容領域的學科能力，以學習理解（A）、實踐應用（B）、創造遷移（C）作為三個水平層級，每個層級進一步拆分為4-5個子維度，分別是：A1觀察注意、A2 記憶、A3 信息提取、A4 分析概括、A5領會理解；B1應用交際、B2解釋推斷、B3 解決問題、B4策略形成；C1發散創新、C2批判賞析、C3內化完善。除此之外，每一能力層級下還有具體的能力描述，在此就不一一說明了。

本次語文學科能力測試一共有18個試題（文化底蘊4題，閱讀方法11題，寫作策略3題）。

樣本

本次測試的學生來自北京市10所中學，三個年級，四類學校，共收回1679份有效試卷。

分析

本研究采用Winsteps（Linacre，2003）和ConQuest（Wu， Adam Wilson，2007）軟件分別進行單維及多維的基于Rasch模型的數據分析。

Rasch模型簡介

Rasch 模型是丹麥數學家Georg Rasch（1960）提出的測驗分析方法模型，是能同時估計項目難度和個體能力的一種概率模型，目的是分析測試分數之間的差異。Rasch 有四個最基本的假設：a 每個個體有其特定的能力；b 每個項目有一個難度；c 每個項目的難度可以呈現在同一標度上；d 可以計算任何特定觀察分數反應概率數目之間的差異？？？。

測試工具評估分析

一、試題的信度和匹配度

（1）信度

信度（RELIABILITY）主要是指測量結果的可靠性、一致性和穩定性，即測驗結果是否反映了被測者的穩定的、一貫性的真實特征。利用Winsteps軟件單維rasch模型檢驗測試工具總體信度。利用ConQues軟件多維Rasch模型模型試題信度。

第一種按學習理解能力-應用實踐能力-遷移創新能力劃分為3個維度，第二種按文化底蘊-閱讀方法-表達策略劃分為3個維度。試題的總體信度為1.00，能力多維中，A、B、C三大能力試題信度分別是0.605、0.824和0.563；文化底蘊、閱讀方法、表達策略三大內容主題試題信度分別是0.795、0.843和0.87。總體符合測量學0.75-1.35的標準。

（2）試題與模型匹配度（MNSQ）

利用單維Rasch模型所得各題MNSQ（WEIGHTED FIT）值95%的試題指標值在0.7-1.3之間，符合要求。

所有試題經過單維Rasch模型和多維Rasch模型檢驗。經單維Rasch模型檢驗，98.4%的試題MNSQ值在0.7-1.3之間；經多維Rasch模型檢驗，學習理解-應用實踐-遷移創新多維檢驗94%的試題MNSQ值在0.7-1.3之間，各知識主題多維檢驗100%的試題MNSQ值在0.7-1.3之間，基本符合要求。

（3）試題難度和學生能力分布（distribution）

關于各維度的學生能力（圖2），維度1（文化底蘊）的學生能力平均值為-0.743；維度2（閱讀方法）的學生能力平均值為-0.818；維度3（表達策略）的學生能力平均值為-0.48。三者比較來看，學生在表達策略上的表現好于其他兩大內容主題，學生在閱讀方法中的表現相對較弱。

根據單維懷特圖結果可知，試題和學生能力的分布形態，都近似于正態分布。同時，學生的能力分布長度稍微短于試題難度分布長度，可以看出試題的難度稍微高于學生的能力水平，究其原因，首先因為本次測試的試題形式較新穎，如對優秀詩文的考查主要選擇理解性默寫，取代過去的給上句寫下句，更加看重中學生的積累程度；其次，平日的考試注重對學生知識的考查，本次以能力作為主要的考查對象，教師和學生都需要不斷地適應這種未來評價的趨勢。

再看各維度題目難度和學生能力分布，根據結果顯示，閱讀方法（維度2）中個別題目的難度較大，在本次測試中并沒有與這些題目難度相當能力的學生，三個維度的題目難度都具有一定的跨度，在中部區域分布最多，其中文化底蘊的題目跨度最大，具有難度最高的題目和難度最低的題目。文化底蘊包括優秀詩文和經典名著，正所謂“厚積而薄發，博觀而約取”，豐厚的文化底蘊需要長久的積累，大量的閱讀中外優秀經典，尤其是背誦中華優秀經典，對于一個孩子的成長有著不可替代的作用。

參考文獻：

[1]Trevor G. Bond， ChristineM. Fox. Applying the Rasch Model： Fundamental Measurement in the Human Sciences[M]. LawrenceErlbaum Associates， 2007. 26.

課題信息：本研究對語文學科能力的界定和測試來源于北京師范大學王磊教授帶領北師大學科課程與教學論研究團隊申請獲批的國家社會科學基金“十二五”規劃2011年度教育學重點課題“中小學生學科能力表現研究”（課題批準號：AHA110005）

現代企業教育·下半月2014年10期

現代企業教育·下半月的其它文章: 五年制高職護生“職業淑女”素質教育的實踐; 《平行四邊形的面積》教學案例; 淺析情境仿真模擬教學法在大學財務管理課程中具體應用; 基于創業導向的高職生就業能力培養的探討; 獨立學院輔導員隊伍建設研究; 高職院校《國貿實務》雙語教學改革探討