999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

雙語(yǔ)教育背景下的少數(shù)民族學(xué)生數(shù)學(xué)學(xué)業(yè)測(cè)驗(yàn)公平性分析

2019-11-16 02:29:44
關(guān)鍵詞:語(yǔ)言數(shù)學(xué)學(xué)生

(1.北京師范大學(xué) 中國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心,北京 100875;2.教育部民族教育發(fā)展中心,北京 100082)

2018年兩會(huì)政府工作報(bào)告提出:發(fā)展公平而有質(zhì)量的教育.教育公平已成為社會(huì)普遍關(guān)注的問題.測(cè)試公平是教育公平的重要體現(xiàn).所謂測(cè)驗(yàn)公平指的是一個(gè)測(cè)驗(yàn)對(duì)于來(lái)自不同群體并具有相同目標(biāo)能力或熟練程度的個(gè)體所測(cè)得的特性相同[1].如果一個(gè)測(cè)驗(yàn)對(duì)于同一目標(biāo)能力水平下的兩個(gè)學(xué)生群體,作答正確率存在不一致的現(xiàn)象,即測(cè)驗(yàn)對(duì)某個(gè)群體學(xué)生有利而對(duì)其他學(xué)生不利,那么這個(gè)測(cè)驗(yàn)是缺乏公平性的[2].通過這個(gè)測(cè)驗(yàn)測(cè)量出的學(xué)生群體之間的差異,便不能判定就是目標(biāo)能力的差異,對(duì)此數(shù)據(jù)進(jìn)行的后續(xù)分析都將毫無(wú)意義.所以,確保測(cè)試的公平性成為測(cè)驗(yàn)開發(fā)者及社會(huì)普遍關(guān)注的問題.

新疆雙語(yǔ)教育質(zhì)量監(jiān)測(cè)工作旨在考察雙語(yǔ)教育的推進(jìn)效果及影響因素,為雙語(yǔ)教育的提高和改進(jìn)提供對(duì)策建議.監(jiān)測(cè)結(jié)果報(bào)告會(huì)對(duì)不同學(xué)生群體進(jìn)行差異比較,而測(cè)驗(yàn)公平是群體差異比較的前提.測(cè)驗(yàn)是否公平可以通過項(xiàng)目功能差異(Differential Item Functioning,簡(jiǎn)稱DIF)進(jìn)行檢驗(yàn).通過DIF檢驗(yàn),可以檢測(cè)出測(cè)驗(yàn)中可能對(duì)受測(cè)者的測(cè)驗(yàn)表現(xiàn)產(chǎn)生偏差的題目,進(jìn)而通過修改或刪除相應(yīng)題目提高測(cè)驗(yàn)在不同受測(cè)者群體間的公平性和準(zhǔn)確性.研究從DIF角度出發(fā),對(duì)數(shù)學(xué)監(jiān)測(cè)工具的項(xiàng)目是否存在偏差進(jìn)行實(shí)證研究.

1 新疆雙語(yǔ)教育質(zhì)量監(jiān)測(cè)

新疆雙語(yǔ)教育質(zhì)量監(jiān)測(cè)工作在2011年正式啟動(dòng),由教育部主辦,新疆教育廳協(xié)辦,通過對(duì)新疆地區(qū)義務(wù)教育階段少數(shù)民族學(xué)生雙語(yǔ)教育質(zhì)量的監(jiān)測(cè),全面、科學(xué)、準(zhǔn)確地反應(yīng)雙語(yǔ)教育的推進(jìn)效果,揭示雙語(yǔ)教育推進(jìn)中存在的問題和不足,為下一步雙語(yǔ)教育教學(xué)改進(jìn)提供數(shù)據(jù)支撐.

雙語(yǔ)教育的成果可以通過學(xué)生的學(xué)業(yè)水平來(lái)體現(xiàn),學(xué)業(yè)成績(jī)主要包括學(xué)生的漢語(yǔ)(文)、數(shù)學(xué)、民族語(yǔ)文等學(xué)科成績(jī).2017年,小學(xué)階段監(jiān)測(cè)已開展的學(xué)科為漢語(yǔ)和數(shù)學(xué),民族語(yǔ)文測(cè)試正在工具研發(fā)階段.同時(shí),還通過學(xué)生、雙語(yǔ)教師和學(xué)校校長(zhǎng)調(diào)查問卷,考察了雙語(yǔ)教育影響因素.監(jiān)測(cè)采取分層抽樣,整班抽取的原則,每年抽取的樣本量在全疆學(xué)生的10%左右,范圍已經(jīng)覆蓋到全疆15個(gè)地州的94個(gè)縣市.針對(duì)南疆雙語(yǔ)教育實(shí)際情況,2016年除了對(duì)全疆6年級(jí)學(xué)生進(jìn)行測(cè)試外,還增加了南疆小學(xué)四年級(jí)學(xué)生連續(xù)3年的追蹤監(jiān)測(cè).這7年的新疆雙語(yǔ)教育質(zhì)量監(jiān)測(cè)工作,客觀記錄和呈現(xiàn)了新疆少數(shù)民族雙語(yǔ)教育成效,準(zhǔn)確分析了相關(guān)影響因素,科學(xué)提出了對(duì)策建議,其研究成果已被有關(guān)部門采納,成為后續(xù)研究的基礎(chǔ)和依據(jù).

2017年監(jiān)測(cè)時(shí),新疆義務(wù)教育階段雙語(yǔ)教育模式分為模式1和模式2兩種.模式1采用小學(xué)漢語(yǔ)、數(shù)學(xué)、科學(xué)和信息技術(shù),初中漢語(yǔ)、外語(yǔ)、數(shù)學(xué)、物理、化學(xué)、生物和信息技術(shù)使用國(guó)家通用語(yǔ)言文字授課,其它課程使用本民族語(yǔ)言文字授課的教學(xué)模式.模式2采用全部課程使用國(guó)家通用語(yǔ)言文字授課,開設(shè)民族語(yǔ)文課程的教學(xué)模式.因?yàn)槟J?和模式2的數(shù)學(xué)課均使用國(guó)家通用語(yǔ)言文字授課[3],普通班的數(shù)學(xué)課使用民族語(yǔ)言文字授課,所以在考察普通班學(xué)生數(shù)學(xué)水平時(shí),數(shù)學(xué)試卷為民族語(yǔ)試卷.即數(shù)學(xué)試卷分為漢語(yǔ)試卷(雙語(yǔ)班用)和民族語(yǔ)試卷(普通班用)兩種,這為研究第二語(yǔ)言數(shù)學(xué)測(cè)驗(yàn)的公平性提供了難得的機(jī)會(huì).

2 項(xiàng)目功能差異

項(xiàng)目功能差異(DIF)是指將測(cè)試群體按目標(biāo)能力水平進(jìn)行匹配后,不同測(cè)試群體在測(cè)驗(yàn)表現(xiàn)上的差異性[4].DIF檢驗(yàn)是確保測(cè)驗(yàn)公平的統(tǒng)計(jì)技術(shù)手段.如果一個(gè)項(xiàng)目在不同群體中以相同的方式衡量相同的能力,具有不同特征的團(tuán)體,如不同性別、民族、學(xué)科背景或認(rèn)知風(fēng)格等,都應(yīng)該具有相同的通過率.如果在同一能力水平上的兩個(gè)或兩個(gè)以上團(tuán)體,作對(duì)該題目的概率的差異是由目標(biāo)能力無(wú)關(guān)的因素引起的,這個(gè)項(xiàng)目就存在DIF[5].DIF有兩種形式,一致性DIF(Uniform DIF)和非一致性DIF(Un-uniform DIF).一致性DIF是指在能力水平匹配的情況下,一組的某項(xiàng)目得分一直顯著高于另一組;非一致性DIF是指在能力水平匹配的情況下,一組的某項(xiàng)目得分僅僅在部分能力范圍內(nèi)顯著高于另一組[6].

根據(jù)Messick[7]的觀點(diǎn),對(duì)測(cè)試分?jǐn)?shù)解釋的有效性受到構(gòu)念無(wú)關(guān)因素或構(gòu)念測(cè)量不充分的影響.Haladyna和Downing[8]認(rèn)為與結(jié)構(gòu)無(wú)關(guān)的方差會(huì)導(dǎo)致測(cè)量數(shù)據(jù)的系統(tǒng)誤差增大,使得測(cè)驗(yàn)無(wú)法準(zhǔn)確評(píng)估考生的真實(shí)水平.第二語(yǔ)言測(cè)驗(yàn)中,語(yǔ)言因素可以被視為與構(gòu)念無(wú)關(guān)的潛在來(lái)源之一,作為載體的題目語(yǔ)言成為測(cè)驗(yàn)偏差的可能來(lái)源之一.特別是對(duì)于那些用非母語(yǔ)進(jìn)行做答的學(xué)生,閱讀和作答的熟練程度很可能會(huì)干擾他們的表現(xiàn).已有研究表明,語(yǔ)言復(fù)雜性可能會(huì)阻礙第二語(yǔ)言學(xué)習(xí)者對(duì)這些項(xiàng)目的理解[9].Shaftel等人[10]在他們關(guān)于語(yǔ)言特征對(duì)數(shù)學(xué)測(cè)試項(xiàng)目的影響的研究中發(fā)現(xiàn),與母語(yǔ)言相比,在考試項(xiàng)目中消除語(yǔ)言復(fù)雜性能夠適度提高英語(yǔ)學(xué)習(xí)者的分?jǐn)?shù).因此,有理由認(rèn)為語(yǔ)言復(fù)雜性可能導(dǎo)致項(xiàng)目偏差.

國(guó)外學(xué)者對(duì)英語(yǔ)為非母語(yǔ)的英語(yǔ)學(xué)習(xí)者(English language learner,ELL)與美國(guó)本土的學(xué)生(native students)的數(shù)學(xué)測(cè)驗(yàn)成績(jī)進(jìn)行研究發(fā)現(xiàn),一些題目存在DIF,且對(duì)ELL不利.如Martiniello[11]對(duì)2003年春季馬薩諸塞州綜合評(píng)估系統(tǒng)(Massachusetts Comprehensive Assessment System,MCAS)四年級(jí)數(shù)學(xué)測(cè)驗(yàn)進(jìn)行DIF檢驗(yàn),發(fā)現(xiàn)題目的語(yǔ)言特征是產(chǎn)生DIF的原因,且不利于ELL的學(xué)業(yè)表現(xiàn).Wolf和Leon[12]也發(fā)現(xiàn)語(yǔ)言復(fù)雜性是解釋DIF的一個(gè)關(guān)鍵變量.學(xué)術(shù)詞匯是表征語(yǔ)言復(fù)雜性的突出特征.Eid[13]調(diào)查了在SAT的數(shù)學(xué)測(cè)驗(yàn)中ELL和非ELL學(xué)生之間可能產(chǎn)生DIF的題目特征,研究發(fā)現(xiàn)低可讀性題目的平均分較高,高可讀性項(xiàng)目有利于ELL組,而低可讀性項(xiàng)目?jī)A向于非ELL組.但也有研究發(fā)現(xiàn)語(yǔ)言并不能導(dǎo)致數(shù)學(xué)測(cè)驗(yàn)的DIF.如Ockey[14]發(fā)現(xiàn)ELL和非ELL在數(shù)學(xué)文字題的成績(jī)上,存在統(tǒng)計(jì)學(xué)上的顯著差異(t=9.05,P<0.001).然而,主成分分析不支持語(yǔ)言能力等第二潛在能力的存在.Snetzler和Qualls[15]使用MH方法對(duì)愛荷華州基本技能測(cè)試(Iowa Tests of Basic Skills,ITBS)進(jìn)行了兩年的ELL和非ELL之間的DIF追蹤檢驗(yàn),結(jié)果發(fā)現(xiàn),四年級(jí)學(xué)生隨著年齡增長(zhǎng),DIF效應(yīng)值增加,但是六年級(jí)卻沒有這個(gè)現(xiàn)象,作者認(rèn)為這種不一致現(xiàn)象是由于題目過難而非語(yǔ)言因素造成的.MilleR[16]調(diào)查了語(yǔ)言負(fù)荷最大的數(shù)學(xué)題目是否對(duì)非ELL考生更有利.他檢驗(yàn)了美國(guó)大學(xué)測(cè)試項(xiàng)目評(píng)估(American College Testing Program Assessment,ACT)的6個(gè)內(nèi)容領(lǐng)域中的40個(gè)測(cè)量數(shù)學(xué)推理能力的題目.研究結(jié)果并不支持高詞頻題目有利于非ELL的假設(shè).

國(guó)內(nèi)研究者對(duì)于第二語(yǔ)言的測(cè)驗(yàn)偏差研究主要集中在英語(yǔ)測(cè)驗(yàn)和對(duì)外漢語(yǔ)測(cè)驗(yàn)領(lǐng)域,如對(duì)漢語(yǔ)水平考試(HSK)測(cè)驗(yàn)進(jìn)行語(yǔ)言測(cè)試公平分析[6,17-18],對(duì)英語(yǔ)測(cè)驗(yàn)進(jìn)行DIF分析[2]等.這些研究有的對(duì)不同的DIF檢驗(yàn)方法進(jìn)行了比較,有的發(fā)現(xiàn)了可能導(dǎo)致DIF的因素,如測(cè)試者的專業(yè)背景、性別、種族等.雖然中國(guó)學(xué)者對(duì)測(cè)驗(yàn)公平進(jìn)行了一系列嘗試性研究,但是主要集中在第二語(yǔ)言測(cè)驗(yàn)本身,尚無(wú)對(duì)將第二語(yǔ)言作為學(xué)科測(cè)試語(yǔ)言的測(cè)驗(yàn)進(jìn)行公平性研究的先例.其次,以往檢測(cè)DIF的過程較為簡(jiǎn)略,標(biāo)準(zhǔn)并不明晰.再次,以往研究對(duì)測(cè)驗(yàn)出現(xiàn)偏差的原因及改進(jìn)建議討論較少,對(duì)命題及測(cè)驗(yàn)編制指導(dǎo)性不強(qiáng).

3 研究?jī)?nèi)容及意義

目前中國(guó)第二語(yǔ)言測(cè)驗(yàn)公平研究主要集中在對(duì)學(xué)生掌握該種語(yǔ)言能力的程度進(jìn)行測(cè)量的考試中,如英語(yǔ)四級(jí)考試、對(duì)外漢語(yǔ)考試等,但在一線教育教學(xué)中,還存在用第二語(yǔ)言呈現(xiàn)并作答其它學(xué)科考試(如數(shù)學(xué)測(cè)試)的情況,如每年都會(huì)有部分少數(shù)民族學(xué)生參加普通高等學(xué)校招生全國(guó)統(tǒng)一考試,因此考察第二語(yǔ)言對(duì)測(cè)驗(yàn)公平性的影響非常必要.

在綜合以往研究及現(xiàn)實(shí)需要的基礎(chǔ)上,研究擬通過比較以民族語(yǔ)(維吾爾語(yǔ),以下簡(jiǎn)稱維語(yǔ))進(jìn)行測(cè)試的學(xué)生與使用第二語(yǔ)言(漢語(yǔ))進(jìn)行測(cè)試的學(xué)生的數(shù)學(xué)測(cè)驗(yàn)表現(xiàn),考察測(cè)驗(yàn)是否有偏;若存在偏差,在模型中納入學(xué)生漢語(yǔ)測(cè)驗(yàn)分?jǐn)?shù),考察學(xué)生的哪部分漢語(yǔ)能力是造成測(cè)驗(yàn)偏差的來(lái)源,同時(shí)結(jié)合相關(guān)題目具體分析導(dǎo)致測(cè)驗(yàn)偏差的原因.

研究是對(duì)少數(shù)民族數(shù)學(xué)學(xué)業(yè)測(cè)驗(yàn)是否存在題目偏差的首次探討,豐富和擴(kuò)展了測(cè)驗(yàn)公平領(lǐng)域的研究,為今后相關(guān)研究提供了理論參考.此外,結(jié)合國(guó)內(nèi)外文獻(xiàn)梳理了邏輯斯諦回歸方法(Logistic Regression,LR)檢驗(yàn)DIF的步驟,明晰了效果量的判斷標(biāo)準(zhǔn),為今后測(cè)驗(yàn)偏差檢驗(yàn)提供方法參考.最后,研究結(jié)果為測(cè)驗(yàn)編制中如何提高民族地區(qū)數(shù)學(xué)測(cè)驗(yàn)公平提供了可借鑒的工作思路.

4 研究方法

4.1 樣本情況

研究使用2017年南疆五年級(jí)學(xué)生的監(jiān)測(cè)數(shù)據(jù).2017年五年級(jí)監(jiān)測(cè)工作在兼顧抽樣學(xué)校的城鄉(xiāng)比重的基礎(chǔ)上,按照各縣市雙語(yǔ)班和普通班各自數(shù)量的12%比例分層抽樣.抽樣覆蓋到南疆4個(gè)地州、32個(gè)縣共9?176名學(xué)生.由于五年級(jí)數(shù)學(xué)監(jiān)測(cè)僅有1?917名學(xué)生使用維語(yǔ)試卷,為保證樣本量基本一致,隨機(jī)選取漢語(yǔ)試卷考試的學(xué)生1?892人.維語(yǔ)作答學(xué)生中女生871人,男生1?023人,缺失23人;漢語(yǔ)作答學(xué)生中女生953人,男生922人,缺失17人.維語(yǔ)作答學(xué)生中,來(lái)自農(nóng)村的有1?573人,來(lái)自城鎮(zhèn)的有334人,缺失19人;漢語(yǔ)作答學(xué)生中,來(lái)自農(nóng)村的有1?500人,來(lái)自城鎮(zhèn)的有373人,缺失19人.兩個(gè)學(xué)生團(tuán)體構(gòu)成大體相同.

4.2 測(cè)試工具

數(shù)學(xué)學(xué)科測(cè)試采用紙筆形式完成.數(shù)學(xué)測(cè)試包含數(shù)與代數(shù)、圖形與幾何、統(tǒng)計(jì)與概率3個(gè)內(nèi)容,涵蓋了小學(xué)五年級(jí)的學(xué)科知識(shí)點(diǎn).數(shù)學(xué)試卷語(yǔ)言有漢語(yǔ)和維語(yǔ)兩種,供不同雙語(yǔ)教學(xué)模式學(xué)生使用.為考察漢語(yǔ)能力對(duì)數(shù)學(xué)測(cè)驗(yàn)偏差的影響,收集相應(yīng)學(xué)生的漢語(yǔ)測(cè)驗(yàn)成績(jī).漢語(yǔ)測(cè)驗(yàn)包括聽力理解、閱讀理解、書面表達(dá)3部分,注重對(duì)學(xué)生國(guó)家通用語(yǔ)言文字應(yīng)用能力進(jìn)行考察.兩門學(xué)科的標(biāo)準(zhǔn)總分均為100分,測(cè)試卷均具有良好的信度和效度.

4.3 變量選擇與數(shù)據(jù)處理

研究考察不同語(yǔ)言數(shù)學(xué)試卷的題目是否存在項(xiàng)目偏差.因變量為學(xué)生對(duì)題目的作答反應(yīng),為0、1計(jì)分,答錯(cuò)記0分,答對(duì)記1分.匹配變量為學(xué)生數(shù)學(xué)測(cè)驗(yàn)分?jǐn)?shù)值,通過經(jīng)典測(cè)驗(yàn)理論(Classical Test Theory,CTT)進(jìn)行評(píng)分.分組變量為學(xué)生教學(xué)模式.雙語(yǔ)班,包括模式1和模式2采用漢語(yǔ)試卷作答,定為焦點(diǎn)組,編碼為1;普通班采用維語(yǔ)試卷,定為對(duì)照組,編碼為0.為考察漢語(yǔ)水平對(duì)項(xiàng)目偏差的影響,研究將納入學(xué)生漢語(yǔ)試卷各部分得分作為解釋變量,包括聽力分?jǐn)?shù)、閱讀分?jǐn)?shù)、書面表達(dá)分?jǐn)?shù).這3個(gè)分?jǐn)?shù)均由項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)方法估計(jì).各變量缺失值均少于10%,采取系統(tǒng)默認(rèn)的方法處理缺失值.

4.4 DIF檢驗(yàn)方法

DIF檢驗(yàn)方法根據(jù)是否需要構(gòu)建數(shù)學(xué)模型,分為參數(shù)方法和非參數(shù)方法.參數(shù)方法具有明確的數(shù)學(xué)模型,如LR法、基于IRT的方法;非參數(shù)方法無(wú)需依靠模型進(jìn)行檢驗(yàn),如MH(Mantel-Haenszel)法,SIBTEST(Simultaneous Item Bias Test)法等.其中,基于IRT的方法和SIBTEST方法適用于匹配變量為潛在變量的情況,而LR/LDFA和MH方法適用于匹配變量為觀察分?jǐn)?shù)的情況[5].在實(shí)際應(yīng)用中,MH方法是應(yīng)用最為廣泛的檢驗(yàn)方法,美國(guó)ETS公司在使用過程中還提出了評(píng)價(jià)DIF大小的效果量MHαΔ,但這種方法只能檢驗(yàn)是否存在DIF,無(wú)法進(jìn)一步說(shuō)明是一致性DIF還是非一致性DIF[19].隨著研究的深入,LR方法漸漸成為常用的檢驗(yàn)方法之一,因?yàn)長(zhǎng)R法不僅可以檢驗(yàn)題目是否存在一致性DIF,還可以使用連續(xù)變量作為匹配變量,或者在模型中加入其它控制變量,以達(dá)到檢驗(yàn)DIF的影響因素的目的.研究因匹配變量為觀察分?jǐn)?shù),且進(jìn)一步考察影響因素,因此采用LR法進(jìn)行DIF檢驗(yàn).

研究綜合Zumbo[20]和汪文義[5]提出的LR方法檢驗(yàn)步驟,對(duì)項(xiàng)目進(jìn)行DIF分析.即通過建立3個(gè)嵌套模型:

5 結(jié)果分析

5.1 不同語(yǔ)言的試卷項(xiàng)目功能差異檢驗(yàn)

將教學(xué)模式作為分組變量,雙語(yǔ)班為焦點(diǎn)組,普通班為對(duì)照組.對(duì)數(shù)學(xué)測(cè)驗(yàn)33道題的作答情況轉(zhuǎn)換為0、1計(jì)分,按照LR方法的第一步將所有試題進(jìn)行全模型分析,結(jié)果發(fā)現(xiàn)共有11道題分組變量效應(yīng)顯著.對(duì)這11道題分別建立模型2和模型3,以進(jìn)一步明確DIF大小,分析結(jié)果見表1.

表1 各題目LR法模型統(tǒng)計(jì)量比較

在表1中,雖然在檢驗(yàn)一致性DIF時(shí),有10道題的對(duì)數(shù)似然比卡方檢驗(yàn)達(dá)到顯著性水平,但其中有9道題的決定系數(shù)之差均小于0.035,項(xiàng)目功能差異可以忽略不計(jì).第19題的大于0.035,小于0.07,說(shuō)明存在中等程度的一致性DIF.在檢驗(yàn)非一致性DIF中,有5道題卡方檢驗(yàn)達(dá)到顯著或邊緣顯著水平,但是均小于0.035,說(shuō)明所有題均不存在非一致性DIF.

進(jìn)一步對(duì)第19題模型2的參數(shù)進(jìn)行分析,β2=-1.893,為負(fù)值,表明對(duì)對(duì)照組有利,即同等數(shù)學(xué)能力條件下,作答維語(yǔ)試卷的學(xué)生答對(duì)這道題的概率更高,作答漢語(yǔ)試卷的學(xué)生答對(duì)概率相對(duì)較低.

5.2 漢語(yǔ)水平對(duì)項(xiàng)目偏差的影響

通過以上研究可以發(fā)現(xiàn),數(shù)學(xué)測(cè)驗(yàn)中的第19題存在語(yǔ)言導(dǎo)致的項(xiàng)目偏差.為進(jìn)一步分析漢語(yǔ)能力中的哪部分是偏差產(chǎn)生的根源,這一部分以19題學(xué)生作答反應(yīng)為因變量,將漢語(yǔ)測(cè)試的3個(gè)分項(xiàng)得分作為控制變量加入模型中,重新進(jìn)行DIF檢驗(yàn).即建立:

其中,Lj為聽力得分,Rj為閱讀得分,Wj為書面表達(dá)得分.若加入漢語(yǔ)測(cè)驗(yàn)得分后,分組變量不再產(chǎn)生DIF,就表明控制學(xué)生漢語(yǔ)水平后,測(cè)驗(yàn)不再存在因語(yǔ)言導(dǎo)致的偏差,即同一數(shù)學(xué)能力的學(xué)生在維語(yǔ)和漢語(yǔ)試卷上的得分概率是相同的,進(jìn)而說(shuō)明漢語(yǔ)水平是導(dǎo)致項(xiàng)目偏差的因素之一.

在加入漢語(yǔ)的3個(gè)分項(xiàng)得分和分組變量的模型5中,Logit回歸分析顯示(表2),漢語(yǔ)測(cè)驗(yàn)的3個(gè)分項(xiàng)中,只有書面表達(dá)分?jǐn)?shù)成顯著性水平,而聽力和閱讀均不顯著.

表2 模型5的Logit回歸統(tǒng)計(jì)分析

如表2所示,在加入漢語(yǔ)水平變量后,分組變量依然效應(yīng)顯著,考慮到樣本量較大的數(shù)據(jù)情況,通過比較兩個(gè)模型的決定系數(shù)之差也就是效果量來(lái)明確這個(gè)項(xiàng)目偏差的大小,檢驗(yàn)結(jié)果見表3.

表3 第19題加入漢語(yǔ)水平變量后的DIF分析

在無(wú)漢語(yǔ)水平相關(guān)變量的模型中,模型2和模型3的決定系數(shù)之差是0.039,屬于中等程度DIF.由表3中可以看到,在加入漢語(yǔ)水平變量后,在無(wú)分組變量時(shí),模型的決定系數(shù)是0.497;在加入分組變量時(shí),決定系數(shù)增加到0.509;兩者之差是0.012,屬于DIF可以忽略不計(jì)的取值范圍.這說(shuō)明加入漢語(yǔ)水平變量后,第19題的項(xiàng)目偏差已經(jīng)不存在了.也就是說(shuō),漢語(yǔ)水平是引起數(shù)學(xué)測(cè)驗(yàn)DIF的重要因素.結(jié)合表2,可以進(jìn)一步確定,是漢語(yǔ)書面表達(dá)能力導(dǎo)致了第19題產(chǎn)生項(xiàng)目偏差.同樣數(shù)學(xué)能力的學(xué)生,由于作答漢語(yǔ)試卷學(xué)生的漢語(yǔ)書面表達(dá)能力的原因,導(dǎo)致第19題正確率較低,出現(xiàn)由試卷語(yǔ)言因素導(dǎo)致的項(xiàng)目功能偏差.

5.3 結(jié)合具體題目進(jìn)行分析

研究發(fā)現(xiàn)數(shù)學(xué)測(cè)驗(yàn)的第19題存在語(yǔ)言因素導(dǎo)致的DIF,下面進(jìn)一步結(jié)合題目?jī)?nèi)容進(jìn)行具體分析.首先來(lái)看一下第19題(圖1).

圖1 第19題

題目考察列方程解應(yīng)用題的能力,答案是:

解:設(shè)火車的速度是x米/秒

試卷其它數(shù)學(xué)文字題只需要直接列式解答,與這些題的作答相比,該題多了一個(gè)“解設(shè)”環(huán)節(jié),也就是多了一個(gè)漢字書寫的步驟.這道題漢字書寫的難度在于,雖然在題目右側(cè)的文本框中出現(xiàn)了“火車的速度是多少”的文字,給學(xué)生設(shè)未知數(shù)提供了線索,但是整道題內(nèi)容分散,將有效的題目信息分散到左側(cè)的上下兩個(gè)組塊和右側(cè)的一個(gè)組塊中,需要學(xué)生理順這3個(gè)組塊之間的關(guān)系,并綜合理解文字“飛機(jī)的飛行速度比火車行駛速度的7倍還多10米”、飛機(jī)火車圖示例下面所示文字“飛機(jī):220米/秒”“火車:?米/秒”和小女孩提出的“火車的速度是多少呢?請(qǐng)你用‘列方程的方法’解決這個(gè)問題”3個(gè)部分的內(nèi)容后,才能夠準(zhǔn)確設(shè)未知數(shù)“火車的速度”是“x”,單位“米/秒”,并組織自己的語(yǔ)言來(lái)寫出這句話.這對(duì)于將漢語(yǔ)作為第二語(yǔ)言學(xué)習(xí)的少數(shù)民族學(xué)生來(lái)說(shuō),無(wú)疑是有難度的.首先,增加了他們對(duì)題意理解的難度,在閱讀題目時(shí),由于題目信息過于分散,導(dǎo)致他們對(duì)題目的理解出現(xiàn)困難;雖然圖片的呈現(xiàn)在一定程度上增加了題目的可理解性和趣味性,但是過多的圖片分散了學(xué)生的注意力,不利于審題.其次,增加了學(xué)生的書寫難度,題目的文字部分分布在3個(gè)組塊內(nèi),對(duì)于漢語(yǔ)水平低的學(xué)生而言,提取有用文字和詞語(yǔ)的困難增加,導(dǎo)致他們遣詞造句出現(xiàn)困難,難以寫出正確的“解設(shè)”,后面的作答更無(wú)法完成.因此,通過分析發(fā)現(xiàn),這道題不僅漢語(yǔ)書面表達(dá)能力直接導(dǎo)致DIF,對(duì)題目的閱讀理解能力通過影響學(xué)生的書面表達(dá),間接導(dǎo)致這道題產(chǎn)生DIF.

6 討論

測(cè)驗(yàn)公平是考試公平的重要內(nèi)容之一,直接影響到考試結(jié)果的準(zhǔn)確性.如果一個(gè)高利害考試(如中、高考)結(jié)果不準(zhǔn)確,將影響到學(xué)生受教育機(jī)會(huì)的公平性,進(jìn)而影響整個(gè)社會(huì)教育公平的實(shí)現(xiàn).特別是在少數(shù)民族雙語(yǔ)測(cè)驗(yàn)中,由于加入了第二語(yǔ)言這一因素,更加要求測(cè)驗(yàn)編制者注意測(cè)驗(yàn)公平問題.面對(duì)測(cè)驗(yàn)偏差,如何修改或完善測(cè)驗(yàn)題目,實(shí)現(xiàn)測(cè)驗(yàn)公平成為命題者的重要考慮內(nèi)容.

6.1 編制試題時(shí)應(yīng)考慮學(xué)生語(yǔ)言能力水平

在編制少數(shù)民族學(xué)生學(xué)業(yè)測(cè)驗(yàn)時(shí),不僅在漢語(yǔ)學(xué)科要考慮到漢語(yǔ)能力對(duì)作答的影響,在數(shù)學(xué)等其它學(xué)科中也要考慮學(xué)生漢語(yǔ)水平特別是閱讀能力和書寫能力的差異,避免學(xué)生會(huì)做數(shù)學(xué)題卻由于語(yǔ)言原因?qū)е碌氖Х脂F(xiàn)象.結(jié)合研究結(jié)果,在編制第二語(yǔ)言測(cè)驗(yàn)時(shí),特別是編制學(xué)科測(cè)驗(yàn)時(shí)應(yīng)注意以下方面.在題目形式上,盡量避免題干內(nèi)容的分散,以降低學(xué)生的閱讀理解難度;在題干詞匯上,使用更易于理解的詞語(yǔ)來(lái)呈現(xiàn)題目以避免理解偏差[10],圖片雖然可以幫助學(xué)生理解詞語(yǔ),但是不宜過多;在語(yǔ)句編排上,應(yīng)盡量選取短句呈現(xiàn)題目[11],且集中呈現(xiàn),減少學(xué)生因推理句子先后順序而導(dǎo)致的閱讀困難.總之,多角度綜合考慮,從學(xué)生語(yǔ)言掌握水平入手,排除題干中干擾學(xué)生理解及作答的因素,降低題目的語(yǔ)言復(fù)雜性,幫助學(xué)生專注于任務(wù)本身并展示他們?cè)谀繕?biāo)領(lǐng)域的技能,提高試卷編制質(zhì)量.

6.2 處理存在項(xiàng)目偏差的題目要謹(jǐn)慎和全面

研究是對(duì)第二語(yǔ)言測(cè)驗(yàn)進(jìn)行公平性檢驗(yàn)的嘗試.在實(shí)踐中,在檢測(cè)出DIF的基礎(chǔ)上應(yīng)對(duì)有DIF的題目進(jìn)行處理.對(duì)于如何處理存在DIF的題目,研究者們有著不同的看法.有研究者認(rèn)為存在項(xiàng)目偏差的題目嚴(yán)重影響測(cè)驗(yàn)公平性,應(yīng)該刪除或者替換[22];但其他研究者認(rèn)為“如果一個(gè)項(xiàng)目所測(cè)的知識(shí)點(diǎn)是測(cè)驗(yàn)本身要測(cè)的內(nèi)容,即使有較高的DIF也不應(yīng)刪除”[23].可見,對(duì)存在DIF的題目的處理需要持審慎態(tài)度,不能簡(jiǎn)單地刪除題目,應(yīng)綜合多方面進(jìn)行考慮.對(duì)于該測(cè)驗(yàn)來(lái)說(shuō),第19題是一道運(yùn)用方程的應(yīng)用題,是必須要考察的知識(shí)點(diǎn)之一,因此不能做刪除處理,應(yīng)根據(jù)測(cè)驗(yàn)的內(nèi)容領(lǐng)域和認(rèn)知水平,以及學(xué)生的漢語(yǔ)能力,著重從學(xué)生理解和書寫角度對(duì)題目進(jìn)行針對(duì)性修改,如將3部分文字內(nèi)容整合到一起,替換“火車:?米/秒”這種不規(guī)范的問題提出形式,采用更淺顯易懂的詞語(yǔ)呈現(xiàn)問題,減少圖示的數(shù)量,在確保準(zhǔn)確考察該知識(shí)點(diǎn)的基礎(chǔ)上,減少由于語(yǔ)言因素導(dǎo)致的測(cè)驗(yàn)偏差.

6.3 測(cè)驗(yàn)編制工作需要工作機(jī)制保證測(cè)驗(yàn)公平

研究是在測(cè)驗(yàn)實(shí)施后進(jìn)行的DIF檢驗(yàn),因此無(wú)法再對(duì)測(cè)驗(yàn)進(jìn)行改進(jìn)和完善.這也提示科研人員,在測(cè)驗(yàn)編制的實(shí)際工作中,測(cè)驗(yàn)公平性問題并不能僅靠最后的檢驗(yàn)來(lái)發(fā)現(xiàn),更需在編制各環(huán)節(jié)規(guī)避偏差問題,因此亟需借助完善的工作機(jī)制來(lái)保證.首先,在測(cè)驗(yàn)編制前,制定并公布審核標(biāo)準(zhǔn).美國(guó)教育考試服務(wù)中心(Educational Testing Service)認(rèn)為,制定測(cè)驗(yàn)公平性審核標(biāo)準(zhǔn),不僅使審核過程更為客觀、全面,而且如果命題者熟知這些標(biāo)準(zhǔn),在編制中就可以避免使用產(chǎn)生偏差的語(yǔ)料[24].其次,在測(cè)驗(yàn)編制后,對(duì)測(cè)驗(yàn)公平性進(jìn)行審核.除組織專家參照審核標(biāo)準(zhǔn)對(duì)測(cè)驗(yàn)公平性進(jìn)行審核外,還可借助DIF等統(tǒng)計(jì)方法進(jìn)行檢驗(yàn).最后,對(duì)于檢測(cè)出有偏差的題目進(jìn)行進(jìn)一步修改與完善.只有建立完整的測(cè)驗(yàn)公平審核機(jī)制才能有效減少或消除項(xiàng)目偏差,確保測(cè)驗(yàn)獲得數(shù)據(jù)的有效性.

7 結(jié)論

研究發(fā)現(xiàn),在數(shù)學(xué)測(cè)驗(yàn)中,試卷的語(yǔ)言會(huì)影響同等目標(biāo)能力學(xué)生對(duì)題目的正確作答概率,即學(xué)生第二語(yǔ)言水平是造成數(shù)學(xué)測(cè)驗(yàn)DIF的原因之一.進(jìn)一步對(duì)第19題進(jìn)行分析發(fā)現(xiàn),不僅漢語(yǔ)書面表達(dá)能力直接導(dǎo)致DIF,對(duì)題目的閱讀理解能力通過影響學(xué)生的書面表達(dá),間接導(dǎo)致DIF的產(chǎn)生.因此,在編制少數(shù)民族學(xué)生學(xué)業(yè)測(cè)驗(yàn)中,為保證測(cè)驗(yàn)結(jié)果的真實(shí)性,控制或消除測(cè)驗(yàn)偏差是提高測(cè)驗(yàn)質(zhì)量的內(nèi)在要求.今后可進(jìn)一步分析學(xué)科語(yǔ)言特征對(duì)DIF的影響機(jī)制,以便系統(tǒng)指導(dǎo)第二語(yǔ)言測(cè)驗(yàn)編制,降低或消除測(cè)驗(yàn)偏差.

猜你喜歡
語(yǔ)言數(shù)學(xué)學(xué)生
語(yǔ)言是刀
文苑(2020年4期)2020-05-30 12:35:30
趕不走的學(xué)生
讓語(yǔ)言描寫搖曳多姿
學(xué)生寫話
累積動(dòng)態(tài)分析下的同聲傳譯語(yǔ)言壓縮
學(xué)生寫的話
我為什么怕數(shù)學(xué)
新民周刊(2016年15期)2016-04-19 18:12:04
數(shù)學(xué)到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
我有我語(yǔ)言
數(shù)學(xué)也瘋狂
主站蜘蛛池模板: 亚洲中文字幕在线一区播放| 日本一区二区三区精品国产| 国产精品微拍| 国内精品久久久久鸭| 国产91久久久久久| 欧美一级夜夜爽www| 欧美另类视频一区二区三区| 欧美一级一级做性视频| 午夜视频免费试看| 国产理论最新国产精品视频| 精品成人免费自拍视频| 精品国产aⅴ一区二区三区| 国产一级在线观看www色| 成AV人片一区二区三区久久| 亚洲第一精品福利| 毛片基地美国正在播放亚洲| 午夜电影在线观看国产1区| 国产乱码精品一区二区三区中文 | 四虎成人精品| 国产一区二区三区夜色| 欧美另类第一页| 亚洲自拍另类| 久久精品只有这里有| 国产一区二区三区精品久久呦| 18禁色诱爆乳网站| 狠狠色综合久久狠狠色综合| 国内a级毛片| 欧美激情二区三区| 尤物精品视频一区二区三区| 青青草原国产av福利网站| 人妻免费无码不卡视频| 91精品免费高清在线| 亚洲手机在线| 2024av在线无码中文最新| 欧美一区二区三区国产精品| 国产美女久久久久不卡| 91亚洲视频下载| 免费看美女毛片| 日本一区二区三区精品国产| 国产精品九九视频| 色综合天天娱乐综合网| AⅤ色综合久久天堂AV色综合| 中文字幕在线看| 国产一区二区免费播放| 99在线视频网站| 夜夜操天天摸| 国产又大又粗又猛又爽的视频| 白丝美女办公室高潮喷水视频| 日韩A∨精品日韩精品无码| 国产swag在线观看| 亚洲AV电影不卡在线观看| 青青草欧美| 久久这里只精品热免费99| 免费av一区二区三区在线| 亚洲乱码在线播放| 中文字幕亚洲综久久2021| 26uuu国产精品视频| 亚洲国产成人久久精品软件| 亚洲综合二区| 五月婷婷丁香综合| 国产日韩欧美在线视频免费观看| 永久免费无码日韩视频| 无码内射在线| 亚洲天堂在线免费| 亚洲免费毛片| 91福利国产成人精品导航| 国产精品永久久久久| 国产一区二区精品福利 | 亚洲黄色视频在线观看一区| 丁香综合在线| 精品黑人一区二区三区| 91精品国产自产91精品资源| 欧洲av毛片| 久久久久无码精品| 欧美啪啪网| 免费A级毛片无码无遮挡| 高清不卡毛片| 国产精品内射视频| 2021精品国产自在现线看| 欧美日韩一区二区三区四区在线观看 | 亚洲一级毛片免费观看| 亚洲精品久综合蜜|