999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學業測量中需要考慮的基本要素及分析指標

2017-04-29 00:00:00陸運清
教育實踐與研究·理論版 2017年2期

摘要:學業測量在學校教育的各個階段都是師生極其熟悉和重視的教學環節。由于基礎教育階段學生的學業成績得到特別關注,學業測量的科學與否引起的積極和消極作用更為凸顯。在依據測量結果進行相關分析和作出決策時,學業測量的科學性是至關重要的。

關鍵詞:學校教育;基礎教育階段;學業測量;基本要素;測驗編制;指標分析

學業測量在學校教育的各個階段都是師生極其熟悉和重視的教學環節,在基礎教育階段,作為學業評價的依據和綜合素質評價的重要組成部分,學業測量結果更是得到教育管理部門以及家長、老師和學生的廣泛重視,甚至還常引起全社會的熱議。由于基礎教育階段學生的學業成績得到特別關注,學業測量的科學與否引起的積極和消極作用更為凸顯。科學的學業測量可以在多方面發揮其積極作用。首先,學業測量可以對教師的教學和學生的學習提供客觀、準確的反饋信息,以便師生總結經驗、發現問題。其次,學業測量可以為教學管理部門提供評價和選拔的有效依據,從而做出客觀、合理的決策。此外,學業測量還可以提供教學研究的真實數據資料,進而探索出不同教學內容和教學環境下有效的教學方法。相反,科學性差的學業測量會得到與真實情況偏差較大的測試結果,從而對教學等各方面的工作引起誤導。因此,在依據測量結果進行相關分析和做出決策時,學業測量的科學性是至關重要的。

一、學業測量的基本要素

學業測量是根據教學內容和教學目標以及測量目的的要求,按照一定的標準對教學活動的效果加以測定的過程。因此,要保證學業測量的科學性,首先要明確測量的目的,確定學業測驗的種類。在此基礎上還需要了解教學目標的層次和教學內容的分析方法。

(一)學業測驗的種類

學業測驗是學業測量的工具,按測量目的分類,學業測驗可分為:安置測驗(如分班測驗)、預測測驗(如模擬測驗)、形成性測驗(如單元測驗)、總結性測驗(如期末測驗)、診斷性測驗(針對學生可能存在的問題編制測驗)、難度測驗(鑒別最高水平)、速度測驗(鑒別掌握知識、技能的熟練程度、思維的敏捷程度)等。

按測驗結果的評價標準分,學業測驗可以分為常模參照測驗和目標參照測驗。目標參照測驗是依照測驗的既定目標和標準來解釋分數的測驗。其目的在于考查被試是否達到了既定目標,比如目的是為了了解學生對教學大綱內容掌握的情況,這樣的測驗即為目標參照性測驗;常模參照性測驗是依照測驗的集體常模來解釋分數的測驗,其目的在于區分被試的不同水平。如目的是選出成績優秀的學生給予獎勵的測驗就屬于常模參照測驗。

(二)測驗目標

測驗目標采用美國當代著名心理學家、教育學家本杰明.布魯姆(Beniamin Bloom)將認知目標分成的知識、理解、應用、分析、綜合和評價六個層次。

1.知識(Knowledge)。反映考生辨認和記憶具體的事實,一般概念、原則、術語,事物的分類、過程等情況。例如:某事件哪一年發生?某原子的原子量是多少?默寫某段兒文字。

2.理解(Comprehension)。對知識的理解或說明,要求考生用自己的語言把記得的知識復述、解釋、歸納等。例如:具體給出一三角形,讓學生寫出其中一角的正弦;復述或翻譯某段兒文字。

3.應用(Application)。將抽象的概念應用到實際問題中,要求考生根據新情況選擇某些抽象的原理和方法加以應用。例:給出兩相似三角形,已知其中之一的兩邊長和另外一個的一邊長,求第二個的未知對應邊長。

4.分析(Analysis)。將整體分解為部分,并確定各部分之間的關系。要求考生將某一事實或概念分解為若干組成部分,然后指出它們之間的內在關系或相互聯系。例如:讓考生根據國際政治、經濟背景以及各國之間的利害關系分析第二次世界大戰的起因。

5.綜合(Synthesis)。將要素和部分整合成新的概念體系。要求考生將各部分組合成一個新的整體。例如一道要求考生談自己生活經驗的寫作題。

6.評價(Evaluation)。形成自己的價值標準,并對事物進行評判。例如,要求考生對某篇作品、某種方法或某種結論進行評價。

在學業測量的實際應用中。一般在布魯姆的認知層次基礎上將高層次的測驗目標分析、綜合和評價合并為綜合應用,這樣,測驗目標劃分為知識、理解、簡單應用和綜合應用四個層次。

(三)測驗內容

對測驗內容的劃分可以根據命題的具體情況采用按章節或按內容組成部分等方式對全部教學內容進行劃分。測驗內容是教學內容的抽樣,不管按哪種方式劃分,都必須使試題在一定程度上反映所要測試的內容,這樣測驗內容對教學內容才具有代表性,測量結果才能反映學生的真實水平。否則,測驗內容片面,不能代表教學內容,測得的結果與學生真實情況不符,這樣的學業測量將失去意義甚至產生負面作用。

二、測驗的編制

(一)雙向細目表的編制

雙向細目表是從考試目標和考試內容兩方面考慮制定出的測驗規劃。編制雙向細目表的具體步驟為:1.研究考試大綱。2.列出考試大綱中各部分內容占的比例。3.列出各層次教學目標所占的比例。4.編制雙向細目表,列出各部分內容每個認知層次的比例。5.總體考查,適當調整。

在重要的測驗編制中,需要命題小組的不同人員各自根據考試大綱編制命題雙向細目表,然后比較小組內成員的雙向細目表,對存在差異的部分要進行充分討論、合理調整,最后形成統一意見。下表為某物理統考命題雙向細目表。

(二)試題的編制

在學業測量中有各種各樣的題目類型,一般來說,不同的題型適合測試不同的認知層次。試題的類型可以分為客觀性試題和主觀性試題,又稱為封閉式和開放性試題兩大類。客觀題具有唯一的標準答案,一般用于測試較低的目標層次,具體包括:選擇、判斷、匹配、填空等題型。主觀題沒有標準答案,用于測試較高的目標層次,具體包括:問答題、寫作題、操作題、證明題等。

要準確地達到測試目標,每種題型的編制都需要遵循一些原則,在此對幾種常見的題型進行簡要說明:

1.選擇題的編制

選擇題由一個題干和幾個選項組成。題干可以是直接問句或不完整敘述句,選項在“正確答案型”和“最佳答案型”選擇題中分別包括一個正確答案或一個最佳答案,其它幾個為似真的錯誤答案或不佳答案,后者也叫“誘答”項。選擇題編制的主要原則是“誘答”要有似真性,真正具有誘答作用。如果題目不符合這個原則,考生會很容易用排除法獲取并未準確掌握的答案。例如,如果選擇題為:鴉片戰爭發生于:A、1100年;B、1840年;C、2010年;D、2015年,考生會根據大的時間跨度很容易排除掉A、C、D選項。

2.是非題的編制

是非題一般提出一個陳述性的句子要求考生指出正誤選項,是非題又叫二項選擇題。其編制的主要原則是每題只測量一個重要概念,避免同時測量兩個或兩個以上的概念,盡量少用否定敘述,特別避免雙重否定的敘述。例如,墨西哥和巴西是南美洲國家;15不是非分數。這些表述就不符合是非題的編制原則,測試結果不能很好地反映考生對知識點的真實掌握情況。

3.配對題的編制

配對題由幾個前提和幾個配列的選項組成。編制的主要原則是各題干或選項的性質必須近似,配對項目不要太多,選項數目一般等于或多于前提數目。如果以1.我國最大的城市、2.我國最長的河流、3.我國近代革命先行者、4.中華人民共和國成立的時間幾個選項與A孫中山、B上海、C 1949年、D長江幾項配對,由于各項性質完全不同,即使所有知識點都沒有掌握都可以正確匹配。而以1.紅樓夢、2.三國演義、3.水滸傳、4.西游記為選項與A羅貫中、B吳承恩、c曹雪芹、D施耐庵幾個作者項配對的題目可以很好地測試出對相應知識點的掌握情況。

4.填空題的編制

填空題和選擇題的題干類似,是以直接問句或不完整敘述句的形式呈現,答案需要考生提供,考點的掌握層次比選擇題高。填空題編制的主要原則是問題必須十分清晰,填答部分是問題中的重要部分,空格不宜太多。此外,出題人員選擇要測試的知識點可能并不是填空部分的唯一答案。例如:我國第一顆原子彈爆炸是在( )。填空部分可以填些1964年、1964年10月16日、新疆、新疆羅布泊、羅布泊試驗基地等多個答案。這種情況需要特別注意。

5.主觀題的編制

主觀題是在測試中需要學生用自己的表達回答問題的試題。其最大特征是學生可以在處理問題的方式、選用材料、組織資料的方式等方面有一定程度的自由發揮。主觀題的優點是可以測量較高層次的學習目標,并且對學生的學習習慣和方式產生積極影響,促進學生思維的發展和解決問題的能力。主觀題也有一定的缺點,主要表現在試題無法大量取樣,評分易受主觀因素影響,答題和閱卷花費時間較多等方面。主觀題的常見編制方式有:說明兩種事物的異同、比較兩種方法的優劣;導致某結果的原因是什么?說明同意或不同意某觀點的理由;說明某篇文章或某種理論的主要觀點;從有關資料中概括出某種原則;就提供的資料做出推論;以某項原則將事物分類;說出有關敘述的錯誤之處;列舉并說明某事物的主要特征;評價評價一些觀點的優缺點;等

編制主觀題需要注意不能編制教材中有現成答案的題目.否則學生通過背誦答案可以獲得高分,這樣測量的是學生的記憶能力.不能達到測量高層次認知目標的目的。此外,主觀題的編制要注意明確陳述問題,使學生了解做答的任務和要求,還要充分考慮可能的答案,在有關專家中形成一致意見,并且要注意答案中評分標準的可操作性。

(三)試卷的編排

在依據雙向細目表內容和目標層次分布的基礎上選擇合適題型編制好測驗題目后,再經過檢查確認就可以將試題組合成試卷。試卷的排列要遵循由易到難的原則,難題排在前面可能對學生心理產生影響,從而導致對后面本來會的題目不能正確回答的結果。此外,要明確試卷的回答方式,如果必要需要編寫試卷做答說明。

三、學業測驗的指標分析

學業測驗的分析指標一般包括難度、區分度、信度和效度。

1.難度

難度是指測驗或測題的難易程度。符號是P。在教育測量學中,難度的概念被定義為通過率。這樣,客觀題的難度計算公式為P=k/n,k和n分別為答對的人數和總人數;主觀題的難度為P=M/W,M和W分別為相應題目的平均分及滿分。這樣用通過率計算出的題目難度與習慣表述的“難度”正好相反.題目越難通過率越小,也就是難度數值越小;題目越容易通過率越大.難度數值越大。為了與日常描述的“難度”統一起來,在實際應用中常采用1-P表示難度,稱測量學定義的難度P叫難度系數。

兩端分組法也是計算試題難度的常用方法。其具體步驟為:(1)把考生的總分進行由高至低排列;(2)從高分向下取27%考生,再從低向上取27%考生,分別計算出該題在高、低兩組考生中的難度PH、PL;(3)難度P為PH和PL的平均值,即P=(PH+PL)/2。

2.區分度

區分度是衡量測題對被試測試指標不同水平的鑒別程度。區分度高的題目.能把不同水平的被試有效地區別開來。考生在某題的得分與考生的實際水平的相關系數可以作為該題目區分度的指標。但是,由于考生的實際水平未知材進行測驗,所以,考生在整份試卷上得分可作為考生實際水平的估計值.更為合理的估計值應為(總分-該題得分)。這樣,區分度的計算指標為考生在某題的得分與考生(總分-該題得分)的相關系數。

此外,兩端分組法也常用于測驗題目區分度的計算。計算過程的前面步驟與用兩極端分組法計算難度時相同,在計算出PH和PL后,題目的區分度D=PH-PL。

區分度與難度有一定關系,一般而言,難度居中,區分度較大;難度偏高或偏低,區分度較低。難度為1或0時,區分度為0。對難度和區分度的要求與測驗目的有關。目標參照性測驗的目的在于考查被試是否達到了既定目標,常模參照性測驗的目的在于區分被試的不同水平。只有對于純粹的常模參照性測驗,難度為1和0才沒有意義。在其它類型的測試中,可以允許這樣的題目存在。

3.信度分析

信度是測驗一致性或可靠性的指標,是測試結果能夠反映測試穩定水平的程度。常采用的信度指標有折半信度、重測信度、復本信度、a系數等。

折半信度中折半的指導思想是把整份測驗分為內容和認知層次等基本一致的兩部分.然后考查考生在兩部分測驗上得分的一致性,實際中經常采用的是奇一偶折半法。在計算出考生兩部分測驗得分的相關系數后,用Spearman-Brown公式rS-B=2r/(1+r)計算出折半信度。

用同一測驗在一定的時間間隔下對同一組應試者先后測試兩次,重測信度是應試者兩次測試成績的一致性(用相關系數表示)。在學業測驗中,重測信度適用于速度測驗不適用于難度測驗。

復本信度用兩個等值(題型、題數、難度、區分度相等)但具體內容不同的測驗,在最短的適當時間間隔內對相同應試者實施測驗,應試者在兩個等值測驗得分的一致性即為復本信度。實際應用中A、B試卷即為復本測驗,二者測驗結果的相關系數為復本信度。

a系數。當測題分拆成兩半的等效性無法保證時,可用a系數法計算信度。通過統計分析軟件SPSS中的信度分析可以直接計算出a系數。

4.效度分析

效度是測試有效性或準確性的質量指標,是測試能夠反映所要測試目標的程度。效度可分為內容效度、效標關聯效度、結構效度等。

內容效度又叫邏輯效度,是指測試反映出要測試內容的程度,即測驗內容對測驗目的的適合程度。考察內容效度時依據試卷對測試內容進行分析,列出雙向細目表,然后比較試卷分析雙向細目表與命題雙向細目表。二者一致性越高說明測驗內容與計劃要測的內容一致性越高,也就是內容效度越高。

效標關聯效度又叫準則效度,是指尋找到一種能夠反映測試有效性的客觀標準(亦稱效標),進而考察這次測試與效標之間的相關程度。效標關聯效度可分為預測效度和同時效度。如果測驗和效標測驗實施的時間間隔較長,而且效標在后,則稱為預測效度。如,通過高中一年級的學習成績評價中考的效度,是預測效度。如果測試與效標的時間間隔很短,則稱為同時效度。在很短時間間隔內測試老師的自編測驗和權威部門組織專家編制的相應測驗,這樣可以分析老師自編測驗的同時效度。

結構效度是指測試能夠測量到心理結構或特征的程度,是指測試分數能夠被解釋的程度。心理測量中常用多種方法考查結構效度,學業測量的結構效度一般認為已經包括在內容效度中,不用其它方式分析。

測驗的信度和效度有一定的關系。一個測驗的信度高其效度不一定高.而如果其效度高則信度也會高。因此,信度是效度的必要條件,效度是信度的充分條件。精心編制測驗、保持良好的測試環境、減少評分誤差等是保證測驗效度所必備的過程,如果這些做好了,測驗的信度也會較高。

在科學編制學業測驗和合理實施測驗的基礎上,不但能保證合理的難度和區分度以及較高的信度和效度,還可以在可靠的學業測量結果基礎上進行教學研究,如教學方法之間的效果差異分析、某種教材適合的教學環境、教師的教學風格與學生掌握的學科知識認知層次的關系等。總之,科學的教育測量結果不僅可以作為評價教學效果和診斷教學中可能存在問題的依據,還可以為教學的改進提供有效的指導信息。

[責任編輯 馮榮光]

主站蜘蛛池模板: 国产精品天干天干在线观看| 成人综合网址| 99re在线观看视频| 一级片一区| 国产亚洲视频免费播放| 欧美啪啪一区| 欧洲免费精品视频在线| 人人爽人人爽人人片| 萌白酱国产一区二区| 99精品热视频这里只有精品7| 一本久道久久综合多人| 美女无遮挡拍拍拍免费视频| 亚洲综合久久成人AV| 亚洲日韩高清在线亚洲专区| 精品人妻系列无码专区久久| 国产美女丝袜高潮| 亚洲精品不卡午夜精品| 狼友视频一区二区三区| 亚洲第一天堂无码专区| 91精品网站| 91美女视频在线| 亚洲天堂视频在线观看免费| 九色91在线视频| 熟妇人妻无乱码中文字幕真矢织江 | 中文字幕日韩丝袜一区| 成人国产精品一级毛片天堂| 国产精品精品视频| 高清无码一本到东京热| 啪啪啪亚洲无码| 日本欧美视频在线观看| 午夜精品久久久久久久无码软件 | 99热这里只有精品久久免费| 国产精品大尺度尺度视频| 黄色一及毛片| 久久精品这里只有精99品| 一区二区三区四区在线| 天天色天天操综合网| 国产精品视频久| 十八禁美女裸体网站| 日韩在线中文| 91麻豆精品国产91久久久久| 国产不卡一级毛片视频| 国产成人精品18| 视频在线观看一区二区| 久久国产精品麻豆系列| 日本一区二区三区精品视频| 国产免费a级片| 国产福利免费在线观看| 久久综合色天堂av| 亚洲欧美h| 国产精品对白刺激| 54pao国产成人免费视频| 久久大香香蕉国产免费网站| 国产老女人精品免费视频| 狠狠亚洲五月天| 国产亚洲精久久久久久久91| 蜜臀av性久久久久蜜臀aⅴ麻豆| 色有码无码视频| 国产视频久久久久| 日日噜噜夜夜狠狠视频| 亚洲精品第一页不卡| 精品国产香蕉伊思人在线| 亚洲无码91视频| 一级看片免费视频| 天堂av综合网| 国产h视频免费观看| 久久这里只有精品23| 欧美国产视频| 狠狠干欧美| 欧美黄色网站在线看| 日本免费一级视频| 国产十八禁在线观看免费| 国产小视频a在线观看| 欧美一级在线看| 欧美激情首页| 日a本亚洲中文在线观看| 国产18在线播放| 综合社区亚洲熟妇p| 久久综合色视频| 手机永久AV在线播放| 波多野结衣中文字幕一区二区| 福利在线不卡一区|