999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基礎教育中學業測評的測量學取向

2013-04-29 00:44:03柴彩霞
教學與管理(理論版) 2013年6期
關鍵詞:成就理論測量

學業成就,指個體在某一學科領域所具有的知識、技能或者取得成績的水平[1]。學業測評是以國家教育教學目標為依據,運用恰當的、有效的工具和途徑,系統地收集學生在教學和自學的影響下認知行為上的變化信息和證據,并對學生的知識和能力水平進行價值判斷的過程。它在教育中起著非常重要的作用。從微觀的課堂教學活動來看,對學業成就的測量與評價是一個重要環節,可以幫助老師了解學生的學習情況,指導教學活動,同時還可以幫助學生達到教學目標,促進其能力的發展;從宏觀的教育活動來講,學業成就的測量與評價可以給學校或教育機構提供更多的教學效果信息,從而起到監控教學質量的作用。然而,在新課程改革背景下,學業成就的測量與評價存在很多的技術難題與弊端。

一、當前學業成就測評所面臨的技術難題

隨著基礎教育改革的不斷深入,對學生學業成就的測評工作已經取得很大進展,但我們仍然無法忽視其中存在的問題:一是現行的學業成就測評仍然擺脫不了對學生進行排隊的嫌疑,通過測評所挖掘的學生的信息仍然不夠深,從而導致對學生的能力不能很好地診斷和指導[2];二是囿于測評技術的發展局限,現行的學業成就測評還是主要考查學生對知識的掌握程度,對學生能力的掌握還不夠深;三是學業成就測量與評價的非標準化,導致了測評內容缺乏客觀性。盡管我們打破了傳統的統一教材一統天下的局面,制定了一個共同的課程標準,但現行的考試制度還是抹不去學業成就測驗內容選擇的主觀色彩;四是學科專家和心理測量學專家之間的聯系不夠緊密,導致學科專家在成就測評的實施過程中,缺乏心理測量學的理論指導,而心理測量學專家對學科知識和課程標準也吃不透;五是在我國現狀下,大規模的學業成就測評的形式非常單一,主要采取紙筆的形式,這也導致人們對測評的客觀性和公正性存有質疑。綜合上述五個問題的出現,分析其根本原因,主要原因還是心理測量學的基本理論還沒有完全融入到學業成就測量與評價的實踐中去,所以,要解決學業成就測評面臨的問題,還得從心理測量學的理論與技術的實施中尋找答案,加強心理測量學專家與學科專家之間的聯系與交流,從而做到學業成就測評的客觀、公正與公平,促進學生能力的發展。

二、學業成就測評的經典測量學基礎

經典測量理論(Classical test theory,CTT)起始于20世紀中葉之前,其主要特點是以真值理論為基礎,以信度、效度、難度和區分度為指標,它的基本假設是考生的分數并不是一個絕對的值,而是其真實能力或技能的反映與測量誤差的和,所以稱為真值理論。根據經典測量理論,人們逐步建立并完善了測驗發展的標準化程序,通過標準化的程序提高所編制的測驗的信度和效度。

自2001年國家教育部提出課程改革以來,教育心理學工作者和學科專家在新課程下學業成就測評工具的研發上,下了不少工夫。經典測量理論在學業成就測評中也得到了一定的應用。某地區初中數學成就測驗在編制過程中,首先是依據初中數學課程標準,確定初中數學涉及4個領域的內容:數與代數、空間與圖形、統計與概率以及綜合應用。同時結合美國教育學家B.S.Bloom的教育目標分類法,選擇記憶能力、理解能力、運算能力、推理能力、綜合應用能力為教育目標,確定測量目標。根據教學內容和教學目標,制定了雙向細目表,之后對該區的數學教學專家進行了訪談,確定了項目以及項目所占的權重,然后組成兩套平行題本。根據題本通過小樣本預試,用難度、區分度的指標來篩選題目,最后確定正式施測題本。采取分層整群抽樣,進行施測收集數據,分析數據,從而根據數據分析的結果來評價學生學會了什么,對什么是了解、知道、理解、應用[3]。

在大規模的學業測評中,試題往往要全面覆蓋基礎教育的各個學科,測試題目非常多,如果要將這些題目讓全部學生作答,測試的時間會大大超過學生所能承受的限度,這也是不可能實現的,矩陣取樣技術化解了這個難題。將覆蓋多個學科的所有題目按照一定原則分配到多套測驗中,學生隨機分配,每個學生只需完成一套測驗中的試題,這樣的設計叫做完全矩陣取樣設計。采用這種設計解決了測驗時長的問題,但是不同學生測試結果的比較又成了新的問題。針對這一問題,發展出不完全矩陣取樣設計,就是每一個題本中都有一部分共同題,利用學生在共同題部分作答的情況,將學生在整個題本中的作答結構等值到同一個量尺上,就可以解決個體之間的比較問題。

即便如此,經典測量理論下的學業成就測驗,采用總分指標來評價能力,對個體在總體中的相對位置進行排序,不能指出被試具體掌握了哪些內容,更無法診斷其題目作答錯誤的原因,仍然擺脫不了還只是對學生知識點考查的怪圈,在注重能力培養的素質教育背景下,它缺乏對學生能力的掌握;用難度與區分度的指標來分析學生的反應,保留了一些反映學生能力的題目;在實際的教學過程中,教師一般也都是自出題目,對題目的難度和區分度只做一個主觀的估計,同時,它也缺乏避免曝光的理論技術指導,從而造成學業成就測驗的標準化程度很低;另外,如果涉及到語文成就測驗時,主觀題目的設計以及結果的分析又會面臨統計學的難題。

三、學業成就測評的現代測量學指導

基于經典測量理論下成就測驗只能測查知識點的致命缺點,教育與心理學工作者圍繞經典測量理論的一些問題展開了討論,促進了測量理論的新發展,注重表現學生能力的項目反應理論(Itemresponse theory,IRT)產生了,該理論起始于20世紀60年代,其特點是:采用嚴格的數學模型來反映不同能力水平的測試者對測試題目的反應模式。項目反應理論相對于經典測量理論來說取得了巨大的進步,但也并非沒有缺點[4],它的3個基本假設非常嚴格——(1)單一維度假設,即假定測驗的所有題目只測查同一種能力或潛在特質。但實際上,很少有測驗只測查單一的能力或特質。(2)局部獨立性假設,即當控制所測量的能力或特質之后,被試在不同題目上的反應是相互獨立的。換一句話講,就是被試對題目的反應只受該題目所測的能力的影響。(3)單調遞增假設,即被試對題目正確反應的概率隨其能力水平的增加而單調遞增。這3條非常嚴格的假設,使其應用受到很大的限制。

從20世紀90年代至今,圍繞項目反應理論產生了很多新的研究和新的動向,如:多維項目反應理論(Multi-dimensional IRT,MIRT)、非參數項目反應理論(Non-parametric IRT,NIRT)等。多維項目反應理論為成就測驗中所涉及的每個維度引入能力和項目區分度參數,進而模擬測驗題目和被試之間的交互作用,它是一個非線性的用來表征題目參數、被試的多維潛在能力以及其正確作答概率之間關系的數學函數,通過這個模型,我們可以對被試的多個特質進行分別推斷。換一句話說,利用多維項目反應模型能同時估計被試在多個維度上的能力參數,并且考慮各能力維度之間的關系,因此,如果測驗數據是多維的,則多維模型就能更有效地估計被試及項目參數。這使我們能更深入地了解被試,結合多方面的信息,為對被試的評估或診斷提供幫助。在實際應用中,一個總的學業成就測驗可以分為多個子測驗,如果子測驗測量了不同的內容領域或認知技能,則這些項目就有可能代表了不同的維度,這時,對每個項目能夠正確作答所需要的內容領域或認知技能進行分析是非常必要的,在傳統測驗中一個知識點的考查可能涉及到對多個能力的考查,用經典測量理論的假設,一個題目對應一個能力,這顯然是有很大的誤差。另外,多維項目反應理論能夠提供項目在每個能力維度上的區分度參數,可以據此來選擇對多維能力差異具有敏感性的項目。在教育中,課堂上學科教師給學生出的小測驗比比皆是,這種測驗不僅題目少,而且受測的對象也僅僅是本班的學生,即樣本小,這時,非參數項目反應理論就給我們提供了模型,這至少削弱了我們對經典測驗中樣本分布正態和在參數項目反應理論中關于特質分布正態假設的依賴。

四、學業成就測評的認知診斷技術前沿

認知診斷理論(Cognitively diagnostic theory)非常值得我們關注。隨著認知心理學的發展,關于知識與技能的認知理論為我們研發成就測驗工具提供了理論基礎。認知診斷理論就是以現代測量學為基礎,結合認知科學對學習理論的研究與發現,采用更精致的數學模型,來研究如下問題,(1)學生在答題時,經歷哪些認知過程?(2)這些認知過程如何發展?以及能力高的學生與能力低的學生在這些方面有哪些差異?認知診斷可以通過學生對試題的作答反應,推論出其認知過程與知識結構的可能狀態。

在學業成就測評中,經典測量理論和項目反應理論,都是根據理論中的一些指標來篩選題目,將學生按順序排列在特定能力(或特質)的連續體上。這并不能給學生或教師有用的診斷信息,不能幫助學生或教師理解需要學習或教學的知識與技能。而運用認知診斷理論,我們能更深入地理解隱含在考生總分背后其認知技能之間的差異。這為我們深入挖掘受測者信息提供了一個有力的工具。

認知診斷理論中比較有代表性的有Mislevy的以概率為基礎的推理(the probability based inference)、Corbett和Anderson等人的學生思維模擬(student modeling)、Britton和Tidwell的認知結構診斷(cognitive structure testing)以及Tatsuoka的規則空間模型(rule space model)[5]。Tatsuoka的規則空間模型最初是用來診斷小學生在解決四則運算問題時答對或者答錯的原因,進而發現學生使用錯誤的規則來解題,因此會產生系統化的錯誤,這種系統化的錯誤,他們稱之為“失誤”。該模型的方法包括兩個階段[6]:第一階段是抽取某個領域的認知特征并根據這些認知特征確定潛在的知識結構;第二個階段是把學生的反應模式劃分到所確定的各個知識結構中去,并且計算被試的屬性掌握概率。在構建規則空間的過程中使用了項目反應理論中參數估計的方法,所以嚴格來講,規則空間模型的建構方法是項目反應理論的繼承與發展。用規則空間模型的方法編制成就測驗時,通過可達到矩陣的距離來澄清各屬性之間的關系,使得矩陣中的項目屬性關系清晰且符合邏輯。同時,由于屬性間的邏輯關系很清晰,所以在項目的反應上就能很清楚地知道學生掌握了哪些屬性,或者未掌握哪些屬性,或者是因為失誤而造成的反應錯誤,這樣就能給教師和學生提供更深層的信息,從而進行補救性的教學[7]。

在實際工作中開展認知診斷測評,需要進行一系列的系統化工作:(1)確定診斷目標。必須明確要診斷的具體學科內容,如小學數學分數診斷,中學語文句法診斷等。(2)確定診斷目標所涉及的認知屬性及屬性間的階層關系。這項工作需要認知心理學家、學科專家和教育測量學專家共同完成。(3)根據已經確定的屬性和屬性層級關系選擇適當的模型,如規則空間模型就是一種。(4)預測驗與正式測驗,獲取模型參數。(5)診斷結果報告和有針對性的補救教學措施的制作。

認知診斷測評技術的發展使形成性評價的實施得以可能。在課程改革的背景下,教育的主題是關心人的發展,全面提高人的素養,同樣,學業測評的功能也就從過去關注結果的評價逐漸轉向注重過程的評價,強調通過評價改進教學活動,促進學生發展。“為了學習的評價”(Assessment for Learning,AFL)理念就應運而生,其核心目的是促進學生的學習,同時,該理念還提出了教育政策制定者過于強調大尺度教育評價對教育的影響而忽視了課堂上的評價。事實上,過程性評價是課堂上應該選擇的最有效的評價方式,因為,在課堂教學活動過程中,為了促進教學活動而不是鑒定學生能力,教師和學生需要共同對學習過程進行監控和評價。這樣,教學活動得到及時反饋,教師可以根據評價結果來調整教學;同時,學生得到學業評價的反饋,也提高了學業監控能力。

五、學業測評技術的理論發展與反思

通過心理測量理論的歷史發展這條主線,對其在學業成就測評中的應用進行回顧,體現了測量理論在學業成就測評中的意義與價值,同時,這也體現了學業成就測評的測量學取向。從經典測量理論下學業成就測驗對知識的測查,到項目反應理論下學業成就測驗對能力的靜態刻畫,再到認知診斷理論下學業成就測驗對能力的動態診斷,從而使教育者從反應行為的面紗下揭開能力的形成過程,對學生能力能進行更好的診斷、評價以及實施補救性的個性化教學。從學業成就測評的測量學取向的發展來看,隨著認知科學、教學研究和心理統計學的發展,以認知理論為基礎的新的測量方法和測驗設計方法也會得到進一步發展,從而更好地指導學業成就的測評工作。

在對測評理論發展趨勢的展望下,我們也應該有所反思。傳統的學業測評中,更多地強調對學生學業水平和能力的衡量,但是認知診斷技術的發展趨勢告訴我們,對學業的測評不僅僅是為了對學生進行考量,更應該是對教師改進教學質量提供信息,為教育質量的提高提供信息。另外,增值性評價的提出,提倡學生本身的縱向比較,更關注學生個體的發展與提高,使教育更人性化。這也更順應了《基礎教育課程改革綱要(試行)》中指出的,改革課程評價過分強調甄別和選拔的功能,發揮評價促進學生發展、教師提高和改進教學實踐的功能。

參考文獻

[1] Lewis R Aiken.心理測驗與考試——能力和行為表現的測量.張厚粲,譯.北京:中國工業出版社,2002.

[2] 辛濤.新課程背景下的學業評價:測量理論的價值.北京師范大學學報(社科版),2006.

[3] 柴彩霞.7~9年級數學成就測驗的初步編制.湖南師范大學,2005.

[4] 辛濤.項目反應理論研究的新進展.中國考試,2005(7).

[5] 余娜,辛濤.規則空間模型的簡介與述評.中國考試,2007(9).

[6] Tatasuoka K K..Rule space an approach for dealing with misconceptions based on item response theory.Journal of Education Measurement,1983,28(4).

[7] Tatasuoka K K.Rule.A paper presented at theCDT workshop in 2005,Beijing China.

(責任編輯 關燕云)

猜你喜歡
成就理論測量
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
了不起的成就
今日農業(2021年2期)2021-11-27 19:19:53
神秘的混沌理論
理論創新 引領百年
相關于撓理論的Baer模
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
失戀“成就”的CEO
華人時刊(2017年13期)2017-11-09 05:39:16
回顧五年成就
主站蜘蛛池模板: 伊人天堂网| 日韩人妻少妇一区二区| 日韩乱码免费一区二区三区| 免费国产高清精品一区在线| 亚洲三级色| 91精品免费高清在线| 久久夜色精品国产嚕嚕亚洲av| 日本色综合网| 国产乱子伦手机在线| 精品无码人妻一区二区| 亚洲中文字幕国产av| 欧美国产精品不卡在线观看| 日韩少妇激情一区二区| 国产精品三区四区| 亚洲 欧美 日韩综合一区| 日本道综合一本久久久88| 日本高清在线看免费观看| 九九线精品视频在线观看| 午夜视频www| 亚洲av色吊丝无码| 精品少妇人妻无码久久| 国产美女无遮挡免费视频网站| 欧美精品H在线播放| 亚洲国产亚综合在线区| 国产香蕉一区二区在线网站| 久久精品娱乐亚洲领先| 日日拍夜夜操| 国产精品美女网站| 一级毛片高清| 国产精品美女网站| 亚卅精品无码久久毛片乌克兰| 国产免费羞羞视频| 欧美精品三级在线| 秋霞一区二区三区| 国产午夜福利片在线观看| 99这里精品| 亚洲一本大道在线| 在线网站18禁| 国产成人欧美| 激情六月丁香婷婷| 国产精品自在线拍国产电影 | 亚洲精品在线91| 亚洲一区网站| 亚洲色图欧美在线| 国产精品三区四区| 亚洲swag精品自拍一区| 日本午夜视频在线观看| 久久国产亚洲偷自| 亚洲精品视频网| 日日噜噜夜夜狠狠视频| 国产在线观看第二页| 国产一级毛片在线| 日韩成人免费网站| 国产电话自拍伊人| 亚欧美国产综合| 欧美高清国产| 久久久久亚洲AV成人网站软件| 国产特级毛片| 亚洲日韩每日更新| V一区无码内射国产| 久热re国产手机在线观看| 色噜噜狠狠狠综合曰曰曰| 青青草原国产精品啪啪视频| 精品国产Av电影无码久久久| 日本黄色a视频| 九色视频线上播放| 中文字幕亚洲乱码熟女1区2区| 亚洲区一区| 亚洲精品自产拍在线观看APP| 日本亚洲最大的色成网站www| 制服丝袜一区二区三区在线| 在线无码av一区二区三区| 99久久婷婷国产综合精| 亚洲成人精品在线| 人人艹人人爽| 国产精品不卡片视频免费观看| 久久夜色精品国产嚕嚕亚洲av| 亚洲欧美成人在线视频| 午夜国产大片免费观看| 园内精品自拍视频在线播放| 99热这里都是国产精品| 视频一本大道香蕉久在线播放|