999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

IRT在體育學習成果測評領域中的應用及其對我國體育中考的啟示

2021-08-26 04:18:27何毅董國永
體育學刊 2021年4期
關鍵詞:中考體育評價

何毅 董國永

摘?要:對項目反應理論(IRT)在美國體育學習成果測評體系(PE Metrics)中的應用進行解析,并提煉了基于IRT的PE Metrics測評體系表現特征。研究認為,IRT在PE Metrics中的應用主要體現在基于測驗等值技術的數據采集設計、利用多層面Rasch模型進行參數估計、通過標定與校準建立體育學習成果測評題(項目)庫等方面。在IRT方法和技術的支持下,PE Metrics具備測評項目及量規的難度參數恒定且分布均勻、不同運動項目的測評結果可進行交流、學生能力估計的精確性、測評項目開發的動態性和可延續性等特征。在此基礎上,提出完善我國體育中考測評體系的應然之策,主要包括:廣泛納入“真實性”運動技能測評內容,突破體育中考的“應試化”桎梏;利用測驗等值技術,實現體育中考運動技能測評分數的可比性;研制參數詳實的測評工具,提高體育中考分數的精確性和區分度;建立動態體育中考題(項目)庫,不斷豐富和完善體育中考測試內容。

關?鍵?詞:學校體育;體育學習成果測評;體育中考;項目反應理論

中圖分類號:G807?文獻標志碼:A?文章編號:1006-7116(2021)04-0094-07

Abstract: This paper analyzes the application of IRT in PE metrics of American sports learning achievement evaluation system, and refines the performance characteristics of PE metrics evaluation system based on IRT. The research shows that the application of IRT in PE metrics is mainly reflected in the design of data collection based on test equivalence technology, parameter estimation by using multi-level Rasch model, and the establishment of test (item) database of physical education learning achievements through calibration and correction. With the support of IRT method and technology, PE metrics has the characteristics as follows: constant and uniform distribution of difficulty parameters of evaluation items and rubrics, communication of evaluation results with different sports items, accuracy of students' ability estimation, and dynamic and continuity of development of evaluation items. On this basis, this paper puts forward the corresponding measures to improve the evaluation system of China's physical education examination for high school, which mainly includes: widely introducing the "authenticity" sports skills evaluation content, breaking through the "exam oriented" shackles of physical education examination for high school; realizing the comparability of sports skills evaluation scores by using test equivalent technology; developing the test instruments with detailed parameters in order to improve the accuracy and differential degree for the scores of physical education examination for high school, and establishing a dynamic database of physical education examination programs (items) to constantly enrich and perfect the contents of the physical education examination.

Key words: school physical education;physical education learning achievement evaluation;physical education examination for high school;item response theory

2020年8月體育總局與教育部聯合印發的《關于深化體教融合 促進青少年健康發展的意見》和2020年10月中共中央辦公廳、國務院辦公廳印發的《關于全面加強和改進新時代學校體育工作的意見》提出:“將體育科目納入初、高中學業水平考試范圍。改進中考體育測試內容、方式和計分辦法,科學確定并逐步提高分值。”[1-2]由此可見,隨著體育在學校教育中地位不斷提升,學生的體育考試成績將不再是無關緊要的分數,而是更有可能成為學生綜合素質評定甚至是中高考的重要組成部分。與此同時,在體育考試逐漸演變為“高利害”測試的背景下,體育考試分數必然會成為學生、學校和社會關注的焦點。因此,如何確保體育“高利害”測試的科學性、合理性和公平性成為決定我國體育考試制度有效實施的關鍵所在。然而,從現階段我國體育中考實施效果來看,雖基本滿足體育“高利害”測試的制度要求,但仍存在爭議,有待進一步完善,如“應試化”傾向嚴重、評分標準區分度不足、項目設置不盡合理等[3]。究其原因,現階段我國體育中考的測評方法和技術難以滿足體育“高利害”測試的科學性、合理性和公平性需求,成為掣肘體育中考測試內容選擇、測評方式改進和計分辦法更新的重要因素。

現階段我國大部分地區體育中考的測量標準和工具均是以經典測量理論(Classical Test Theory,CTT)為基礎而構建的,因此難以克服其理論體系的先天局限性,如弱或差的信效度控制、孤立的測試開發、評價結果無法進行交流等[4]。為了克服CTT的局限性,一種新興的測量理論——項目反應理論(Item Response Theory,IRT)逐漸發展起來。基于IRT設計的標準化測驗不僅在理論上更加符合測量原理,同時也具有更大的解決實際測量問題的潛力,因此在現代心理和教育測量領域得到了廣泛應用[5]。然而,在當前我國體育學習成果測評領域,IRT的研究與實踐應用不足,在一定程度上限制了我國體育測量特別是體育中考測評改革與發展的推進步伐。美國國家運動與體育教育協會(National Association for Sport and Physical Education,NASPE)研制推出的體育學習成果測評體系——PE Metrics(簡稱PEM)正是以IRT為基礎,充分利用現代測量理論與方法的優勢,突破傳統體育學習成果測量的局限性,在體育學習成果測量實踐中取得顯著效果,為強調問責與改進的美國學校體育作出了突出貢獻。實踐證明,PEM不僅獲得了體育教師的廣泛認可,同時也是體育科研人員較為信賴的大范圍體育學習成果測評工具[6]。它山之石,可以攻玉。本研究從研制方法和技術層面深入剖析IRT在美國PEM測評體系中的應用,總結歸納基于IRT的PEM的表現特征,并針對我國體育中考所面臨的現實困境,提出完善我國體育中考測評的應然之策,為進一步推進我國體育中考改革助益。

1?基于IRT的PEM研制

PEM是針對美國K-12年級的以標準為參照的體育學習成果測評體系。NASPE成立的評價工作組(Assessment Task Force,ATF)依據美國國家體育課程標準(以2013年版為例)的5個領域目標,開發涵蓋了兩個維度的評價內容,即針對標準1的運動技能評價和針對標準2~5的認知評價。對于標準1統領的運動技能評價,ATF根據不同評價(運動)項目或任務制定了詳細的評價量表,每份量表中均包含有表現性指標、評價任務、評分量規和評價方案、設備或材料、空間或位置圖等內容,評價者依據評分量規對學生在評價任務中的表現進行打分,而評價方案、設備或材料、空間或位置圖等則主要用于評價過程中對學生和評價者的詳細指導;對于標準2~5所涵蓋的知識、概念和態度,因為難于將其操作化,ATF最終決定采用紙筆測驗形式對學生進行考核[7]。此外,ATF還開發了網絡在線平臺PEM在線(PE Metrics online),其主要功能包括:為評價者提供更加直觀的視頻指導,幫助評價者提高評分準確性和操作熟練程度;提供已開發或后續開發的評價工具;幫助評價者錄入、分析和解釋評價結果,為評價的利益相關者提供反饋信息[8]。

1.1?IRT—PEM研制的理論基礎

CTT作為歷史上第一個測驗理論,經過多年探索與發展已經形成了一套較為完整的理論體系,是過去測量實踐中使用較為廣泛的理論模型。然而,CTT也存在著無法克服的先天缺陷,包括無法區分各類測量誤差、樣本依賴性、能力量表與難度量表的不一致性等[9]。20世紀50年代,在分析和克服CTT自身不足和缺陷的基礎上,加之電子計算機的普及與發展,一個更加復雜、統計效率更高的測量理論模型——IRT應運而生。

IRT的主要內容是通過數學函數揭示被試者在測驗項目上的反應行為與被試者潛在特質之間的關系。這種關系函數表達式,即項目特征曲線解析式,被稱為IRT各種模型的項目反應函數[10]。常用的IRT模型有正態卵形模型,單、雙、三參數Logistic模型,其中單參數Logistic模型也被稱Rasch模型。在實際應用中,通過這些模型對測驗分數進行統計調整,能有效解決測量實踐中測驗分數等值、項目參數估計和誤差控制等問題。隨著IRT模型的不斷豐富和擴展,其逐漸實現了對人格特質、潛在能力、行為意向、情景評價等多種目標的測量。如今,IRT已成為教育領域幾項重要測驗的基石,如美國研究生入學考試(GRE)、學術評估測試(SAT)以及中國大學生英語水平測試(CET)等。

IRT的測量優勢主要體現在以下幾個方面:第一,題目參數的不變性。IRT的題目參數估計是獨立于考生樣本的,即題目難度不會因為抽樣學生能力水平的高低而變化;第二,題目參數與能力參數的一致性。項目反應理論將項目難度和被試者能力置于同一尺度,使用共同的Logit單位;第三,誤差控制的精確性。在測驗中,不同能力或得分有其不同的概率誤差。項目反應理論通過提供題目信息函數和測驗信息函數兩個統計量,控制不同能力水平被試者的測量誤差,從而更精確地估計每個考生的能力水平[11]。總體而言,IRT具有諸多CTT所不具備的優勢,是現代心理和教育測量實踐中最受歡迎的測量理論之一。

1.2?IRT在PEM研制過程中的應用

1)基于測驗等值技術的數據采集設計。

在教育和心理測量實踐中,往往需要通過多種測驗形式來測量同一知識結構或心理品質,為了使不同測驗形式的分數建立在同一尺度之上,進而比較不同測驗形式中受試者的能力水平,就需要對測驗分數進行等值處理。因此,測驗等值對于測驗結果的可比性、保證測驗的公平性具有重要意義。當不同測驗形式分別施測于不同被試組時,等值需要完成參數量表的變換,即將不同被試群體的參數標刻在同一參數量表之上,而實現變換的前提是不同測驗形式必須有公共測驗題(項)目相關聯,即鉚測驗-非等組設計。因此,ATF在全國性數據采集中使用了水平和垂直等值設計,其包含共同項目(試題)和連接項目(試題)。共同項目用于校準同一年級中不同項目,而連接項目用于關聯不同年級之間項目。共同項目和連接項目的選擇并不是事先預定的,而是根據試點測試階段數據的常規項目分析結果決定。其中,共同項目是在常規項目分析結果中顯示出良好區分度的項目,連接項目則是根據難度水平進行選擇,如“原地運球”和“單腳跳”是幼兒園評價中的共同項目,“滑步”和“用拍擊球”是用于連接幼兒園和2年級之間的連接項目[12]。可以看出,在基于IRT的測驗等值技術指導下ATF制定了科學合理的數據采集方案,為后續項目分析與校準奠定基礎。

2)利用多層面Rasch模型進行參數估計。

ATF在不斷對測評(項目)進行修改和完善后,利用廣泛的項目管理網絡從全國各地進行數據采集,以進行后續數據分析和校準。具體而言,ATF專門雇傭評分人員根據測試錄像和評分量規對學生運動表現進行評分[13]。評分數據使用傳統的和基于IRT的兩種方式進行分析。首先采用描述性統計分析,對數據中的異常值或打字錯誤進行篩選、識別和刪除;然后計算項目反應頻率,以及每項評價的平均值和標準偏差;最后,使用多層面Rasch模型分析不同測評項目、評分量規和學生能力水平。多層面Rasch模型是經過拓展的Rasch模型之一,其主要作用在于通過被試者在題(項)目上作出特定反應概率來計算個體能力和題(項)目難度。評分數據的多層面Rasch分析是通過FACETS軟件完成的,其報告結果包括項目及量規難度、學生能力水平、殘差均方和加權后的殘差均方。項目及量規難度值和學生能力水平值均以logit為單位,這也實現了題目難度與學生能力水平的參數估計及校準。ATF的統計分析結果表明,PEM的采集數據與模型擬合良好,量規及評價項目難度等分布均勻[12]。

3)通過標定與校準建立體育學習成果測評題(項目)庫。

在數據分析過程中,ATF首先對特定年級的評分數據進行分析并錨定,再分析其他年級評價項目的統計數據。如在運動技能評價(項目)構建中,首先分析2年級的評分數據,然后在2年級的尺度上對其他年級數據進行分析,最終將所有年級的量規及項目都標定在同一尺度之上。事實上,PEM的構建正是遵循了題庫開發的基本程序,在將所有測評題(項)目和量規都置于同一尺度之后,就形成了一個包含不同項目及其相關統計資料(如難度)的體育學習成果測評資源庫。從PEM的研制流程和成果發布可以看出,題庫建設并不是一蹴而就的,而是一個動態的持續不斷的過程。如在PEM的研制過程中,ATF首先發布了針對小學階段的運動技能測評工具[14],隨著測評項目和測試工作的逐步完成,NASPE又陸續發布了小學和中學階段的運動技能和認知測評工具[15],由此逐步構建中小學體育學習成果測評體系PEM的基本框架。此后,通過IRT的標定和校準,ATF不斷地豐富和完善測評工具與內容,最終形成了一個資源豐富、交互共享的K-12年級體育學習成果測評題(項目)庫。

2?基于IRT的PEM表現特征分析

2.1?測評項目及量規的難度參數恒定且分布均勻

在以CTT為基礎的測量實踐中,對于項目難度、區分度等參數的估計是根據測試樣本獲得的,因此,樣本代表性直接影響著參數值的大小。以難度參數而言,對于同一個測驗項目,若測試樣本的整體水平較高,就會過低地估計項目難度值;若測試樣本的整體水平較低,則會過高地估計項目難度值。相反,在IRT中難度被認為是題(項)目的固有屬性,其估計得出的參數不受樣本能力水平的影響,即參數不變性。PEM正是利用了IRT的這一特性,準確估計出評價項目及量規的難度參數值,很好地解決了樣本依賴性問題,從而確保評價工具的有效性和可靠性。此外,在PEM的構建過程中,ATF經過多次實地測試和項目分析,并根據分析結果對測評(項目)進行修改,其目的在于確保項目及量規的難度參數適當,即既要保證項目及量規難度范圍的廣度,也兼顧其難度參數的連續性。在實際應用中,由于測評項目及量規是恒定的并且是已知的,教師或研究人員可以根據評價目的和意圖形成測驗。例如,若想了解學生的整體能力水平,那么就可選擇難度范圍較廣的測評項目;若想構建標準參照類型的測試(如資格證考試),則可選擇與截至分數(或標準)難度相當的測評項目。

2.2?不同運動項目的評價結果可進行交流

PEM包含兩個維度的測評內容,即針對標準1的運動技能測評和針對標準2~5的認知測評。其中,標準1引領的運動技能測評中包含多個運動項目或任務,彼此之間的內容也大不相同。在CTT中真分數的意義僅僅限于一組特定的測評項目,因此無法建立不同運動技能測評結果之間的聯系,這也進一步限制了測評項目的豐富和測評結果的應用。相對而言,基于IRT的等值技術為這一問題提供了很好的解決途徑。在PEM的構建過程中,ATF利用Rasch模型進行校準,使所有項目、量規及學生能力置換于同一量表之上,進而使得不同項目之間、不同量規之間、項目及量規與學生能力之間可以進行比較,很好地解決了不同測驗版本之間的等值問題。如在PEM中,參加籃球運動項目測評的學生成績可以直接和參加排球運動項目測評的學生成績進行比較,但前提是需將學生在量規上的得分轉換為“能力分數”。

此外,評價分數可進行比較的另外一個好處就是,可以測量學生成績的變化和增長。如某學生在2年級時參加“立定跳遠”項目測評,但隨著該學生年級升高和教學內容及難度變化,其在5年級須參加“體操”項目測評,這種情況下通過PEM依然可以比較學生隨著年級變化的能力水平。評價結果可進行交流這一特性使得PEM具備應用于大規模標準化運動技能測試的潛力,確保了大范圍評價分數的統計學意義,這也是PEM逐漸開始應用于體育科研領域的重要原因之一。

2.3?學生能力估計的精確性

傳統體育學習成果測評方式是以常模參照為基礎的,這就意味著只能通過將個人成績與常模團體進行比較,進而判斷個體在團體中的相對位置和名次,但無法準確判斷學生學習目標的達成情況。相較而言,標準參照評價更加關注個體對知識和技能掌握的真實情況,是一種以過程性評價為主,過程性評價與終結性評價相結合的評價范式。因此,標準參照評價可以更準確診斷學生的學習成果。在PEM構建過程中,ATF通過解析“課程標準”,撰寫具有可操作性的表現性指標和評價量規,進而開發出相應的測評內容和方式,其目的在于構建標準參照的體育學習成果測評體系,即PEM。此外,在形成測評題(項目)庫之后評價可以選擇與學生能力相當的評價項目,進而精準定位學生的能力水平。

實際上,為了確保測評結果的精確性和可靠性,ATF在PEM的構建過程中做了大量工作。如在測評項目及量規的參數估計過程中,ATF通過不斷測試、反饋及修訂,確保測評項目及量規難度參數的連續性,從而為評價者提供更加精確的學生能力水平信息。此外,為了檢驗PEM測量準確性,ATF成員還對測驗中所需最少的測評項目數量這一問題進行驗證。結果表明:當PEM用于“高利害”測試時,應當使用至少兩個測評項目精準定位學生能力;而在教學實踐中,依然可以使用單一測評項目去確定學生的運動水平,只是需要教師更加謹慎地對結果進行解釋[16]。

2.4?測評(項目)開發的動態性和可延續性

基于IRT的題庫建設是現代教育測量領域的主流趨勢,并在各個學科領域得到了廣泛應用。雖然PEM根據課程標準的年級水平劃分包含各個年級特有的測評項目,但從本質上來說,在將所有評價項目置于同一尺度之后,年級水平僅僅起到參考作用,而整個測評項目所組成的項目庫才是其實質所在。換言之,評價者不一定需要局限于從特定年級的評價項目中選擇測評工具,而可以從整個題(項目)庫中選取合適測評工具。除此之外,題庫建設實現了測評(項目)開發的動態性和可延續性。過去以CTT為基礎的測量實踐中,因其信效度和誤差控制問題,大多測試都是孤立開發的,無法對其進行改進和完善。而在PEM中,通過對評價項目及量規進行標定和校準,從而使所有評價項目都置于同一尺度,在后續也可以依照已有項目尺度增添新的測評項目。實際上,從PEM的研制流程及成果發布上也可以看出其評價開發的動態性和可延續性特征。由于測評體系研制是一個極其復雜又耗費資源的過程,特別是在需要進行全國性測試和數據采集的情況下,ATF通過將研制任務階段化,即在開發小學標準1測評項目之后繼而開發中學測評項目,逐步實現對測評題(項目)庫的構建。

3?對我國體育中考的啟示

多年來體育中考為我國學校體育發展帶來的積極效應顯而易見,而且體育中考經過多年改革與發展,在不斷實現自我完善的同時,也為各學段學生綜合素質評定中體育評價及體育高考積累豐富和寶貴經驗,進一步推進了我國學校體育評價與考試制度的改革與發展步伐。事實上,雖然我國在體育中考改革與發展進程中積累了一定經驗,但在體育中考實踐中存在一些問題或不足,亟待進一步解決和完善。如體能性、碎片化的考試內容致使體育中考的“應試化”傾向嚴重;評分標準的科學性、公平性欠缺,體育中考分數的真實性和有效性大打折扣;體育中考與學校體育課程教學缺乏有效銜接,“考什么,教什么”使得課程標準的效力削減等[18]。簡言之,體育中考處于“風口浪尖”的重要原因是其考試性質發生了根本性改變,即由水平性考試轉變為選拔性考試,而沿用傳統測量技術、考核方式、評分標準等內容顯然很難滿足選拔性考試需要,其結果必然導致體育中考的部分功能難以顯現或缺失。因此,在體育中考上升為國家戰略且具有法律效應的既定事實下,改進與更新傳統體育中考的測評方式、評價內容和計分標準等具體操作,是完善我國體育中考制度、推進體育中考改革與發展的關鍵。因此,我國體育中考應借鑒美國PEM的成功經驗,充分利用現代測量理論IRT的方法和優勢,突破傳統體育學習成果測評的現實困境,以建立科學、合理和公平的體育考試制度。

3.1?廣泛納入“真實性”運動技能測評內容,突破體育中考的“應試化”桎梏

2020年10月中共中央、國務院印發的《深化新時代教育評價改革總體方案》指出:“改進中考體育測試內容、方式和計分辦法,形成激勵學生加強體育鍛煉的有效機制。”可以看出,體育中考不僅是對學生體育學習效果進行總結性評價,而是希望成為促使學生養成良好鍛煉習慣進而提升體質的長效手段。然而,近年來隨著體育科目分值在中考成績中的比重逐年提升,體育中考中的“異化”和“應試化”現象也越來越嚴重,關于體育中考中“吃藥”“潛規則”“考前突擊”等事件的報道屢見不鮮[19]。究其原因,體育中考的項目設置及測試內容不盡合理。如目前各省市中考體育測試項目中技能項目明顯少于素質項目,且部分技能項目也僅僅是單個動作考試(如籃球投籃、足球顛球),忽視體育運動的技能性、情境性特點[20]。單一化和機械性的考試內容使得學生、家長和學校能夠通過短時間集訓“應對”體育中考,使得正常體育教學秩序也受到嚴重干擾,成為“應試教育”的附庸產物[21]。

美國PEM以IRT為指導,基于課程標準構建運動項目測試表現性指標體系,開發豐富多樣的“情境性”運動技能測評方案,進而實現對體育運動技能的“真實性”評價,極大地弱化了測評的“應試化”傾向。因此,我國體育中考應廣泛納入“真實性”運動技能測評內容,基于課程標準的目標體系構建統一的運動技能表現性指標體系,據此開發種類豐富的運動技能測評任務或方案,以突破體育中考的“應試化”桎梏,促進學生體育鍛煉習慣和終身體育思想的養成,使學生真正掌握一至兩項運動技能,提高學生的運動興趣和鍛煉參與熱情,最大限度發揮體育中考對學生身心健康發展的長期效益。

3.2?利用測驗等值技術,實現體育中考運動技能測評分數的可比性

當前,我國各地區體育中考均含有對學生運動技能模塊考核,學生選考一至兩項運動技能項目計入總分,主要包括排球墊球、排球發球過網、籃球運球、1分鐘運球投籃、足球運球等內容[22]。暫且不論某一基本技術是否能夠代表學生真正掌握這項運動,單從評分標準和計分規則來看,便很難真正體現體育中考的科學性和公平性。如2020年10月云南省公布的《初中生體育考試專項技能考試內容及分值》中,七年級足球顛球的0.5分與籃球30秒原地定點雙手胸前傳球的0.5分是否可以等同?相同分數是否意味著難度相同或者說學生需要付出同等時間和精力?隨著年級增長,同一項目得分越高是否代表著學生運動能力增強?顯然,在沒有經過科學論證的情況下以上問題很難給予肯定答案。實際上,在以CTT為基礎的真分數模型中,受試者能力量表與評價項目難度量表不一致,實測分數并不處于等距量表之上,且由于其對于樣本的依賴性很難建立“平行測驗”。因此,即使是對同一能力的考核,兩個測驗分數也難以進行比較。簡言之,以真分數模型為基礎的體育中考測驗中,既不能將不同運動項目的測驗分數進行橫向比較,也不能將同一項目的不同測驗分數進行縱向比較。簡單的分數疊加和對比不僅削弱了體育中考測驗的科學性和公平性,同時也無法提供更多大范圍反饋和改進信息,由此更進一步加深了體育中考的“終結性”意蘊。

如前所述,測評體系的構建是一項極其復雜而又專業的工作,必須按照規范化、標準化和科學化的操作流程進行。因此,我國體育中考應以省、自治區為單位,在確定測試內容后進行大范圍試驗和數據收集,利用測驗等值技術制定相應的評分標準和細則,實現體育中考分數的可交流性,進一步提升體育中考分數的科學性和公平性。

3.3?研制參數詳實的測評工具,提高體育中考分數的精確性和區分度

作為一種升學考試,體育中考的目的不僅在于“以考促練”,提高學生的運動參與和體質健康,還應當兼具考試所具有的競爭、選拔作用。因此,體育中考成績應有合理區分度且符合正態分布。若大部分學生都能獲得高分甚至滿分,顯然不會引起學生和家長的重視,無法體現體育中考的本質功能,最終極有可能導致體育中考流于形式。然而,調查結果顯示,部分地區或學校的體育中考合格率甚至是滿分率高達90%[23]。可見在人人都可拿高分的情況下,體育中考已然淪為“合格性”考試,其效果可想而知。反之,若體育中考分數的差異性和區分度不斷提高,其分數必然會引起學生、家長和社會的“錙銖必較”,由此便對體育中考分數的準確性提出更高要求。然而,在真分數模型中所測得的實測分數并不位于等距量表上,同一測試中被測學生必須置于被測對象團體中,根據相對等級和相對位置來評估其能力水平或評分,只有在施測能力水平與測驗難度相當的被試者時,才容易獲得比較高的測量精度。

以美國PEM以IRT為基礎,對ATF研制出的每一個評價工具進行參數估計,將個人能力與項目難度置于同一尺度,最終形成項目難度已知且分布均勻的評價工具庫,使得測評者可根據相應難度的測評工具準確定位學生能力,確保測評分數的區分度和精確性。實際上在我國其他學科測評領域,上述技術和方法已經得到運用并取得了突出效果。如大學生英語水平測試,測驗者根據難度系數選擇試題并形成測驗,不僅準確估計受試者真實英語水平,同時也保證每次測驗的難度一致。因此,隨著體育中考分值的不斷上升,精確估計學生體育學習成果和能力便顯得尤為重要。我國應充分利用現代教育測量理論的優勢,開發參數詳實的體育測評工具,確保體育中考測評分數的科學性、嚴謹性和精確性。

3.4?建立動態體育中考題(項目)庫,不斷豐富和完善體育中考測試內容

我國體育中考對于正常體育教學秩序的沖擊是不言而喻的,這不僅是由于“體能性”“應試化”的測評內容和方式使得體育教學淪為“訓練課”,更體現于中考測試內容對體育教學內容選擇的束縛。當前我國各省、市公布的體育中考測試內容明顯少于《義務教育體育與健康課程標準(2011年版)》中水平目標所要求和涉及的內容。進一步調查發現,為了“備戰”體育中考部分學校只會開設中考體育測試內容所包含的體育課程,不僅限制了學生體育學習內容的可選范圍,不利于提高學生體育學習興趣和動力,而且降低了《義務教育體育與健康課程標準(2011年版)》對于體育教學的指導意義和價值,很可能導致體育“新課改”多年積累的成果付之一炬。此外,在實施健康中國戰略背景下,無論是以《健康中國2030》政策為代表的宏觀設計,還是體育與健康課程標準的中觀指引,亦或是學生個人對健康的微觀訴求,均體現出新時代國家和人民對健康的重視程度。現階段,體育與健康課程作為我國健康教育實施的重要平臺和載體,體育中考理應納入對學生健康能力和知識的考核,以此促進學生健康知識的儲備和健康生活方式的養成。

實際上,在以CTT為基礎的測量實踐中,因其信效度和誤差控制的問題且大多數測試都是孤立開發的,故很難對其進行后續改進和完善。美國PEM在IRT技術和方法的支持下,遵循題庫開發的基本程序和方法,構建內容豐富、科學合理的體育學習成果測評題(項目)庫,不僅確保測評項目和內容開發的動態性和可持續性,更實現了對題(項目)庫測評工具的不斷改進和更新。因此,我國體育中考應遵循題(項目)庫開發的基本原理和方法,建立體育中考項目庫,不斷豐富和完善體育中考測試內容,滿足學生對不同運動項目的學習需求,使得“考什么練什么”轉變為“練什么考什么”,提高學生體育學習興趣和動力。同時,也應建立體育中考試題庫,采用紙筆測試形式納入對學生健康知識儲備和健康素養的考核,以此促進學生健康生活方式的養成,為深入貫徹落實“新課改”和“健康中國”戰略的理念和要求助力。

隨著國家和社會對于青少年身心健康問題越來越重視,體育在學校教育中的地位不斷提升,各層次、各學段體育考試將成為國家和社會獲取體育教學質量有效信息及問責的重要參考指標。鑒于體育中考的制度要求和實踐問題,在體育考試“高利害”性越來越突出的背景下,如何構建科學合理的體育中考測評體系是完善我國體育考試制度的必要前提和必由路徑。現階段我國可借鑒國外優秀經驗,充分利用現代測量理論的優勢,突破傳統體育學習成果測評的現實困境,彌補我國體育學習測量領域的缺陷和不足。在此基礎上,還須立足于本土實際,在實踐中積極探索體育中考的新方法、新技術、新路徑,不斷更新和改進體育中考的測試內容、測評技術和計分辦法,以建立更加科學、更加合理、更符合現代教育發展趨勢的體育學習成果測評體系,為進一步完善我國體育考試制度提供充分經驗與技術支持。

參考文獻:

[1] 中華人民共和國教育部. 關于印發深化體教融合 促進青少年健康發展意見的通知[EB/OL]. (2020-08-31)[2020-11-20]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1779/202009/t20200922_489794.html.

[2] 中華人民共和國教育部. 中共中央辦公廳 國務院辦公廳印發《關于全面加強和改進新時代學校體育工作的意見》和《關于全面加強和改進新時代學校美育工作的意見》[EB/OL]. (2020-10-15)[2020-11-25]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/t20201015_494794.html.

[3] 李小偉,劉亦凡. 中考體育如何在阻力中前行[J]. 人民教育,2020(Z3):99-101.

[4] ZHU W,RINK J,PLACEK J H,et al. PE Metrics:Background,testing theory,and methods[J]. Measurement in Physical Education and Exercise Science,2011,15(2):87-99.

[5] 盧榮偉. 項目反應理論在大規模考試試題分析中的應用[J]. 統計與管理,2017,32(10):50-52.

[6] CHEN W,HAMMOND BENNETT A,HYPNAR A. Examination of motor skill competency in students:Evidence-based physical education curriculum[J]. BMC Public Health,2017,17(1):222-229.

[7] Society of Health and Physical Educators. PE Metrics:Assessing student performance using the national standards & grade-level outcomes for K-12 physical education[M]. 3rd ed. Champaign:Human Kinetics,2018.

[8] 何毅,董國永. 美國PEM體育學習評價體系研究[J]. 首都體育學院學報,2018,30(6):537-541.

[9] 杜文久. 高等項目反應理論[M]. 北京:科學出版社,2014.

[10] 戴海琦,羅照盛. 項目反應理論原理與當前應用熱點概覽[J]. 心理學探新,2013,33(5):392-395.

[11] 鄭日昌. 心理與教育測量[M]. 北京:人民教育出版社,2011.

[12] WEIMO Z,CONNIE F,YOUNGSIK P,et al. Development and calibration of an item bank for PE Metrics assessments:Standard 1[J]. Measurement in Physical Education & Exercise Science,2011,15(2):119-137.

[13] BENEDICT D,JUDITH H P,KIM C G,et al. Development of PE Metrics elementary assessments for national physical education standard 1[J]. Measurement in Physical Education & Exercise Science,2011,15(2):100-118.

[14] Society of Health and Physical Educators. PE Metrics:Assessing the national standards,standard 1:elementary[M]. Champaign:Human Kinetics,2008.

[15] Society of Health and Physical Educators. PE Metrics:Assessing national standards 1-6 in elementary school[M]. Champaign:Human Kinetics,2010.

[16] CONNIE F,WEIMO Z,YOUNGSIK P,et al. Related critical psychometric issues and their resolutions during development of PE Metrics[J]. Measurement in Physical Education & Exercise Science,2011,15(2):138-154.

[17] 吳鍵,袁圣敏. 1985—2014年全國學生身體機能和身體素質動態分析[J]. 北京體育大學學報,2019,42(6):23-32.

[18] 楊立遠. 體教融合背景下體育中考的歷史回顧、現實困境與發展出路——“體育中考”云學術工作坊綜述[J]. 體育與科學,2020,41(6):111-116.

[19] 斯涵涵. 瘋狂的應試體育,誰該“吃藥”[N]. 健康報,2017-07-13(002).

[20] 徐燁,朱琳. 體育中考的公平訴求及因應之策[J]. 武漢體育學院學報,2013,47(11):30-35.

[21] 周凰,古雅輝,劉昕. 中考改革背景下學校體育發展的熱效應與冷思考[J]. 北京體育大學學報,2017,40(7):68-75.

[22] 買佳,金光輝,董國永. 利益相關者視角下體育中考執行現狀及實施對策[J]. 體育學刊,2020,27(3):79-84.

[23] 常州中考. 常州市武進體育中考滿分率接近90%. [EB/OL]. (2020-06-07)[2020-11-09]. http://www.wljyyjy.com/ChangZhouZhongKao/364217.html.

猜你喜歡
中考體育評價
因式分解中考都考啥
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
提倡體育100分 也需未雨綢繆
甘肅教育(2020年2期)2020-11-25 00:50:04
伴你走進“旋轉”中考園
垂直平分線,中考怎樣考?
2016體育年
我們的“體育夢”
基于Moodle的學習評價
保加利亞轉軌20年評價
多維度巧設聽課評價表 促進聽評課的務實有效
體育師友(2012年4期)2012-03-20 15:30:10
主站蜘蛛池模板: 伊人色在线视频| 国产在线97| 亚洲无码视频喷水| 2021最新国产精品网站| 国产青榴视频| 91午夜福利在线观看精品| 无码aaa视频| 欧美在线精品怡红院| 青青草原国产| 亚洲国产成人久久77| 久久精品丝袜| 怡红院美国分院一区二区| 国产一区二区三区在线观看视频 | 免费看美女自慰的网站| 亚洲制服丝袜第一页| 亚洲IV视频免费在线光看| 国产杨幂丝袜av在线播放| 国产精品成人AⅤ在线一二三四| 最新加勒比隔壁人妻| 奇米影视狠狠精品7777| 日韩精品成人在线| 国产日本欧美亚洲精品视| 99精品高清在线播放| 四虎永久在线视频| 午夜福利在线观看成人| 91成人在线观看| 综合久久五月天| 欧美色伊人| 人妻丰满熟妇αv无码| 亚洲精品少妇熟女| 国产精品区视频中文字幕| 国产欧美日韩精品综合在线| 国产91色| 国产精品女人呻吟在线观看| 国产美女叼嘿视频免费看| 在线观看免费AV网| 国产精品久久久久久久久| 亚洲中文字幕手机在线第一页| 亚洲av片在线免费观看| 欧美a在线| 国产亚洲欧美在线视频| 亚洲VA中文字幕| 国产高清无码第一十页在线观看| 精品国产免费第一区二区三区日韩| 国产精品丝袜视频| 97在线观看视频免费| 国产午夜人做人免费视频中文| 欧美在线一二区| 色欲综合久久中文字幕网| 日本黄色不卡视频| 人妻少妇久久久久久97人妻| 成年免费在线观看| 亚洲国产成人麻豆精品| 国产玖玖视频| 国产视频a| 另类综合视频| 中文字幕日韩视频欧美一区| 久久精品aⅴ无码中文字幕| 亚洲精品福利视频| 91精品专区| 国产精品免费久久久久影院无码| 制服丝袜一区二区三区在线| 欧美成人手机在线观看网址| 成人午夜网址| 国产精品成| 青青草原国产av福利网站| 成人另类稀缺在线观看| 久青草网站| 精品久久人人爽人人玩人人妻| 青青青伊人色综合久久| 免费国产一级 片内射老| 婷婷丁香色| 国产精品亚洲一区二区三区z| 久久久噜噜噜久久中文字幕色伊伊 | 亚洲性视频网站| www亚洲天堂| 国产又粗又猛又爽视频| 最新国产精品鲁鲁免费视频| 国产在线观看91精品| 一级全黄毛片| 黄色网址手机国内免费在线观看| 伊人欧美在线|