




摘 """""要:基于新課改背景編制中小學體育教師評價素養量表,實現中小學體育教師評價素養的量化評價。運用文獻資料法厘定中小學體育教師評價素養的基本內涵和提出其核心要素,并據此采用專家咨詢法、數理統計法編制中小學體育教師評價素養初始量表;選取784名中小學體育教師(樣本1)的問卷進行項目分析、探索性因子分析;選取833名中小學體育教師(樣本2)的問卷進行驗證性因子分析、信效度以及恒等性檢驗;間隔4周后,對來自樣本2的120名中小學體育教師(樣本3)的問卷進行中小學體育教師評價素養量表信度重測。結果表明:中小學體育教師教學評價素養量表由評價知識、評價技能、評價態度、評價習慣、評價品格5個分量表構成,共22個題項。二階五因子結構模型各項擬合指標達到統計學意義;量表的內部一致性系數、重測信度系數、內容效度系數、收斂效度系數均介于標準值區間;量表具有跨性別、跨學段、跨地區的測量等值性。研究認為,中小學體育教師評價素養量表具有一定的科學性和可靠性,可以作為測量我國中小學體育教師評價素養的有效工具。
關 "鍵 "詞:學校體育;中小學體育教師;評價素養;體育與健康課程標準;量化評價
中圖分類號:G807.2;G807.3""""文獻標志碼:A """文章編號:1006-7116(2025)02-0114-09
Establishment of evaluation literacy scale for physical education teachers in primary and secondary schools and its reliability and validity test
GUO Hongliang1,"2,XU Weixin3,GUO Yongbo4,YU Yonghui5,YAO Lei2
(1.Postdoctoral Mobile Station,Beijing Sport University,Beijing 100084,China;2. School of Education,Beijing Sport University,Beijing 100084,China;3.College of Sports Science,Fujian Normal University,Fuzhou 350007,China;4.School of Physical Education,Guangzhou College of Commerce,Guangzhou 510320,China;5.Department of Physical Education,Renmin University of China,Beijing 100872,China)
Abstract:"Based on the background of the new curriculum reform, the evaluation literacy scale of primary and secondary physical education teachers was developed to realize the quantitative evaluation of the evaluation literacy of primary and secondary physical education teachers. The basic connotation and core elements of the evaluation literacy of primary and secondary physical education teachers were determined by the method of literature data, and the initial scale of evaluation literacy of primary and secondary physical education teachers was prepared by Delphi expert consultation and mathematical statistics. A total of 784 physical education teachers (sample 1) were selected for project analysis and exploratory factor analysis. The confirmatory factor analysis, reliability and validity, and identity test were conducted on the questionnaires of 833 primary and secondary school physical education teachers (sample 2). After an interval of 4 weeks, 120 primary and secondary physical education teachers from sample 2 (sample 3) were re-tested for the reliability of the evaluation literacy scale of primary and secondary physical education teachers. The results showed that the evaluation literacy scale of physical education teachers in primary and secondary schools was composed of 5 sub-scales, including evaluation knowledge, evaluation skill, evaluation attitude, evaluation habit and evaluation character. The fit indexes of the second-order five-factor structure model were statistically significant, and the internal consistency coefficient, retest reliability coefficient, content validity coefficient and convergence validity coefficient of the scale were all in the range of standard values. The present scale has the measurement equivalence of cross-gender, cross-school and cross-region. The conclusion suggests that the evaluation literacy scale of primary and secondary school physical education teachers is scientific and reliable, and can be also used as an effective tool to measure the evaluation literacy of primary and secondary school physical education teachers in China.
Keywords:"school physical education;primary and secondary school physical education teachers;evaluation literacy;physical education and health curriculum standards;quantitative evaluation
當前,培養中小學生的體育與健康核心素養已經成為我國基礎教育階段體育與健康課程與教學改革的重要方向。評價作為體育與健康課程教學的重要組成部分,是落實學生體育與健康學科核心素養的重要抓手。對此,教育部頒布的《普通高中體育與健康課程標準(2017年版)》(以下簡稱《課程標準2017年版》)、《普通高中體育與健康課程標準(2017年版2020年修訂)》(以下簡稱《課程標準2020年修訂版》)、《義務教育課程方案(2022年版)》(以下簡稱《課程方案2020年版》)、《義務教育體育與健康課程標準(2022年版)》(以下簡稱《課程標準2022年版》)、《基礎教育課程教學改革深化行動方案》(以下簡稱《行動方案》),均對中小學體育教師的教學評價賦予新的內涵要義和提出更高要求,使評價與教學、學習之間的共生關系得到前所未有的體現。然而,受傳統體育教學觀念的影響,部分中小學體育教師時常將評價置于教學活動之外[1];部分中小學體育教師在開展體育教學評價活動時,一方面,對學生體育學習的評價內容仍舊局限于運動技能和身體素質的發展與提高,并按照統一的評分標準對學生進行結果評價,最終以運動成績“論英雄”[2]。另一方面,為了提高體育教學評價的效率,不喜歡耗時費力卻具有人文關懷的評價方法[3],如增值性評價、表現性評價、檔案袋評價等。此外,在評價主體方面,教師擁有控制權和主導權,但學生的評價主體地位被弱化、評價權益被忽視[4]。顯然,以上問題的存在不僅無法滿足發展學生體育與健康核心素養的需要,同時也反映中小學體育教師評價素養的不健全。
中小學體育教師評價素養作為教師專業素養的重要組成部分,其高低直接決定課程改革能否切實有效地開展,決定課程改革目標在何種程度上可以實現[5-6]。因此,提高中小學體育教師評價素養尤為必要和迫切。中小學體育教師評價素養測評工具是揭示中小學體育教師評價素養發展現狀和現存問題、提出改進對策的有力抓手和有形標尺。因此,在發展體育與健康學科核心素養、體育教師評價素養亟待提升的多重背景下,研制嚴謹、適用、科學的中小學體育教師評價素養測評工具無疑具有重要的理論與現實意義。
1 "中小學體育教師評價素養的基本內涵與核心要素
1.1 "中小學體育教師評價素養的基本內涵
1991年美國教育評價專家斯蒂金斯[7]首次提出“評價素養”,并將教師評價素養界定為教師所應具備的基礎性教育評價知識和將這些知識運用到各種學生成就測驗中的技能。此定義將知識和技能作為教師評價素養的同時,主要體現“對學習進行評價”的評價取向。隨后越來越多的研究者將評價素養確認為教師專業素養的組成部分[8],并在斯蒂金斯定義的基礎上對教師評價素養進行多維界定。通過梳理大致可分為以下兩種觀點:其一,此類觀點在界定取向上,關注“評價促進學生的學習”。如Webb[9]指出:評價素養是關于評價學生所知、所能的方法類知識,怎樣解釋評價結果的知識,以及如何用評價結果提高教學效率以改善學生學習的知識。斯蒂金斯于2017年在原始定義基礎上提出,教師評價素養是指精確測量和報告學生學業成就的知識與技巧,使用評價過程和結果去改善學生學習[10]。其二,此類觀點關注評價促進學生學習的同時,一方面強調教師評價的發生場域,即教師主要針對學生的學習過程和結果進行評價;另一方面體現評價素養的多維性。如李順雨[11]指出,教師為了促進學生的學習,通過使用多種評價方法針對學生的學習過程和結果進行評價時所體現出的知識、技能、態度和價值取向的集合。鄭東輝[12]指出,教師評價素養是教師依據促進學習的評價理念開展學生評價所表現出來的關鍵能力和倫理品格。
由此可見,國內外學者對教師評價素養內涵的認識莫衷一是,爭論的焦點在于對評價素養屬概念、對教師評價發生場域和目的取向的認識。首先,就評價素養屬概念而言,從構詞法的角度來講評價素養屬于偏正短語,因此將中心語素養作為評價素養的屬概念是適切的。素養介入到教育領域中不再是簡單的文化認知,而是一個抽象的、多維的復雜概念,是知識、技能、態度、倫理等多方面結合在一起的整體表現[5]。其次,就評價發生場域而言:一方面,評價必須是貫穿于體育教學活動始終的,因為評價的即時性特點就決定“過程性”評價實為其本質;另一方面,核心素養導向的評價觀著重強調學生評價實踐活動的過程性與綜合性[12]。最后,從評價對于學習的目的來看有以下3種典型的取向,一是“對學習進行評價”,二是“為了學習的評價”,三是“作為學習的評價”[13]。其中,“對學習進行評價”是為了分等和報告,是學習之后對學習結果做出鑒定與區分,無助于學生的后續學習與改進,而“為了學習的評價”和“作為學習的評價”則是明確將評價作為教學的一部分來支持學習[13]。顯然,核心素養導向的評價實踐活動,要求教師所要堅持的是為了學習和作為學習的評價取向[12]。
綜上所述,本研究基于對評價素養屬概念、教師評價發生場域和目的取向的分析和理解,將中小學體育教師評價素養內涵界定為:中小學體育教師通過不斷學習和實踐而形成的,能夠對學生體育學習過程和結果進行評價且能夠通過評價促進學生體育學習所需具備的知識、技能、態度及品行的綜合表現。
1.2 "中小學體育教師評價素養核心要素
首先,中小學體育教師評價素養是教師專業素養的重要組成部分[5-6]。按照當前學界對教師專業素養結構的一般認識,其結構通常由知識、能力(技能)、態度(情意)、品格4個部分構成[14],這可以作為建構中小學體育教師評價素養核心要素的重要參考。
其次,追溯教師評價素養的研究歷程。國內外學者基于不同研究視角或采用不同研究思路對教師評價素養要素形成不同觀點,其演變軌跡主要從一維走向多維,即從斯蒂金斯最初提出的知識型[7]到后來的知識與技能型[8-9,13],再到現如今的知識、技能、態度(理念)[6,11-12]+倫理(品格)[12,15]、實踐力[16]、解釋力[16]、意識[12,16]等。但是細究發現,評價知識、評價技能、評價態度已經成為教師評價素養結構中的共有要素[15]。
最后,中小學體育教師評價素養的要素應當具有一定的靈活性和適應性,即必須要與新課改的要求保持一致。鑒于此,本研究結合《課程標準2017年版》《課程標準2020年修訂版》《課程標準2022年版》中的“課程理念”“評價建議”,《課程方案2020年修訂版》中的“課程實施”以及《行動方案》中的“重點任務”等諸多內容,凝練出符合中小學體育教師評價素養內涵的4個要素,即評價知識、評價技能、評價態度、評價品格。如就評價知識而言,《課程標準2017年版》在“評價建議”中明確要求教師知曉“評價的內容”即“圍繞運動能力、健康行為、體育品德”而評。于評價技能而言,《課程標準2022年版》在“評價建議”中提出“采用定量評價與定性評價結合、過程性評價與終結性評價結合......積極探索增值評價,健全綜合評價”的要求,《行動方案》將“提升教師教學評價能力”作為重要任務。于評價態度而言,《課程方案2022年版》在“課程實施”之“改進教育評價”一欄中,要求教師“重視并積極開展學習評價,倡導評價促進學習的理念”。于評價品格而言,《課程方案2022年版》在“課程實施”之“改進教育評價”中要求教師“嚴格遵守評價的倫理規范,尊重學生人格,保護學生自尊心”。此外,習慣理論認為,所有穩定的素養必然會通過習慣以思維或行動的方式外顯,習慣是素養的體現,也是形成素養的主要方式[17]。因此,評價習慣理應成為中小學體育教師教學評價素養的核心要素。而且,中小學體育教師具備良好的評價習慣即“每課一評”是對接體育課時預設目標是否達成、達成度如何及存在哪些問題的必要通道[18]。
綜上所述,基于對教師專業素養要素的借鑒、國內外教師評價素養文獻分析和比較,并結合新課改對中小學體育教師教學評價提出的新要求,本研究將評價知識、評價技能、評價態度、評價習慣和評價品格作為中小學體育教師評價素養的核心要素,并構成中小學體育教師評價素養量表的5個維度。
2 "研究對象與方法
2.1 "調查對象
樣本1:主要用于中小學體育教師評價素養量表的項目分析、探索因子分析。采用方便抽樣的方式,于2024年5—6月通過問卷星平臺(www.wjx.com)分別向北京、山東、廣東3個省市的中小學體育教師發放問卷,901份剔除無效問卷117份(測謊題答錯),有效問卷為784份,有效率為87.0%。其中,男性379人(48.4%),女性405人(51.6%),小學教師214人(27.2%),初中教師305人(38.9%),高中教師265人(33.8%),平均教齡7.2年。教育測量學指出量表開發所需的樣本量與觀測條目之比應為10∶1[19],中小學體育教師評價素養初始量表題項共為26個,因此樣本量符合要求。
樣本2:主要用于中小學體育教師評價素養量表的驗證性因子分析、信效度檢驗。采用方便抽樣的方式,于2024年7月通過問卷星平臺(www.wjx.com)分別向上海、福建、江蘇3個省市的中小學體育教師發放問卷978份,剔除無效問卷145份(測謊題答錯),有效問卷為833份,有效率為85.2%。其中,男性479人(57.5%),女性354人(42.5%),小學教師276人(33.1%),初中教師299人(35.9%),高中教師258人(31.0%),平均教齡6.1年。樣本量符合教育測量學要求。
樣本3:主要用于重測信度分析。采用方便抽樣的方式,時隔4周通過問卷星平臺(www.wjx.com)從樣本2中隨機選取120名中小學體育教師進行第二次正式測試。剔除無效問卷17份(測謊題答錯),有效問卷為103份,有效率為85.8%。其中男性59人(57.3%),女性44人(42.7%),小學教師39人(37.8%),初中教師38(36.9%)人,高中教師26人(25.2%),平均教齡7.6年。
2.2 "研究方法
專家咨詢法:本研究通過兩輪專家咨詢法最大范圍內征求、匯集學校體育學研究領域和體育教師發展研究領域的15位資深專家對初步編制的中小學體育教師評價素養量表評價指標及題項進行評估,其中教授11名,副教授4名,博士生導師11名,碩士生導師4名。兩輪咨詢函回收率為100%,專家積極度高;專家判斷依據系數Ca介于0.8~1.0之間,表明理論依據和實踐經驗在很大程度上決定著專家意見。熟悉程度系數Cs介于0.8~1.0之間,說明專家對該領域的熟悉程度高。權威度系數Cr介于0.8~1.0之間,平均值為0.899,也反映出專家權威度高。""""數理統計法:本研究的中小學體育教師評價素養量表為李克特5級量表,所有題項的計分范圍為“1~5分”:按5(非常符合)、4(符合)、3(一般)、2(不符合)、1(非常不符合)進行賦值。量表總得分的計算方式為“總分/項目數”,取值范圍為“1~5分”[20],得分越高說明中小學體育教師評價素養越高。采用SPSS 27.0統計軟件對樣本1調查數據進行項目分析、探索性因子分析,對樣本2和樣本3調查數據進行信效度檢驗。采用AMOS 23.0統計軟件對樣本2數據進行驗證性因子分析與恒等性檢驗。
3 "結果與分析
3.1 "中小學體育教師教學評價素養量表的設計
首先,將構成中小學體育教師評價素養的5個核心維度確定為一級評價指標;其次,根據各一級評價指標的內涵,選取相應的可觀測變量即測量題項。可觀測變量主要通過以下兩種路徑獲取:一是借鑒其他學科領域中教師評價核心素養評價工具題項,并更改使用情境和核心詞匯。二是參考《課程標準2017年版》《課程標準2020年修訂版》《課程標準(2022版)》《課程方案2022年版》中的相關內容。初步形成由5個一級評價指標和28個題項組成的初始量表。
3.2 "中小學體育教師評價素養量表評價指標的完善與確定
1)評價指標完善:德爾菲專家咨詢第1輪。
本研究將初始量表編制成專家咨詢問卷后,采用問卷星的方式邀請15位專家對各評價指標進行定性評估,評估原則主要包括評價指標是否及義、表達是否清楚、閱讀是否流暢、是否晦澀難懂、有無歧義、是否適用于調研人群以及各個維度之間是否相對獨立等[21]。本輪共計發放問卷15份,回收問卷15份,有效問卷15份,回收有效率100%。
回收問卷后發現,5個一級評價指標均獲得15位專家的肯定。同時部分專家就測量題項提出以下意見:部分專家建議在評價知識維度下增加“評價方法的使用方法”題項,部分專家建議在健身技能維度下增加“反思技能”題項以及“評價目標設計”題項,另有部分專家認為評價習慣“會自動進行評價”與“評價是我不用刻意去記就會去做的事情”表述重復,違背獨立性原則。針對以上意見,經過查閱相關資料以及與部分不同專家反復溝通,本研究決定采納,并對存在問題的評價指標進行刪除,形成包含5個一級評價指標、28個測量題項的中小學體育教師評價素養量表。
2)評價指標確定:德爾菲專家咨詢第2輪。
將經過第一輪修改和調整后的中小學體育教師評價素養評價指標編制成李克特5級量表,請各位專家對每一評價指標按5(非常重要)、4(比較重要)、3(一般重要)、2(一般不重要)、1(非常不重要)進行賦值。本輪共計發放問卷15份,回收問卷15份,有效問卷15份,回收有效率100%。待回收問卷后,根據變異系數對各評價指標進行取舍。如果測量題項的變異系數大于或等于0.25,則說明該題項的專家意見協調程度不夠[22]。變異系數計算公式如下所示,其中Si表示i指標的標準差(專家認同度),Mi表示i指標的平均值(專家意見集中度),Vi表示i指標的變異系數(專家意見協調度)。通過計算,結果顯示中小學體育教師評價素養5個一級評價指標、28個測量題項平均值均在4.3分以上,變異系數均小于0.25,協調系數較好(Plt;0.001),表明專家對各評價指標具有較高認可度且意見比較一致。
(1)
3.3 "項目分析
首先,對量表的28個題項進行臨界比值(CR)分析,具體為:對28個題項求和并進行高低排序,取前27%被試者計為高分組,后27%被試者計為低分組。隨后對高低分組的同一題項的得分進行獨立樣本T檢驗。結果顯示,28個題項均達到高度顯著水平(Plt;0.001),CR值均大于3.0,表明28個測量題項具有良好的鑒別度且全部符合要求[23]34。接下來采用同質性檢驗法,對28個測量題項與總分的相關性進行分析。若相關系數小于0.4,表示個別題項與量表構念只是一種低度關系,題項與整體量表的同質性不高,此題項應該刪除[23]34。檢驗結果發現,28個測量題項相關系數均大于0.4。綜上所述,經過項目分析后中小學體育教師評價素養量表28個題項均保留。
3.4 "探索性因子分析
通過項目分析后,對量表進行KMO和Bartlett球形度檢驗,結果發現KMO值為0.980,Bartlett球形度檢驗結果為x2=21 911.088,df=378,P =0.000(Plt;0.001)。根據Kaiser的觀點,KMO值為0.9以上,Bartlett球形度檢驗達到0.05顯著性水平適合進行因子分析[23]76。接下來,采用主成分分析法和最大方差法,提取出特征根值大于1的因子,并遵循吳明隆等提出的6條題項判斷標準[23]159對題項進行篩選。經過3輪探索后,結果顯示KMO值以及Bartlett球形度檢驗的相關數值均符合測量學要求,能夠從眾多公因子中提取特征根值大于1的因子為5個,5個因子旋轉特征值分別為10.096、4.510、3.763、1.521、1.016,5個因子累積方差解釋率77.728%,達到60%的標準[23]36(見表1),表明因子分析結果理想。同時刪除4道雙重載荷較高的題項(A4與B7、B8與B9),刪除了2道因素負荷量低于0.45的題目(C3、E4)。
根據因子分析結果分別對5個因子進行命名,其中因子1包含A1、A2、A3、A5、A6五個題項,命名為“評價知識”;因子2包含B1、B2、B3、B4、B5、B6、B10七個題項,命名為“評價技能”;因子3包含C1、C2、C4、C5四個題項,命名為“評價態度”;因子4包含D1、D2、D3三個題項,命名為“評價習慣”;因子5包含E1、E2、E3三個題項,命名為“評價品格”。最終,5個因子和22個題項共同形成中小學體育教師評價素養量表。
3.5 "驗證性因子分析
根據探索性因子分析結果,本研究構建一階五因子結構模型與二階五因子結構模型,隨后導入樣本2數據,采用AMOS 23.0統計軟件中的極大似然模型估計法對以上兩個競爭模型進行檢驗和比較。同時依據修正指數表中的參數對模型進行修正。修正結果表明,如果在e1和e2、e6和e10、e11和e12、e14和e16之間建立共變關系,卡方自由度比、均方根漸進誤差等擬合指標會符合或接近標準值,但是二階五因子結構模型各項適配度指標均優于一階五因子結構模型。同時,根據Doll建議的目標系數t值算法來檢驗二階模型的解釋力,計算公式為一階因子有關模型的卡方值除以二階因子模型卡方值,t值越接近1則表示二階模型越能取代一階模型[24-25]。通過計算,t值為0.809,即中小學體育教師評價素養二階五因子結構模型解釋了一階的80.9%。因此,可認為與一階五因子模型相比,二階五因子結構模型為最佳模型(見圖1)。此外,該結果既表明中小學生體育教師評價素養量表具有良好的結構效度,也佐證中小學生體育教師評價素養結構框架的合理性。
3.6 "中小學體育教師評價素養量表的恒等性驗證
由于本研究調查對象包含性別、學段及地區,對此,在秉持寬松策略的原則下(模型不做任何限制),采用結構模型恒等性(MGSEM)分析檢驗中小學體育教師評價素養量表在不同性別、學段、地區之間的測量等值性。通過檢驗發現,模型因素負荷、截距、共變異數與測量誤差比較中P值均大于0.05未達到顯著性水平,且ΔNFI、ΔIFI、ΔRFI均小于0.05,ΔCFI小于0.01。以上結果不僅表明中小學體育教師評價素養量表具有跨性別、跨學段、跨地區的恒等性,而且也為中小學體育教師評價素養模型可作為較為普遍的相關研究基底模型[25]提供重要依據。
3.7 "信效度檢驗
在本研究中信度檢驗指標主要為:內部一致性系數(Cronbach’s α系數)和重測信度。如表2所示,通過對樣本2數據檢驗,中小學體育教師評價素養總量表Cronbach’s α系數為0.883,5個分量表的內部一致性系數介于0.806~0.893之間。通過對樣本3數據檢驗,中小學體育教師評價素養總量表重測信度相關系數為0.841(Plt;0.001),5個分量表重測信度相關系數介于0.818~0.871之間(Plt;0.001)。內部一致性系數介于0.8與0.9之間表示量表具有穩定的內部一致性,ICC>0.80表示重測信度極好[23]221。因此,上述結果表明中小學生體育教師評價素養量表具有良好的信度。
在本研究中效度檢驗指標主要為:內容效度、收斂效度。(1)在內容效度方面,主要包含條目水平的內容效度指數(I-CVI)與量表水平的內容效度指數(S-CVI),本研究邀請15位的資深專家對題項與其對應的各評價指標之間的相關性進行評定。通過計算,I-CVI為0.853,S-CVI為0.868。I-CVI不低于0.78、S-CVI不低于0.8表示量表內容效度較好[26]。因此,以上結果表明中小學生體育教師評價素養量表具有較好的內容效度。(2)在收斂效度方面(如表3所示)經過檢驗,中小學生體育教師評價素養量表所有題項標準因子載荷均大于0.500;5個分量表平均方差萃取AVE介于0.513~0.546之間,組合信度CR介于0.734~0.798。Hair等指出只有同時滿足以下3種標準才說明量表具有良好的收斂效度:(1)標準因子載荷(Estimate)均大于0.500;(2)平均方差萃取(AVE)大于0.500;(3)組合信度(CR)大于0.700[23]224。因此,以上結果表明中小學生體育教師評價素養量表具有較好的收斂效度。
4 "討論
4.1 "中小學體育教師評價素養量表結構分析
中小學體育教師評價素養量表主要由評價知識、評價技能、評價態度、評價習慣、評價品格5個分量表構成。評價知識反映的是體育教師對評價目的、功能、內容以及方法等方面的認識和理解。換言之,體育教師在開展核心素養導向的評價活動前,應該熟知“為什么評”“評什么”以及“怎么評”等方面的知識。“為什么評”旨在強調評價目的,即對學生的體育學習行為進行觀察、診斷、反饋、引導和激勵,以判斷基于核心素養的課程目標的達成度,給教師和學生提供即時、多元、有效的反饋,促使學生更積極地學與教師更有效地教[27]125。“評什么”主要圍繞運動能力、健康行為、體育品德3個核心素養展開。其中,運動能力評價內容主要包括基本運動技能、體能、專項運動技能等的掌握程度,以及在日常生活中運用所學運動知識與技能解決實際問題的能力,在展示或比賽中的表現等[27]125;健康行為評價內容主要包括體育鍛煉習慣、營養膳食、合理作息、安全防范、情緒調控、適應能力等[28];體育品德評價內容主要包括學生在學練、展示或比賽中表現出的體育精神、體育道德和體育品格等[27]126。“怎么評”主要指向的是滿足學生體育與健康學科核心素養發展所需要的評價方法。評價知識既是體育教師科學有效開展核心素養導向評價活動的重要前提,也是實現教-學-評一體化和避免盲目評價的先決條件。
評價技能是指體育教師將評價知識運用于評價實踐活動中的能力。根據《課程標準2020年修訂版》《課程標準2022年版》的要求,核心素養導向的體育教學評價活動必須具備以下5個技能:一是會撰寫指導評價活動且契合體育與健康學科核心素養的學習目標;二是運用科學的評價方法準確收集與體育與健康學科核心素養相關的學習信息;三是依據學習信息對教學進行反思并針對性地改進;四是將產生的評價結果與初始學習目標比較,解釋反饋給學生,既要讓學生從評價中知道“我的實際水平”,也要讓學生知道“我在哪些方面運動表現較好”“我在哪些方面運動表現存在不足”“接下來我該如何提高”;五是引導學生參與體育學習評價,學生由被評價者成為課堂評價的主體既是整體培育學生核心素養的時代之需,也是課堂評價范式轉型的重要訴求。一方面,對于促進學生的自我調節學習和終身學習均具有重要意義,另一方面也有利于將反饋信息傳遞給體育教師,促進體育教師的教學質量提高和專業改進[29],最終實現以評促教。總而言之,作為體育教師評價活動的核心環節,評價技能不僅是體育教師將評價知識轉換為評價行為的關鍵和評價能力的集體表現,而且也是體育教師有效開展核心素養導向評價活動不可或缺的基本手段,解決體育教師“想評而不會評”的根本基礎[30]。評價態度是指體育教師對教學評價持有的看法以及由此做出行動選擇的一種心理傾向[16]44,其內蘊著體育教師的價值判斷和情感因素,表征著體育教師的評價立場,即體育教師如何看待評價以及在開展核心素養導向的評價活動時認同什么、堅持什么。此外,對于中小學體育教師而言,真正能夠促使其摒棄傳統評價理念、實施核心素養導向的評價活動,并非在于其個人的好奇心和利益的驅使,而在于其是否真正認同評價改革的價值以及由此產生的主觀意愿。由此言之,體育教師評價態度是開展核心素養導向評價活動的重要驅動,決定著體育教師的評價行為選擇[16]44。
評價習慣是體育教師形成的自覺穩定的評價行為方式,主要體現在評價行為穩定性和評價行為自動化兩個方面。評價行為穩定性意味著體育教師要“每課一評”。評價行為自動化意味著體育教師評價行為是不需要外在環境的制約、高度自覺的行為方式[31]。體育與健康學科核心素養的形成是一個時間長久、由量變到質變的過程。顯然,這一過程離不開評價的反饋、導向和激勵作用。如果體育教師評價行為缺失恒常性、穩定性,那么既無法實現課時目標的有效連接,也無法協調教學程序、改進教學方法、作出正確的決策。評價品格是指體育教師在教學評價活動中所應該具備的道德品質。評價品格隱喻著體育教師從評價的設計、信息的收集到測評結果的解釋、運用及交流溝通,都必須建立在客觀公正、合理合法、合乎倫理的基礎上[15]。評價是把雙刃劍,評價向善,如給予學生評價知情權和參與權,尊重學生的多樣性,保護學生的評價隱私,有助于消除學生對評價的恐懼心理,吸引學生參與到評價中來并利用評價來改善自己的學習[12]。如果評價在不經意間傷害了學生,如傷人的評價語言、人與人之間的橫向比較,不僅會對學生的學習產生消極影響[15],而且也與《課程標準2020年修訂版》《課程標準2022年版》倡導“關愛學生”的教育評價理念是背道而馳的。因此,真正實施核心素養導向的評價活動離不開“尊重個體差異”“因材施評”在教學實踐上的運用,即評價品格是體育教師必備的評價素養。
4.2 "中小學體育教師評價素養量表具有一定的科學性和可靠性
評價指標的科學性直接決定著測評工具的科學性。本研究首先采用保障評價指標體系準確性、科學性的德爾菲專家咨詢法對中小學體育教師評價素養量表進行定性評估。心理測量學指出,項目分析的主要目的在于檢測編制的量表或測試個別條目的適切或者可靠程度[22]4,基于此,本研究采用臨界值比法、題總相關法等對量表題項的適切性進行定量評估。探索性因子分析主要目的是找出影響觀測變量的因子個數,以及各個因子和各個觀測變量之間的相關程度,建立量表的或問卷的結構效度[32]。對此,本研究通過主成分分析法減少題項的數目,找出量表的潛在結構,將中小學體育教師評價素養量表中具有錯綜復雜關系的變量綜合為5個核心因子。驗證性因子分析主要目的是檢驗量表建構效度的適切性與真實性[32]。本研究通過驗證,發現構建的二階五因子結構模型各項適配度指標均符合標準值,而且在模型修正過程中沒有刪去過多的路徑和題項。綜上,多種方法相結合的選擇途徑不僅從不同角度和目的對題項進行篩選,而且也保證被選題項的質量和量表的科學性[33]。
測量恒等性是指測驗工具或評量方法適用于不同對象,或于不同時間地點上使用時,測驗分數或評量結果應具有一定的恒等性[34]。為此,本研究借助多群組驗證性因素分析考察中小學體育教師評價素養量表跨性別、跨學段、跨地區的測量恒等性。結果發現,因素負荷、截距、共變異數與測量誤差4個指標取值均符合理想范圍,這一結果表明跨性別、跨學段、跨地區不會對中小學體育教師評價素養量表的測量結果和穩定性產生影響。相關研究指出,測量工具時間太長可能會造成測試對象的消極情緒,進而“抵觸”測評過程,降低測評的有效性[35]。通過對多名被測試者進行訪談,得出中小學體育教師評價素養量表測量題項數量適中,而且題項長短適宜,自評完成時間介于4~6分鐘之間,易被接受。綜上所述,以上研究方法以及操作過程具有較強的科學性,進而也為中小學體育教師評價素養量表的科學性提供重要保障。
在本研究中,內部一致性系數、重測信度、內容效度、收斂效度均在理想值區間。結果表明中小學體育教師評價素養量表具有良好的可靠性和適用性,可以為我國中小學體育教師評價素養的測量提供工具支持。
4.3 "局限與展望
一方面,由于人力、物力、時間等方面的限制,本研究僅選擇部分地區部分中小學體育教師作為調查對象,造成樣本量有限、選取的調查對象不夠寬闊,因此后續研究可以進一步擴大樣本量和樣本選擇范圍,對中小學體育教師評價素養量表進行修正和驗證。另一方面,本研究主要采用自上而下型的研究思路,即基于文獻調研的方式獲取中小學體育教師評價素養量表測評題項,盡管題項具有一定科學性和適用性,但是這種思路往往會造成收集到的資料不夠全面。因此,后續研究可通過開門問策、深入實踐完善題項內容(如采用半結構式訪談法對中小學體育教師進行訪談),以使中小學體育教師評價素養量表更好地為體育教師實施核心素養導向的評價活動服務。
參考文獻:
[1] 張細謙,姚蕾. 體育課程與教學論[M]. 北京:高等教育出版社,2021:252.
[2] 張健. 新課程標準下體育教學評價的問題與對策研究[J]. 課程·教材·教法,2015,35(6):98-102.
[3] 鄭東輝,毛瑋潔. 論教師評價倫理素養的培育[J]. 教師教育研究,2024,36(5):16-21.
[4] 范云祥,馬衛平. 體育教學評價中幾對范疇的思考[J]. 上海體育學院學報,2011,35(4):70-73.
[5] 檀慧玲,王玥,沈漪佳. 教師評價素養發展的挑戰與對策:基于深化教育評價改革和實施新課標的省思[J]. 教育科學研究,2023(8):34-41.
[6] 盛雅琦,張輝蓉. 新時代教師評價素養的內涵解構、價值意蘊及測評框架[J]. 課程·教材·教法,2022,42(5):146-152.
[7] STIGGINS R J. Assessment literacy[J]. Phi Delta Kappan,1991,72(7):534-539.
[8] YUE T X,GAVIN T L B. Teacher assessment literacy in practice:A reconceptualization[J]. Teaching and Teacher Education,2016(58):149-162.
[9]"WEBB N. Assessment literacy in a standards-based urban education setting[C]//In Annual Meeting of the American Educational Research Association,NewOrleans,Louisiana,2002:1-5.
[10]"CHAPPUIS J,STIGGINS R J."Stuernt-involved assessment for learning[M]. 7th ed. New York:Person Education Inc,2017:11.
[11] 李順雨. 初中課堂教師評價素養研究[D]. 大連:遼寧師范大學,2016:22.
[12] 鄭東輝. 新時期教師到底需要怎樣的評價素養[J].教育發展研究,2022,42(4):46-51.
[13] EARL L M. Assessment as learning[M]. Thousand Oaks,CA:Corwin,2013:26,27.
[14] BROOKHAR S M. Educational assessment knowledge and skills for teachers[J]."Educational Measurement:Issues and Practice.2011,30(1):3-12.
[15] 朱傳世. 教師評價素養框架設計初探[J]. 中國教師,2024(5):35-38.
[16] 趙雪晶. 我國中學教師教學評價素養研究[D]. 上海:華東師范大學,2012.
[17] 朱永新. 習慣養成是核心素養形成的行動路徑——新教育實驗推進“每月一事”的理論與實踐[J]. 課程·教材·教法,2017,37(1):4-15.
[18] 邵偉德,何魯偉,鄒旭鋁,等. 核心素養融入體育課堂教學的邏輯與策略——以2022年版課程標準為視角[J]. 首都體育學院學報,2023,35(1):10-20.
[19] 羅伯特,德威利斯. 量表的編制:理論與應用[M].席仲恩,杜鈺,譯. 重慶:重慶大學出版社,2018:68.
[20] 孟高慧,劉暢. 大學生學術信息組織水平量表的開發與應用[J]. 圖書情報工作,2021,65(12):73-82.
[21] 孟萬金,苗小燕,官群,等. 中國中小學生家庭幸福感量表編制[J]. 教育研究與實驗,2020(3):91-96.
[22] 陳華友,周禮剛,劉金培,等. 統計預測與決策[M]. 北京:科學出版社,2018:13.
[23] 吳明隆. 問卷統計分析實務—SPSS操作與應用[M]. 重慶:重慶大學出版社,2010.
[24] DOLL W J,XIA W,TORKZADEH G A confiematory factor analysis of the end-user coomputing satisfaction instructment[J]. MIS Quarterly,1994,18(4):453-461.
[25] 晏駿,譚廣鑫,李信厚,等.《粵港澳青少年民族傳統體育文化認同量表》的編制與檢驗[J]. 體育科學研究,2023,27(6):25-31.
[26] 史靜琤,莫顯昆,孫振球. 量表編制中內容效度指數的應用[J]. 中南大學學報(醫學版),2012,37(2):49-52.
[27] 教育部. 義務教育體育與健康課程標準(2022年版)[M]. 北京:北京師范大學出版社,2022.
[28] 季瀏. 我國《義務教育體育與健康課程標準(2022年版)》解讀[J]. 體育科學,2022,42(5):3-17.
[29] 郭洪瑞. 學生評價素養的國外研究及其啟示[J]. 中國考試,2022(12):70-79.
[30] 楊國海. 教師評價素養的內涵及框架[J]. 當代教育科學,2011(4):11-19.
[31] 喬玉成. 青少年鍛煉習慣的養成機制及影響因素[J]. 體育學刊,2011,18(3):88-94.
[32] 吳明隆. 結構方程模型—AMOS的操作與應用[M]."重慶:重慶大學出版社,2009:212.
[33] 孫瑩,鮑鑫中. 一種基于方差最大化的組合賦權評價方法及其應用[J]. 中國管理科學,2011,19(6):142-148.
[34]"REISE S P,WIDAMAN K F,PUGH R H. Confirmatory factor analysis and item response theory:Two approaches for exploring measurement invariance[J]. Psychological Bulletin,1993(114):552-566.
[35] 陳思同,劉陽,唐炎. 體育素養測量與評價的現狀、挑戰及未來[J]. 體育學刊,2019,26(5):111-117.
收稿日期:2024-09-26
基金項目:全國教育科學規劃2020年度教育部青年項目課題(ELA200418)。
作者簡介:郭洪亮(1991-),男,博士,在站博士后,研究方向:學校體育學。E-mail:GHL11210707@163.com""通信作者:姚蕾