








摘 要:采用問卷調查、數理統計等方法對普通高校體育課程學生評教有效性進行實證研究。研究發現,學生評教既是對“教”的評價,也是對“人”的評價,評教分數具有區分度和有效性。具體而言:(1)“一表多課”學生評教體系造成體育課程評教分數低于其他課程;(2)教學因素影響評教結果,教得好(教學效果好)的教師評教分數較好;(3)非教學因素“人”影響學生評教分數,青年教師、講師、人緣好、顏值好、技能好的女性教師更易獲學生好評,即體育課程教師存在差異;(4)體育課程教學項目評教也存差異,三大球、三小球優于武術、健美操、瑜伽等項目。研究認為,構建不同課程評教指標、實現評教專業化發展,加強學生評教宣傳,助力評教公正公平,用好評教結果,實現以評促教,從而有效提升普通高校體育課程教學質量。
關 鍵 詞:學校體育;學生評教;體育課程;普通高校;有效性
中圖分類號:G807 文獻標志碼:A 文章編號:1006-7116(2024)06-0125-08
Evaluation of teaching or individuals:A study on the effectiveness of student evaluation of teaching in physical education courses of college and university
PU Biwen1, 2
(1.Department of Physical Education,Guangdong University of Finance,Guangzhou 510521,China;
2.School of Physical Education,South China Normal University,Guangzhou 510006,China)
Abstract: This empirical study uses questionnaire surveys and statistical analysis to investigate the effectiveness of student evaluations in physical education courses at colleges and universities. The findings reveal that student evaluation of teaching assess both the "teaching" and the "individual”, and evaluation scores demonstrate differentiation and effectiveness. Specifically: (1) the "one form for multiple courses" evaluation system leads to lower scores for physical education compared to other courses; (2) teaching factors influence evaluation results, with teachers who perform well receiving higher scores; (3) non-teaching factors, such as the teacher's youth, rapport, attractiveness, and skills, impact evaluation scores, showing differences among physical education instructors; (4) there are discrepancies in evaluation among different physical education projects, with team sports and racket sports outperforming martial arts, aerobics, and yoga. Thus, it is recommended to develop differentiated evaluation indicators for various courses, promote specialized development of evaluations, enhance publicity around student evaluations, ensure fairness and justice in evaluations, utilize evaluation results to improve teaching, and to ultimately enhance the quality of physical education courses in general universities.
Keywords: school physical education;student evaluation of teaching;physical education courses;college and university;effectiveness
學生評教是高校教師教學評價和教學質量保障制度的重要組成部分[1]。對教師的教學質量或教學效果進行評價涵蓋普通高校的所有學生、教師、課程,評教數據較為完善,用于反映整體教學質量[2-3]。普通高校體育課程是以培養學生體育興趣、掌握運動技能、發展運動特長、促進終身鍛煉習慣養成[4]為目標,相較于普通本科其他課程教學,具有較強的實踐性、示范性、身體參與活動等特點。然而,高校教學評價量表造成學生評教行為偏差、信息失真、信度效度較低[1, 5-7],同時存在學生對評教認知不足,難以區分是對教學還是對教師評價等問題[8]。評教結果廣泛運用于教師晉升、職稱評審,對教師的教學工作有著重要影響[9],導致教師的教學工作過于注重評教結果,忽視教學本質,影響體育課程的教學質量[10]。如何有效評價體育課程教學質量,體育課程學生評教是否有效可信,仍有待商榷。尤其是在體育課程評教中存在的具體問題:如“一表多課”學生評教體育課程是否有效(即體育課程評教是否與其他課程有區別)?教得好不如教師受學生歡迎好(即評課還是評人)?體育課程教師是否也有差異(評價的區分度)?體育課程不同運動項目課程評教是否存在差異?針對以上問題,本研究對廣東地區15所高校(覆蓋三批次錄取到一批次錄取學生)進行調研,探討普通高校體育課程評教的有效性,為推動高校體育教學高質量發展提供參考建議。
1 研究設計
1.1 數據來源
通過與學生教師訪談、梳理各學校評教指標及借鑒相關研究文獻等,制定出包括學生特征、體育課程評教、理論課程評教、實踐課程評教、體育教師特征、體育教師教學因素、學生及體育課程評教認知等7個方面,共計56個選項的調查問卷(見表1、表2)。變量X上標對應類別序號,下標表示類別中的變量序號,比如 表示第一類學生特征的第4個問題,依此類推。
在數據獲取方面,通過紙質問卷和網絡問卷相結合的方式對廣東地區15所非體育專業的普通本科層次學校(以下簡稱“普通高校”)學生進行發放。最終,共發放紙質問卷800份,回收756份,收到網絡問卷2 016份,兩者回收共計2 772份。剔除問卷關鍵變量缺失和全部答案統一的無效問卷,最終確定1 986份為實際有效問卷。問卷信度檢驗顯示Cronbach's α系數為0.932;效度檢驗KMO值為0.962且Bartlett球形度檢驗P<0.001,可見問卷信效度滿足社會學調研要求[11]。具體問卷題項表述、變量賦值情況等(李克特5級評分)見表1、表2。
1.2 研究思路
研究主要探討普通高校“一表多課”學生課程評教下體育課程評教是否與其他課程評教存在差異,學生是對教師教學的評價還是教師的評價以及不同運動項目課程的差異性。具體思路及步驟:一是采用單因素方差分析對體育課程與其他課程(包括理論課程、實踐課程)差異性進行檢驗,以驗證“一表多課”學生體育課程評教與其他課程的差異。二是采用參數檢驗分析高評分教師和低評分教師在教學因素方面是否存在差異,以驗證學生評教是否是對教師教學的評價,即回答學生評教是否是對“教”的評價。三是采用回歸模型并控制教學因素,對教師特征和學生特征等“人”的因素如何影響評教進行分析,以探討學生評教中是否受“人”因素影響。
1)女教師占比45.57%,男教師占比54.43%;2)因410份教師無職稱,該項樣本量為1576
2 結果與分析
2.1 不同類型課程學生評教差異性分析
已有研究發現,單一量表對不同類型課程評價結果存在顯著差異[12],造成學生課程評價失真。體育課程以身體練習為主要手段,通過合理的體育教育和科學的體育鍛煉過程,達到增強體質、增進健康和提高體育素養為主要目標,且具有較強的實踐性。為進行有效對比,將其他課程分為理論課程和實踐課程。理論課程是指采用課堂教學,以課程知識點為主,教師講解傳授,學生識記和理解知識點一類課程,包括數學分析、中國近代史、保險學、宏觀經濟學、馬克思主義哲學等課程。實踐課程是指采用場景教學,以操作為主,教師實現示范、學生學習技能的一類課程,包括機械制圖、自動化生產線實訓、豐田維修技術、計算機實操、Stata應用等。采用單因素方差分析檢驗體育課程、理論課程、實踐課程評價是否存在顯著性差異,具體結果見表3。
通過表3可知,體育課程、理論課程、實踐課程等評教結果顯示,課前準備、認真程度、答疑輔導、講解、內容社會實踐練習、教材講義選擇、學習資源、教學啟發、學生溝通、能力培養、收獲、課程推薦等均呈現出顯著性差異(P<0.05),體育課程評教分值最低,實踐課程評教分值最高。由此可見,體育課程、理論課程及實踐課程評教存在顯著差異,不利于體育課程獲取學生高分評教。
2.2 “教”的因素對學生評教影響
假設學生評教是對教學因素的評價,故提出以下兩個研究假設:假設一、教師在體育課程學生評教中獲取高分且教學因素指標 相對優越,說明學生評教是對“教學”的評價;假設二、在體育課程學生評教中獲取高分和低分的教師,教學因素指標 不存在顯著差異,或高分老師 評價成績相對較差,說明學生評教不是對“教學”的評價。
為檢驗以上研究假設,將原有的數據分為高分區和低分區。為了使區分更為顯著,去除中間的386份,將高分和低分各800份進行對比分析,采用方差齊性和均值t檢驗進行分析,具體結果詳見表4。
通過表4可知,方差齊性檢驗中 、 、 的F值統計統計量P>;0.05,屬于方差齊性的情形,而 、 、 、 、 的P<0.05,屬于方差不齊性。均值t檢驗結果顯示, 課程難度、 教學方式適合等呈現顯著性差異, 考勤嚴格程度呈現顯著性差異且低分組優于高分組,教師遲到、學生答疑指導、課程組織熟練程度、講解示范清晰程度、訓練項目拓展水平等評分高的教師均優于低評分教師,說明高分組教師通過教學等吸引學生,低分組通過考勤留住學生。由此可見,學生評教是對教學的評價,即學生評教是有效的。
2.3 “人”的因素對學生評教影響
在學生評教過程中,非教學因素(如教師人緣、教師形象等)是否會對學生評教產生影響呢?以下檢驗“人”的因素對學生評教的影響。
1)教師人緣對學生評教的影響。
“教得好,不如人緣好”。吳立軍等[8]關注教師人緣對影響學生評教的影響。現實中學生對體育教師熟悉程度遠高于學校評教指標,存在學生依據自身對體育教師的認知和熟悉程度進行評價[10]。體育教師群體中也常常抱怨“教的好不如與學生關系好”,針對教師人緣是否對學生評教產生影響,分別涉及“人緣”變量對學生評教影響模型和“人緣”與“教學效果”組合效應模型,探討教學效果和人之間的影響,具體模型如下:
模型一引入“人緣”變量, 為學生評教成績,控制教學因素后將教學因素、學習收獲等體育課程評教成績進行匯總,生成新的變量,構成 , 為教學效果, 為教師人緣,具體模型定義如下:
模型一: (1)
模型二是在控制教學因素后,以教學效果差、人緣好為基準,構建教學效果好,人緣好;教學效果好,人緣差;教學效果差,人緣好等3類教學效果與人緣組合的虛擬變量,討論教學效果與人緣組織如何影響學生評教,具體模型如下:
模型二:
(2)
本研究數據為截面數據,為此采用Robust穩健估計,降低模型自相關對模型評估的影響,模型一、二回歸分析結果詳見表5、6。
通過表5可知,模型一的教師教學因素和人緣因素變量均在1%水平顯著,學習收獲則在5%水平顯著,且回歸系數均為正數,表明“人緣”因素與學生評教結果顯著正相關,說明“人緣”因素對學生評教產生影響。
表6數據顯示, 、 、 虛擬變量在以“教學效果差、人緣差”為基準,采用Robust穩健標準誤回歸分析可知, 、 、 回歸系數顯著為正,其中 、 顯著水平在1%, 顯著水平為5%,說明與基準類型的“教學效果差、人緣差”,說明 、 、 評教成績都顯著好于基礎類型。通過對回歸系數分析發現 > > ,學生評教成績從高到底依次為“教學效果好、人緣好”>“教學效果差、人緣好”>“教學效果好、人緣差”>“教學效果差、人緣差”。由此可知“教學效果好、人緣好”的教師學生評教成績好,“教學效果差、人緣差”的教師學生評教成績差,“教學效果差、人緣好”的教師學生評教成績好于“教學效果好,人緣差”的教師,說明在學生評教活動中人緣好強于教學效果好。
2)教師嚴格程度對學生評教的影響。
學生評教成績與教師晉升、績效考核等緊密聯系[13],由此造成教師不敢管、不管嚴,嚴師帶來學生報復性低分評教[14]。現實調研發現,學生認為教師認真、嚴格要求并非會帶來學生評教低分。采用考勤等手段約束學生,教師自身教學敷衍,教學效果差的老師容易被學生低分評價。到底是嚴師出低分還是教學效果差造成的低分評價呢?以“ 教師考勤嚴格”作為單獨評教指標,在 構建組合變量是剔除 ,加入教學效果 , 為學生評教成績,構建模型三檢驗嚴師出低分現實情況;以“ ”和“ ”組合成虛擬變量,以“考勤81465d21460425b8fc330a62dcc9047b不嚴,教學效果差”為基準,構建模型四分析嚴師和教學效果是如何影響評教,具體模型如下:
模型三: (3)
模型四:
(4)
通過表7可知,模型三的教師教學因素、學習收獲變量均在1%水平顯著且回歸系數均為正;考勤嚴格程度則在5%水平顯著且回歸系數均為負數,表明“嚴師”因素與學生評教結果顯著負相關,說明“嚴師”因素對學生評教成績產生負向影響,“嚴師出低分”。
模型4以“考勤不嚴,教學效果差”為基準,表8數據顯示, 、 、 均在1%水平顯著,其中 、 且回歸系數為正, 回歸系數為負,即“考勤嚴格,教學效果好”“考勤不嚴,教學效果好”的教師學生評教成績均優于基準類型教師,“考勤嚴格,教學效果差”的教師學生評教分數顯著劣于基準類型。體育教師教學效果好,學生評教分數較好,其中“考勤不嚴、教學效果好”教師學生評教優于“考勤嚴格、教學效果好”教師;“考勤不嚴、教學效果差”教師學生評教優于“考勤嚴格、教學效果不好”教師。由此可見,體育課程教學中嚴格教師出低分現象確實存在。
3)學生、教師個體特征對學生評教的影響。
學生評教追蹤研究發現教師評教分數相對固化,評教分數較好的教師每次評教分數相對較高,評教分數較低的教師每次評教分數相對較低[15]。在普通高校體育課程評教過程中,好評給了誰、差評給了誰;學生也存在給予全體教師高分或者低分的實際情況,盲目打分,即誰打了高分,誰打了低分。在教學因素 和教學效果 基礎上引入教師和學生個體特征,其中模型五引入學生個體特征,如 (學校類型)、 (年級)、 (性別)、 (專業)、 (體育課程項目類別)等,因大學本科僅大一、大二開設體育課程教學,僅對大一和大二進行比對,分析哪些類型的學生給了好評、哪些類型的學生給了差評。模型六引入教師個體特征,如 (性別)、 (年齡)、 (職稱)、 (人緣)、 (顏值)、 (技能水平)、 (課程難度),分析哪些類型的教師獲得好評,哪些類型的教師被打低分。具體模型如下:
模型五:
(5)
模型六:
(6)
通過表9可知,從學校類型來看,以本科一批為基準,本科一批、本科二批和本科三批存在顯著差異(P<0.01)且回歸系數為正,由此可見本科一批學生評教成績最低,本科三批相對較好,最好為本科二批。從年級來看,以大學一年級為基準,大一、大二存在差異,但無顯著性差異(P >0.05)且回歸系數為負,大二學生在學生評教中給分更低。從性別來看,以男性學生為基準,男、女學生存在顯著性差異(P<0.05)且回歸系數為正,說明女生更愿意給出高分。從專業類型來看,以文科學生為基準,文科、理科、藝術類均存在顯著性差異(P<0.05)且回歸系數為正,說明文科類學生評教成績相對較低,藝術類學生在體育課程中評教成績最高。從體育課程項目類型來看,以三大球為基準,三大球和三小球并無顯著性差異(P >0.05),武術、健美操、瑜伽等表演類存在顯著性差異(P<0.05)且回歸系數為負,說明表演類等體育項目教學成績相對較低。由此可見,錄取批次高、年級高、藝術類學生、學習武術、健美操、瑜伽等表演類課程的男生,容易在體育課程評教中打出低分。
通過表10可知,從性別來看,以女教師為基準,男女教師間存在顯著性差異(P<0.05)且回歸系數為負,說明男教師被低分評價。從年齡來看,以青年教師為基準,中青年教師存在顯著性差異(P<0.01),青老教師存在顯著性差異(P<0.05)且回歸系數均為負數,同時年齡越大回歸系數負值越大,可見年齡大的教師易被低分評價。從職稱來看,以無職教師為基準,助教、講師、副教授在5%水平顯著,教授在10%水平顯著,助教和教授回歸系數為負且助教負值更大,說明助教更易被學生評教給差評。從教師人緣來看,以教師人緣很差為基準,均存在顯著性差異(P<0.01)且回歸系數均為正,人緣越好回歸系數越大,說明人緣差的教師易被學生給差評。從教師顏值來看,以教師顏值差為基準均存在顯著性差異(P<0.05)且回歸系數均為正,顏值越高回歸系數越大,說明顏值差的教師易被學生給差評。從教師技能水平來看,以技能水平差為基準,中低水平無顯著性差異(P >0.05),高水平存在顯著性差異(P<0.05),說明中低技能水平的教師易被學生給差評,高水平技能教師評教成績優于中低技能水平教師,課程難度則無顯著性差異(P >0.05)。由此可見,老教師、助教、人緣差、顏值差、技能水平低的男教師更易被學生評教給低分。
3 結論及建議
普通高校“一表多課”學生評教中,體育課程評教分數顯著低于理論課程和實踐課程。就“教學”因素而言,教學效果較好的教師評教優于教學效果差的教師,說明普通高校體育課程評教具有區分度,是對教師教學的評價,學生評教有效。就非教學因素“人”而言,教師人緣顯著影響學生評教,在現實體育課程評教中“拼人緣”“嚴師出低分”等現象確實存在;引入學生、教師個體特征研究發現,錄取批次高、年級高、藝術類、學習武術、健美操、瑜伽等課程男生更易打低分,老教師、助教、人緣差、顏值差、技能水平低的男教師更易被學生評教給低分。非教學因素“人”影響學生評教,存在對“人”的評價,體育課程項目差異存在,三大球、三小球優于武術、健美操、瑜伽等表演性項目。
基于以上結論,提出如下建議:
第一,構建不同課程評教指標,實現評教專業化發展。對“一表多課”存在的體育教師評教分數偏低的現實問題,依據課程特征制定差異化評教標準、提高體育課程教學質量、建立多維度的評教體系等,改善體育課程評教偏低現狀。一是制定差異化評教標準,針對體育課程的特點,制定更符合其性質的評教標準,如增加評價體育課程教學方法的創新性、課程的互動性和參與度等評教內容,降低教材、講義等評教內容。二是建立多維度的評價體系,構建一個包含學生、同行教師、教育專家等多方參與的評價體系,以更全面地評估和提升教學質量。
第二,加強學生評教宣傳,助力評教公正公平。針對“拼人緣”“嚴師出低分”等問題,一是強化學生評教的教育和引導,讓學生充分理解評教的重要性和目的,強調評價應基于教師教學內容、方法、態度等,而非個人喜好或人際關系。二是實現教師績效評價多元化,不僅考慮學生評教結果,同時考慮教師的教學準備、課堂管理、教學創新以及同行評議。三是構建合理的教學考勤政策,充分考慮考勤和學生評教政策的公正性,避免因放松考勤或評分方式而影響學生對教師的評價。
第三,用好評教結果,實現以評促教。研究結果顯示學生評教分數具有區分性且整體有效,由此可見學生評教是提高體育課程教學質量、實現教學管理的有效手段。現階段學生評教仍是教師績效考核、職稱晉升等證明手段,學生評教促使體育教師教學功能弱化,為此應有效利用學生評教結果,促進以評促教,如體育課程教學過程中低分教師(如分數后5%)應組織專家進行現場評教和診斷,提出針對性建議,指定優秀有經驗的教師傳幫帶,提升教學水平。
參考文獻:
[1] 周繼良. 高校學生評教行為偏差影響因素的實證研究——基于制度分析的視角[J]. 高等教育研究,2018,39(2):59-72.
[2] 葉賦桂,田靜,羅燕. 美國高校教師評價的變革及其動因研究[J]. 教育學報,2008(5):74-81.
[3] 郭麗君. 走向為教學的評價:地方高校教學評價制度探析[J]. 高等教育研究,2016,37(6):68-73.
[4] 謝燕歌,洪浩. 普通高校公共體育課程教學指導思想探索與思考[J]. 北京體育大學學報,2014,37(1):94-99.
[5] 周繼良,龔放,秦雍. 高校學生評教行為偏差及其與學科類別、學校類型和學業自評的關系——基于南京和常州十所高校的實證調查[J]. 高等教育研究,2017,38(10):64-74.
[6] 周繼良,秦雍. 高校學生評教行為偏差基本類型及其與學生相關背景特征的關系[J]. 復旦教育論壇,2018,16(6):65-73.
[7] 韓映雄,周林芝. 學生評教的信度、效度、影響因素及應用風險[J]. 復旦教育論壇,2018,16(6):74-81.
[8] 吳立軍,田啟波. 評“教”還是評“人”?!——基于學生評教的有效性研究[J]. 高教探索,2020(8):57-65.
[9] 馬浚鋒,羅志敏. 偏離、異化與重塑:學生評教本真性變奏——基于高校學生質性評教結果[J]. 高教探索,2023(3):48-55.
[10] 田賢鵬,姜淑杰. 高質量發展視域下高校學生評教:問題表征與制度變革[J]. 現代教育管理,2022(9):74-83.
[11] 風笑天. 社會研究方法[M]. 北京:中國人民大學出版社,2013:56.
[12] 隗金水. 廣州體育學院研究生課堂教學質量評價的研究[J]. 廣州體育學院學報,2011,31(6):98-102.
[13] 王洪才. 高質量高等教育體系的基本內涵、主要特征與實踐路徑[J]. 現代教育管理,2023(4):1-9.
[14] 李欣,張威. “多元交互”在線教學評價指標體系構建的內涵、框架及路徑[J]. 現代教育管理,2022(10):101-107.
[15] 王玉剛,柳興國,安強身. 學生評教的“廉價投票權”問題及治理[J]. 高教探索,2015(8):71-75.