編者按:引體向上是一項鍛煉背部和手臂肌肉的訓練項目,標準動作過程是雙手抓住單杠,將身體向上牽引,下巴超過單杠即為一次成功。
用計算機程序分析數據是科研的常用方法,如今中學生也能在教師指導下利用這一方法開展探究性學習研究。這類軟件基于復雜的數學模型開發,但學生無需深究其背后的算法原理,只需掌握兩項基礎技能:篩選有效數據和正確解讀結果。本文即是此類探究學習活動的成功案例,感興趣的同學可以在老師指導下,學習并使用SPSS等軟件開展研究。
研究背景
根據北京市2023年9月新頒布的中考方案,體育成績(70分)占中考總成績的比例已提高至 13.21% ,其中初二年級體測成績(10分)占比1. 89% 。經調查,有53. 62% 的男生認為引體向上是難度最大的項目。因此,本研究希望通過問卷調查和數據分析的方法,探討影響初二男生引體向上成績的因素,為提高學生的引體向上成績提供理論依據和指導。
問卷調查
本研究通過專家訪談和實地觀察擬定了調查問卷,對部分初二男生進行調查,并與被調查者逐一溝通以確保調查結果的真實有效。
問卷共設置10個問題:
1.你認為自己有運動天賦嗎?2.迄今為止,你接受過多少年正規體育訓練?包括任何體育項目的正規訓練,自己隨便玩玩的不算。
3.迄今為止,你進行系統性的上肢力量訓練(如啞鈴彎舉、杠鈴平推、俯臥撐等)的年限是多少?偶爾做做、一周未必能做一次訓練的不算。
4.你的身體質量指數(即BMI指數,用來衡量人體胖瘦程度)是多少?5.你初一年級體質健康測試成績是多少?6.你一分鐘最多可以做多少個標準的仰臥起坐?
7.你可以連續做多少個標準的俯臥撐?
8.你能連續做多少個標準的引體向上?
9.你是否學習過引體向上的動作技巧?
10.近兩個月,你平均每天花在針對引體
向上訓練的時間是多少?
通過問卷星軟件回收有效問卷69份,并與被調查者逐一溝通,確保了調查結果真實。
下面是收集到的數據和分析。
數據分析
以問題8(你能連續做多少個標準的引體向上?)的結果作為因變量,其余問題的結果作為自變量,做數據分析。
1.多元回歸分析
使用SPSS軟件將收集到的問卷數據進行多元回歸分析,得到以下結果,見表1和表2。

方差分析結果顯示,本研究回歸模型具有統計學意義。

分析結果顯示,連續標準俯臥撐數量、初一體育成績、上肢力量訓練年限,都與“能連續做幾個標準的引體向上”之間存在顯著相關。
2.機器學習算法分析
其后我又使用Python語言編程,錄入收集到的問卷數據,使用決策樹、隨機森林、梯度提升等3種算法分別進行分析,得到3種算法下各特征變量重要性及排名,見表3。

結論與建議
綜合多元回歸分析和機器學習算法兩類方法所做的相關性分析結果,可得出初一體育成績和連續標準俯臥撐是影響“能連續做幾個標準的引體向上”的最重要因素。
多元回歸分析結果表明,上肢力量訓練年限也是影響“能連續做幾個標準的引體向上”
的重要因素;機器學習算法表明,BMI指數同樣是重要影響因素。
因此,學校、家長和學生本人應重視上述四項內容,提前規劃,高度重視初一年級體育成績,堅持進行俯臥撐鍛煉,加強上肢力量訓練,并注意控制體重。
研究局限
為提高調查問卷的完成數量,避免被調查者產生抵觸情緒,很多問題的選項被設置成數值段,而非精確的數值。這導致在數據分析過程中,只能采取對類賦值或取均值的手段對數據進行轉換,可能會影響最終數據分析結果的
準確性。
多元回歸的假設條件包括線性關系、誤差獨立性等,對于非線性關系的數據,擬合效果比較差。機器學習算法需要大規模數據,本研究中數據量過少,擬合效果可能比較差。
(作者:學生;指導教師:錢雨)