999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中考體育成績預測方法研究

2021-07-14 07:58:30吳春連
中文信息 2021年5期
關鍵詞:中考體育模型

吳春連

(萬達信息股份有限公司,上海 200041)

引言

在《體育總局教育部關于印發深化體教融合 促進青少年健康發展意見的通知》發布后,各省市積極響應政策,同時廣大家長、學生對加強體育運動的響應效果也逐步凸顯,并加強了被納入中考的體育項目的學習,以期在中考中獲得良好的表現。本文采用歷年學生的體育成績數據訓練了幾種擬合模型,從而對學生中考體育成績進行預測。

一、擬合模型介紹

首先給出中考體育成績預測問題的形式化定義。假設有n個學生,每個學生都有自己日常的體育數據,用m維向量x來記錄,向量中的每一個維度都表示具體的某一種體育特征,包括身高、體重、BMI、肺活量等等;學生對應的中考成績用y表示,其中y可以為學生的中考體育總成績或者具體某一項考試的成績。所有n個學生的數據可以表示為{(x1,y1),(x2,y2),…,(xn,yn)}

本項目的目標是學習一個擬合函數f,在給定一個學生u的日常體育特征Xu時,預測他的中考體育成績,即uy?=f(Xu),并期望uy?u盡可能接近于他的真實成績yu。

下面介紹本文研究的一些經典的機器學習方法、其建模形式、適用問題以及需要設定的參數等情況。

1.最近鄰模型

K-近鄰模型屬于比較簡單的一種模型,經常被用于作為機器學習的基準方法。即在訓練集中,根據輸入特征,找到與目標對象最接近的K個鄰居,將他們輸出值的平均值作為目標對象的預測值。K-近鄰模型沒有具體的學習參數,主要依靠訓練集的數據,來推測新樣本的情況。該模型的優點是結構簡單,訓練成本較低。其中,需要確定的參數主要包括選擇合適的距離函數,以及確定最優的K值。該模型適用于訓練數據較為豐富,且數據存在局部性模式的情況。該模型也存在一些缺陷,例如,模型的預測速度受訓練數據的總量、K值的大小、距離函數的復雜程度影響較大。而且如果數據中存在較多噪聲,有些數據點附近訓練數據樣本較少等情況,則擬合效果較差。

2.線性擬合模型

線性擬合模型是最簡單的一種擬合模型。該模型假設輸入特征x和預測的目標y存在線性關系。輸出的預測值可以用輸入的特征進行加權估計得到。公式為=wx+b,其中,是預測值,w是權值向量,b是偏置,x是自變量向量。在定義完預測模型之后,需要根據訓練樣本,估計模型中的參數w和b。預測模型的目標是最小化預測值和真實值之間的偏差,因此,可以定義損失函數為

其中,n表示訓練樣本數量。如果將的估計函數代入到該公式中,就可得到損失函數L(w,b)=最小化該損失函數,就可得到模型的參數。對于最小化該損失函數,可以有兩種方法,包括最小二乘法和梯度下降法。最小二乘法是根據求導,使得導數為0的方式,獲得極值,最終得到參數的解析解梯度下降法是使用迭代的方式,首先對預測模型求導,然后得出迭代公式,根據如下的公式對權重和偏置進行不斷迭代,即可得到參數其中,和分別表示損失函數對于權值和偏置的導數,α是學習速率,需要設定為小于1的值。線性擬合模型的優點是假設輸入和輸出是線性關系,模型較為簡單,模型過擬合的風險較小,所需要的訓練數據也較少。模型需要確定的參數是權值向量和偏置。該模型適用于輸入和輸出存在明顯線性關系的場景。同時,也存在模型較為簡單,難以建模復雜非線性依賴的缺陷等。

3.多項式擬合模型

為了解決線性模型難以建模復雜依賴的問題,可以向線性模型中加入特征的冪次項。具體操作是,根據原始特征向量x,分別求出其2次、3次等指數結果。然后擬合公式=p0+p1X1+p2X2+…+pqXq。

其中,p0,p1,…,pq是需要學習的參數。在定義完預測公式之后,與線性模型類似,可以定義如下的損失函數,最小化該損失函數,即可得到其中的參數{p0,p1,…,pq}L=

需要注意的是該模型雖然有指數項,但是只需要根據原始特征求出來x1,x2,…,xn的值,就可以把多項式擬合問題,轉化為線性擬合的問題。該模型的優勢在于可以建模輸入和輸出的非線性關系。需要確定的參數包括各項權值。該模型相比于線性模型參數更多,需要的訓練數據也更多,可能存在更大的過擬合風險。

4.支持向量回歸(Support Vector Regression,SVR)模型

線性模型較為簡單;而多項式模型也只是加入了指數項,提升了其建模非線性關系的能力,但是局限性也比較大。SVR模型通過引入核函數,進一步提升了模型擬合復雜關系的能力。SVR模型是支持向量機模型的變種。支持向量機(support vector machine,SVM)是針對分類任務提出的模型。SVR模型思想與其類似,是尋找一些支持向量,確保預測值相對于真實值不會偏離到支持向量劃定的界限之外。SVR的推導過程是從線性模型開始的,然后引入了核函數提升其建模非線性關系的能力。首先定義線性擬合函數=wx+b,SVR的思想是只要真實值和預測值偏差不太大即算預測正確,設ε為擬合精度控制參數,期望-ε<y<+ε。

考慮到SVM中的線性不可分的情況,引入松弛變量和,得出SVR的優化問題引入拉格朗日乘子,經過對偶和求解,得出預測函數其中,α,為拉格朗日乘子,即為待求參數。然后引入核函數,得到預測公式其中,K(Xu,Xi)是核函數,表示對象u和i相似的程度。核函數可以使用非線性核增加模型建模非線性關系的能力。核函數有很多種選擇,下面介紹幾種常用的核函數:

● 線性核函數是使用內積的形式,計算出兩個特征向量的相似程度,公式為K(x,z)=XTZ,其中,X和Z分別表示一個向量,XT表示向量X的轉置。

● 多項式核函數使用多項式的形式,計算兩個特征向量之間的關聯性K(x,z)=(axTz+c)d,其中,a和d是兩個可以設置的超參數。

● 高斯核使用高斯函數來計算兩個特征向量之間的相似性。

SVR模型是針對非線性關系建模的一種有效的模型。需要求的參數包括拉格朗日乘子,核函數的選擇,以及核函數中的超參數等。SVR模型需要根據數據分布的特點選擇合適的核函數。

二、訓練數據分析

訓練數據分類兩類,一類是預測的目標數據,包括中考體育總成績,以及學生中考體育專項成績,另一類是輸入特征包括學生在初三年級的體質健康測試成績和日常體育成績。

1.數據分布分析

本文分析的預測目標數據分別為體育總分、1000米、800米、50米、實心球、仰臥起坐、立定跳遠,各項數據的平均分分別為27.72、78.08、81.49、82.21、84.61、92.07和89.65,標準差分別為3.05、23.31、20.36、18.05、19.50、11.31、18.18。總分都是接近30分,差別不大,其他各專項數據分布如下圖:

輸入特征數據為體育行為數據和體質健康數據,包括學生體育行為成績、身高、體重、BMI、肺活量、50米跑、坐位體前屈、仰臥起坐、體質健康總分。各項平均分分別為85.11、164.86、57.00、92.27、86.61、8.56、74.04、68.30、80.34。各項標準差分布為13.77、7.52、12.23、13.53、14.64、0.92、17.58、25.79、9.99。各項數據分布直方圖如下:

由上述分布情況可以看出,身高、體重、50米跑、體質健康總分都是比較符合高斯分布的。而且每個項目的數據分布、數據范圍都不同,需要進行歸一化處理,才能作為模型的輸入,否則可能降低預測的準確性。

2.數據相關性分析

本文還分析了輸入特征與預測目標之間的關聯性。只有強關聯性的特征,才會對預測任務有幫助。本文采用了皮爾森相關系數來衡量各個特征與預測目標之間的相關性強弱。分析結果表明中考1000米成績與體重、BMI、50米跑、體質健康總分的相關性較大,實心球和體質健康總分以及50米跑成績相關性較大,仰臥起坐與50米跑和體質健康總分相關性較大,立定跳遠和仰臥起坐以及體質健康總分的相關性較大。

三、模型超參設置和預測結果分析

1.模型超參設置

本文通過實驗尋求各擬合模型的最佳超參。對于K近鄰擬合方法,當K值為10時獲得了該方法的最好效果;對于線性擬合模型,設置梯度下降的學習速率為0.01;對于多項式擬合模型最終指數的值設置為2時獲得了最好的預測效果;對于SVR模型需要確定的超參數包括核函數類型的選擇以及核函數中的超參數設置。本文測試了線性核、多項式核、徑向基核,其中徑向基核獲得了最好的預測效果。

2.預測結果分析

為了訓練所設計的模型,并驗證其預測效果,將中考體育成績、體質健康和體育行為的歷史數據分為兩部分,隨機選擇其中90%的數據作為訓練集,剩余10%的數據作為測試集。預測的目標包括中考體育總成績和體育專項成績。為了比較不同模型的預測精度,本項目使用MAE指標來評價各個模型。在模型訓練好之后,使用模型在測試集上進行預測,并根據計算公式得到MAE的值。其中,m是測試樣本的個數;X(i)為真實值,這里每個要預測的Xt都是一個預測樣本的真實值;為模型預測的結果;|·|表示求絕對值。MAE的值越小,說明預測模型的預測效果越好。實驗表明,K近鄰、線性模型、多項式模型、SVR模型預測中考總成績的MAE值分別為1.62、1.41、1.40和1.32。由此可知,SVR模型獲得了最好的預測效果。本文還對各體育專項進行了預測實驗,結果表明,SVR模型在1000米,800米,50米、實心球和坐位體前屈項目上獲得了較好的預測效果。以下散點圖展示了中考體育總成績及各專項成績的真實值與預測值之間的相關性。

四、結語

在本文研究的所有的預測模型中使用了徑向基核函數的SVR模型獲得了最好的預測效果。預測結果和真實值具有明顯的正相關性,說明本文設計的預測模型是十分有效的。從而可以為學生選擇中考體育項目提供一定的數據參考,為體育總成績的預估提供依據。

猜你喜歡
中考體育模型
一半模型
因式分解中考都考啥
重要模型『一線三等角』
提倡體育100分 也需未雨綢繆
甘肅教育(2020年2期)2020-11-25 00:50:04
重尾非線性自回歸模型自加權M-估計的漸近分布
伴你走進“旋轉”中考園
垂直平分線,中考怎樣考?
2016體育年
3D打印中的模型分割與打包
我們的“體育夢”
主站蜘蛛池模板: 五月天久久综合国产一区二区| 色亚洲成人| 全色黄大色大片免费久久老太| 国产真实乱子伦精品视手机观看 | 欧美日韩导航| 99久久精品久久久久久婷婷| 国产高潮流白浆视频| 四虎AV麻豆| 色婷婷色丁香| 亚洲国产成人久久精品软件| 免费高清毛片| 青青久视频| 国产视频大全| 日本欧美在线观看| 亚洲a级毛片| 精品福利视频导航| 国产成人精品一区二区三在线观看| 欧洲av毛片| 青青久在线视频免费观看| 午夜综合网| 国产精品人人做人人爽人人添| 亚洲第一区欧美国产综合| 午夜视频免费一区二区在线看| 国产女人水多毛片18| 国产av无码日韩av无码网站| 波多野结衣久久高清免费| 国产精品19p| 国产成人亚洲精品蜜芽影院| 国产精品高清国产三级囯产AV| 国产欧美视频综合二区| 国产精品毛片一区| 国产成人区在线观看视频| 国产成人一区在线播放| 色网站在线视频| 亚洲精品在线观看91| 国内精品一区二区在线观看 | 成人国产一区二区三区| 国产精品v欧美| 99久久精品国产自免费| 一级看片免费视频| 国产大片喷水在线在线视频| a网站在线观看| 在线一级毛片| 91美女视频在线观看| 欧美一区精品| 国产三级a| 色综合色国产热无码一| 亚洲男人的天堂网| 日韩av手机在线| 中文字幕在线一区二区在线| 亚洲第七页| 热九九精品| 99久久亚洲精品影院| 国产在线精品99一区不卡| 人妻夜夜爽天天爽| 久久99国产综合精品1| 国产成人精品一区二区秒拍1o| 凹凸国产分类在线观看| 国产福利2021最新在线观看| 国内精品一区二区在线观看| 欧美天堂久久| 国产女人喷水视频| 极品尤物av美乳在线观看| 777午夜精品电影免费看| 亚洲国产欧洲精品路线久久| 国产va在线观看免费| 99re视频在线| 国产杨幂丝袜av在线播放| 色成人综合| 欧美日本二区| 欧美国产另类| 91啪在线| 国产精品网址你懂的| 在线观看精品国产入口| 99视频有精品视频免费观看| 国产剧情一区二区| 亚洲精品无码av中文字幕| 在线看AV天堂| 亚洲精品男人天堂| 欧美色99| 日本欧美中文字幕精品亚洲| 成人免费午间影院在线观看|