□劉博洋(南開中學天津300100)
NBA球員排名系統的分析與評價
□劉博洋(南開中學天津300100)
為了評價NBA球員的表現,ESPN(英文:Entertainment and Sports Programming Network,即娛樂與體育節目電視網,一般簡稱ESPN)在每年NBA休賽季組織專家對球員進行排名,并提出了一套成體系的排名系統,為NBA官方所采用。然而,很多球迷認為該系統對進攻型球員有一定的偏袒性。本文從統計分析的角度出發,以2013年ESPN排名前50的球員得分為樣本,計算進攻型球員和防守型球員得分的平均值,并進一步分析兩種球員得分平均值是否有顯著性差異。統計軟件計算的結果未通過t檢驗,說明球員得分有顯著的不同,即該系統確實有一定的偏袒性。
NBA排名假設檢驗顯著性分析
為了評估NBA球員在球場上的單場平均效率,NBA官方采用了ESPN專家約翰?霍林格提出的球員價值評估數據體系。利用PER值,可以將球員所有表現記錄下來,然后加權集成,綜合而成,便可以對不同位置、不同年代的球員進行評估和比較。其計算公式為:[ (得分數+助攻數+總籃板數+搶斷數+蓋帽數)-(投籃出手數-投籃命中數)-(罰球出手數-罰球命中數)-失誤數]/球員的比賽場次,這個依據的得出,可以綜合判斷球員良性表現,并且參照球員的球場不良表現,接著根據球員出場的次數來得出單場平均的效率表現,加以排名。然而,卻有一些專家對此頗有微詞,認為這個排名體系對進攻型球員有所偏袒。因此,本文以2013年EPSN排名中前五十的球員為樣本,分析該排名中進攻型球員與防守型球員的得分是否有統計學意義上的顯著性區別。若區別顯著,則認為該排名系統有所偏袒;若區別不顯著,則認為該排名系統對于進攻型與防守型的球員的評價是公平的。
2.1、模型假設與符號

2.2、兩樣本的差異顯著性檢驗
假設檢驗,即對所估計的總體提出相應的假設,通過實驗或調查得到的樣本數據,用統計方法對樣本數據進行分析,依據樣本提供的有限信息,來檢驗假設是否成立,推斷總體情況的一種統計學方法。在假設檢驗中,我們常把一個要檢驗的假設記做,稱為原假設或零假設,而把與之對立的假設稱為,稱為備擇假設。假設檢驗有可能犯兩類錯誤,在原假設為真時決定放棄原假設,稱為第一類錯誤,也稱“棄真”錯誤,這類錯誤出現的概率記為;在原假設為假時決定接受原假設,稱為第二類錯誤,也稱“存偽”錯誤,這類錯誤出現的概率,記為。如果我們控制第一類錯誤出現的概率小于一定的閾值,如0.01、0.05,則這樣的假設檢驗也稱顯著性檢驗,稱為顯著性水平。在本文中,我們使用兩個獨立樣本的t檢驗,即根據樣本數據對兩個樣本來自的兩獨立總體的均值是否有顯著差異進行推斷。
2.3、t檢驗的前提條件
(1)兩樣本相互獨立;
(2)樣本來自的兩個總體服從正態分布。
2.4、檢驗步驟
(1)考慮兩個正態總體,其均值分別為和;
(2)寫出原假設和備擇假設:

(3)選取一定的顯著性水平;
(4)構造檢驗統計量,由于此時兩總體方差未知且不等,構造t統計量如下:

在H0下,
其中

(5)用統計軟件計算出t值及其對應的P值;
(6)做出推斷:
①若P值顯著性水平,則拒絕原假設,即認為兩總體均值有顯著性差異;
②若P值顯著性水平,則接受原假設,即認為兩總體均值沒有顯著性差異。
(1)我們選取2013年排名前50的球員作為樣本,樣本量相對比較大,因此我們可以近似認為樣本是服從正態分布的;可將球員分為兩部分,一部分屬于進攻型球員,如,中鋒,前鋒,另一部分屬于防守型球員,如后衛,根據實際情況可知,兩種球員來自相互獨立的兩個總體,所以,可以使用t檢驗。
(2)作出原假設和備擇假設:

(3)代入實際數據。
根據2014年EPSN排名前50的球員的得分,經過簡單的數據處理可知:進攻型球員的平均得分=20.62,防守型球員的平均得分=20.18,進攻型球員得分的方差=11.89,防守型球員得分的方差=10.43,進攻型球員的樣本量=32,防守型球員的樣本量=18。經過統計軟件計算,可以得到與之對應的P值=0.65472。
(4)得出結論。
一般情況下,我們經常采取0.01、0.05、0.1這三個值作為顯著性水平,在這三個顯著性水平下,P值均大于這個臨界值,所以拒絕原假設,即認為進攻型球員與防守型球員得分有顯著性的差異。這也說明該系統確實具有一定的偏袒性。
該模型從生活實際入手,從實際中發現問題,并用科學的統計分析的方法分析和解決問題,對日常生活中的問題給出了科學的解釋。然而,該模型也有一定的不足之處,首先,該模型僅選取了2013年中一部分球員的得分進行分析,相對于NBA這項宏大的賽事多年積累的賽事經驗,數據量偏小;其次,該模型的抽樣有一定的偏差,選取了排名前五十的球員作為樣本,這部分球員已經是整體上表現相對較好的球員,不能全面的代表NBA所有球員,若有條件,可以進一步考慮使用分層抽樣的方法獲取數據;最后,該模型使用EXCEL中的統計函數做數據分析,分析的結果可能稍有誤差,考慮到兩樣本均值十分接近,應努力消除該誤差的影響,采用R,SPSS等多種統計分析軟件進行相互驗證,以確保結論的科學準確性。

附表:2013-2014 NBA常規賽技術統計排行——得分榜
[1]2013年ESPN球員排名.美國有線電視聯播網.
[2]何丹等.基于因子分析的NBA現役球員綜合能力評價[J].漢口學院學報,2013.
G811
A
1006-8902-(2016)-11-SY