








本周末看了布拉德皮特演的一部豆瓣高分傳記電影《點石成金》(英文原名moneyball),當然這部電影不是講賺錢或者炒股的電影,而是一部體育題材的電影。該片講述了奧克蘭運動家棒球隊總經理比利·比恩招了一個MIT畢業的完全不懂棒球的數據分析師,而他如何運用數據去發掘被低估的球員,以小搏大、力抗其它薪資總額比他們多上數倍的大球隊的故事。
這部電影改編自邁克爾·劉易斯(Michael Lewis)的暢銷書《點石成金》。有人會質疑說這本書是不是在夸大數據分析的作用,質疑現在說的體育大數據是噱頭。
我們今天來聊聊體育數據分析。目前體育大數據比較模糊,研究應該是屬于體育數據分析(即體育分析)的一部分。體育數據分析的定義(Sports Analytics)是借用體育相關數據(例如運動員統計資料、戰術信息等等一系列與研究對象相關的信息)來發掘有價值特征(相關性、隱藏趨勢等等),并通過圖形、報告等形式傳達給終端決策者的一種過程。
體育數據分析歷史
這最早要追溯到1920年英國生理學家A.V.希爾定義了最大攝氧量的概念,來衡量運動員攝入氧氣的能力。說到最重要的奠基人,不得不提到一個人:比爾-詹姆斯,被稱為棒球統計界的一哥。他出版了《棒球摘要》,是棒球數據分析的創始人。其棒球分析法被稱為Sabermetrics(賽伯計量學,又稱棒球統計學),可以科學地分析并研究棒球比賽,通過對統計學數據的應用來探討球隊贏球和輸球的原因。
《點石成金》電影中講述的前奧克蘭運動家總經理、現棒球運營副總兼小老板比利-比恩則是將棒球數據分析發揚光大之人。2002年比恩拒絕了波士頓紅襪隊老板亨利(也是英超利物浦足球隊的老板)的高薪待遇,亨利數學極好,是個重視數據分析的老板,轉而邀請了詹姆斯,詹姆斯也用實際行動證明自己不僅是學術派還是運用理論的實踐家,棒球數據分析方法指導波士頓紅襪隊總共四次奪得世界大賽冠軍,是MLB聯賽在本世紀拿下最多冠軍的球隊(04,07,13,18)。
體育數據分析怎么用
戰術制定的分析。通過分析對手技戰術和自己的特點制定攻防策略。在2015年的Sloan體育數據分析大會上,第25屆德甲冠軍拜仁慕尼黑俱樂部的首席分析師Michael Niemeyer講述了當時的教練瓜迪奧拉是如何開始接受并使用數據分析的方法的。在拜仁對戰羅馬的時候,球員位置的數據表明羅馬隊的球星托蒂只有在另外兩個隊友之后的站位才能發揮好,了解這樣的信息就能使拜仁以三后衛的陣型仍然能防住羅馬鋒線的進攻。
中國女排同樣也有數據分析師袁靈犀,現場輸入記錄,依賴于軟件生成數據分析圖,每局比賽結束助理教練會把袁靈犀打印出來的技術統計拿給現場指揮的郎導和安導。
球員評估的分析。幫助球隊準確評估球員價值并尋找到適合球隊的技戰術風格的隊員,主要是應用于球探和球員轉會市場,也是《點球成金》中主要的應用領域,尋找性價比高,有潛力的運動員。筆者之前有做過一個棒球數據集的分析,評估球員的上壘率的影響因素,下面一張圖可以看到(橫軸是體重,縱軸是打擊率)。
球員訓練反饋的分析。通過傳感器收集數據,分析使用者的運動信息(動作速度、角度、幅度、力度等數據,)以及運動習慣(左、右手)來糾正運動姿勢并反饋技戰術特點統計,以此提高使用者的技戰術水平。這個主要是適用于個人運動頻次比較高的領域,如棒球,高爾夫等。
哪些運動在用體育運動分析
體育競技是目前體育分析行業發展的核心領域,國際職業體育聯盟和球隊對體育數字化分析已經有了較為廣泛的應用。舉個美國大聯盟的例子,美國有四大體育聯盟MLB(國家棒球聯盟),NFL(國家橄欖球聯盟),NBA(美職籃),NHL(國家冰球聯盟)。我們對比可以發現棒球和籃球中雇傭數據分析師的比例最高。
數據從哪里來
全球一線的數據采集商,目前至少有10多家頂級的數據源。國外相關產業起步比較早,發展也比較成熟,Opta、Enetpuls、SportsRadar直接這些就是比較大型和知名的公司,而被足球迷所熟知的幾大足球聯賽比賽期間的數據統計較多的使用的是OPTA的數據源,此外還有ESPN API, Rapid API, iSportsAPI等數據服務接口不斷涌現。
來自于視頻圖像中數據;目前這塊還不是特別成熟,隨著云計算和圖像識別,機器學習的發展,相信包括在排球比賽中更多的不是靠分析師手工的輸入,而是讓分析師更多關注于分析結果的輸出。
智能硬件中返回的運動和訓練的數據,可以幫助球員評估訓練效果和預測傷病等。
隨著科技的發展,體育數據分析,未來會在體育競技水平提高上扮演著越來越重要的作用,如果你既懂球,也懂數據分析,那么這是個值得令人期待的領域。
來源:數據氧氣、知乎