利物浦俱樂部舊隊徽
十幾年前,利物浦越打越差瀕臨破產,在2007年和2010年兩次被轉賣。2010年,靠研發預測大豆市場波動算法走上致富之路的期貨交易員John Henry買下了利物浦俱樂部。他決心用自己擅長的數據分析改造這支隊伍。
最早用數據打球的奇人是比利·比恩。他用賽伯計量學統計棒球數據,把運動員的表現量化,挑選那些被低估的球員,就和現在玩足球經理游戲差不多。2002年,比恩靠著數據分析讓美國職棒的小球隊奧克蘭運動家隊拿下了創紀錄的20連勝的奇跡。這個故事后來被拍成了好萊塢電影《點球成金》。
繼棒球之后籃球等競技體育也開始引入數據分析。不過由于足球的進球數就是籃球的零頭,對足球進行數據分析十分困難。切爾西和阿森納,都曾做過數據分析的嘗試,但是兩個頂級俱樂部都沒有發現數據分析的好處,因此并不十分看重他們各自的科研團隊。不少媒體和球員對數據踢球也是相當抵制。前英超中場Craig Burley曾經表示,“期望進球(射門成功概率)就是胡扯。”
實際上外界的看衰似乎有點道理,在Henry接手后的頭6個賽季里,利物浦戰績依然不佳。但是Henry仍然相信大豆市場和足球運動一樣都由數學規律支配。2012年,他把一個重量級的數據分析師Ian Graham納入麾下。Graham加入后,利物浦開始逆襲了。
Ian Graham是劍橋大學高分子物理方面的博士后,但他并不想成為物理學家,而是加入一家給足球隊做數據分析的初創公司。
Graham在俱樂部相當強勢,他在教練和運動員選秀的過程中有一票否決權。其他俱樂部雖然也有數據分析師,但是在他們決策層的話語權并沒有利物浦的這樣高。
利物浦的球員納比·凱塔在2014年接受采訪時表示:“有人給利物浦介紹球員的時候,都要先讓Graham的模型過一遍,如果Graham的模型說不可以,那么俱樂部就不會簽這個人。”不僅是球員,就連利物浦現在的教練尤爾根·克洛普也是Graham用模型跑了一遍才被認可的。
那么,Graham的模型真的挑出了有潛能的球員嗎?我們來看看一些事實。
Graham 2012年加入利物浦時的主要任務就是分析巴西球員菲利佩·庫蒂尼奧是否有采購的價值。Graham一波分析之后發現,小哥性價比很高,于是庫蒂尼奧就被簽約了。
過了一段時間,庫蒂尼奧升值之后,利物浦又把他賣掉,就和炒股票似的。這一波操作后,利物浦賺到了大筆溢價,終于有錢買下維吉爾·范戴克、阿利森·貝克爾和法比尼奧這些估值偏低的球員。當然,這些隊員都是Graham分析之后推薦給俱樂部的。事實證明,這3人加強了利物浦的防守陣容。
通過數據分析,Graham還曾推薦利物浦買下穆罕默德·薩拉赫。最終在2017年6月,利物浦以4100萬美金的價格簽下了薩拉赫。這個決定相當英明,因為在為利物浦效力期間,薩拉赫打破了當時英超的紀錄,進球32個。
除了頂梁柱Graham,俱樂部的體育總監Michael Edwards也是數據分析師出身。利物浦的數理大牛還包括天體物理學家Tim Waskett、哈佛畢業的Will Spearman、世界青年國際象棋錦標賽冠軍Dafydd Steele。
Tim Waskett曾為歐足聯歐洲聯賽做軟件開發和統計分析。Will Spearman曾在歐洲核子研究中心(CERN)研究高能物理,原本方向是希格斯玻色子。Dafydd Steele是數學專業曾在能源部門工作。看照片中間這些大哥就是利物浦俱樂部的數據分析師們。
數據分析師Ian Graham
利物浦俱樂部的數據分析師們(紅圈)
在這些數據分析師的助陣下,Graham更是如虎添翼。利物浦榮獲上賽季歐洲冠軍杯、國際足聯世界俱樂部杯和歐洲超級杯。
當然,贏并不是關鍵,關鍵是贏得壕。在本賽季,利物浦領先第二名25分,在過去的25場比賽里一場都沒有輸,失球數比第二名少11個,控場能力相當驚人。
所以問題來了,利物浦的數據分析師到底做了什么,讓俱樂部變得這么優秀呢?
具體細節當然是機密,但是可以確定的是利物浦搜集了海量的數據,用來決定哪些球員該在哪場比賽里踢哪個位置,應該用哪種策略更有機會贏。
利物浦也是最早使用從數據科學中誕生的打法——球場控制(pitch control)的俱樂部。
在2019年的英國皇家科學院圣誕講座上,Waskett介紹,他們會搜集每場球賽中每次球員和足球接觸的數據;而在英超的比賽里,他們還能得到額外的追蹤數據,因為賽場周圍有一圈監控攝像頭,它們可以以每秒25幀的速度實時記錄球員和球的運動,一場球賽下來就有150萬數據點。這就是球場控制的主要數據來源。
Waskett介紹“通過分析射門發生的位置以及成功率,就可以對未來類似的情況進行統計預測。”每個球員都有自己的期望進球,根據這些統計數據,球員就知道自己在什么位置射門更容易進球。
利物浦的球場控制到底長啥樣呢?
圖中藍色小圓球是隊友,紅色是對手,黃色的是目前控球的人。藍色區域代表有進球可能的區域,所以要把球傳給藍色位置的球員才行。
球場控制的理念已經逐漸被更多俱樂部采用。
下圖是在2018年麻省理工斯隆運動分析大會上,巴塞羅那隊的數據分析師分享的球場控制圖,紅色代表有進球價值,綠色代表沒有進球價值。
你可能會想,這些數據分析師在分析的時候,會不會和我們普通球迷一樣,看運動員的具體表現給建議呢?
令人意外的是,Graham透露他在做分析的時候,完全不看視頻,只相信數據分析的結果。他說:“視頻會讓你有偏誤。”因此,他的團隊得出的一些建議常常和普通球迷甚至教練看視頻時的直覺反應相反。
當然,平時運動員的訓練數據也能派上用場。這些球員在訓練的時候,就會穿上一個帶有GPS的小背包。會記錄球員訓練時的運動距離、速度、加速度。這些數據被用來分析球員,優化他們的訓練,提升他們的表現,然后以更好的價格賣出去。
利物浦足球的口號是“你永遠不會獨行(Youll Never Walk Alone)。”沒想到這句話居然在原本最不可能組成CP的體育特長生和理科尖子生上應驗了。
看完利物浦的故事我們明白,數學好玩個球啊!(請自行斷句)
(本文經授權轉載自“把科學帶回家”微信公眾號,有刪節)
利物浦的球場控制實時分析圖
巴塞羅那的球場控制圖
數據分析在訓練時的應用