袁俊杰
近年來,奧運會正日益成為許多國家增強國家軟實力、提升國家形象的重要手段。準確預測各國奧運金牌總數和排名,對制訂我國奧運參賽目標有著十分重要的意義,也是人們在奧運會前關注的熱門話題。
隨著大數據時代的來臨,由已知推測未知的可靠性和精準性也隨之提高。2012年,荷蘭著名體育數據公司Infostrada(后被Gracenote公司收購)利用大數據技術匯總奧運會、世界錦標賽、世界杯(或同級別的比賽)等賽事成績,將比賽名次、比賽時間距奧運會的遠近、比賽級別(奧運會、世界錦標賽、世界杯)設定不同權值,利用某種運算統計預測出各國奧運金牌數。
比賽名次是由運動員自身發揮、對手在比賽中的表現、裁判的評定行為三方面因素決定的,每個方面的異常都會導致名次的變化。世界錦標賽是除奧運會以外的最高水平比賽之一,同場競技,比賽環境相同,世界錦標賽的名次無疑是奧運會金牌預測的最好依據。以世界錦標賽為主的世界高水平體育賽事的名次與奧運金牌到底有什么關系?本文以田徑為例,分析世界錦標賽名次與奧運金牌的關聯程度,期望能利用相關權值來建立奧運金牌預測模型。
田徑世界錦標賽每兩年舉辦一次,分別在每個奧運周期的第一年和第三年。本研究選取了1997-2019年間的田徑世界錦標賽前8名(剔除非奧運項目)、2000-2016年奧運會的田徑金牌獲得者等數據進行研究分析。
主要采用文獻資料法、數理統計法、對比分析法、倒推法進行研究。
通過檢索國際田徑聯合會網站(www.iaaf.org)的相關成績數據,整理導入到Access數據庫中,編寫SQL語句結合Excel軟件對數據進行統計,對比分析統計結果推算出一個公式,最后代入歷史數據進行驗證。
統計結果表明,田徑世界錦標賽的每個名次的運動員都有可能獲得奧運金牌,每個名次獲得奧運金牌的概率是不同的,基本上第一名獲奧運金牌的概率最大。
奧運周期第一年的田徑世界錦標賽的前3名運動員獲得奧運會金牌的平均概率分別為19.3%、9.4%和5.1%;奧運周期第三年的田徑世界錦標賽的前3名運動員獲得奧運會金牌的平均概率分別為28.3%、16.3%和6.0%,明顯高于奧運周期第一年的田徑世界錦標賽。但4-8名的奪金概率在第一年和第三年并沒有太大差距。
奧運周期第一年的田徑世界錦標賽的前8名運動員平均能獲得當屆奧運田徑金牌的47.2%左右,奧運周期第三年的田徑世界錦標賽的前8名運動員平均能獲得63%的奧運會田徑金牌,明顯高于奧運周期第一年的田徑世界錦標賽。從近幾屆世界錦標賽看,前八名奪金概率隱有上升趨勢。即使2015年田徑世界錦標賽前8名運動員獲奧運金牌最多,也僅為奧運田徑金牌的72.3%。其余30%左右的金牌,被世界錦標賽前8名以外的運動員和未參加當屆世界錦標賽的運動員獲得?!昂隈R”頻現,意外爆冷,這種不可預測性正是體育競賽獨特的魅力。

表2 各奧運周期第三年田徑世界錦標賽前8名獲奧運金牌概率
近5屆奧運會的田徑比賽中,共有51個國家獲得過金牌,其中僅有10個國家獲得過5枚及以上金牌,即只有10個國家平均每屆奧運會獲1枚以上金牌。曾獲得各周期第一年世界錦標賽第一名的國家中,有17個國家獲得當屆奧運會金牌;有12個國家雖未進入世界錦標賽前八,但各獲1-2枚奧運金牌,希臘更是共獲4金;曾獲得各周期第三年世界錦標賽第一名的國家中,有27個國家獲得當屆奧運會金牌,有7個國家雖未進入世界錦標賽前八名,但各獲得1-2枚奧運金牌。巧的是,各有9個國家雖然在第一年或第三年世界錦標賽上獲得過第一名,但沒有在奧運會上奪金。

表3 各國在奧運周期第一年的田徑世界錦標賽上前8名獲奧運金牌的概率

表4 各國在奧運周期第三年的田徑世界錦標賽上前8名獲奧運金牌的概率
從表中可以看出,在同一世界錦標賽的相同名次下,不同國家獲奧運金牌的概率不同,并且與該項目的平均概率也不同。前10名國家中,奧運周期第一年和第三年世界錦標賽成績中,美國、牙買加、英國和波蘭第一名的奧運奪金概率都遠高于平均值。古巴和埃塞俄比亞分別在第一年和第三年略高于平均值,其他5國則低于平均概率。前八名的奪金概率也各有一半國家分散在平均值兩側。
不同國家世界錦標賽前8名運動員奪得奧運金牌數占該國奧運田徑金牌總數的比例也不同,這與該國奧運田徑金牌總數和排名并沒關系,有些國家的奧運田徑金牌全部由世界錦標賽前8名的運動員奪得,有些國家世界錦標賽前8名運動員沒有獲得奧運金牌,反而由其他運動員爆冷奪金。
從世界錦標賽第一名的奪金概率來看,各國的奧運周期第三年的概率都明顯大于奧運周期第一年的概率;同樣,大多數國家在奧運周期第三年世界錦標賽的前8名運動員比奧運周期第一年世界錦標賽的前8名運動員能獲得更多的奧運金牌,這與項目整體統計結果是一致的。
根據上面分析,可以簡單推出一個公式:G=(∑Rn·Vn)/P8(其中n=第1……8名;G=預測金牌數;Rn=世界錦標賽第n名的總數;Vn=世界錦標賽第n名獲奧運金牌的概率;P8=世界錦標賽前8名獲奧運金牌的數量占該項目奧運金牌總數的百分比)。
選取近5屆奧運會各獲5枚以上田徑金牌的10個國家,根據上面公式來倒推各屆奧運會田徑金牌的預測值,以田徑世界錦標賽第一名的總數作為參考值,進行對比分析,每個國家按照周期第一年世界錦標賽和第三年世界錦標賽計算,各得到5組數據,經比較得到表5。

表5 田徑世界錦標賽第一名總數(參考值)、本模型預測值與實際值誤差次數比較
從表5可以看出,美國、肯尼亞、英國、德國這4個國家,誤差縮小的次數遠大于誤差增大的次數,按照公式計算出的數值明顯比參考值更接近實際金牌數。俄羅斯、牙買加埃塞俄比亞等國家并不明顯,誤差縮小和持平的總次數略比誤差增大的次數多,而波蘭、中國、古巴則持平,誤差縮小和持平的總次數基本與誤差增大的次數相等。
從這幾個國家的倒推結果可以發現,現在的統計誤差比參考值都有不同程度的減小。因此,采用各國家每個名次的奧運奪金概率來計算金牌預測值是可行的,當然還需要進一步考慮主場因素、歷史成績等其他因素來調整權值。
根據2017年田徑世界錦標賽的前八名成績,用預測模型計算出這10個國家在2020年東京奧運會田徑項目上可能獲得的金牌數分別為:美國10枚,肯尼亞和英國各4枚,牙買加3枚,俄羅斯、埃塞俄比亞和波蘭各2枚,德國和中國各1枚,古巴0枚。而根據2019年田徑世界錦標賽的前八名成績,計算出這些國家在2020年東京奧運會田徑項目上可能獲得的金牌數分別為:美國13枚,牙買加5枚,肯尼亞、英國和中國各3枚,埃塞俄比亞和波蘭各2枚,俄羅斯、德國和古巴各1枚。這些結果留待日后驗證。

表6 根據2017年、2019年世界錦標賽成績預測的2020年東京奧運會田徑金牌
1.對田徑項目來說,世界錦標賽前3名的奧運奪金概率依名次遞減,第1名的奧運奪金概率最高;世界錦標賽距離奧運會越近,第1名的奧運奪金概率越高;奧運金牌獲得者并不一定是世界錦標賽的前8名運動員。
2.在同一世界錦標賽的同一名次下,不同國家奪得奧運金牌的概率不同。世界錦標賽距離奧運會越近,同一國家的世界錦標賽第1名的奧運奪金概率越高,世界錦標賽前8名運動員奪得奧運金牌也越多。
3.利用每個世界錦標賽名次的總數、該名次對應的奧運奪金概率、世界錦標賽前8名所獲奧運金牌數占該項目奧運金牌總數的百分比來預測某個國家某個項目的奧運金牌預測值數是可行的。
4.建議對所有奧運項目的世界錦標賽、世界杯(世界杯總決賽)等世界最高水平的比賽名次與奧運會成績進行對比分析,同時考慮奧運會各項目參賽名額限制和主場等其他因素,在大數據環境下完善預測模型,提高奧運金牌預測的準確率,為我國制定奧運目標提供數據支撐。