于浩洋++黃亞玲
摘要:隨著科技的進步和人們生活的互聯(lián)網化,圍繞著大數(shù)據(jù)的應用范疇將越來越多,一場關系到人們生活、工作、思維的“大數(shù)據(jù)”時代悄然來臨,作為體育人更應該跟上時代的腳步,探析“大數(shù)據(jù)”時代下體育相關領域的變革。采用文獻資料法和邏輯分析法,對“大數(shù)據(jù)”的核心及本質進行分析;通過體育領域相關案例分析“大數(shù)據(jù)”給體育領域帶來的巨大變革:觀賽體驗的提升、體育科學重新洗牌以及體育數(shù)據(jù)科學家的崛起等。
關鍵詞:大數(shù)據(jù);體育;觀賽體驗;體育科學;挑戰(zhàn)
中圖分類號:G8116文獻標識碼:A文章編號:16-276(215)2-5-5
Abstract:WiththeprogressofscienceandtechnologyandInternetbecomingembeddedinpeople'severydaylife,moreandmoreapplicationsonBigDatawillbeappliedhe"BigDataEra"relatedtopeople'slife,workandthinkingiscomingquietlyAsthepeopleforsports,weshouldkeeppacewiththetimestoanalyzerelevantreforminthefieldofsportsinthiseraWiththemethodsofliteraturereviewandlogicalanalysis,thispaperhasanalyzedthecoreandessenceoftheBigDataheanalysisofsomesportsrelatedcaseshasrevealedthebigchangesthatBigDatahasbroughttosports:ascensionofmatch-watchingexperience,majorbreakthroughinsportsscienceandtheriseofscientistsinsportsdata,etc
eywords:BigData;sports;match-watchingexperience;sportsscience;challenge
在NBA比賽轉播中,曾經出現(xiàn)過這樣一個場景,電視解說稱:“在25年12月17日之后,姚明只參加了火箭56%的常規(guī)賽,在這段期間,姚明上場的時候,火箭隊勝率為623%,姚明缺陣的時候,火箭勝率為52%;姚明背靠背比賽得分比兩場比賽間休息2天的得分平均高26分。”上述就是來自“大數(shù)據(jù)”的直觀應用,教練員和運動員通過每項賽事背后的技術統(tǒng)計來評價本場比賽發(fā)揮的好壞,而這些數(shù)據(jù)也將直接影響教練員對比賽的掌控。
與NBA類似,網球也涉及大量的數(shù)據(jù):一發(fā)成功率、一發(fā)得分率和Ace球是標志球員競技水平的關鍵指標;發(fā)球速度、接發(fā)球成功率、上網成功率、得分點則突出體現(xiàn)了球員的打法特點,如果非受迫性失誤和雙發(fā)失誤率上升,那表明球員的心理狀態(tài)或者體力開始下滑。212年,3歲的羅迪克宣布退役,此前他3次打入大滿貫決賽,均遺憾輸給費德勒。外界曾分析,羅迪克的退役與其3次被瑞士人淘汰有關,羅迪克和他教練無法找到擊敗費德勒的針對性方案,不得不在同一個地方摔倒3次。但是,在IBM的大數(shù)據(jù)系統(tǒng)看來,費德勒并非無法戰(zhàn)勝。系統(tǒng)顯示,羅迪克在兩次或更少擊球的“對打”勝率為7%,一旦將該數(shù)據(jù)提升到56%,他將有機會在3次面對費德勒時均贏得大滿貫賽事。
大數(shù)據(jù)系統(tǒng)對網球比賽而言是一次顛覆性的進步,它能針對性地為比賽選手提供最優(yōu)戰(zhàn)術。IBM為此收集分析了過去8年的大滿貫比賽數(shù)據(jù),通過對1萬個歷史數(shù)據(jù)信息的分析,來為每一個大滿貫選手模擬了一個對比數(shù)據(jù)庫[2]。對于球員和教練而言,重要的是最佳成績和獲勝。IBM每場比賽后為每個球員和教練提供比賽和視頻分析。一系列IBM分析軟件對比賽數(shù)據(jù)進行運算,并逐點實現(xiàn)數(shù)據(jù)與整場比賽視頻同步,提供關于哪些方面表現(xiàn)良好、哪些方面需要改進的詳細視圖。由此看來,大數(shù)據(jù)在網球賽事中的普及運用將更高效地培養(yǎng)和提高職業(yè)網球選手的能力,增加整個行業(yè)的競爭性。
那么我們不禁要問,到底什么是“大數(shù)據(jù)”,“大數(shù)據(jù)”難道僅僅指計算機系統(tǒng)軟件分析?大數(shù)據(jù)時代又將是一個什么時代?除此之外,大數(shù)據(jù)時代對我們的體育領域又將會產生哪些深刻的影響呢?本文將帶領讀者一起探討這些問題。
1研究方法
本文采用文獻資料法和邏輯分析法,對“大數(shù)據(jù)”的核心及本質進行分析;通過體育領域相關案例分析“大數(shù)據(jù)”給體育領域帶來的巨大變革:觀賽體驗的提升、體育科學重新洗牌以及體育數(shù)據(jù)科學家的崛起等。
2研究結果與分析
21“大數(shù)據(jù)”時代的三大核心轉變
29年,甲型1N1流感爆發(fā)的時候,與習慣性滯后的官方數(shù)據(jù)相比,谷歌成為了一個更有效、更及時的指示標。公共衛(wèi)生機構的官員獲得了非常有價值的數(shù)據(jù)信息。驚人的是谷歌公司的方法甚至不需要分發(fā)口腔試紙和聯(lián)系醫(yī)生——它是建立在大數(shù)據(jù)基礎上的。這是當今社會獨有的一種新能力:以一種前所未有的方式,通過海量數(shù)據(jù)進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。時至今日,大數(shù)據(jù)的應用已經深入到我們生活、工作的方方面面,而大數(shù)據(jù)的精髓在于我們分析信息時的三個轉變,這些轉變將改變我們理解和組建社會的方法:
211第一個轉變就是,在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關的所有數(shù)據(jù),而不再依賴于隨機抽樣。
19世紀以來,當我們面臨大量數(shù)據(jù)時,社會都依賴于采樣分析。但是采樣分析是信息缺乏時代和信息流通受限制的模擬時代的產物。以前我們通常把這看成是理所當然的限制,但高性能數(shù)字技術的流行讓我們意識到,這其實是一種人為的限制,與局限在小數(shù)據(jù)范圍相比,使用一切數(shù)據(jù)為我們帶來了更高的精確性,也讓我們看到了樣本無法揭示的細節(jié)信息。
212第二個轉變就是,研究數(shù)據(jù)之多,以至于我們不再熱衷于追求精確度。
當我們測量事物的能力受限時,關注最重要的事情和獲取最精確的結果是可取的。直到今天,我們的數(shù)字技術依然建立在精準的基礎上。我們假設只要數(shù)據(jù)表格把數(shù)據(jù)排序,數(shù)據(jù)庫引擎就可以找出和我們檢索內容完全一致的檢索記錄。
這種思維方式適用于掌握“小數(shù)據(jù)量”情況,因為需要分析的數(shù)據(jù)很少,所以我們必須盡可能精準地量化我們的記錄。在某些方面,我們已經意識到了差別。例如,我們不可能用“分”在各個單位去精確度量國民生產總值。隨著規(guī)模的擴大,對精確度的癡迷將減弱。達到精確需要有專業(yè)的數(shù)據(jù)庫。針對小數(shù)據(jù)量和特定事情,追求精確性依然是可行的,比如一個人在銀行賬戶上是否有足夠的錢用來消費。但是在這個大數(shù)據(jù)時代,很多時候,追求精確性已經變得不可行,甚至不受歡迎了。當我們擁有海量數(shù)據(jù)時,絕對的精準不再是我們追求的主要目標。擁有了大數(shù)據(jù),我們不再需要對一個現(xiàn)象刨根問底,只要掌握大體的發(fā)展方向即可。當然我們不是完全放棄精確度,只是不再沉迷于此。適當忽略微觀層面上的精確度會讓我們在宏觀層面擁有更好的洞察力。
213第三個轉變因前二個轉變而促成,即我們不再熱衷于尋找因果關系,而是相關關系。
尋找因果關系是我們人類長久以來的習慣。即使確定因果關系很困難而且用途不大,人類還是習慣性地尋找緣由。相反,在大數(shù)據(jù)時代,我們無需再盯緊事物之間的因果關系,而應該尋找事物之間的相關關系,這會給我們提供新穎且有價值的觀點。相關關系也許不能準確告知我們某件事情為何會發(fā)生,但是它會提醒我們這件事情正在發(fā)生。在很多情況下,這種提醒本身已經足夠強大。如果數(shù)百萬電子醫(yī)療記錄顯示橙汁和阿司匹林的特定組合可以治療癌癥,那么找出具體的藥理機制就沒有這種治療方法本身來得重要。同樣,假如林書豪和哈登二人同時在場時,火箭的勝率要更高,想必主教練一定不會放棄二人其中一人,就算不知道原因也無所謂了。大數(shù)據(jù)告訴我們“是什么”而不是“為什么”。在大數(shù)據(jù)時代,我們不必知道現(xiàn)象背后的原因,我們只要讓數(shù)據(jù)自己發(fā)聲。[3]
我們不再需要在還沒有收集數(shù)據(jù)之前,就把我們的分析建立在早已設立的少量假設的基礎上。讓數(shù)據(jù)發(fā)聲,我們會注意到很多以前從來沒有意識到的聯(lián)系的存在。大數(shù)據(jù)時代開啟了一場尋寶游戲,而人們對于數(shù)據(jù)的看法以及對于由因果關系向相關關系轉化時釋放出的潛在價值的態(tài)度,正是主宰這場游戲的關鍵。
大數(shù)據(jù)時代風起云涌,我們的生活、工作、思維將進行一場新的革命,而體育領域的重大變革必須引起我們體育人的高度重視。
22大數(shù)據(jù)時代下體育領域的變革
221觀賽體驗大變革
基于觀眾感受的體育科技創(chuàng)新,在近幾年達到了新的高度。尤其是大數(shù)據(jù)的智能運用,給世界知名的體育職業(yè)聯(lián)盟提供了新的發(fā)展契機。當前全球體育產業(yè)出現(xiàn)了幾個明顯區(qū)別于以往的不同之處。
從觀眾來看,目前最大的觀眾群出生于198年至1993年之間。這一代觀眾對各種新鮮事物都有好奇和期待,這其中包括親臨比賽現(xiàn)場的感受。同時,這一代觀眾無時無刻不在社交網絡上活躍著。社交網絡是數(shù)字信息時代增長得最快的一個部分。這也讓如今的體育產業(yè)相關數(shù)據(jù)出現(xiàn)巨大變化,在轉瞬即逝的2秒中,網絡里交錯傳播的數(shù)據(jù)就已超越過去2年整個互聯(lián)網儲存量的總和。
對于一支球隊來說,這些數(shù)據(jù)可以來自于方方面面:球迷、球員、球探報告、候選人、特許直播權以及現(xiàn)場直播。這種變化對世界上各大體育職業(yè)聯(lián)盟的發(fā)展提出了什么新要求?試想一下未來體育轉播的畫面:今后,比賽日他們不僅能收到來自隊員為其量身定制的信息,還能夠通過手機支持的忠實度賬戶獲得購買特許權,甚至在去洗手間排隊的間隙都可以收到實時戰(zhàn)況。如果遇上有人情緒失控,球迷們還能通過手機立即報告,將會有專人迅速呼叫保安人員,以保證比賽順利運行并提高賽場整體管理水平。你能想象從手機上投標賽后新聞發(fā)布會的座位嗎?或者預約在衣帽間外和明星球員照相合影?而這一切都將不再是夢想。
在NBA的官方網站上,有專門的統(tǒng)計頁面,這里面把NBA歷史上收集的幾乎所有球員、球隊信息以非常易用的方式提供出來,后臺使用了APANA這樣的內存分析數(shù)據(jù)庫,以應對網站數(shù)以萬計的訪問者的訪問,提高隨機、靈活查詢的速度,提供了一種前所未有的用戶體驗,對上百個指標的不同過濾、統(tǒng)計、排序等等,可以定制分析報表,而不需要大量固化報表格式和場景。NBA也徹底改變了球迷獲取球員數(shù)據(jù)的方式。如今,你不僅可以看到凱文杜蘭特是聯(lián)盟領先的得分手,而且能看到他的最高得分點,以及他是如何在這些關鍵時刻得分。頂尖的實時分析可以深入小到隊員的身體狀況,大到球隊的整體表現(xiàn)。教練不再需要黑板粉筆,最新的3D會自動模擬出下半場出場隊員表現(xiàn)。球員的身體狀況和安全會有科技支持提供監(jiān)控,球賽也會隨著數(shù)據(jù)革新變得更為智能,“最后沖刺”將變得更個性化,為觀眾帶來便利,選秀日同樣會實現(xiàn)數(shù)字化。
222體育社會科學的“噩夢”?
消極比賽一直被極力禁止,備受譴責,很多運動員備受困擾。芝加哥大學的一位經濟學家列維特和他的同事通過對日本國民體育運動“相撲”11年中超過6場摔跤比賽的記錄進行調查后發(fā)現(xiàn):非法操縱比賽結果的情況確實時有發(fā)生,但是不會出現(xiàn)在大家都很關注的比賽上。冠軍賽也有可能被操縱,但是數(shù)據(jù)表明消極比賽主要還是出現(xiàn)在不太被關注的聯(lián)賽的后幾場中。這時基本上沒有什么風險,因為很多選手根本就沒有獲獎的希望。
相撲比賽的一個比較特殊的方法就是,選手需要在15場賽事中大部分場次取得勝利才能保持排名和收入。這樣一來就會出現(xiàn)利益不對稱的問題。當一名7勝7負的摔跤手遇到一個8勝6負的對手時,比賽結果對第一個選手來說極其重要,對他的對手而言則沒有那么重要。列維特發(fā)現(xiàn),在這樣的情況下,需要贏的那個選手很可能會贏。這看起來像是對手送的“禮物”,因為在聯(lián)系緊密的相撲界,幫別人一把就是給自己留了一條后路。那么有沒有可能是要贏的決心幫助這個選手獲勝呢?答案是:有可能。但是數(shù)據(jù)顯示的情況是,需要贏的選手的求勝心也只能把勝率提高到25%。所以,把勝利完全歸功于求勝心是不妥當?shù)摹?shù)據(jù)進行進一步的分析可能會發(fā)現(xiàn),與他們在先前比賽中的表現(xiàn)相比,當他們再相遇時,上次失利的一方要擁有比對方更高的勝率。因為在相撲界,你的付出總會有“回報”,所以第一次的勝利看上去更像是一名選手送給另一位選手的禮物。
這個情況是顯而易見的,但是如果通過隨機采樣分析法,就無法發(fā)現(xiàn)這個情況。而大數(shù)據(jù)分析通過使用所有比賽的極大數(shù)據(jù)捕捉到了這個情況。大數(shù)據(jù)是建立在掌握所有數(shù)據(jù),至少是盡可能多的數(shù)據(jù)的基礎上的,所以我們就可以正確地考察細節(jié)并進行新的分析。在任何細微的層面,我們都可以用大數(shù)據(jù)去論證新的假設。是大數(shù)據(jù)讓我們發(fā)現(xiàn)了相撲中的非法操縱比賽結果,它讓我們能清楚分析微觀層面的情況。
當然有些時候,我們還是可以使用樣本分析方法,畢竟我們仍然活在一個資源有限的年代。但是更多時候,利用手中掌握的所有數(shù)據(jù)成為了最好也是最可行的選擇。在體育領域,體育統(tǒng)計以及體育測量等體育社會科學將是被大數(shù)據(jù)撼動最厲害的學科。因為大數(shù)據(jù)分析取代了樣本分析,社會科學不再單純依賴于分析實證數(shù)據(jù)。這些學科過去曾非常依賴樣本分析、研究和調查問卷。我們總是習慣把統(tǒng)計抽樣看做文明得以建立的牢固基石,就如同幾何學定理萬有引力定律一樣,但是它們只是為了在技術受限的特定時期,解決當時存在的一些特定問題而產生的,其歷史也不過百年。如今,技術環(huán)境已經有了很大的改善,在大數(shù)據(jù)時代進行抽樣分析就像在汽車時代騎馬一樣。在某些特定的情況下,我們依然可以使用樣本分析法,但這不再是我們分析數(shù)據(jù)的主要方式,而當這一切都來臨的時候,體育社會科學會如何重新洗牌我們將拭目以待。
223“體育專家”的消亡與“體育數(shù)據(jù)科學家”的崛起?
改編自《魔球——逆境中制勝的智慧》的影片《點球成金》講述的是這樣一個真實的故事:美國的奧克蘭運動家棒球隊總經理比利拋棄了幾百年一直依賴的選擇球員的傳統(tǒng)慣例,采用了一種依靠電腦程序和數(shù)學模型分析比賽數(shù)據(jù)來選擇球員的方法。他并沒有采用那些像“棒球擊打率”這樣傳統(tǒng)的標準,而是采用了看上去很奇怪的、類似“上壘率”這樣的標準[5]。這個方法發(fā)現(xiàn)了體育賽事的另一面,始終存在卻一直被忽略的一面。一個球員怎樣上壘并不要緊,不管是地滾球還是三壘跑,只要他上壘了就夠了,當數(shù)據(jù)表明偷壘不實用的時候,即使這會讓比賽更有看頭,比利也不會再關注這種華而不實的技能。比利這一打破常規(guī)慣例的做法遭致一片質疑和批評,就如同伽利略用“太陽中心說”來挑戰(zhàn)天主教的權威一樣。然而比利卻帶領這支備受爭議的球隊在22年的美國聯(lián)盟西部賽中奪得了冠軍,還取得了2場連勝的戰(zhàn)績。從那以后,統(tǒng)計學家取代球探成為了棒球專家,很多其他球隊開始爭相采用比利的方法來指導球隊運作。
同樣的,人類從依靠自身判斷做決定到依靠數(shù)據(jù)做決定的轉變,也是大數(shù)據(jù)做出的最大貢獻之一。從網球到籃球,從棒球到足球,數(shù)據(jù)分析如今正席卷職業(yè)體育界。每次擊球,每次揮桿都可能會影響整場比賽的結果。運動員和球隊如今越來越依靠數(shù)據(jù)和數(shù)據(jù)分析師來使他們更快更強。新技術如傳感器以及3D多普勒雷達等,可以跟蹤運動員的表現(xiàn),使得運動員能夠更好的了解和分析自己的運動[6]。所謂的體育專家和技術專家的光芒都會因為大數(shù)據(jù)時代下新的數(shù)據(jù)分析師和數(shù)據(jù)科學家的出現(xiàn)而變暗,因為后者不受舊觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出來的聲音。他們的判斷建立在相關關系的基礎上,沒有受到偏見和成見的影響。他們的判斷完全依賴于匯集起來的數(shù)據(jù)所顯示的實際信息,所以有著牢靠的根基。
如今我們正在見證所謂的“專家”在各個領域影響力的減弱。在傳媒界,如外國的高客網和“赫芬頓郵報”以及中國的“今日頭條”這些網站上傳播的新聞通常取決于數(shù)據(jù),而不再是編輯的新聞敏感度。因為數(shù)據(jù)比有經驗的記者更能揭示出哪些是符合大眾口味的新聞。Coursera,一家網上教育公司,深度地研究它收集的所有數(shù)據(jù),比如學生重放講座視頻的哪個片段,從而找出不明確或者很吸引人的地方,然后反饋給設計課程的團隊。這都意味著,與時俱進才是在職業(yè)體育領域取得成功的必備技能;當然,行業(yè)專家是不會真正消亡的,只是他們的主導地位會發(fā)生改變。
未來,體育數(shù)據(jù)分析師會與他們一樣備受推崇,而這將不僅是兩種職業(yè)地位的轉變,這將極大地改變我們怎樣看待知識的價值,因為我們往往傾向于把專業(yè)人才看得比全才更重要,也就是說深度就是財富。然而,專業(yè)技能就像精確性一樣,只適用于過去的時代,當時人類掌握的數(shù)據(jù)永遠不夠多也不夠準確,所以需要直覺和經驗指導。在那個時代,經驗是先決的,因為只有通過這種無法從書本和別人口中得到、埋藏在潛意識里知識的積累,我們才能做出更明智的決定。但是當你來到大數(shù)據(jù)時代的時候,你可以通過挖掘數(shù)據(jù)而得到更多。所以體育數(shù)據(jù)分析師會把過去看成是迷信和成規(guī),這不是因為他們更聰明,而是因為他們擁有了財富之源——數(shù)據(jù)。同時,作為外行人,他們不會被行業(yè)內的爭論所限制,因為他們不會被自己所支持一方的觀點所影響而產生偏見,這是他們與行業(yè)專家不一樣地方。這種轉變意義非凡,以往我們大部分人往往都通過經驗、回憶以及猜測做出決定,就像以前我們簽約一個幾百萬美元年薪的球員,也只是看感覺,沒有什么客觀標準。但是隨著管理決策越來越受預測性分析和大數(shù)據(jù)分析的影響和控制,依靠直覺做決定的情況將會被徹底改變。
3結論與建議
31大數(shù)據(jù),大挑戰(zhàn)
我國于去年1月啟動的第六次全國體育場地普查距離第五次已經過去了整整十年。這十年間,我們成功舉辦了北京奧運會、廣州亞運會等大型體育賽事,體育事業(yè)也得到了長足的發(fā)展。然而,我們卻仍然沒有止住憑著經驗和感覺前進的慣性。僅就體育場地建設這方面來講,過去一些地方對體育場館的建設缺乏布局合理性、前瞻性等定量的論證,導致不少體育場館建成后僅僅辦過一兩項賽事就淪為“大而無用”還“燒錢”的累贅,在城市的另一角,擁有很高健身熱情的群眾卻又落得無處可去的尷尬。即將到來的全國體育場地普查正是為了積累這些基礎數(shù)據(jù)。本次普查將體育場地分為8類,普查的項目中除了場館地址之外,幾乎將所有特征量化,給之后的數(shù)據(jù)處理和挖掘留下充足余地,會帶來很大的便利。[7]
然而,我們還應該看到,大數(shù)據(jù)時代是建立在西方民主、開放和理性的基礎上,我們不僅離一些國家已經實現(xiàn)的數(shù)據(jù)跨區(qū)域共享、聯(lián)網和實時更新還有很遠的距離,而且我國社會現(xiàn)代化程度尚且有限,市場經濟制度和法治體系仍不健全,但是作為發(fā)展中國家前列的中國,目前正面臨一個重大的歷史抉擇關口。應該說,在過去的3余年時間里,中國在快速走向信息化、網絡化的方面還是做交出一份不錯的成績單,如今大數(shù)據(jù)很可能成為發(fā)達國家在下一輪全球化競爭中的利器,而發(fā)展中國家仍然處于被動依附的狀態(tài)之中,中國要趕上這樣一場大數(shù)據(jù)變革,各界應該首先嘗試公開數(shù)據(jù)、方式、方法充分挖掘數(shù)據(jù),不再追求因果關系,承認混雜性,探索相關關系,轉變思維,通過大數(shù)據(jù)創(chuàng)新的方式擁抱“大數(shù)據(jù)”時代,就一定會抓住創(chuàng)造歷史的時機。
參考文獻:[5"]
[1]徐濤大數(shù)據(jù)顛覆中網 新體育,213 11
[2]劉同大數(shù)據(jù)、云計算彰顯智慧體育 互聯(lián)網周刊,213 23
[3]維克托·邁爾-舍恩伯格,肯尼思·庫克耶大數(shù)據(jù)時代[M]杭州:浙江人民出版社,213
馮舉高大數(shù)據(jù)加快體育科技創(chuàng)新[N]經濟日報,213-1-23
[5]王萌職業(yè)體育進入數(shù)據(jù)分析時代[N]I經理世界,212-8-3
[6]金亮大數(shù)據(jù)時代降臨[N]紐約時報,212-2-13
[7]袁博體育與大數(shù)據(jù)軟件與信息服務 213 11