當(dāng)前,體育學(xué)界的定量研究多數(shù)處于統(tǒng)計(jì)相關(guān)性的描述階段,基于因果推斷的解釋能力不足,而在其他學(xué)科(尤其經(jīng)濟(jì)學(xué)和計(jì)算機(jī)學(xué))中,因果推斷已經(jīng)成為“新的學(xué)科前沿”。2020年6月,英國(guó)學(xué)者Guan Jing 等在利物浦大學(xué)經(jīng)濟(jì)論壇上報(bào)告了1 篇文章,主要探討運(yùn)動(dòng)與健康的雙向因果關(guān)系。他們指出,當(dāng)前體育學(xué)界對(duì)于因果推斷的運(yùn)用主要存在2 個(gè)問題:①忽略內(nèi)生性;②武斷假設(shè)因果關(guān)系的單一路徑,如只指出運(yùn)動(dòng)促進(jìn)了健康,而未考慮健康的人更愛運(yùn)動(dòng)。目前很多國(guó)內(nèi)學(xué)者也注意到:內(nèi)生性是影響因果推斷的核心問題。具體而言,回歸分析可通過控制協(xié)變量使不同組別具備可比性(如運(yùn)動(dòng)和不運(yùn)動(dòng)2組人群的健康程度比較),但總有一些無法觀測(cè)到的變量(如基因特征)未被納入控制變量,而它們又與解釋變量(如基因特征、運(yùn)動(dòng)偏好)相關(guān),違反回歸分析中“隨機(jī)誤差項(xiàng)與解釋變量相互獨(dú)立”這一基本假設(shè),從而導(dǎo)致估計(jì)參數(shù)(回歸系數(shù))偏誤。這種遺漏變量偏誤是產(chǎn)生內(nèi)生性問題的主要來源。此外,內(nèi)生性問題還源于自選擇偏誤(如參與運(yùn)動(dòng)本身即是具備某種特征的人自行選擇的結(jié)果)、樣本選擇偏誤(如僅研究參與運(yùn)動(dòng)的群體就得出普遍結(jié)論)和聯(lián)立偏誤(運(yùn)動(dòng)與健康存在雙向因果關(guān)系)。針對(duì)上述問題,陳云松、梁玉成等國(guó)內(nèi)學(xué)者總結(jié)了相應(yīng)的解決辦法,包括工具變量法、傾向值匹配(PSM)、赫克曼(Heckman)兩階段模型等。另外,近年來較流行的“交叉滯后面板模型”亦是一種利用面板數(shù)據(jù)解決雙向因果問題的方法。值得一提的是,當(dāng)前隨著人工智能的發(fā)展和大數(shù)據(jù)研究的深入,機(jī)器學(xué)習(xí)方法在社會(huì)現(xiàn)象的“分類”和“預(yù)測(cè)”上呈現(xiàn)出強(qiáng)大功能,未來其可助力因果推斷在體育學(xué)界的應(yīng)用和發(fā)展。
上海體育學(xué)院學(xué)報(bào)2021年3期