999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

相關性分析在體育管理研究中的應用

2016-09-03 08:05:14erryWangJamesZhangJamesDu
上海體育學院學報 2016年3期
關鍵詞:體育分析模型

erry J.Wang,James J.Zhang, James W.Du, 張 軼

(1.美國佐治亞大學 國際體育管理研究中心,佐治亞州 雅典 30602; 2.美國天普大學 福克斯商學院,賓夕法尼亞州 費城 19122; 3.上海大學 體育學院,上海 200444)

?

?特稿?

相關性分析在體育管理研究中的應用

erry J.Wang1,James J.Zhang1,James W.Du2,張軼3

(1.美國佐治亞大學 國際體育管理研究中心,佐治亞州 雅典 30602; 2.美國天普大學 福克斯商學院,賓夕法尼亞州 費城 19122; 3.上海大學 體育學院,上海 200444)

采用文獻資料和案例分析法,對基礎相關性分析和回歸分析在體育管理研究中的應用進行研究。基于相互依賴型和依存型2種關系的闡述,結合體育管理實證研究案例,討論了在研究設計和分析過程中涉及的研究目標、定義、潛在機制以及關鍵實證假設等問題,并重點介紹依賴型分析方法(如雙變量相關、簡單線性回歸、多元線性回歸、多項式回歸、邏輯回歸、判別函數分析)。

體育管理;相關性分析;回歸分析

Author’s address1.International Sport Management Research Center,University of Georgia,Athens,30602,Georgia,USA; 2.The Fox School of Business and Management,Temple University,Philadelphia,19122,Pennsylvania,USA; 3.The College of Physical Education,Shanghai University,Shanghai 200444,China

不同于揭示和確定一個變量(或一組變量)與另一個變量的因果關系的實驗研究,相關性研究在本質上是描述性的,是通過變量之間的變化一致性確定它們之間的聯系。如果2個變量是相關的,這并不意味著它們之間存在因果關系;反之,如果2個變量之間存在因果關系,那么兩者必然相關。相關性研究通常作為一個實驗性研究的前奏,它主要考慮2個變量或多個變量之間的關系,這些變量代表著人們在認知、情感或行為領域的相關概念和建構。在體育管理學領域,變量既可以是直接從實地觀察、問卷調查或物理測量中獲得的外顯性指標,也可以是不能直接觀測的潛在性因子。Zhang[1]指出,理解和破譯2個或多個自變量和因變量之間的關系是體育管理領域中理論發展和驗證的核心。Andrew等[2]也指出,相關性研究和回歸分析是在檢驗和推進體育管理研究中最常用的統計學工具。

為了便于理解相關性研究和回歸分析的基本概念,讀者應具備一定的統計學基礎,例如關于集中趨勢(如均值、中位數和眾數)、變異性(如區間、標準差和方差)、標準值和數據分布形態(如正態分布、T分布和F分布)。同時,讀者也應具備在假設檢驗方面的相關知識(參見本刊2016年第1期第2篇論文)。

1 雙變量相關性分析

本節著重探討2個連續型變量(包括定距和定比變量)之間的相關關系。在體育管理研究中,這類相關性研究相當常見,比如社交媒體的使用對于球迷參與度的影響[3],服務質量對于消費者滿意度的影響[4],或是旅游目的地的品牌形象對于體育旅游的促進作用[5]。從本質上講,這是一個演繹推理的過程,即按照已有的理論,通過給定或改變相應變量的數值,判斷變量間是否會相互影響。

從此意義而言,雙變量相關性分析著重評估2個連續型變量間的變化模式、強度和方向,這些指標揭示了變量間的相關關系。雙變量相關分析并不對自變量和因變量進行區別。盡管雙變量分析十分必要,但它還不足以解決體育管理領域中的復雜課題。在雙變量相關分析的基礎上,研究者往往需要運用更高階的多元變量分析解決科研實踐中的問題。在雙變量分析中,皮爾森相關系數通常用來量化2個連續型變量間的相關關系。下面是皮爾森相關系數(Pearson correlation coefficient)的數學表達式:

式中:皮爾森相關系數是一個測量線性相關程度的標準化指標。其取值介于-1.0~+1.0,取值靠近-1.0或+1.0表示高強度的負相關或正相關,取值靠近0表示相關性較弱,或非線性模式相關。相關系數的平方代表x和y2個變量間的方差重疊部分(圖1)。

圖1 變量重疊率=解釋方差

實例分析Gibson等[5]檢驗了在大型體育賽事中,賽事服務質量(連續型變量)與現場觀眾滿意度(連續型變量)之間的關系。共有2 297名現場觀眾回答了有關賽事服務質量與消費者滿意度的調查問卷。雙變量間的皮爾森相關系數表明,總體而言,輔助性的服務質量(如工作人員的禮貌程度)對現場觀眾的滿意度產生了積極影響(相關系數r=0.35,r2=0.12,P<0.05),即2個變量間有12%的方差重疊部分。基于此,可以得到如下結論:工作人員的禮貌程度和相關觀眾的滿意度間有顯著的正相關關系。值得注意的是,相關性并不意味著因果關系,之前的結果不能推導出提高工作人員的禮貌程度就必然能夠提升現場觀眾的賽事滿意度。在實踐中,可能還存在其他一些未被測量和被控制的變量,或是未被考慮到的機制,影響著2個變量之間的相關關系。事實上,因果關系的發現只能通過嚴格的實驗研究或在完備的理論基礎上進行估計、重復觀察,并且和統計控制三結合的方式實現。

2 簡單線性回歸

簡單線性回歸是相關性研究中最為基礎的數據分析方法之一,并且是對雙變量相關分析的進一步延伸。簡單線性回歸對2個變量進行了自變量和因變量的區分,并將2個變量之間的變化關系通過一個線性函數進行表示:

(2)

式中:y是一個連續因變量;x可以是一個連續型自變量(包括定距和定比變量)或是一個離散型自變量(包括定類變量如男女,定序變量如李克特量表排序數據);b0是回歸的截距,即當x為0時,y的均值;b1是變量x的回歸系數(或權重),即當x變改變一個單位時,y改變的程度;e代表估計誤差。

實例分析在體育市場需求的研究中,賽事的吸引力是預測球迷賽事消費的一個關鍵因素[7-10]。為了估算賽事的吸引力對于消費程度的影響,可以采用簡單回歸分析。首先研究者提出需要統計檢驗的假設:零假設(H0)即表示消費程度和賽事的吸引力沒有關系,以及備選假設(H1),即兩者之間具有顯著的相關關系。關于變量的測量,研究者可以直接采用文獻中類似研究的測量模型,也可以基于自己的研究需求修改已有的測量模型,或是設計出全新的測量模型。在本案例中,球迷的賽事消費通過其消費意愿測量,賽事的吸引力通過球迷感知到的賽事吸引力測量。2個變量均采用李克特5級量表評估,即1=最低程度的消費意愿/吸引力,5=最高程度的消費意愿/吸引力。假設通過數據搜集(在比賽前進行),獲得300份有效的球迷調查問卷。通過以最小二乘法的簡單回歸(可采用SPSS中的REGRESSION程序得到),得到的結果如表1所示。

表1 賽事吸引力和球迷賽事消費的回歸分析

注:因變量= 球迷消費意愿;自變量= 球迷感知到的賽事吸引力

表1中關于自變量系數的統計值(β=0.61;P<0.01)表明,賽事的吸引力與球迷的賽事消費有顯著的相關關系,因此,可以拒絕零假設。且其統計值進一步表明,賽事的吸引力正面影響球迷的賽事消費意愿。最終的回歸函數可以表示為:

y=0.5+0.6x

(3)

式中:y是球迷的賽事消費意愿;x是感知到的賽事吸引力;0.5是回歸模型的截距;系數0.6是因變量對于自變量的變化率。從回歸模型可以得出,感知到的賽事吸引力每提高一個單位,球迷的消費意愿將提升0.6個單位。在表1中,β代表系數b的標準化數值,是將因變量和自變量的數值轉化為標準值(Z值)時求得的系數。在僅有2個變量的簡單回歸中,β就等于相關系數r。在多個自變量的情況下,β主要代表因變量在自變量的權重,或者表示自變量對因變量貢獻的水平。在后面的多元回歸中將作詳細說明。SEE代表標準估計誤差,代表著觀測值和預測值之平均差。對模型解釋力的評估,可以通過計算決定系數 (coefficient of determination)實現,即標準系數的平方:

(4)

其在0~1.0取值,1.0代表無誤差的預測精度,0代表毫無預測精度。

表2顯示了各種平方和信息,可計算得到決定系數等于0.372 1(即72.67/195.30), 暗示著37.21%的觀賽頻率方差可以由賽事的吸引力解釋。該修正的決定系數是基于自變量的個數、樣本量以及研究涉及的可靠性系數水平得出的。如果一個研究涉及比較不同的假設回歸模型,該修正值將尤為有效。

表2 決定系數中平方和的計算

注:SS=平方和;df=自由度;MS=均方差

相關性研究有2個目的:一是解釋2個隨機事件的關聯性;二是預測隨機事件。在傳統意義上,體育管理的研究更傾向于解釋相關性,研究者最熱衷的工作是確定一個重要的統計自變量和計算預期變化的百分比。目前,預測函數越來越多地被應用于體育管理研究中。例如:在體育金融調查中,研究者利用宏觀及(或)微觀市場信息預測體育消費的市場規模;或者通過運動表現預測球隊(球員)的勝負率,繼而推測其“吸金”能力。

3 多元線性回歸

當進行一個簡單的線性回歸分析時,只能估算一個連續因變量和一個連續或離散自變量之間的線性關系,然而在實際中一個變量很難解釋事物的所有或主要的變化。同時考慮多個與因變量相關的自變量,能更多解釋因變量的方差和減小標準估計誤差的量級。在前面提到的實例中,除了賽事的吸引力之外,其他因素也可能潛在地影響球迷的賽事消費,如門票價格、對運動項目的熱愛程度、賽事日程、替代娛樂方式、宣傳、廣告、促銷活動等因素,都有影響觀賽人數的潛在可能[7-10]。綜合多個預測回歸模型,可能更好地掌控因變量的變化,提高估算的精度。一個多元線性回歸模型可以表示成下列方程:

y=b0+b1x1+b2x2+b3x3+….+bnxn+e

(5)

有人會問:當有多個自變量時,為什么不進行多次簡單回歸分析?這是因為多元回歸分析更優于多次的簡單回歸分析,其優點包括(但不限于)下列幾個方面:① 多元回歸分析可同時檢測多個自變量對因變量的影響,節省時間;② 多元回歸分析可考慮多個自變量之間的交叉重疊,減少自變量的冗余,避免高估;③ 多元回歸分析可分析各個自變量對因變量的貢獻。

研究課題通常會涉及數量較多的變量,這些變量都可能成為最終的自變量;而具體的變量選取,會極大地影響最后的回歸模型,故回歸方法在多元回歸分析中扮演著重要的角色。總體而言,其包括2種類型:驗證性回歸和序列性回歸。如果大量的文獻已經確定了相關的自變量,研究者只是在驗證這些結論,即研究者已經清楚所要納入回歸方程的自變量,那么驗證性回歸法可以被采用。如果研究課題是在新的研究環境下進行的,那么已知的理論框架可能會發生變化,比如一些已知的自變量或許不再能顯著地解釋因變量,一些交互作用會消失或出現,一些新的自變量需要被納入回歸方程。在此情況下,如果仍嚴格依照已知的理論框架選取自變量,可能會導致過度識別(over-identified)的問題。驗證性回歸法通常在體育經濟學和體育金融學中被應用。

序列性回歸法具體包括3個種類:逐步(stepwise)回歸、順序(forward)回歸和逆序(backward)回歸。在逐步回歸中,研究者依據對因變量的解釋程度,逐步選取自變量。具體步驟如下:① 能最大程度地解釋因變量方差的自變量應首先被選取,故研究者首先建立了一個簡單回歸模型,y=b0+b1x1;② 在剩余的自變量中,選取能最大程度地解釋因變量方差的自變量。研究者建立如下回歸模型,y=b0+b1x1+b2x2;③ 研究者須再次檢測第1個選取的自變量(即x1)是否仍顯著地解釋因變量的方差,如果是,則保留第1個自變量,如果不是,則將第1個選取的自變量從回歸模型中移除;④ 重復第②和第③步,直至所有剩余的變量都不能顯著地解釋因變量的方差。

考慮到逐步回歸在修正自變量方面的靈活性,該方法被大多數研究者所接受。順序回歸的數理原理與逐步回歸相似,不同之處在于一旦某一變量被納入回歸模型,該變量在隨后的分析中便不能被移除。對于逆序回歸,首先應把所有待選變量納入回歸模型,隨后將不能顯著解釋因變量的變量逐步移除。與順序回歸相似,一旦逆序回歸開始,在后續的分析中將無法修正已納入模型的變量。總體而言,序列回歸更適用于探索性研究。

對于多元回歸分析,研究者至少要用2個自變量預測或解釋因變量,如果其中2個自變量高度相關,則會導致共線性問題。例如,在預測消費者的體育消費時,家庭年收入和休閑娛樂支出2個變量之間可能是高度相關的,而變量間重合部分的方差只能被計算一次;因此,高度共線性將大大減少稍后進入模型的變量的解釋力。如有3個或者更多自變量間高度相關,則被稱之為多重共線性。方差膨脹因子(VIF)經常用來評估變量間多重共線性的程度。以往的經驗表明,當1

在多元回歸分析中,研究者可能傾向于比較自變量對因變量的貢獻水平。自變量的單位可能是不同的類型,如美元、小時、年、比賽場數。在這種情況下,直接的比較是行不通的,研究者需要標準化自變量的取值。變量的標準化可以通過以下公式實現:

(6)

式中:Z是標準值,x為變量,μ為總體變量的均值,σ為總體變量的標準差。標準化后的均值都為0,標準差為1.0,因此方差也為1.0。因為標準化系數不再擁有原來的單位,所以可以依據它們的量級(權重)進行比較。

實例分析在體育賽事中,球迷是體育組織的主要收入來源。球迷的賽事消費可以由多元回歸預測,例如賽事的吸引力、票價、熱愛度、賽事日程等。假設研究者有意解釋在一個新的市場(如中國的觀賞型體育市場),這些因素是否可以通用,多元回歸分析將能夠預測這些因素的影響力。假設這些因素變量是連續的,下面給出該研究的步驟。

(1) 建立假設。下面分別是零假設和備選假設:H0賽事吸引力 (x1)、票價 (x2)、喜愛度 (x3)、賽事時間 (x4)、替代形式(x5)、宣傳 (x6)、廣告 (x7)、促銷 (x8) 與球迷的賽事消費意愿(y)無顯著關系;H1賽事吸引力 (x1)、票價 (x2)、喜愛度 (x3)、賽事時間 (x4)、替代形式(x5)、宣傳 (x6)、廣告 (x7)、促銷 (x8) 與球迷的賽事消費意愿(y)有顯著關系。

(2) 確定或格式化自變量與因變量的取值。在本案例中,所有自變量和因變量均采用五級李克特量表取值(1=最低,5=最高)。

(3) 用VIF值確定這些自變量之間的多重共線性。在確定不具有多重共線性(即VIF≤ 5) 后,接下來研究者選擇合適的回歸方法。

在本案例中,研究者采用逐步回歸的方法構建模型。在進行逐步估計時,需要首先選取對因變量變化做最大貢獻的自變量,這一步可以用來通過確定自變量和因變量之間的相關關系確定。因此,研究者首先建立了自變量和因變量之間的相關關系矩陣(在此僅列出矩陣的關鍵部分)(表3)。

表3 多元線性回歸:模型1自變量與因變量的相關關系

如表3所示,票價與消費者賽事消費的絕對值相關關系最強,故x2要首先用在回歸模型中。接下來,應在剩余變量中挑選第2個進入回歸模型的變量,該變量應是在所有剩余變量中對因變量解釋力最強的變量。考慮到回歸模型中已經有一個變量(即x2),所以偏相關系數可以作為接下來選擇變量的依據。這里偏相關的平方代表在控制已有自變量的情況下,新增自變量對因變量的解釋度。如表4所示,廣告(x7)有著最大的偏相關系數,故賽事吸引力(x1)作為第2個自變量被納入回歸方程。

表4 多元線性回歸:模型2

接下來,須重新估算該模型,判定第1個被選取的變量(票價)是否仍然能顯著地解釋因變量(表5)。

表5 多元回歸模型:模型3

表5中的結果認定:票價變量依然顯著地解釋賽事消費,因此,這2個變量應保留在回歸模型中。如果在這一步中,票價對賽事消費的解釋不再顯著,那么它將從模型中被移除。重復執行上述過程,直到不再有剩余變量能顯著地解釋因變量的變化。假設6個變量(吸引力、票價、喜愛度、賽程、廣告和促銷)最終被確定能對球迷的賽事消費意愿產生顯著的影響,最終的標準化系數回歸模型為:

y=1.1+0.30x1-0.39x2+0.26x3+

0.14x4+0.32x7+0.27x8

(7)

根據上述回歸模型中的標準化系數,研究者很容易得出這6個變量對因變量的貢獻水平。在研究報告的結尾,需要報告決定系數的信息。在本案例中,這8個變量共解釋了56.41%的球迷賽事消費意愿(表6)。

表6 回歸分析說明:方差解釋度的計算

盡管逐步估計是一個被廣泛認可的模型選擇策略,但研究者應該注意逐步回歸尤其是順序回歸法存在相應的爭議及缺陷,如R2的估計偏差、容易違反F分布和卡方檢驗的相關假設、β系數估計的不穩定。在可能的情況下,可以結合驗證性和時序性回歸法的優缺點進行綜合使用。這將在系列的后續文章中,介紹更為先進和穩健的模型選擇方法,如Mallow C (p)。

通過多元回歸分析,研究者能夠處理多個自變量和一個因變量之間的關系;但在一些研究課題中,研究者也會同時面對多個因變量。比如,總體的體育消費可以進一步分解為運動鍛煉消費、賽事觀看消費和體育用品消費。如果研究者把多個具體的體育消費類別作為因變量時,多元回歸分析就有其相應的局限性。對于這種包含多個因變量的研究課題,典范相關分析和結構方程模型更為合適。考慮到結構方程模型涉及到較為復雜的測量議題,比如潛在變量、路徑分析、中介變量、多群分析、縱向研究等,我們會在后續的文章中進行詳細介紹。

4 曲線回歸分析

當進行多元回歸分析時,體育管理的研究通常假設自變量和因變量是一種線性關系,基本關鍵點是認為2個變量之間有一個定量比例關系,固定其他條件,因變量的變化受控于重復地添加一個數到自變量中。用線性建模簡化和提取一種社會現象的本質具有一定的優勢,但有時不足以涵蓋一些曲線關系的存在。實際上,當考慮到時空的變化時,在社會科學中,很少有變量的關聯是表現成線性模式。

對于曲線分析,數學變換經常被使用(如博克斯變換就包括對數的、二次函數的及三次項的形式),將曲線關系用單調函數(即因變量隨著自變量的增大而增大或者隨著自變量的減小而減小)或非單調函數(在任一點的切線斜率的符號在整個定義域上是變化的)來表達。在這些方法中,各種類別多項式回歸的目標就是確定最好的擬合線,這需要通過構造含2個或多個變量的多項式完成。當因變量可以在概念上被看作一個自變量的冪函數時,采用多項式模型是合適的。傳統的多項式模型是各類曲線函數在體育管理研究中使用較多的一種,其模式為:

y=α+β1x+β2x2+β3x3+…+βmxm+ε

(8)

式中:y是因變量,x是自變量,a和ε表示截距和剩余項。應注意的是,曲線關聯很少被單獨地估計,而是經常被添加到線性模型中更好地預測因變量。圖2展現了變量x和y的曲線關系,拐點是指其周圍的斜率符號發生變化的點。

實例分析在由Williamson等[12]進行的實證研究中,作者在WNBA的情境下,探索了2個連續性的社會人口變量(如年齡和家庭收入)和球迷識別因素(例如自豪、反應、追隨)之間的關系。在球迷識別因素中,自豪是指對聯盟中的球隊感到自豪(即球迷能自豪地談論球隊、夸耀所在城市的球隊、高興穿上球隊的隊服);反應是指對球隊和球員有正面反應(即球迷能感知到球隊的團隊精神、球迷認為球隊具有正面的公眾形象、感知到球員是好的榜樣);追隨涉及消費者跟隨球隊和球員的傾向(如球迷索要球員的親筆簽名、打聽與球員、教練員、工作人員相關的事情、在媒體中追蹤球隊的信息)。在文獻綜述里,作者希望人口狀態的不同背景與識別因素能夠展現多項式關系的模型;因此,曲線回歸分析將被應用到研究方案中。

圖2 x和y之間關系的圖形表示

曲線回歸分析的結果顯示在表7中,包含了線性模型 (linear)、二次模型 (quadratic)、三次模型 (cubic) 的趨勢分析。基于R2和其增量的顯著檢驗,在說明社會人口變量和識別因素的關系上,三次模型在預測力上要好于線性模型和二次模型。例如,在年齡和自豪感的關系上,應用線性回歸,年齡變量僅能說明1.4%自豪感的方差,由二次曲線模型,這個數值上升到2.2%,由三次曲線模型,這個數值進一步上升到2.4%。年齡組在20歲之前和60歲以上的與自豪感的識別因素是正相關,反之,介于20~60歲的與他們自豪感的關系上展現出平緩的趨勢。類似的三次模式也適用于家庭收入變量。總的來說,Williamson等[12]的研究結果確定了在研究中采用曲線回歸分析的適當性和必要性,而僅有線性趨勢的分析,可能會造成低估,甚至錯估。

5 邏輯回歸 (Logistic regress)

前文中談及的多元回歸分析主要是處理連續型因變量,然而,在體育管理領域中,研究者也經常要處理分類型因變量。如在體育賽事市場需求的研究中,研究者可以將消費者分為2類:有需求組和無需求組(或者現場觀賽者和非現場觀賽者)。研究者可以依據樣本消費者的多項消費特點建立統計模型,進而預估總體消費者是否有相關的消費需求。對于這種包含一個二元的分類型因變量和多個連續型自變量的研究設計,(二元)邏輯回歸便是恰當的解決方法。邏輯回歸的一般形式可以表達為:

表7 在社會人口變量和球迷識別因素之間的曲線回歸分析

y=b0+b1x1+b2x2+b3x3+…+bnxn+e

(9)

式中:y是兩元的分類型因變量;x1,x2,…,xn是連續型自變量;e代表測量誤差。在確認邏輯回歸適合研究課題后,研究者接下來首先要考慮樣本量的大小,其具體包含2個層面:整個研究的總體樣本量和分組樣本量。對于前者而言,因為邏輯回歸采用最大似然估計法,其需要較多元回歸更大的樣本量,每個自變量需要最少50個觀察值[13]。對于后者而言,單個組別中的每個自變量需要至少10個觀察值[6]。 邏輯回歸在數據分布的相關假設方面的要求相對較低。在一些假設未滿足的情況下,比如多元正態分布、自變量的線性關系和方差齊性,邏輯回歸仍然相對比較穩健。如圖3所示,邏輯模型(logit)分布呈S型曲線。該曲線用來表達了自變量和因變量之間的關系,其取值在0~1。x軸代表自變量的程度,y軸代表因變量的概率分布。自變量在低端的概率無限趨近于0.0,在高端的概率無限趨近于1.0。

圖3  Logistic曲線

在估算過程中,需要先通過方差分析(ANOVA)或者多元方差分析(MANOVA)檢驗2個不同組別(即有需求組和無需求組)中的自變量是否有顯著區別,只有有顯著區別的自變量才能被選取。變量的選取需按照逐步推導與估算來進行,研究者首先需選取能最大限度地降低模型的-2LL值 (-2 乘以概率的對數值)。這里的-2LL值是用來測量回歸模型擬合度的一個重要指標,越小的-2LL值代表越高的模型擬合度。另外值得注意的是,邏輯回歸中變量系數的顯著性需要通過沃爾德檢驗(Wald test)檢測。邏輯回歸函數可以表示為

b0+b1x1+b2x2+…+bnxn

(10)

odds值可以通過計算logit值的反對數得出。如odds值大于1,表示自變量和因變量之間呈正相關關系;如小于1,則表示負相關關系。最終的回歸概率可以通過以下方程計算得出:

(11)

實例分析在全球范圍內,體育活動在培養社區意識、促進社會平等、提高身體素質等方面的作用已得到廣泛承認,因此,各國政府機構也著力于促進和推廣體育活動的開展。雖然近年來,越來越多的研究致力于探究推動體育發展的關鍵性因素,但絕大部分研究著眼于社會經濟層面的角度。政府機構(包括州、市級政府)在投資體育基礎建設方面發揮著重要作用,但其在促進居民體育參與方面的功效在很大程度上被忽視。在Wicker等[14]的研究中,作者通過對德國斯圖加特市2 054名居民的調查,評估體育基礎設施的狀況是否會影響人們的體育參與行為。

通過電話訪談的形式,研究者首先獲得了德國斯圖加特市居民的體育參與數據,如是否經常性地參與體育活動;如果參與,參與的頻率、強度和持續性等。在該研究中,個人是否參加體育活動是一個二元因變量,即“1”代表定期參與體育活動的居民(至少每周一次);“0”代表近期沒有參與體育活動的居民。研究同時收集了受訪者的社會經濟狀況信息(即收入狀況、受教育程度、性別和年齡),以及斯圖加特市 23個城區的體育基礎設施的信息(即體育設施的可用性和設施的類型)。邏輯回歸的結果顯示,在控制受訪者社會經濟狀況的變量后,一些體育設施(即俱樂部項目、公共活動場所和健身中心)的可用性會正向影響居民的體育參與行為。這些體育設施變量的odds值小于1.0,意味著低水平的體育設施供給會對居民的體育活動參與度造成負面的影響(注意居民參與體育活動為反向變量)。值得注意的是,表8中只列出了每個自變量的odds比值,該值可以通過log odds的轉換獲取原始的邏輯系數。最終,每個人參與體育活動概率可以通過之前介紹的公式計算出。

表8 基礎設施建設對居民體育參與邏輯回歸結果 (n=2 054)

注:*表示P<0.05;**表示P<0.01

6 多元判別分析

邏輯回歸多用于處理包含一個二元分類因變量的研究課題。在處理包含3個或3個以上組別的類型因變量時,判別函數分析經常被使用。為了區別于2組的判別函數分析,將3組及3組以上的判別函數分析稱之為多元判別分析。本質上,判別函數分析是用來驗證2組自變量的平均值是否有顯著區別。在多元判別分析中,組內平均值被稱為中心(centroid)。為了測量組間的中心差異,研究者首先需要提取判別函數,即一個由自變量組成的線性函數方程。用來依據研究中的分組圖式(如有需求組、無需求組、待定組),判別多個組別。如果研究中涉及n個組別,則相應就有n-1個判別函數。比如,3個組別共有2個判別函數,其可以使每個觀察值在一個二維空間上投像。在運用判別分析時,應注意越多的組別會提供越詳細的組別信息,然而這也會很大程度地增加區分組別的復雜度和困難度。研究者應遵循研究的簡約(parsimony)原則選定組別。一般而言,判別函數可以表達為

Zjk=b0+W1x1k+W2x2k+…+Wnxnk

(12)

式中:Zjk為第k個受試者在第j個判別函數上的區別值,其經常采用標準化的形式表達;b0為判別函數的截距;W1為第i個自變量的區別系數,表示該自變量區分組別中的力度,在沒有多重共線性(multicollinearity)的情況下,越大的值意味著越強的區別度;xnk為第i個自變量在第k個受試者上的取值。

在確定判別分析在研究課題中的恰當性后,研究者應在總體和分組層面檢查樣本量。對于總體樣本量而言,每個自變量至少需要20個觀察值;對于分組樣本量而言,至少需要每組20個觀察值[6]。為了交叉驗證結果的效度,建議研究者將總體樣本量分為2個部分:分析樣本和保留樣本。如果每組大致有相等的樣本量,研究者可將總體樣本量隨機兩等分。如果組別之間的樣本量差異較大,研究者則須根據單個組別在總體樣本中所占的比例,相應選取分析組和保留樣本。如總體樣本為100,其中80個受訪者有賽事需求,20個受訪者沒有相應的需求。在這種情況下,研究者應確保分析樣本和保留樣本都有40個有需求的受訪者和10個無需求的受訪者。

數據的分布情況在很大程度上影響判別函數分析的準確度。在進行數據分析之前,需要檢驗樣本是否符合數據分布的相關假設,比如方差齊性、多元正態分布、變量間的線性關系,以及自變量間較低的多重共線性。如果樣本數據違反了這些假設,則不建議繼續使用判別分析。這也是在處理二元因變量時,邏輯回歸分析優于判別函數分析的原因。在確定滿足數據分布的相關假設后,研究者應選擇恰當的估算方法。一種為同步估算,即所有自變量同時被包括在判別函數內,并不考慮每個自變量的區別程度。 這種估算方法的使用經常出于一些理論層面的考量。另外一種為逐步估算,其類似于多元回歸分析中的逐步推導。在多元回歸分析中,自變量的選擇是基于對總體方差大小的解釋程度;而在判別分析中,自變量的選擇是基于其對不同組別的區別程度。對區別程度的判斷主要通過該自變量是否能貢獻最大的馬氏間距檢驗值(Mahalanobis Distance,D2)。具體的操作流程會在后面的實例分析中詳細闡釋。在判別分析能正確區別每個觀察值的比例時,被稱之為命中率(hit ratio)。大多數的統計軟件都能提供相關的信息(如被錯誤區分的個體,以及在哪個組別該個體被錯誤歸納)。在判別分析中,有2種常用的判別個體組別的方法:計算臨界值(也稱之為關鍵性Z值)和建立歸納函數(也稱之為Fisher’s 線性函數)。在建立歸納函數時,有n個組別,就有n個歸納函數。每個個體的組別可以通過其在每個歸納函數的取值判斷。如果該個體在某一歸納函數中的取值最大,那么這個個體就屬于該組別。

實例分析在此仍選用體育賽事市場需求的例子。假設依據相關的文獻,以下5個市場變量能夠影響消費者的賽事消費(y):賽事吸引力(x1),體育熱情(x2),賽事日程(x3),廣告投放(x4),推廣活動(x5)。在該例子中,消費者的賽事消費被概念化為3種情況:參加賽事、不參加賽事和待定。研究者試圖研究以上5個市場變量(即自變量)預估消費者的3種消費行為 (即因變量)。其中5個市場變量以7分的Likert量表評估。根據這些描述,可以確定判別分析被用來處理該研究實例。

研究者首先應評估樣本的充足性,并將總體樣本數據分為分析樣本和保留樣本。假設有效數據包括140名受試者,并且每組(參加組、不參加組和待定組)有相等的樣本數。研究者隨機抽取70份數據作為分析樣本,剩余的70份數據作為保留樣本在后面的交叉驗證中使用。根據前文所述的樣本量標準,我們可以肯定手中樣本的充足性。接下來研究者應檢驗樣本數據的分布假設。這里假設所得到的數據滿足了相關要求并采用逐步推導的方式進行估算。如表9所示,x1、x3、x4和x5的均值在3個組別中都有顯著區別。這些自變量的選擇順序,須根據每個自變量的最小馬氏間距檢驗值判定,代表著最相似的2個組別的距離。具有最大的最小馬氏間距檢驗值的變量應當被首先選取,因此,x4被首先選入判別函數。

研究者須在剩余的自變量中重復上述檢測。假設在把x4加入判別函數后,x5的最小馬氏間距檢驗值在剩余的自變量中最大;因此,x5作為第2個自變量被納入判別函數。判別分析的威爾克的拉姆達檢驗值 (Wilk’s lambda值)從先前的0.42降至當前的0.27,意味著將x5納入判別函數能帶來更好的判別效果。現階段,在總體層面的區別和單個組別之間的區別都具有顯著性。x4和x5的“F撤除”值(Fto Remove值)的大小處于合理的范圍內,意味著2個自變量之間較低的多重共線性。如果判別函數中的某個自變量的“F撤除”值很小,則需要在判別函數中先移除該自變量,然后重新進行判別分析,并檢測總體模型的擬合度的顯著性以及Wilk’s Lambda值的變化。如果總體模型的擬合度依舊顯著,而且Wilk’s Lambda值只有很小幅度的改變,這意味著在判別函數中的自變量存在較高程度的多重共線性。因此,根據簡約的原則,“F撤除”值很小的自變量應在判別函數中被移除。剩余的自變量(x1、x2和x3)未能顯著地區別3個組別,因此,逐步估算到此為止。

表10列出了判別分析的總結統計。判別函數1最大程度地區別了3組之間的不同;判別函數2最大程度地區別了除判別函數1之外的3組間的不同。2個判別函數共計解釋了78.91%的組間區別。在區分單個個體的組別方面,建議使用歸納函數法。具體而言,每個個體在3個歸納函數上的取值,可以通過填入其在歸納函數中的各自變量(x4和x5)上的取值計算得出。如果該個體在某一個歸納函數中的取值最大,那么這個個體就屬于該組別。

表9 因變量分組的描述性統計和區別性檢驗

表10 判別分析的總結性統計

7 結束語

在進行單變量或多元變量相關性數據分析時,應注意幾個關鍵的參數條件:① 正態分布 (normal distribution),不僅要求每個變量自身呈正態分布,而且要求當所有變量組合在一起時,也呈整體的正態分布;② 方差齊性 (homoscedastic),因變量的方差在不同的自變量取值上都要相等;③ 線性關系,變量之間呈線性的相關關系。對于相關和回歸分析而言,變量間的線性關系是進行數據分析的基礎。值得注意的是,曲線型的相關和回歸是通過自變量若干取值段上的線性關系實現的。當這些假設被嚴重違反時,數據分析結果會產生誤導。參數條件的測量可以通過統計軟件如SPSS、 AMOS、Mplus或LISREL進行。通常,對數轉換是解決違反參數假設條件行之有效的方法。否則,研究者需要使用非參數統計方法進行數據分析,然而非參數統計方法的能量有限。這些超出了本文的范圍,需要在以后的討論中進一步說明。

通過研究實例,本文主要描述了依賴型的相關性研究(即有明確的因變量)的調查設計和數據分析。依據研究問題、研究假設和分析目的,研究者須選擇恰當的分析方法。盡管相關性分析的數理原理相對比較復雜,但從本質上講,相關性分析屬于描述性研究的范疇,因此,研究者應避免過度估計。在現實中,相關性研究僅僅揭示了變量間的相關關系,而因果關系可能存在,也可能不存在。因果關系的檢測需要建立在堅實的理論基礎和邏輯推理之上,最好能通過嚴格控制自變量檢測因果關系。在下一篇論文中,將討論依存型分析的研究設計及分析方法,即如何將相似的個體或自變量進行歸類,比如聚類分析、探索性因子分析、確認性因子分析。另外,也會討論一些測量理論和量表開發的相關內容。

[1]Zhang J J.What to study? That is a question:A conscious thought analysis[J].Journal of Sport Management,2015,29(1):1-10

[2]Andrew D P,Pedersen P M,McEvoy C D.Research methods and design in sport management[M].Urbana-Champaign,IL:Human Kinetics,2011

[3]Filo K,Lock D,Karg A.Sport and social media research:A review[J].Sport Management Review,2015,18(2):166-181

[4]Tsuji Y,Bennett G,Zhang J.Consumer satisfaction with an action sports event[J].Sport Marketing Quarterly,2007,16(4):199-201

[5]Gibson H J,Qi C X,Zhang J J.Destination image and intent to visit China and the 2008 Beijing Olympic Games[J].Journal of Sport Management,2008,22(4):427-450

[6]Hair J F,Black W,Babin B J,et al.Multivariate data analysis[M].Upper Saddle River,NJ:Pearson Prentice Hall,2010

[7]Cianfrone B A,Zhang J J,Pitts B,et al.Identifying key market demand factors associated with high school basketball tournaments[J].Sport Marketing Quarterly,2015,24(2):91-95

[8]Zhang J J,Lam E T,Connaughton D P.General market demand variables associated with pofessional sport consumption[J].International Journal of Sports Marketing & Sponsorship,2003,5(1):33-35

[9]Zhang J J,Pease D G,Hui S C,et al.Variables affecting the market competitors on the attendance of professional sport games:The case of a minor league hockey team[J].Sport Marketing Quarterly,1995,6(3):34-40

[10]Byon K K,Zhang J J,Connaughton D P.Dimensions of general market demand associated with professional team sports:Development of a scale[J].Sport Management Review,2010,13(2):142-157

[11]Stine R A.Graphical interpretation of variance inflation factors[J].The American Statistician,1995,49(1):53-56

[12]Williamson D P,Zhang J J,Pease D G,et al.Dimensions of spectator identification associated with women’s professional basketball game attendance[J].International Journal of Sport Management,2003,4(1):59-91

[13]Wright R E.Logistic regression.In L G Grimm & P R Yarnold (Eds.),Reading and understanding multivariate statistics[M].Washington,DC:American Psychological Association,1995:217-244

[14]Wicker P,Breuer C,Pawlowski T.Promoting sport for all to age-specific target groups:the impact of sport infrastructure[J].European Sport Management Quarterly,2009,9(2):103-118

Correlation Studies in the Application of Sport Management Research∥

Jerry J.Wang1,James J.Zhang1,James W.Du2,Zhang Yi3

The purpose of this article is to provide an overview of the fundamentals of correlational studies and associated regression analyses in the application of sport management research.Concrete discussions entail the goals,definitions,underlying mechanism,and key assumptions embedded in research designs and analytical process,which are illustrated in the technical categories of dependence correlation (i.e.,bivariate correlation,simple linear regression,multiple linear regression,polynomial regression,logistic regression,and multiple discriminant analysis).

sport management; correlational study; regression analysis

2016-03-01;

2016-04-25

Jerry J.Wang(1986-),男,河南洛陽人,美國佐治亞大學博士研究生,國際體育管理研究中心研究員;Tel.:(706) 201-7183,E-mail:jqwang@uga.edu

簡介:張軼(1979-),女,湖北武漢人,上海大學體育學院講師;Tel.:13918666846,E-mail:zhangyi3270@i.shu.edu.cn

G80-05

A

1000-5498(2016)03-0001-09

10.16099/j.sus.2016.03.001

猜你喜歡
體育分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
提倡體育100分 也需未雨綢繆
甘肅教育(2020年2期)2020-11-25 00:50:04
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
2016體育年
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
我們的“體育夢”
主站蜘蛛池模板: 亚洲精品国产首次亮相| 日韩高清欧美| 一级片一区| 亚洲视频影院| 国产在线观看精品| 国产激情无码一区二区APP| 嫩草国产在线| 久久综合亚洲色一区二区三区| 九九九精品成人免费视频7| 国产迷奸在线看| 中文字幕第4页| 亚洲国产欧洲精品路线久久| 911亚洲精品| 久久天天躁狠狠躁夜夜躁| 欧美不卡在线视频| 91亚洲精品第一| 亚洲日本在线免费观看| 亚洲三级成人| 波多野结衣一区二区三视频| 色欲色欲久久综合网| 色窝窝免费一区二区三区| 国产剧情国内精品原创| 99国产在线视频| 青草娱乐极品免费视频| 亚洲欧美日韩久久精品| 国产高清在线观看91精品| 久青草网站| 国产在线观看一区精品| 最新日韩AV网址在线观看| 国产精品不卡片视频免费观看| 一本一道波多野结衣av黑人在线| 婷婷五月在线| 国产91无码福利在线| 亚洲日韩精品欧美中文字幕| 精品福利国产| 国产成人三级| 乱系列中文字幕在线视频| 热99精品视频| 日本三级欧美三级| 88国产经典欧美一区二区三区| 黄网站欧美内射| 91视频国产高清| 91 九色视频丝袜| 国产高颜值露脸在线观看| 国产麻豆va精品视频| 国产凹凸视频在线观看| 毛片最新网址| 少妇精品久久久一区二区三区| 伊人AV天堂| 69av免费视频| 国产成人免费视频精品一区二区| 亚洲成网777777国产精品| 国产美女久久久久不卡| 国产成人高清亚洲一区久久| 国产在线91在线电影| 亚洲视频免| 欧美啪啪一区| 日本欧美视频在线观看| 欧美成人第一页| 无码精油按摩潮喷在线播放 | 亚洲天堂久久新| 97成人在线观看| 日韩毛片免费观看| a毛片在线免费观看| 69av在线| 亚洲成a人片在线观看88| 国产一级在线播放| 国产一级毛片在线| 日日碰狠狠添天天爽| 99精品在线视频观看| 国内精品久久久久久久久久影视| 国产精品无码影视久久久久久久| 亚洲精品福利视频| 国产精品无码影视久久久久久久| 国产免费观看av大片的网站| 国产精品美女网站| 无码久看视频| 国产91高跟丝袜| 找国产毛片看| 亚洲欧美在线精品一区二区| 欧美不卡视频一区发布| 中国国产高清免费AV片|