999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

小樣本數據潛變量建模:貝葉斯估計的應用

2018-12-13 05:00:52毛志雄李玉磊
中國體育科技 2018年6期
關鍵詞:信息模型研究

晏 寧,毛志雄,李 英,李玉磊,郭 璐

?

小樣本數據潛變量建模:貝葉斯估計的應用

晏 寧1,2,毛志雄1,李 英3,李玉磊1,郭 璐1

1. 北京體育大學 心理學院, 北京 100084; 2. 北京聯合大學 心理素質教育中心, 北京 100101; 3. 北京中法實驗學校, 北京 100095

旨在通過一項基于計劃行為理論的鍛煉行為實證研究案例,說明貝葉斯結構方程模型如何應對小樣本數據。貝葉斯方法之所以適用于小樣本數據主要因為:貝葉斯方法不依賴大樣本理論且允許估計測量模型中所有可能的殘差協方差,經典統計方法中這些均無法實現;借助貝葉斯定理,采用信息先驗的貝葉斯估計允許將先前研究的結果與當前研究進行整合,從而使假設獲得檢驗的機會,這也是經典統計方法無法實現的。與最大似然估計相比,貝葉斯估計有助于降低對樣本量的要求、避免不適當解、更好地反映研究者的理論構想和先驗信念、促進科學知識的積累。然而,貝葉斯估計并非萬能,必須確保合理、透明地使用先驗信息。

貝葉斯方法;結構方程模型;最大似然估計;殘差相關;先驗分布

1 問題的提出

眾所周知,樣本量越大,<0.05的可能性越大。然而研究實踐過程中,研究者并非總有機會獲得大樣本數據。運動與鍛煉心理學領域的研究也不例外。縱向追蹤研究中的樣本流失、研究對象的總體數量極為有限、嚴格的研究參與者篩選標準、研究經費的限制以及道德約束等因素均有可能使研究者獲得大樣本的期望難以、甚至根本無法實現。而小樣本數據帶來的一個直接后果是統計檢驗力降低,由此造成的不顯著的值,使得研究結果在零假設檢驗框架下無法獲得有意義的解釋[7,26,33]。此時,研究者常需面對兩難的選擇,堅持還是放棄自己感興趣的研究問題。

究竟多大樣本量才能滿足當前研究所需,是每個學者在研究開始之前必須要回答的問題。借助模型中參數個數來粗略估計研究所需樣本量是常用的策略之一。如:Lee等(2004)[26]的研究顯示,采用最大似然估計(maximum likelihood estimation)進行結構方程模型分析時,至少需要自由參數5倍以上的樣本量,才能獲得參數的無偏估計,這個標準已經比實踐中常用的經驗法則要寬松得多。模型復雜程度和測量模型特征也是確定樣本量時經常需要考慮的因素,如:Hair等(2014)[15]基于模型復雜程度和基本測量模型的特征給出一套更為精細的確定樣本量的經驗法則:當模型中包含5個及以下構念,每個構念有3個以上觀測條目且平均方差萃取量在0.6及以上時,最小樣本量為100;當模型包含7個及以下構念,每個構念有3個以上觀測條目且平均方差萃取量在0.5左右時,最小樣本量為150;模型包含7個及以下構念,平均方差萃取量低于0.45,且(或)存在觀測條目不足3個的構念,最小樣本量為300;模型包含7個以上構念,其中部分構念平均方差萃取量低于0.45,且(或)單一構念的觀測條目不足3個,最小樣本量為500。除上述法則外,Muthén(2002)[32]甚至認為,確定樣本量唯一有效的途徑是進行模擬研究。如果模擬研究顯示5倍于自由參數個數的樣本量可以提供足夠的統計檢驗力,則實際研究中的樣本量至少要5倍于自由參數個數。

然而,如果基于上述策略確定的樣本量無法達到,會出現什么情況?考慮一下這個研究問題:采用前瞻設計,考察計劃行為理論(the theory of planned behavior,TPB)[4]相關構念對有鍛煉意向和少量鍛煉行為、但未達到推薦鍛煉標準的視障大學生群體的鍛煉行為的預測效果。這個問題中,研究者感興趣的群體有兩個限制條件。1)視障大學生。因為元分析結果顯示,計劃行為理論對鍛煉行為的預測效果存在群體差異[28],因而有必要單獨考察計劃行為理論相關構念對視障大學生鍛煉行為的預測效果。2)滿足“有鍛煉意向和少量鍛煉行為、但未達到推薦鍛煉標準”的篩選條件。因為符合這一條件的研究參與者,是未來最有可能通過心理社會變量的干預促進其鍛煉行為的群體。通常,此類研究問題需要使用結構方程模型來回答,如前所述,使用最大似然估計需在大樣本量條件下才能獲得參數的無偏估計。但是,該研究在實際數據采集過程中,至少面臨5個挑戰。1)視障大學生總人數相對有限,且分散于眾多高校,研究者期望獲得一個大樣本數據,其難度可想而知。即便有些高校開設的特殊教育類專業存在一定數量的視障大學生,由于這些專業在校生的規模有限,想要獲得大樣本數據也并非易事。如2016年全國僅有1 941名殘疾人(含視障)進入高等特殊教育學院學習[2],而北京地區規模最大的特殊教育學院目前在校視障大學生也僅有160人左右。2)“有鍛煉意向和少量鍛煉行為、但未達到推薦鍛煉標準”這一篩選條件的限制進一步加劇了獲得大樣本的難度。3)樣本流失是前瞻設計無法回避的現實。4)從倫理層面講,需征得本人的同意,才能邀請其參加研究項目進而獲得數據。5)重度視障大學生無法獨自完成紙筆測驗,需要安排調查員協助進行,造成時間成本和經費投入的增加。在上述5個挑戰面前,研究者獲得根據經驗法則確定的樣本量,難度倍增。那么,對于這一研究問題,除了等待若干年,以積累足夠的樣本量之外,是否只有放棄一途?

2 貝葉斯估計應對小樣本數據的原理

與最大似然估計相比,貝葉斯估計(Bayesian estimation)不一定需要大樣本量[30]。在分析小樣本數據時,貝葉斯估計可以同時兼顧估計精度和統計檢驗力[26]。這主要歸因于貝葉斯估計可以將參數的先驗信息納入分析過程[36]。

貝葉斯估計的核心思想是將收集觀測數據前已掌握的關于參數的知識(先驗)與觀測數據信息(似然函數)相結合,進而獲得更新的參數知識(后驗)[24]。確定先驗分布的依據是研究者在采集觀測數據前,確信已經掌握的關于模型參數背景知識的多少,以及對這些信息的確信程度。當參數值及其精度的先驗信息可以獲得并加以利用時,可設定信息先驗分布(informative prior distribution)。先驗知識可從前人的研究(如:元分析或類似的研究)中獲得,其優點是便于他人核實這些先驗信息的來源。當然也可從本領域理論或實務方面的專家處獲得[41]。當沒有任何可資利用的先驗知識,或者未使用先驗知識時,可選擇無信息先驗(non-informative prior distribution),即假定我們對于模型參數一無所知,觀測數據中的參數估計值出現在負無窮到正無窮任一點上的概率均等,也就是模型參數服從一個從負無窮到正無窮的均勻分布(uniform distribution)。從貝葉斯的觀點來看,先驗信息的缺乏同樣值得考慮,也有必要將其納入后續統計分析。換句話說,量化未知與量化已知同等重要[22]。有些情況下,設定參數取值范圍從負無窮到正無窮沒有實際意義,因此可以在設定先驗分布時,增加參數取值范圍的設定,如:先驗均值的取值范圍可以不包含超出量表刻度以外的數值。更多關于貝葉斯方法的介紹可參考van de Schoot等(2014)、Depaoli等(2017)文獻。

一般來說,先驗信息精度越高,所攜帶的信息量越大,對估計結果的影響越大[37]。當使用無信息先驗時,先驗分布不會對最終模型參數估計產生任何影響,因而,采用無信息先驗分布所得結果與最大似然法一致[30]。當使用低精度的信息先驗,尤其是樣本量較大時,結果幾乎不會受到先驗信息的影響。不管樣本量大小,精度較高的信息先驗不僅可以將先前研究的結果納入當前的分析過程,更可由此獲得更加精確的可信區間(credibility interval)或者后驗預測區間(posterior predictive interval)估計值。換句話說,先驗分布的精度越高,后驗分布所攜帶的信息就越多,即:統計檢驗力就越高,或者說,統計推斷錯誤不太可能發生[38]。此外,將先驗信息納入分析過程可避免不可接受的估計值以及貝葉斯估計中的收斂問題。而多項模擬研究[18,29]結果顯示,經典統計方法中常用的最大似然估計則經常遭遇違犯估計和收斂問題。總之,采用信息先驗的貝葉斯估計在小樣本量條件下,也可以獲得有意義的結果。但是,我們仍強烈建議,如果有可能,獲取大樣本數據仍應作為研究者的首選。

3 研究案例

本文數據來源于一項鍛煉行為促進領域的實證研究。該研究旨在考察計劃行為理論相關構念對有鍛煉意向和少量鍛煉行為、但未達到推薦鍛煉標準的視障大學生鍛煉行為的預測效果。

計劃行為理論是身體活動促進領域應用最廣泛的理論之一。該理論認為,行為態度、主觀規范和主觀控制感透過行為意向影響行為[4]。如果將主觀行為控制感視為自己是否對從事該行為有足夠選擇權的評價,則主觀行為控制感可對行為的產生有直接預測作用[3]。目前已有多項元分析和敘事性綜述為計劃行為理論解釋和預測不同人群各種形式的身體活動行為提供了支持性證據,且研究結果具有較高的一致性[6,10,11,14,17,21,23,34]。如:近期一篇元分析[28]結果顯示,行為態度與行為意向、主觀行為控制感與行為意向、主觀行為控制感與身體活動、行為意向與身體活動的相關系數(標準差)分別為:0.60(0.14)、0.55(0.20)、0.34(0.15)、0.48(0.18)。鑒于元分析結果具有易量化、可查證、可提供變量關系的強證據等特點,研究案例將以此作為先驗信息的來源,并將其納入后續的數據分析過程。

為降低讀者的認知負荷,研究案例僅將計劃行為理論框架中的行為意向和主觀控制感作為鍛煉行為的預測因素納入假設模型。根據計劃行為理論,可以假設,鍛煉意向和主觀控制感對鍛煉行為均有顯著正向預測作用,且主觀控制感可同時對鍛煉意向有顯著正向預測作用。

下文將借助真實數據分析過程演示說明如何應用貝葉斯估計分析小樣本數據,同時對比最大似然估計和貝葉斯估計在小樣本條件下模型擬合和參數估計的差異。至于兩種估計方法對比的結果,可以預期,在小樣本量條件下,當最大似然估計無法對模型參數作出有效估計時,采用允許納入先驗信息的貝葉斯估計,可使研究假設獲得重新檢驗的機會。

特別說明,因該數據僅用作演示說明的目的,且假設模型僅選用了部分計劃行為理論構念,相關結果不構成計劃行為理論對視障大學生鍛煉行為預測效果的研究證據。

3.1 方法

采用前瞻設計。研究參與者來源于某高校特殊教育學院的在校大學生,第1次測量完成鍛煉行為以及鍛煉意向和主觀控制感的測量。4周后,完成第2次鍛煉行為測量。共有81人完成兩次測量。兩次測量中,達到ACSM推薦鍛煉標準[16],即每周參與中等強度鍛煉5次以上或者大強度鍛煉3次以上者,以及每周參與中等以上強度鍛煉低于1次者予以剔除。最終獲得52份有效數據。

鍛煉意向和主觀控制感的測量各3個條目,采用6級李克特量表計分[1]。鍛煉行為采用【休閑時間鍛煉問卷】(the Godin Leisure-Time Exercise Questionnaire,GLTEQ)[13],要求參與者報告過去4周中,每周鍛煉時間在30 min以上的次數[35]。

采用Mplus 7.4[31]進行潛變量建模。首先,使用最大似然法對模型進行估計,此時,不使用任何先驗信息。模型擬合采用傳統的2/CFI、TLI、RMSEA、SRMR等指標進行評估。一般來說,2/小于3,CFI、TLI大于0.9,RMSEA、SRMR小于0.05代表模型擬合良好[15]。

使用信息先驗進行貝葉斯估計時,需進行敏感度分析(sensitivity analysis),以考查先驗信息選擇的合理性。所謂敏感度分析即通過考查不同先驗信息條件下模型參數估計結果的差異,檢驗先驗分布的選擇對后驗分布的影響程度。如不同先驗信息條件下模型參數估計結果相差不大,則表明先驗分布的選擇對后驗分布的影響較小,可以一定程度上支持先驗信息選擇的合理性[12]。根據Zondervan-Zwijnenburg等(2017)[40]的推薦,本研究選用無信息先驗和信息先驗兩種先驗信息進行敏感度分析,并詳細報告先驗信息的來源及設定方法,以確保先驗信息使用的透明度。具體來說,無信息先驗模型估計采用Mplus的默認設置。如:測量條目均值、鍛煉行為截距項、因子載荷和路徑系數的默認先驗分布為N(0,1010),代表模型中這些參數服從先驗均值為0,先驗方差為1010的正態分布,以此近似代表先驗均值為0,先驗方差無限大的均勻分布。測量條目和鍛煉行為的殘差方差以及鍛煉意向、主觀控制感兩個潛變量方差的先驗分布為IG(-1,0),即服從先驗均值和先驗方差無限大的逆伽馬分布(inverse gamma distribution)。信息先驗模型是在上述模型的基礎上,首先對所有觀測變量進行標準化轉換,然后通過model prior命令增加參數先驗分布的設定。本研究依據近期一篇元分析[28]所提供的鍛煉意向與鍛煉行為、主觀控制感與鍛煉行為、主觀控制感與鍛煉意向關系的相關系數及其標準差確定相應路徑系數的先驗分布為N(0.48, 0.032 4)、N(0.34, 0.022 5)、N(0.55, 0.04)。根據Hair等(2014)[15]關于標準化因子載荷的推薦標準,確定因子載荷的先驗均值為0.7,根據Asparouhov等(2010)[5]的建議,選擇0.01作為因子載荷的先驗方差,即標準化因子載荷的先驗分布為N(0.7, 0.01),代表因子載荷很可能介于0.5~0.9之間(0.7±0.2)。根據Muthén等(2012)[30]的建議,采用近似零的殘差相關替代零殘差相關,理由將在下文討論。測量條目殘差相關的先驗分布設為IW(0, 12)①,即服從先驗均值為0,先驗方差為0.011的逆威沙特分布(inverse Wishart distribution);殘差方差的先驗分布設為IW(1, 12),即服從先驗均值為0.2,先驗方差為0.027的逆威沙特分布。

由于對殘差相關設定了小方差信息先驗,收斂的難度增大,因而需要設定較大的迭代次數。根據Muthén等(2012)[30]的建議,固定貝葉斯迭代100000次。行為意向和主觀控制感是計劃行為理論中兩個獨立的構念,因此這里不考慮設置交叉載荷。其余使用Mplus的默認設定。以PSR指標小于1.1,且軌跡圖呈現快速上下變動,但沒有長期趨向或任意漂移的情形時,可認為達到收斂[12]。模型擬合采用后驗預測值和卡方差異值95%可信區間來判斷。后驗預測值在0.5附近,且卡方差異值95%可信區間以零為中心基本對稱,代表模型擬合良好。模型比較選用DIC指標,DIC值越小代表模型擬合越好[12]。

3.2 結果

最大似然法模型估計結果見表1。鍛煉意向和主觀控制感所有條目的標準化因子載荷均在0.7以上;主觀控制感到鍛煉意向的標準化路徑系數為0.758,主觀控制感解釋鍛煉意向方差的57.4%;模型擬合指標除RMSEA之外,均比較理想。然而,鍛煉意向和主觀控制感到鍛煉行為的路徑系數以及對鍛煉行為方差解釋率均未達顯著,提示僅部分研究假設獲得支持。此外,最大似然估計結果報告中,有一個主觀控制感測量條目的殘差方差未達顯著,意味著該參數估計值非常接近負值,超出統計分析所能接受的范圍,為不適當解。

表1 最大似然估計結果

注:DV-結果變量;IV-預測變量;Std. FL-標準化因子載荷;unstd.-非標準化路徑系數;std.-標準化路徑系數;INT-行為意向;PBC-主觀控制感;PE-鍛煉行為;***<0.001,下同。

貝葉斯模型估計結果見表2。兩個模型PSR指標在迭代100 000次后,均小于等于1.002。檢視所有參數軌跡圖,也均提示迭代過程已收斂。敏感度分析結果顯示,選用兩種不同的先驗信息(即無信息先驗和信息先驗),所得模型參數(標準化路徑系數和標準化因子載荷)結果差異不大,表明先驗信息的納入并未對模型參數的估計造成重大影響,這一定程度上支持了先驗信息選擇的合理性[37]。從模型擬合指標來看,信息先驗模型后驗預測值為0.564,95%可信區間以零為中心基本對稱,且DIC指標數值較小,提示信息先驗模型擬合度優于無信息先驗模型。從模型參數估計和推斷的結果來看,無信息先驗模型中的標準化路徑系數、標準化因子載荷等參數的后驗估計值均與最大似然估計的結果相近,這是因為無信息先驗分布不會對最終模型參數估計產生任何影響[30];其中,主觀控制感到鍛煉意向的標準化路徑系數為0.753,主觀控制感解釋鍛煉意向方差的56.8%;而鍛煉意向和主觀控制感到鍛煉行為兩條路徑系數的95%PPI包含0,提示僅部分研究假設得到支持,與最大似然估計結果一致。信息先驗模型中所有路徑系數的95%PPI均不包含0,提示全部研究假設得到支持。鍛煉意向和主觀控制感共同解釋了鍛煉行為方差的19.7%,與計劃行為理論對身體鍛煉行為預測效果相關元分析的結果接近[28]。此外,信息先驗模型和無信息先驗模型中所有殘差方差后驗估計值的95%PPI均不包含0,提示未出現違犯估計現象。

表2 貝葉斯估計結果

注:coeff.-標準化路徑系數;*95%PPI不包含0。

3.3 分析

當樣本量較小時,貝葉斯估計通過納入先驗知識,以更新先驗知識的方式,使研究假設全部獲得數據支持;而最大似然估計結果僅支持了部分研究假設。

樣本量較小是導致上述案例中最大似然估計結果未能支持全部研究假設的重要原因。1)根據計劃行為理論及現有元分析[28,34]證據判斷,行為意向和主觀控制感應可有效預測鍛煉行為。而該研究中最大似然估計結果提示模型擬合指標良好,且3條路徑系數所反映的變量關系方向與計劃行為理論所預測的一致,唯獨模型中鍛煉意向到鍛煉行為以及主觀控制感到鍛煉行為兩條路徑系數未達顯著,由此可以排除模型建構本身的問題。2)眾所周知,采用最大似然估計進行結構方程模型分析,需要的樣本量較大。如:根據Hair等(2014)[15]的推薦標準,包含5個及以下構念、每個構念包含3個以上測量條目、且平均方差萃取量在0.6及以上的模型,最少需要100個樣本。3)結構方程模型要求誤差方差為正,且顯著[15]。最大似然估計結果中存在誤差方差不顯著的情形,為不適當解。而貝葉斯方法估計的誤差方差全部為正,且95%可信區間均未包含0,提示未出現不適當解。根據Hair等(2014)[15]的準則,樣本量在300以上,且滿足每個構念至少3個條目的原則,才可能不出現上述違犯估計的情況。即便是采用相對比較寬松的準則,在每個構念包含3個及以上條目時,若要最大似然估計能夠收斂并獲得適當解,樣本量至少也要在150以上[20]。而該研究僅有52筆有效數據。綜合以上3點,不難判斷,最大似然估計結果未能支持全部研究假設,很有可能是樣本量小所致。鑒于該研究數據采集過程中的種種挑戰,增加樣本的難度和成本較高,因此需要一種替代估計方法來對研究假設進行檢驗。

貝葉斯方法不依賴大樣本理論,可將先前研究的結果與當前研究進行整合,從而使假設獲得檢驗的機會,且允許估計測量模型中所有可能的殘差協方差,而這些在經典統計方法中均無法實現[26,30,36,40]。這些特征決定了貝葉斯估計可以在小樣本量條件下作為最大似然估計的替代方案。本研究結果表明,在相對較小的樣本量條件下,貝葉斯估計利用從元分析獲得的變量關系方向、強度的先驗信息,借助Gibbs采樣算法,依然獲得了模型參數的無偏估計,進而使研究假設全部獲得支持。同時,貝葉斯估計通過納入誤差方差的先驗信息(先驗均值為正),也有效避免了不適當解的情形[37]。此外,該研究根據Muthén等(2012)[30]的建議,對殘差相關設定小方差信息先驗,替代零殘差相關。因為主觀控制感和鍛煉意向兩個量表題目具有相似的結構、內容和措辭以及相同反應形式,由此造成的方法偏誤必然會包含在每個測量條目的殘差中,因此,模型中一定會存在微小但不為零的殘差相關。最大似然估計的殘差獨立原則假定所有測量條目的殘差相關為0,僅僅是出于模型簡約性的考慮,而不能使模型更加符合現實情況[30]。因而允許對殘差相關設定小方差信息先驗,或許是信息先驗貝葉斯估計能夠在小樣本條件下對研究假設做出有效檢驗的另一個重要原因。

最后,有必要強調的是,采用最大似然估計進行結構方程模型分析時,經常遇到研究假設無法獲得數據支持(如:因統計檢驗力降低致使>0.05)、違犯估計(如:殘差方差為負或不顯著)等問題。此時需要具體問題具體分析,明確引發這些問題的確切原因,采取針對性的應對措施。切勿一味強行使用信息先驗貝葉斯估計,獲取自己感興趣的研究結果。

4 討論

本文首先簡要分析了小樣本數據的成因,并介紹了貝葉斯方法分析小樣本數據的基本原理。樣本量是每個研究者在開始一項研究前都關心的一個議題。最大似然估計是結構方程模型最常用的估計方法,通常需要較大的樣本量。然而由于種種原因,研究者卻往往難以、甚至無法獲得借助經驗法則或模擬研究確定的最小樣本量。樣本量不足會直接導致統計檢驗力下降,進而使研究結果在零假設檢驗框架下無法獲得有意義的解釋。貝葉斯估計可以作為小樣本量條件下,結構方程模型的備選估計方法。其主要原因在于貝葉斯估計可將先驗信息納入分析過程,結合觀測數據信息,獲得參數的后驗分布,而這個過程并不受樣本量大小的限制。對一筆小樣本數據而言,模型參數的先驗分布精度越高,其后驗分布的精度就越高,統計檢驗力也越高。

然后借助一項運動與鍛煉心理學研究領域實證研究的數據分析過程,說明利用貝葉斯方法分析小樣本數據的具體方法。通過與最大似然估計的對比,可見貝葉斯估計在實務上的4個獨特優勢。1)同等條件下,貝葉斯方法對樣本量的要求較低。正如Lee等(2004)[26]的模擬研究表明,采用最大似然估計的結構方程模型,其最小樣本量為待估計參數的4~5倍,而采用貝葉斯方法僅需待估計參數的2~3倍。不僅如此,Hox等(2012)[19]的研究表明,采用穩健最大似然估計(MLR)進行多層次模型分析時,至少需要50組樣本,而采用貝葉斯估計則僅需20組。2)貝葉斯方法可以避免不適當解。最大似然估計有時會產生不恰當解,如殘差方差不顯著或者小于0、標準化回歸系數大于1。通過殘差方差、協方差先驗分布的設定,這些不適當解的情況不會出現[37]。但需要注意:由于模型設定錯誤導致的不適當解,貝葉斯方法沒辦法解決。3)貝葉斯估計允許將殘差方差和殘差相關的先驗信息納入分析過程,從而使得假設模型能更好地反映研究者的理論構想和先驗信念[30]。4)貝葉斯估計可以將前人研究成果以先驗分布的形式納入當前的研究中,體現研究的繼承性。具體來說,貝葉斯估計可將來源于元分析、先前相同主題研究、預研究或者領域專家的變量關系的方向和強度先驗信息,與當前觀測數據相結合,構建參數的可信區間,從而更新先驗知識[37]。除上述4個優勢之外,文獻[8,9,25,30,36,37,39]表明貝葉斯估計還有其他特點和優勢。

當然,貝葉斯方法也受到諸多質疑,尤其是在先驗的選擇問題上[27]。批評者認為先驗的選擇完全基于研究者的主觀決策,并警告稱應警惕因錯誤選擇先驗而造成的嚴重后果。支持者為此做了諸多努力,并給出具體建議。如:van de Schoot等(2014)[37]的研究結果顯示,對誤設先驗信息所造成的后果可不必過于擔心,但是,研究者有義務確保先驗選擇的透明度。如:清晰、準確的描述所使用的先驗信息,并陳述理由及其來源;如果使用了不同先驗分布,還需用表格呈現敏感度分析的信息。通過這種方式,讀者可以自行決定他們是否信服。近來,Zondervan-Zwijnenburg等(2017)[40]介紹了一份先驗信息的獲取和使用指南,并通過實際研究案例示范了如何獲取先驗信息。這些學者的工作均有助于推動先驗信息使用的規范化。需要指出的是,應用貝葉斯方法的學者也有義務在確保先驗信息設定的透明度和合理性的前提下,規范、合理地使用先驗信息。比如使用先驗信息的一個常見錯誤做法是反復嘗試各種不同的先驗信息,然后選擇對自己有利的結果進行報告。這種做法與捏造數據同屬違反學術道德行為[40]。其實,選擇使用信息先驗的理由不應該是為了獲得統計上顯著的結果,而應該是納入可資利用的先驗信息后,有助于回答那些懸而未決的研究問題。只要恰當的應用信息先驗,不管結果如何,都不會掩蓋該項研究自身的價值。

5 結論

貝葉斯估計可幫助研究者有效應對小樣本數據造成的困擾。總體而言,信息先驗貝葉斯估計通過將參數的先驗信息納入分析過程,同時兼顧了小樣本量條件下模型參數估計精度和統計檢驗力。具體而言,信息先驗貝葉斯估計將先前研究結果以先驗信息的方式納入分析過程,結合當前觀測數據,使研究假設在小樣本量條件下獲得檢驗的機會;通過納入殘差方差的先驗信息,避免小樣本量條件下最大似然估計常見的違犯估計問題;通過納入殘差相關的先驗信息,真實反映模型中必然存在的微小但不為零的殘差相關,有助于改善模型擬合程度。

應用信息先驗貝葉斯估計需要注意以下幾點。1)雖然信息先驗貝葉斯估計可以幫助研究者在小樣本量條件下獲得有意義的結果。但研究者在面對小樣本數據時,首要考慮的問題仍應該是有沒有可能增加樣本量,其次才是先驗信息的選擇問題。2)清晰、準確的描述所使用的先驗信息,并陳述理由及其來源,確保先驗信息選擇的透明度。3)信息先驗貝葉斯估計需進行敏感度分析,以考查不同先驗信息對后驗估計的影響。進行敏感度分析至少也要報告使用統計分析工具軟件中的默認先驗信息和研究者經過檢索、論證確定的先驗信息的模型參數估計結果,并用表格呈現。4)解釋使用不同先驗信息所造成的分析結果的差異。5)方法是服務于研究問題的,貝葉斯方法也不例外。選擇使用信息先驗貝葉斯估計的最重要原因應是有助于特定(領域)研究問題的解決。先驗信息的檢索和選擇可能是一項高度精細化且費時費力的任務,但有助于明晰當前研究與前人研究的區別。恰當的先驗信息提供了對該領域研究現狀的深刻見解,將其納入當前研究,有助于該領域科學知識的更新。而所有已發表的研究也都應為未來同類研究提供先驗信息,進而有助于該領域科學知識的積累。

[1] 胡艷, 毛志雄. 計劃和障礙自我效能對鍛煉意向與行為過程關系的影響[J]. Int J Sport Exerc Psychol, 2008, 6(4): 463-495.

[2] 中國殘疾人聯合會. 2016年中國殘疾人事業發展統計公報(殘聯發[2017]15號)[EB/OL]. (2017-03-31). http://www.cdpf.org.cn/zcwj/zxwj/201703/t20170331_587445.shtml.

[3] AJZEN I. From intentions to actions: A theory of planned behavior [M]//KUHL J, BECKMANN J. Action Control: From Cognition to Behavior. New York: SpringerVerlag, 1985: 11-39.

[4] AJZEN I. The theory of planned behavior[J]. Organ Behav Hum Decis Process, 1991, 50(2): 179-211.

[5] ASPAROUHOV T, MVTHéNE B. Bayesian analysis using Mplus: Technical implementation[Z], 2010.

[6] BLANCHARD C, FISHER J, SPARLING P,. Understanding physical activity behavior in African American and Caucasian college students: an application of the theory of planned behavior [J]. J Am Coll Health, 2008, 56(4): 341-346.

[7] BUTTON K S, IOANNIDIS J P A, MOKRYSZ C,. Power failure: why small sample size undermines the reliability of neuroscience [J]. Nat rev. Neurosci, 2013, 14(5): 365-376.

[8] DEPAOLI S, CLIFTON J P. A Bayesian approach to multilevel structural equation modeling with continuous and dichotomous outcomes[J]. Struct Equ Modeling, 2015, 22(3): 327-351.

[9] DEPAOLI S, RUS H M, CLIFTON J P,. An introduction to Bayesian statistics in health psychology[J]. Health Psychol Rev, 2017, 11(3): 248-264.

[10] DOWNS D S, HAUSENBLAS H A. Elicitation studies and the theory of planned behavior: a systematic review of exercise beliefs [J]. Psychol Sport Exerc, 2005, 6(1): 1-31.

[11] DOWNS D S, HAUSENBLAS H A. The theories of reasoned action and planned behavior applied to exercise: A meta-analytic update[J]. J Phys Act Health, 2005, 2(1): 76-97.

[12] GELMAN A, CARLIN J B, STERN H S,. Bayesian Data Analysis[M]. 3thed. Boca Raton: CRC Press, 2014.

[13] GODIN G, SHEPHARD R. A simple method to assess exercise behavior in the community[J]. Can J Appl Sport Sci,1985,10(3): 141-146.

[14] HAGGER M S, CHATZISARANTIS N L D. Integrating the theory of planned behaviour and self‐determination theory in health behaviour: A meta‐analysis[J]. Br J Health Psychol, 2009, 14(2): 275-302.

[15] HAIR J F, BLACK W C, BABIN B J,. Multivariate Data Analysis[M]. 7thed. UK: Pearson Education Limited, 2014.

[16] HASKELL W L, LEE I-M, PATE R R,. Physical activity and public health: updated recommendation for adults from the American College of Sports Medicine and the American Heart Association[J]. Circulation, 2007, 116(9): 1081.

[17] HAUSENBLAS H A, DOWNS D S. Prospective examination of the Theory of Planned Behavior applied to exercise behavior during women's first trimester of pregnancy[J]. J Reprod Infant Psychol, 2004, 22(3): 199-210.

[18] HOX J J, MAAS C J M. The accuracy of multilevel structural equation modeling with pseudobalanced groups and small samples [J]. Struct Equ Modeling, 2001, 8(2): 157-174.

[19] HOX J J, VAN DE SCHOOT R, MATTHIJSSE S. How few countries will do? Comparative survey analysis from a Bayesian perspective[J]. Surv Res Methods, 2012, 6(2): 87-93.

[20] IACOBUCCI D. Structural equations modeling: Fit indices, samp-le size, and advanced topics[J]. J Consum Psychol, 2010,20(1): 90-98.

[21] JONES L W, GUILL B, KEIR S T,. Using the theory of planned behavior to understand the determinants of exercise inten-tion in patients diagnosed with primary brain cancer[J]. Psychoon-cology, 2007, 16(3): 232-240.

[22] KAPLAN D, DEPAOLI S: Bayesian statistical methods[M]// LITTLE T D. Oxford Handbook of Quantitative Methods. Oxford, UK: Oxford University Press, 2013: 407-437.

[23] KARVINEN K H, COURNEYA K S, CAMPBELL K L,. Correlates of exercise motivation and behavior in a population-based sample of endometrial cancer survivors: an application of the Theory of Planned Behavior[J]. Int J Behav Nutr Phys Act, 2007, 4(1): 20-30.

[24] KRUSCHKE J. Doing Bayesian data analysis[M]. 2nded. USA: Academic Press, 2015.

[25] KRUSCHKE J K. Bayesian estimation supersedes the t test[J]. J Exp Psychol Gen, 2013, 142(2): 573-603.

[26] LEE S Y, SONG X Y. Evaluation of the Bayesian and maximum likelihood approaches in analyzing structural equation models with small sample sizes[J]. Multivar Behav Res, 2004, 39(4): 653-686.

[27] MACCALLUM R C, EDWARDS M C, CAI L. Hopes and cautions in implementing Bayesian structural equation modeling [J]. Psychol Methods, 2012, 17(3): 340–345.

[28] MCEACHAN R R C, CONNER M, TAYLOR N J,. Prospective prediction of health-related behaviours with the Theory of Planned Behaviour: a meta-analysis[J]. Health Psychol Rev, 2011, 5(2): 97-144.

[29] MEULEMAN B, BILLIET J. A monte carlo sample size study: how many countries are needed for accurate multilevel SEM?[J]. Surv Res Methods, 2009, 3: 45-58.

[30] MUTHéN B, ASPAROUHOV T. Bayesian structural equation modeling: a more flexible representation of substantive theory[J]. Psychol methods, 2012, 17(3): 313-335.

[31] MUTHéN L K, MUTHéN B O. Mplus User's Guide[M]. Los Angeles, CA: Muthén & Muthén, 1998-2015.

[32] MUTHéN L K, MUTHéN B O. How to use a monte carlo study to decide on sample size and determine power[J]. Struct Equ Modeling, 2002, 9(4): 599-620.

[33] PRICE L R. Small sample properties of bayesian multivariate autoregressive time series models [J]. Struct Equa Modeling, 2012, 19(1): 51-64.

[34] RHODES R E, NIGG C R. Advancing physical activity theory: A review and future directions[J]. Exerc Sport Sci Rev, 2011, 39(3): 113-119.

[35] STRACHAN S M, BRAWLEY L R, SPINK K S,. Self-regulatory efficacy's role in the relationship between exercise identity and perceptions of and actual exercise behaviour[J]. Psychol Sport Exerc, 2015, 18: 53-59.

[36] VAN DE SCHOOT R, BROERE J J, PERRYCK K H,. Analyzing small data sets using Bayesian estimation: the case of posttraumatic stress symptoms following mechanical ventilation in burn survivors[J]. Eur J Psychotraumatol, 2015, 6(1): 25216.

[37] VAN DE SCHOOT R, KAPLAN D, DENISSEN J,. A gentle introduction to bayesian analysis: applications to developmental research[J]. Child Dev, 2014, 85(3): 842-860.

[38] VAN DE SCHOOT R, WINTER S D, RYAN O,. A systematic review of Bayesian articles in psychology: The last 25 years[J]. Psycholo Methods, 2017, 22(2): 217–239.

[39] YUAN Y, MACKINNON D P. Bayesian mediation analysis[J]. Psycholo Methods, 2009, 14(4): 301–322.

[40] ZONDERVAN-ZWIJNENBURG M, PEETERS M, DEPAOLI S,. Where do priors come from? Applying guidelines to construct informative priors in small sample research[J]. Res Hum Dev, 2017, 14(4): 305-320.

[41] ZYPHUR M J, OSWALD F L. Bayesian estimation and inference: A user's guide[J]. J Manag, 2015, 41(2): 390-420.

①逆威沙特分布中的第2個參數代表自由度,其數值越大,則先驗方差越小,所攜帶的信息量就越大。依據Muthén等(2012)建議的方法,本文中該參數設為12,即模型中觀測條目個數加6。

Latent Variable Modeling with Small Sample Data: The Application of Bayesian Estimation

YAN Ning1,2, MAO Zhi-xiong1, LI Ying3, LI Yu-lei1, GUO Lu1

1. Beijing Sport University, Beijing 100084, China; 2. Beijing Union University, Beijing 100101, China; 3. Beijing Sino-French Experimental School, Beijing 100095, China.

The aim is to provide an empirical example of physical exercise based on the theory of planned behavior to show how Bayesian structural equation model analysis small sample data. Bayesian approach can be used with small sample sizes since they do not rely on large sample theory and allows estimating all possible residual covariance in measurement model, neither of which are possible with frequentist methods; and Bayesian estimation with informative priors allows results from all previous research to be combined with estimates of study effects using Bayes’ theorem, yielding support for hypotheses that is not obtained with frequentist methods. Compared with maximum likelihood estimation, Bayesian estimation might help to eliminate the worry about small sample sizes and the inadmissible parameters, better reflects the researcher’s theories and prior beliefs, and create cumulative knowledge. Nonetheless, Bayesian estimation is not a panacea, it is absolutely necessary to be transparent with regard to which priors were used and why.

G80-32

A

1002-9826(2018)06-0052-07

10.16470/j.csst.201806007

2017-11-15;

2018-08-11

北京體育大學科技創新團隊課題(2015TD001)。

晏寧,男,副教授,主要研究方向為鍛煉行為促進、大學生心理健康教育, E-mail: yanning@buu.edu.cn

猜你喜歡
信息模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产成人一区免费观看| 四虎影视永久在线精品| 日韩高清在线观看不卡一区二区| 香蕉视频在线观看www| 婷婷午夜天| 欧美天天干| 国产精品一区二区久久精品无码| 无码AV日韩一二三区| 亚洲va在线观看| 在线观看亚洲天堂| 久久综合色88| 91视频日本| 中文字幕欧美日韩| 最近最新中文字幕免费的一页| 亚洲bt欧美bt精品| 亚卅精品无码久久毛片乌克兰 | 亚洲天堂区| 无码综合天天久久综合网| 久久毛片基地| 欧美色亚洲| 狠狠操夜夜爽| 麻豆精品在线| 亚洲网综合| 亚洲成人一区二区三区| 青草国产在线视频| 国内精品小视频福利网址| 伊人婷婷色香五月综合缴缴情 | 国产福利小视频在线播放观看| 青青草a国产免费观看| 99伊人精品| 永久免费无码日韩视频| 久久无码av三级| 特级欧美视频aaaaaa| 日韩欧美国产三级| 四虎影视库国产精品一区| 久久semm亚洲国产| 欧美在线一级片| 成人毛片免费在线观看| 性视频久久| 波多野结衣一区二区三区四区| 毛片免费视频| 中日韩一区二区三区中文免费视频| 久久永久精品免费视频| 国产乱人乱偷精品视频a人人澡| 久久久久亚洲Av片无码观看| 高清不卡毛片| 国内精品伊人久久久久7777人| 国产欧美日韩va另类在线播放| 国产精品漂亮美女在线观看| 亚洲一区二区三区在线视频| 操操操综合网| 无码中文字幕精品推荐| lhav亚洲精品| 亚洲欧美精品一中文字幕| 综合久久久久久久综合网| 毛片免费在线| 国产永久在线视频| 国内精品视频| 玩两个丰满老熟女久久网| 亚洲最黄视频| 秋霞午夜国产精品成人片| 国产精品手机在线播放| 午夜福利无码一区二区| 亚洲欧美一区二区三区蜜芽| 青青草原国产一区二区| 91九色最新地址| 午夜视频www| 无码福利日韩神码福利片| 亚洲成A人V欧美综合| 国产精品网址你懂的| 欧美精品aⅴ在线视频| 五月天婷婷网亚洲综合在线| 国产精品天干天干在线观看| 日韩精品成人在线| 亚洲成年人网| 精品欧美视频| 蜜芽国产尤物av尤物在线看| 亚洲精品国产成人7777| 国产女人在线视频| 99热国产这里只有精品无卡顿"| 色噜噜狠狠狠综合曰曰曰| 亚洲人成日本在线观看|