999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

運動與鍛煉心理學研究效度的提高策略:三角互證

2020-03-21 08:32:44巖,周
中國體育科技 2020年1期
關鍵詞:方法研究

石 巖,周 浩

對于特定的現(xiàn)象,科學家和實踐者共同的目標包括觀察、描述、解釋、預測和控制,“準確性”貫穿于研究過程的每一個環(huán)節(jié)。量化研究總是試圖說明在一定前提條件下,科學假設比零假設在邏輯上更可取,而多數(shù)質性研究追求更準確、情境化、主體間性的意義解釋。雖然質性研究領域關于效度有更為廣泛的詮釋,但無論是量化或質性研究,均是努力通過有效的控制,追求效度最大化,同時,效度在質性和量化研究中有較大的共同之處。因此,一項研究完成或發(fā)表后,效度指標成為衡量研究質量的常用標準。研究效度主要分為4種:1)指向變量操作化和測量的構念效度;2)指向統(tǒng)計推論的統(tǒng)計結論效度;3)指向研究過程控制的內部效度;4)指向結果外推的外部效度(陳曉萍等,2008)。由于外部效度考察的是研究結論在其他情境中的可重復程度,其對實證研究質量而言是一個極為重要的評價指標。構念效度、統(tǒng)計結論效度和內部效度任何一個不能得到保證,外部效度就會出現(xiàn)問題,換言之,影響前三者的因素均會影響外部效度。由于每一種方法均存在固有的優(yōu)缺點,而具體研究中又會受到客觀、情境、被試等因素的影響,在任何一項研究中,研究者往往不能同時兼顧上述4種效度(陳曉萍等,2008)。近幾年心理學、運動與鍛煉心理學等領域出現(xiàn)的可重復性危機(reproducibility crisis)(駱大森,2017;王進,2010;Postmes et al.,2005;Schweizer et al.,2016)提醒我們,低質量研究產出不僅會降低公眾對科學研究的信任,也不利于領域內不同研究問題的證據(jù)積累。因此,如何提高研究效度是每個學科領域需要思考的問題。

運動與鍛煉心理學領域的方法學探討均或多或少涉及“提高研究效度”這一理念,如要重視效果量(王進,2010;張力為,2002;張力為 等,1998,2013)。可重復性危機出現(xiàn)后,關于這方面的探討開始增多,主要是針對統(tǒng)計結論效度和研究設計提出的建議,具體可歸納為:1)樣本量,運動與鍛煉心理學研究的樣本量普遍偏小(Schweizer et al.,2016),樣本量與統(tǒng)計功效成正比。因此,通過相關公式在研究設計時估算樣本量,如t檢驗(焦璨,2014)、回歸模型(胡安寧,2015)以及結構方程模型(Myers et al.,2011),提高統(tǒng)計功效,降低Ⅱ型錯誤的概率;2)報告效果量及其置信區(qū)間,P值是統(tǒng)計學意義上的顯著性指標,美國統(tǒng)計學會(American Statistical Association,ASA)(2016)發(fā)布了P值使用“六原則”,而效果量則能反映出研究結果偏離虛無假設的程度;3)公開、透明和開放的研究標準(Hagger,2019),這一點需學界共同努力;4)進行系列研究設計(張連成等,2019)。可以看出,目前研究更多的是在完善虛無假設檢驗層面進行探討,但也應高度重視非統(tǒng)計學因素——人為偏差,如選擇性報告、可疑研究操作等(駱大森,2017)。可重復性是一個對外部效度檢驗的標準,但必須意識到研究效度是一個整體性的或“宏”概念(王進,2010),從統(tǒng)計層面提高研究效度,提高可重復性的方向是正確的,但卻是不充分的,同時,過分強調可重復性可能會對依賴單一方法的發(fā)現(xiàn)提供毫無根據(jù)的確定性(Munafò et al.,2018)。如果原始研究結果本身就是錯的,在重復研究中也有較大的概率獲得同樣的錯誤。因此,本文認為可以將目前科學界探討的可重復性危機問題轉換為“如何提高研究效度”問題。從研究效度層面切入,最佳策略之一為三角互證(triangulation)。

三角互證指的是一種結合不同研究者、研究資料、研究方法等對同一問題進行分析的研究策略(范明林等,2009)。采用兩種或多種方法研究同一個問題,對不同方法的結果進行比較。結果的聚斂可使結果的可靠性、真實性提升,結果的分歧可以讓研究者更加謹慎并思考分歧的原因,甚至添加小研究再去驗證,即“the more methods the better”(Saks,2018)。科學研究實踐的特點之一就是“自證”,無論研究設計多么嚴謹,始終是自己提出假設、收集和分析資料,繼而進行推論,這一過程中存在著太多威脅效度的因素。在現(xiàn)有研究和論文發(fā)表模式下,完善“自證”,多種方法提供多元證據(jù)顯得尤為重要。史學研究中,王國維提出的二重證明法、二重證據(jù)法以及在此基礎上發(fā)展的三重證據(jù)法,就是利用多元資料驗證史學發(fā)現(xiàn)的可靠性和真實性。顏軍指出①引自《體育與科學》微信公眾號“作者自白”欄目,顏軍《體育心理研究方法綜合化的感悟》(2018-05-16)。,盡管應用多種研究方法未必一定能使研究工作獲得成功,但綜合使用研究方法毫無疑問比單一方法更能成功。同時,張力為(2005)認為,結合使用質性和量化方法對提高研究質量必不可少。石巖等(2010)也提示,方法的結合可以對研究結果進行檢驗,從而提高其可靠性,減少因一種方法本身的限制而導致錯誤結論的可能。本研究立于研究效度,提出“三角互證可以提高運動與鍛煉心理學研究效度”這一基本命題,從三角互證的基本概念切入,探討三角互證提高研究效度的原理,在此基礎上提出三角互證提高運動與鍛煉心理學研究效度的4種具體方案。

1 三角互證的基本概念及其提高研究效度的原理

1.1 三角互證的基本概念

“Triangulation”一詞來源于中古拉丁語的“Triangulare”,原意是“做三角”。在航海和土地丈量等領域,它是以三角形原理為基礎的測量定位方法(范明林等,2009)。國內學界存在多種譯法,如三角測量法(范明林等,2009;孫進,2006)、相關檢驗法(陳向明,2000)、多元交叉法(李曉鳳 等,2006)、三角互證法(林剛 等,2014)。目前需要澄清的一個理論問題為:三角互證是一種研究方法還是研究策略。這關系到研究方法術語的規(guī)范性和層次性問題。三角互證引入社會與行為科學研究領域始于研究者對結構效度的思考,操作主義(operationalism)的先天缺陷使研究者提出多重操作主義(multiple operationalism)理念(Boring,1953)。Webb等(1966)首次使用了“Triangulation”來概括一系列理念,如多種測量方法、多重測量等。Denzin(1978)系統(tǒng)詮釋了三角互證的內涵和外延,認為三角互證的目的為:依賴幾種離散的但相關的策略(strategies)和技術(techniques)定義每種研究方法。他以參與式觀察法(participant observation)為例進行了說明,認為參與式觀察法最好被視為調查數(shù)據(jù)、統(tǒng)計分析、文本分析、直接觀察等的綜合。可以確定的是,從Denzin的研究后,將三角互證視為一種研究策略成為一種廣泛的共識。在諸多研究中,三角互證均被表述為研究策略(Carter et al.,2014;Munafò et al.,2018)。根據(jù) Denzin(1978)和Adami等(2005)的研究,可以將三角互證分為4種類別(圖1)。

圖1 三角互證的分類(Adami et al.,2005;Denzin,1978)Figure 1. Classification of Triangulation

資料收集三角互證強調獲取不同性質的資料,如收集不同被試的訪談資料、收集同一批被試的訪談和觀察資料等,即形成交叉驗證資料(cross-validate data)(Adami et al.,2005);研究者三角互證指的是多名研究者或多個研究團隊針對一個問題同時進行研究,可以是整體研究的相對獨立,也可以是在資料收集或資料分析階段的相對獨立;資料分析三角互證即針對同一組數(shù)據(jù)采用多種分析方法;方法學三角互證即采用兩種或多種完整的方法針對一個問題進行研究,包括方法內和方法間三角互證。值得注意的是,雖然三角互證包含了方法間三角互證,但其與混合方法(mixed methods)有一定區(qū)別。20世紀70—90年代末,三角互證一直是進行混合方法研究的重要依據(jù)(Morgan,2019;Tashakkori et al.,2016)。發(fā)展至今,由于三角互證在量化和質性研究領域存在價值多元性(效度、深度、廣度),且該問題至今沒有定論(孫進,2006;Adami et al.,2005),所以近期混合方法領域從術語層面倡議不再使用三角互證(Fetters et al.,2017),而是用聚斂(convergence)、互補(complementarity)和分歧(divergence)替代三角互證。可以看出,研究者實際上是用術語的形式替代了三角互證的價值爭論,聚斂指向效度,互補指向深度和廣度(Morgan,2019)。將“為了三角互證使用混合方法”這一目的拓展為“為了聚斂、互補和分歧使用混合方法”。這種提議在未來混合方法的發(fā)展中可能會被廣泛接受,但就三角互證而言,在量化和質性研究領域依舊被使用,且外延不斷拓展。在大量社會與行為科學研究不可重復的背景下,三角互證再一次引起學界關注。綜合而言,三角互證不等于混合方法,其內涵要大于混合方法,混合方法是質性和量化方法之間的調和,而三角互證包含方法內互證和方法間互證,三角互證的適用范圍和條件也更廣。

1.2 三角互證提高研究效度的原理

闡釋三角互證提高研究效度的原理,需要回答一個關鍵問題:什么研究是高效度的研究?答案可能有很多種,但兩個關鍵因素是必備的,即有效的控制和完整的證據(jù)鏈。

1.2.1 三角互證能夠控制研究變異

所謂控制,實質就是對研究變異的控制。研究變異控制得越好,效度也就越高。研究中的變異來源主要有3種:1)系統(tǒng)變異,即因變量變異中受自變量影響的部分。量化研究中,系統(tǒng)變異越大,自變量對因變量的作用效應也就越明顯,而質性研究中,要保證概念、主題或理論與資料的對應性,又要控制主題之間關系歸納的合理性;2)外生變異,即研究中不關注的變量帶來的變異;3)誤差變異,由隨機誤差和系統(tǒng)誤差構成。為保證研究效度,研究過程中需要最小化外生變異和誤差變異,以實現(xiàn)最大化系統(tǒng)變異。

外生變異會系統(tǒng)影響研究者關注的因變量,但卻與研究目的無關,所以需要進行嚴格控制。一般而言,研究者會采用隨機化抽樣或統(tǒng)計控制來降低外生變異的影響,但這種操作仍然會產生偏差(蘇毓淞,2017)。三角互證在控制外生變異方面更具優(yōu)勢,如進行一項運動提高主觀幸福感的干預實驗,不僅可以收集主觀幸福感的基線水平和干預后水平的量表數(shù)據(jù),還可以在干預過程中/后對被試進行訪談,通過訪談結果驗證主觀幸福感變化是否由運動引起;還可以對被試隨機分組,在統(tǒng)計時使用資料分析三角互證,采用多種分析方法降低外生變異的影響,如在傳統(tǒng)方差分析基礎上進行傾向值匹配,使干預組和對照組處于平衡。對于以探索性為主的研究,需要保證歸納的主題貼合研究目的,而不能歸納到一些外生變異上,如自下而上探索某個構念的維度,歸納的就應是“因子”,而不是“影響因素”類的主題。三角互證可以較好地解決該問題,如王進(2008)在運動員退役過程的心理定性分析研究中就使用三種性質的資料,主試與被試的會話訪談、媒體訪談和文獻記錄有關的行為信息,保證了歸納主題的準確性。

外生變異和誤差變異的影響在統(tǒng)計上很難區(qū)分,這兩部分之和就是在統(tǒng)計分析時所說的剩余部分(residual)(陳曉萍等,2008),但從理論上二者的來源卻是清晰的。誤差變異主要由隨機誤差和系統(tǒng)誤差構成,虛無假設檢驗能夠分離隨機誤差,但不能分離系統(tǒng)誤差(焦璨,2014)。系統(tǒng)誤差的最大來源為研究方法的固有局限,而三角互證的提出和應用很大程度上是面向系統(tǒng)誤差,如Webb等(1966)所言,“如果一個命題被兩個或多個獨立的測量過程確認,其解釋的不確定性就會大大降低”“當一個假設能夠在一系列互補性方法的對比中依舊成立,那么它就具備了單一方法無法達到的有效性”。三角互證降低系統(tǒng)誤差,實質上就是利用了多種方法得出交叉驗證(cross-validating)結果,避免由單一方法局限帶來的效度威脅。

1.2.2 三角互證有助于證據(jù)鏈的形成

當一項研究進行了較好的控制,作結論或提出一個命題時,還需要追求幾個關鍵問題:證據(jù)質量如何?證據(jù)充分嗎?有證據(jù)鏈支撐嗎?以最近體育領域較為熱門的口述史研究為例,假如僅依靠被訪談者的主觀經驗描述就得出結論,其效度必然會受到質疑。因此,口述史研究必須要收集除主觀經驗之外的其他證據(jù),如文本、他人敘述等,形成證據(jù)鏈,使提出的觀點能夠落到證據(jù)鏈區(qū)間。張力為等(2017)從研究結果的角度強調了科學研究證據(jù)和證據(jù)鏈的積累。本文更傾向于要重視單項實證研究的取證問題,并認為三角互證有助于單項實證研究證據(jù)鏈的形成。

證據(jù)鏈是一個法律術語,但其邏輯非常適用于科學研究。在刑偵過程中,刑偵人員不能依靠犯罪嫌疑人承認自己的犯罪行為進行有罪認定,要廣泛尋找物證、人證等,然后將證據(jù)進行組合,完整地證明其犯罪過程。科學研究的結果也需要證據(jù)、強證據(jù)和證據(jù)鏈的有力支持。袁方等(1997)提出,實地研究資料的可靠性不如統(tǒng)計調查,但統(tǒng)計調查資料的有效性不如實地研究。同時,不同研究者的學術背景會影響其取證方法的選擇,如心理學出身的研究者一般會使用實驗法,而社會學背景的研究者則更傾向于問卷調查或田野調查。因此,對于哪種取證方法獲取的資料好,沒有絕對的標準。有必要使用多種方法,并盡可能收集各種來源的資料(袁方等,1997),如循證醫(yī)學的觀點(evidence-based medicine,EBM):經典循證醫(yī)學是最好的研究證據(jù)與臨床醫(yī)生的技能、經驗和患者的期望、價值觀三者之間完美的結合。三角互證與這種觀點相同,強調整合不同取證方法,形成證據(jù)鏈。

三角互證就是要建立一種相互關聯(lián)的證據(jù)關系,將所研究的問題置于這一關系中,處于相互引證關系中的命題要比那些不處于這些關系中的命題更為合理和可靠。根據(jù)司法領域對證據(jù)鏈的詮釋,證據(jù)鏈只能表現(xiàn)為“有助益的支撐”(contributive support),即一個證據(jù)對另一個證據(jù)的助益并非使兩者證成為真,而只是促進彼此變得更可信(栗崢,2017)。同時,證據(jù)鏈的非線性特征也決定了其接近事實的程度遠大于孤證。再如人格心理學研究,人格數(shù)據(jù)主要分為4類:直接詢問本人(S data)、詢問知情人(I data)、生活事件(L data)和觀察行為(B data),盡管諸多學者都倡議在研究中應對數(shù)據(jù)進行整合,但部分研究只使用S data。隨著人格整合模型的不斷發(fā)展,若想了解個體完整的人格,綜合使用量化和質性數(shù)據(jù)就成為一種必然(石巖等,2017)。能夠聚合多元證據(jù)也是目前科學界重視三角互證價值的一大原因(Munafò et al.,2018)。

2 三角互證提高運動與鍛煉心理學研究效度的方案

任何一項研究都難以同時兼顧構念效度、統(tǒng)計結論效度、內部效度和外部效度,但一項研究設計的優(yōu)缺點卻能夠通過研究者自身學術能力和經驗做出合理判斷,如進行實驗研究,要優(yōu)先考慮內部效度,使用扎根理論,首要考慮的就是不同層級編碼的準確性。因此,針對4種主要效度指標,根據(jù)三角互證的分類體系(Adami et al,2005;Denzin,1978),提出4種相應的方案(圖2)。

2.1 方案1:資料收集三角互證

資料收集三角互證是提高構念效度的首選。量化和質性研究雖然是兩種不同的研究邏輯,但構念的準確性是研究效度提高的起點。量化研究是自上而下操作化一個概念或變量,強調測量的準確性,而質性研究則是自下而上生成一個概念或一組概念關系,更強調建構的準確性。三角互證最初的提出就是為了克服操作主義先天的缺點,即對于我們想測量的事物,只能是一種不太完美的測量,因為多數(shù)情況下我們通過概念所“指”的意思,無法通過一些特定的測量方法來窮盡(舒躍育等,2019),所以量化研究中構念效度的提高需要采用多種測量方法對變量進行把控,而質性研究則是要通過資料收集三角互證獲取多元資料,使所歸納的概念或相互關系能夠在獲取的資料中得以證實,即研究者的建構在多大程度上可以從被研究者的建構中找到依據(jù),以及這種依據(jù)在多大程度上能被其他人理解(Flick,2011)。

資料收集三角互證可以在量化和質性研究的資料收集階段使用,要求獲取兩種或多種不同性質的資料。本文以顏軍等(2013)關于鍛煉和心理訓練對心理壓力影響的研究為例,說明量化研究中如何利用資料三角互證來提高構念效度。該研究對因變量心理壓力的測量充分體現(xiàn)出資料三角互證,使用了《中國大學生心理應激量表》和皮質醇作為心理壓力的評價指標,皮質醇被認為是人體的“壓力激素”。研究結果證實中等強度體育鍛煉聯(lián)合團體心理訓練對女大學生心理壓力有積極的調節(jié)作用,同時也能有效調節(jié)被試的皮質醇水平。用兩種不同性質的資料反映壓力水平,很大程度上降低了測量誤差,也使對心理壓力的評價更加客觀。隨著更客觀的測量技術的普及,未來運動與鍛煉心理學探討鍛煉的心理效應時,完全可以收集“心理+生理”資料進行互證,降低單一紙筆測驗方式帶來的構念效度威脅。心理反應不完全等于生理反應,但心理反應必定有其生理基礎。這種資料收集三角互證應用有兩個前提條件:1)研究者有一定的生理學基礎,且具備采集生理數(shù)據(jù)的條件;2)已有研究充分證實了某一心理變量與生理因素的關聯(lián)性。

圖2 三角互證提高研究效度方案Figure 2. Schemes for Improving Research Validity by Triangulation

運動與鍛煉心理學的質性研究中,多元資料的收集已經有所凸顯(王進,2008;Vazou et al.,2005),但整體而言,獲取資料的方法還是相對單一,訪談仍處于主導地位(孫擁軍等,2014)。訪談過程中,由于被試通常了解主試者的研究目的,社會期望(social desirability)往往會成為效度威脅的主要因素(王進,2008),應引起重視。通常情況下,研究者會根據(jù)訪談資料歸納主題和主題之間的關系,此時研究者的詮釋僅僅是依靠“聽到的”資料,主題歸納是否像研究者所理解的那樣?或者說被訪談者敘述是否準確?僅依靠單一資料難以回答這些問題。如果結合訪談和觀察,研究者的歸納不僅是基于“聽到的”資料,還能以“看到的”資料實現(xiàn)相互佐證,那么所歸納的主題就會更具說服力。

本文以一項關于專業(yè)體育培訓中青少年發(fā)展環(huán)境的研究(Strachan et al.,2011)為例,說明資料收集三角互證是如何提高質性研究的“構念效度”。該研究主要基于教練員視角探討什么樣的體育培訓環(huán)境更有利于青少年發(fā)展,使用的資料包括5名優(yōu)秀教練員的訪談資料及其培訓課的觀察記錄資料。資料的處理方式全部為扎根理論分析,在呈現(xiàn)編碼結果時,訪談資料和觀察資料形成了較好的互證關系(表1)。

從表1可見,研究者不僅從訪談資料中獲取了教練員采取的具體措施,通過觀察也得到了較為一致的信息,如個人安全這一類別,4名教練員強調了基礎技能的重要性,其中3名教練員提及基礎技能對運動損傷的預防作用,2名教練員提及會向運動員告知風險因素等,在個人安全類別下的4條具體措施,研究者在觀察教練員培訓過程中印證了3條。兩種性質的資料均指向所歸納的概念,如陳向明(2000)所言,如果有充分的證據(jù)表明一個表述或命題最合理、最恰當?shù)乇憩F(xiàn)了在現(xiàn)存條件下所得到的結果,那么這個表述或命題就是有效的。此外,除了通過兩種或多種資料收集方法外,還可以通過同一種方法獲取兩種或多種資料來源,如王進(2008)在探討運動員退役過程的心理問題時,就使用了“組內+組間”(失敗個案和成功個案)的訪談資料來控制效度。

表1 《精英體育環(huán)境下青少年的積極發(fā)展》的研究結果(Strachan et al.,2011)Tabel 1 Research Result of Positive Youth Development in Elite Sport Contexts

2.2 方案2:資料分析三角互證

資料分析三角互證是一種更偏重從技術層面提高統(tǒng)計結論效度(質性研究中更習慣用“解釋性效度”)的方案,要求用兩種或多種分析方法處理同一組數(shù)據(jù),對研究者的資料分析技術掌握程度要求較高。在受經費、人力、物力等條件限制時,這種方案就成為首選,如量化研究中只能獲取心理測量數(shù)據(jù)、面板數(shù)據(jù)等,質性研究中僅能獲得訪談數(shù)據(jù)。

從大的分類來講,資料可以分為質性和量化資料,前者是以文字為主,后者是數(shù)字。數(shù)字資料的分析方法較為固定,而文字資料分析是對意義的系統(tǒng)探索(陳向明,2000;Hatch,2003)。從某種意義上講,質性資料的價值一定程度上取決于采用何種分析方法。由于質性研究的資料分析必須要達到一種“確切”程度(陳向明,2000),近些年國外教育心理學領域開始倡議資料分析三角互證(Leech et al.,2007),Renz等(2018)認為,隨著質性分析軟件的不斷推廣,多種資料分析方法的結合愈發(fā)便利,這種結合可以提高研究結果的可信性(trustworthiness)。質性資料分析方法種類較多,如持續(xù)比較分析(constant comparison analysis)、主題分析(thematic analysis)、關鍵詞情境分析(keywords-in-context)、計詞分析(word count)、經典內容分析(classical content analysis)等(Angus-Leppan et al.,2010),但被應用最多的資料分析方法為持續(xù)比較分析,即研究中經常提及的“編碼”,而其他分析方法則沒有被充分地認知和使用(Leech et al.,2011)。隨著更多的研究呼吁資料分析三角互證,一些實證研究開始嘗試使用這種策略,如Dadich等(2018)在探討公共衛(wèi)生知識的傳播問題時,就結合使用了主題分析和詞匯學分析,以“圖文互證”的方式展示了研究結果。多種分析方法處理同一組數(shù)據(jù)為挖掘和詮釋數(shù)據(jù)提供了更大的空間,當我們對資料進行編碼,建立概念之間的關系時,可以使用內容分析構建關鍵詞之間的語義網絡,以考察關系建立是否準確。

對于量化研究而言,數(shù)據(jù)分析方法較為固定,即根據(jù)研究目的選擇分析方法。運動與鍛煉心理學研究多數(shù)是以準實驗設計和觀察性的研究設計展開,當進行統(tǒng)計推論時,尤其是嘗試得出變量間因果關系時,須清晰意識到因果推論的基本難題。因果推論的基本難題是無法觀察到反事實,根據(jù)反事實理論(counterfactual theory),若想得出個體A運動與主觀幸福感的因果關系,研究者會設計一個干預實驗,假如干預時間為12周,個體A前、后測主觀幸福感存在差異,此時,研究者還是不能得出因果關系,因為如果想要得出運動與主觀幸福的因果關系,就需要觀察到反事實,即個體A在12周內如果不運動,主觀幸福感不會變化。顯然,時間不能倒流,所以一些有經驗的研究者會在實驗設計時采用隨機取樣、隨機分配的方式設置對照組(隨機保證實驗組和對照組在混淆變量上處于平衡),將對照組作為干預組的反事實進行觀察,但這對于觀察性研究而言難以實現(xiàn)。因此,為了保證統(tǒng)計推論的準確性,運動與鍛煉心理學研究采用準實驗設計和觀察性研究設計時,統(tǒng)計階段可考慮在傳統(tǒng)統(tǒng)計分析基礎上增加附加統(tǒng)計,根據(jù)手頭現(xiàn)有的數(shù)據(jù),盡可能對我們關心的個案進行配對,使其在一些混淆變量上的取值盡可能接近,進行傾向值匹配分析(propensity score matching analysis),對數(shù)據(jù)進行平衡,可根據(jù)樣本的年齡、身高、體重、受教育程度、鍛煉習慣、生活環(huán)境等背景變量進行配對。傾向值就是某一樣本接收到處理的概率,通常使用各類回歸模型來求解傾向值,而回歸模型中使用的共(協(xié))變量就是用來匹配樣本的變量,具體程序如圖3所示。

圖3 傾向值匹配的操作程序(蘇毓淞,2017)Figure 3. Operating Procedure of Propensity Score MatchingAnalysis

本文以苑春永等(2013)關于獨生子女情緒適應的研究為例加以說明。該研究主要解釋了“獨生”是否會影響兒童的情緒適應,使用了中國兒童青少年心理發(fā)育特征調查項目(NCSC)的社會適應數(shù)據(jù)庫,其中非獨生子女2 657名,獨生子女2 685名。研究者使用t檢驗對兩組數(shù)據(jù)進行檢驗,但結果卻很難解釋,如獨生子女的孤獨感、焦慮和抑郁水平均低于非獨生子女,且達到了統(tǒng)計顯著。之后,研究者通過半徑匹配法(radius matching)進行匹配,考慮的共變量包括性別、城鄉(xiāng)、家庭類型、家庭收入等,匹配后再使用t檢驗統(tǒng)計,結果完全不同(孤獨感、焦慮和抑郁水平未達到統(tǒng)計顯著)。根據(jù)此結果,研究者做出了更準確的推論,即是否獨生對兒童的情緒適應沒有影響,社會上存在的獨生子女劣勢論存在偏差。通過在傳統(tǒng)統(tǒng)計分析基礎上,加入更加精確的分析方法,可以起到互證、糾正作用,有利于獲取準確效果量,對證據(jù)積累也具有積極作用。對于運動與鍛煉心理學研究來說,很多還是依賴準實驗設計和觀察性研究設計,本文推薦的這種傳統(tǒng)統(tǒng)計+傾向值匹配的策略可以在一定程度上提高統(tǒng)計結論效度,且簡單易行,傾向值匹配可通過R軟件MatchIt、Matching等程序包實現(xiàn)。

2.3 方案3:研究者三角互證

研究者三角互證是在進行一項研究時,兩個或多個研究者同時、獨立地進行資料收集和分析,其最大價值在于增強研究控制,提高研究的內部效度。量化研究中,內部效度的主要影響因素來自于除自變量以外的各種混淆變量,如主試因素(期望效應、皮格馬利翁效應、投射效應等)、被試因素(霍桑效應、安慰劑效應、亨利效應等)等。質性研究中,內部效度與“詮釋效度”類似,即從研究結果中建立起來的理論是否真實地反映了所研究的現(xiàn)象(陳向明,2000)。無論是量化研究還是質性研究,內部效度提高的關鍵在于研究過程的控制,控制資料收集過程和資料分析過程,研究者三角互證正是通過不同研究人員同時進行同一項工作,以保證研究過程中盡可能少的出現(xiàn)偏誤。研究者三角互證可以是針對某項研究的整體,也可以在資料收集或資料分析階段使用。近期生物醫(yī)學領域提出了“no publication without confirmation”的呼聲,要求研究者按照最佳臨床研究實踐(best clinical-research practices)的標準,在實驗完成后,由相關的其他研究者和團隊進行驗證性研究,即“臨床前實驗”(preclinical trial)(Mogial et al.,2017)。這種研究者三角互證模式價值確實很大,但有較大的操作難度,根據(jù)研究階段性特征,本文提供使用研究者三角互證的兩種形式:1)在資料收集時使用研究者三角互證;2)在資料分析時使用研究者三角互證。這兩種方式在質性研究中可以同時使用,但應重點考慮在資料分析時使用,而在量化研究中,應優(yōu)先考慮資料收集時的研究者三角互證。

質性研究中,保證建構的理論能夠恰當?shù)亟忉屗芯康默F(xiàn)象,而不出現(xiàn)除“理論”之外的其他解釋,控制資料收集和分析過程至關重要。不管是觀察還是訪談,一定程度上會受到研究者自身的價值觀、研究經驗等因素影響。研究者三角互證其實就是一種集體性資料收集,且不同研究者資料收集的過程相對獨立,如果在沒有事先討論的情況下,2個或3個研究者報告了同樣的觀察或訪談結果,那么所獲得資料的信度和效度就會很高,類似于量化研究中的內部一致性。而相對于資料收集,質性研究中理論的生成更應對資料分析過程進行控制。多個研究者參與到資料分析過程中在質性研究中較為常見,即運動與鍛煉心理學領域常提及的三角檢驗或編碼一致性檢驗。就目前研究來看,多數(shù)研究中僅用一句或一段話來說明進行了研究者三角互證,給出一個一致性指標,如一致性達到90%。然而,這種操作存在如下問題:1)體現(xiàn)出領域內對研究者三角互證價值的認知不到位;2)更說明對研究者三角互證的報告程序存在較大缺陷。

資料分析階段進行研究者三角互證的公認程序為:多名研究者通過討論,建立一個編碼框架,然后根據(jù)框架同時進行編碼,或者是由研究者本人先進行編碼,完成后交由其他研究者對各主題與原始資料之間的邏輯性進行檢驗。這種操作實質上是為了獲得結果的最大真實度(陳向明,2000),而不是“一致性”。因此,非常有必要將對“一致性”的追求轉移到“研究者是否有能力檢驗編碼的真實性”問題。質性研究的編碼工作并非任何人都可以參與,尤其是現(xiàn)在大部分質性研究都在試圖建立一種“故事線”式的模型來得出一種因果關系,而這一工作的難度在于不僅要處理概念之間包含與被包含關系,更重要的是要借用邏輯學和集合論的知識來處理變量間“必要性”和“充分性”問題,這往往需要很強的研究素養(yǎng)。因此,資料分析階段使用研究者三角互證,非常有必要在報告中盡量詳細地呈現(xiàn)參與三角互證人員的專業(yè)背景、學術基礎、與研究主題相關的學術經驗等信息。

量化研究中之所以要優(yōu)先考慮在資料收集階段的三角互證,主要原因是量化研究的數(shù)據(jù)分析相對固定,且有相應的軟件支持,統(tǒng)計階段可能會出現(xiàn)一些問題,但通過研究者經驗或與他人的討論基本能夠解決,如在回歸分析時,可能會出現(xiàn)異常值,研究者會根據(jù)經驗采用虛擬變量消除異常值的影響,或尋找精通統(tǒng)計的研究者剔除異常值。從樣本問題的復雜性來看,量化研究數(shù)據(jù)收集的關鍵性不言而喻,樣本量、樣本的隨機異質性和系統(tǒng)異質性、測量工具等問題均會影響內部效度。Mogial等(2017)提出了生物醫(yī)學領域的一種嚴格的研究模式,這種模式對運動與鍛煉心理學具有一定的啟發(fā)性。對于單項研究而言,可以使用多個研究者進行獨立的數(shù)據(jù)采集。以實驗研究為例,可以針對某一問題進行嚴謹?shù)膶嶒炘O計,而實驗操作則由研究者本人和團隊內其他成員獨立進行,即進行兩個或多個實驗,得出效果量及其置信區(qū)間。此外,如果實驗結果有一定差異,可以采用小規(guī)模元分析(胡傳鵬等,2016),整合效果量,通過meta回歸和亞組分析技術識別可能對效果量產生影響的調節(jié)變量,對實驗結果進行更豐富的解釋。運動與鍛煉心理學領域經常會涉及一些自然情境下的鍛煉干預心理研究,且干預時間較長,這種情況就非常適合研究者三角互證。此外,無論是質性研究還是量化研究中使用研究者三角互證,都需要在報告中進行詳細的說明,本文提出一些建議,包括但不限于表2所示的幾點。

表2 研究者三角互證需報告的關鍵信息Table 2 Key Information Reported of Investigator Triangulation

2.4 方案4:方法學三角互證

在所有的效度指標中,外部效度是應用性實證研究最重要的評價標準,也是實證研究最難保證的一項指標。從三角互證的發(fā)展及目前學界的觀點來看,方法學三角互證對外部效度的提高效果最佳(Denzin,1978;Munafò et al.,2018;Saks,2018;Webb et al.,1956)。方法學三角互證操作難度最大,涉及方法內和方法間三角互證,其最大的特點在于“完整”,同時要求兩種方法在研究中處于平等,在技術層面既包括資料收集方法又包括資料分析方法。方法學三角互證不僅要實現(xiàn)兩種方法“取長補短”(Denzin,1978),更要形成兩種或多種完整的證據(jù)。方法學三角互證涉及質性和量化的同時使用,目前越來越多的研究者倡議在實踐層面兩種性質的方法可以同時使用(葉浩生,2008;Goertz et al.,2016;Hagger et al.,2011;Horn et al.,2011;Moran et al.,2011)。基于此,本文主要推薦實踐中易于操作且效果較好的4種方法學三角互證形式:方法內并行三角互證、方法內前后三角互證、方法間并行三角互證、方法間前后三角互證。

2.4.1 方法內并行三角互證

方法內并行三角互證是兩種或多種量化或質性方法同時針對一個問題進行研究,研究過程交互程度較低,得到結果進行對比,追求結果的聚斂。以石巖(2004)對我國優(yōu)勢項目高水平運動員參賽風險的研究為例,該研究采用了列表排序法和帕累托分析法同時對運動員參賽風險進行了評估,在研究方法部分作了如下表述:“應用帕累托分析主要是用于運動員參賽風險評估的嘗試,尋找運動員參賽的主要風險和次要風險,為防范與應對運動員參賽風險提供參考,同時嘗試與列表排序法的評估結果進行比較,探尋運動員參賽風險的評估方法問題”。

帕累托分析是基于開放式問卷的計詞統(tǒng)計,而列表排序則是根據(jù)專家打分,繼而通過計算風險量得出風險排序。這兩種方法是基于不同資料來源和分析,評估運動員參賽風險的角度也不同,兩種方法得出的結果基本趨同。當然,兩種方法針對一個問題研究,有一定概率得出互補或矛盾的結果,此時需要有一個清晰的分析框架,以便于研究者有針對地進行取舍或進一步探討。本文參考Morgan(2019)的研究,提供一個分析框架,該框架可以用于多元資料收集和分析、方法學三角互證的結果分析等階段(表3)。

表3 方法學三角互證結果分析框架Table 3 ResultAnalysis Framework of Methodological Triangulation

質性方法內并行互證,即通過兩種或多種質性方法針對一個問題同時研究,但實際應用有一定難度,因為并不是總能找到最適宜的方法組合,如研究者一般不會使用民族志和扎根理論同時研究一個問題。Brewer等(1989)曾提出過“合成的”(synthetic)方法,即從研究方法的基本類型中借取一些元素而組成方法。因此,本文建議在沒有適宜的方法組合時,應優(yōu)先考慮資料收集三角互證。

2.4.2 方法內前后三角互證

方法內前后三角互證,即通過一種量化或質性方法去驗證另一種方法得到的結果。首先是量化方法內前后三角互證,即通過第2種量化方法驗證第2種量化方法得到的結果。運動與鍛煉心理學的實證研究大都是采用一種方法得到結果后,繼而對結果進行討論。心理學研究不能重復無外乎兩個原因,要么原始研究是假陽性,要么重復研究是假陰性,但近年來的實踐表明,無法重復很大程度上是由于原始研究假陽性過高,假陽性過高與心理學研究中方法與實踐的不嚴謹性不無關系(胡傳鵬等,2016),這種不嚴謹性被稱為可疑研究操作。隨機對照組實驗(randomized controlled trial,RCT)被認為是得出因果推論的最佳方法,但實驗過程的控制和數(shù)據(jù)的統(tǒng)計最容易出現(xiàn)可疑研究操作,如根據(jù)結果的顯著性來決定是否停止收集數(shù)據(jù)、根據(jù)結果的顯著性來選擇統(tǒng)計方法等。對于量化研究,尤其是實驗研究,有必要在完成實驗后自己進行重復性研究,加入自證環(huán)節(jié)。

質性方法內前后三角互證,即在質性研究中采用第2種方法去驗證第1種方法得到的結果,這種形式不僅可以實現(xiàn)驗證、提升結論的外推性目的,也可以起到拓展研究者對問題認知的深度和廣度。以王瑩(2017)對優(yōu)秀運動員形象進行的系統(tǒng)研究為例,其采用了兩種方法對優(yōu)秀運動員的形象進行定位:1)基于媒體文本的扎根理論分析;2)基于公眾視角的自由詞匯聯(lián)想。自由詞匯聯(lián)想的結果不僅能夠起到驗證扎根理論分析結果的作用,更能在一定程度上提高結果的深度和廣度。

與媒體報道提取范疇有差異的是新增添的3個范疇,即外在形象、影響力和利益、公眾人物,這種差異是時代的變遷以及公眾需求主動化、平等化的體現(xiàn)(王瑩,2017)。由此可知,除了“新增添的3個范疇”外,兩種方法歸納的范疇基本一致,優(yōu)秀運動員形象的定位基本能夠達到高效度要求,且結論的適用廣度也得到了提升。質性研究的特征就是重視差異、尊重差異、詮釋差異。因此,研究者對兩種結果的差異進行了系統(tǒng)的理論詮釋。

2.4.3 方法間并行三角互證

方法間并行三角互證,即利用質性研究和量化研究解釋同一個問題,兩種方法處于同等地位,研究過程中兩種方法交互程度低,得出結果后進行對比互證,非常適用于提高運動與鍛煉心理學的小樣本研究的外部效度。Schweizer(2016)進行過系統(tǒng)統(tǒng)計,運動與鍛煉心理學小樣本研究居多。小樣本研究最大的弱點就是統(tǒng)計功效偏低(鮑貴,2014;焦璨,2014),盡管大家都能意識到小樣本產生統(tǒng)計偏誤的概率會增大(雖然效果存在,但統(tǒng)計結果并不顯著),但并未充分重視小樣本產生假陽性結果的概率也非常高(雖然效果不存在,但統(tǒng)計結果顯著)。Gelman等(2014)針對效果量的估計提出了M型錯誤(type M error)和S型錯誤(type S error),小樣本量研究出現(xiàn)M型錯誤的概率也會很高,即報告的效果量要遠高于實際情況。有研究建議增加樣本量,以保證統(tǒng)計功效,但增加樣本量的方法過于絕對,尤其是對于運動與鍛煉心理學研究來講,還有待商榷。運動與鍛煉心理學研究會較多地涉及優(yōu)秀運動員、有鍛煉習慣的中老年人、特殊鍛煉人群等,很多情況下樣本總體均不會很大,再考慮研究經費、時間、地域等限制,增加樣本量確實不能一概而論。運動心理學研究者多是隨隊科研人員,為運動隊提供服務。這部分群體的調研對象多是高水平運動員,調研對象的特殊性也決定了其樣本量有限。因此,對于運動與鍛煉心理學的小樣本研究來講,利用質性和量化并行三角互證提高外部效度就是不二之選。

以Richard等(2017)研究為例,該研究探討了即興創(chuàng)作(improvisation)干預對9名精英花樣滑冰運動員運動成績和心理素質的影響,設計了為期12周,每周1次,每次2 h的即興創(chuàng)作干預方案,評估干預效果的數(shù)據(jù)通過統(tǒng)計運動員比賽成績、自尊量表、正念量表、創(chuàng)造性量表和價值觀量表。在每次干預后要求運動員填寫一份包含7個開放式問題的問卷,包括運動員干預過程中的體驗、面臨的困難等。在整個干預結束后,又對運動員進行了訪談,主要圍繞運動員心理素質展開針對性訪談。研究發(fā)現(xiàn),運動員在干預結束后的運動成績、自尊、創(chuàng)造性以及正念能力都有提升(P<0.05),質性研究中運動員也表示干預后自己的運動技能表現(xiàn)更加流暢,注意力更加集中,并且能克服害羞心理,質性結果對實驗結果起到了檢驗和驗證作用。在該研究的討論部分,針對實驗研究提出的每一條假設,結合質性結果進行了整合性討論,利用質性的訪談資料對實驗結果進行了深層次的解釋。質性研究結果也有效地彌補了顯著性檢驗的先天缺陷,為推論即興創(chuàng)作干預的有效性提供了更有力的證據(jù)。

2.4.4 方法間前后三角互證

方法間前后三角互證在時序上表現(xiàn)為質性和量化的前后驗證,交互性很強。本研究提供3種適用情境:1)利用質性研究檢驗量化研究結果;2)質性研究建構概念模型,利用量化研究進行驗證;3)質性研究構建實質性理論,量化研究進行大樣本的建模驗證。

利用質性研究詮釋量化研究結果,這種前后互證策略具有較強的量化導向,兩階段的結構也便于實施,研究者在兩個階段分別使用量化和質性方法,一次只收集一種類型的數(shù)據(jù)。這也意味著,即便是單個研究者也可以使用這種策略。質性研究的目的在于檢驗量化結果,研究設計要以量化結果為依據(jù),以實現(xiàn)驗證的目的。此外,這種方法間前后三角互證還能夠起到深入詮釋的作用,如Miles等(2008)所言,雖然我們看見實驗組出現(xiàn)了效應,但其并沒有告訴我們黑箱中發(fā)生什么事,我們并不知道它是如何發(fā)生的,只能猜測牽涉的一些機制。此時,質性結果能夠對量化研究進行填補,使研究者能夠針對結果進行更準確的推論。以Vidic等(2017)的研究為例,研究設計詳見表4。

Vidic等(2017)對干預實驗結果進行統(tǒng)計表明,干預結束后運動員感知壓力有所下降,壓力應對能力有顯著提升。根據(jù)這種結果,設計了3個結構化問題對運動員進行訪談,結果表明,運動員認為正念訓練能夠從以下方面使自己受益:提高自我意識、控制、專注以及放松能力,而這些正是運動員壓力應對能力的內容。在討論部分提及,干預實驗結果雖然顯示運動員壓力感知下降和應對能力提升,但卻不能確定這種變化是否由正念訓練引起,而質性研究結果很好地回答了這一問題,為推論正念訓練的效果提供了很強的證據(jù)。

表4 研究設計:美國NCAA籃球運動員的正念干預研究(Vidic et al.,2017)Table 4 Research Design:Mindfulness Intervention with a U.S.NCAABasketball Team

質性研究建構概念模型,利用量化研究進行驗證。其核心在于驗證概念模型的穩(wěn)定性,提高其外部效度,具有較強的質性傾向。量表是運動與鍛煉心理學研究的主要測評工具,而一個量表代表著一個完整的操作化構念。目前主要有兩種編制量表的模式:1)根據(jù)已有理論推導出所要測量概念的維度,根據(jù)相關量表題項或主觀經驗編制題項,經項目分析和因子分析形成量表;2)根據(jù)已有理論確定概念維度,引入層面理論中的映射語句編制題項,利用最小空間分析(small space analysis)或經項目分析和因子分析形成量表。

上述兩種模式都是更重視以數(shù)據(jù)驅動為主的因子分析,完全依靠數(shù)據(jù)確定概念模型,可能會在確定概念維度時脫離研究對象,造成宏觀理論與所研究情境不匹配。量表編制研究應更多地重視理論構建部分,可采用質性研究自下而上形成概念模型,利用量化研究驗證其合理性。黃希庭(2017)談及人格研究中國化問題時提及如下思路:通過質性研究找出人格概念的指標和維度,繼而通過因子分析編制信度和效度較高的量表。這一思路實際上就是質性和量化的前后三角互證。在質性研究階段,可以采用扎根理論建構概念模型,理清概念內涵,使用扎根理論歸納的概念維度和指標編制題項,再通過探索性因子分析檢驗維度的穩(wěn)定性,繼而通過驗證性因子分析建立測量模型,驗證整體概念模型(測量模型)的信度和效度。

質性研究構建實質性理論,量化研究進行大樣本的建模驗證。目前扎根理論在運動與鍛煉心理學領域應用最為廣泛,主要有兩種方式:1)構建概念模型,用于概念的操作化;2)構建“故事線”式的因果模型,用于解釋某種現(xiàn)象或問題。質性研究探索因果關系與量化研究最大的不同在于,量化研究是一種變量取向,而質性研究則是一種個案取向。質性研究是在個案內進行某種特定事件的因果分析,量化研究則是在個案間層面去估計因果效應。對于小樣本的質性研究結果來說,其是否同樣適用于大范圍樣本;對于量化研究結果來說,其因果效應是否在一些特殊個案中同樣穩(wěn)定(Goertz et al.,2012)。這就使質性研究和量化研究在探索因果機制上的互證成為可能。目前扎根理論研究多停留在“故事線”模型階段,較少看到有多項研究針對一個問題進行深入探索。一般情況下,某個問題的一項扎根理論研究發(fā)表后,較少有相關研究再去觸碰。這也導致扎根理論研究的選題追求“新意”,已有模型得不到更多的關注,淪為“一次性研究”,其價值不能得到充分體現(xiàn)。結構方程建模要求變量間每一條路徑都必須有理論和實證研究的證據(jù)支撐,自下而上的扎根理論完全可以作為結構方程模型建模的理論依據(jù),用大樣本的模型去驗證扎根理論所建構的模型,驗證和推廣研究結果。運動與鍛煉心理學領域鮮見這種嘗試,但在其他領域已經有所應用。

以張春雨等(2018)的研究為例,該研究探討了高管團隊異質性對技術創(chuàng)業(yè)企業(yè)績效的影響。從表5可見,研究在質性研究階段呈現(xiàn)了詳細的資料編碼流程,在選擇性編碼階段已經根據(jù)原始數(shù)據(jù)的陳述結構提出了“故事線式”的模型:高管團隊異質性能夠直接影響技術創(chuàng)業(yè)企業(yè)績效,也能夠通過商業(yè)模式價值創(chuàng)造影響企業(yè)績效。根據(jù)該模型,通過面板數(shù)據(jù)建模,驗證了該模型的信度和效度。結構方程模型分析完成后需要對各路徑進行深入的理論分析,解釋“為什么”的問題,傳統(tǒng)討論均是根據(jù)已有理論和相關研究對路徑進行解釋,而質性和量化的前后互證策略給予研究者在討論部分充分利用質性資料的空間,用質性的“深描”“詮釋”方法,結合已有理論和研究對可能存在的因果效應進行解釋,邏輯更加嚴謹。

3 結語

揭示問題的本質是科學研究和研究者們所努力追求的目標,“準確性”貫穿于研究過程的每一個環(huán)節(jié)。可重復性危機的出現(xiàn)不僅會降低公眾對科學研究的信任,也不利于領域內不同研究問題的證據(jù)積累。關于可重復性危機的探討有必要回到“如何提高研究效度”這一根本性問題上,圍繞研究效度反思和推進研究模式、方法的改進和創(chuàng)新。本文提出“三角互證可以提高運動與鍛煉心理學研究效度”這一基本命題,解釋了關于三角互證的兩個基本概念問題,即三角互證是一種研究策略而非研究方法,三角互證不等于混合方法,其內涵要大于混合方法。三角互證能夠較好地控制研究變異,并有助于證據(jù)鏈的積累。根據(jù)三角互證的分類體系,提出了三角互證提高運動與鍛煉心理學研究效度的4種方案:資料收集三角互證、資料分析三角互證、研究者三角互證及方法學三角互證。方法學三角互證在實際應用中可以表現(xiàn)為4種形式:方法內并行三角互證、方法內前后三角互證、方法間并行三角互證、方法間前后三角互證。多元方法的流行傳達著研究者對自身發(fā)展的理解、反思和對解決現(xiàn)實復雜性的方法學研判,始終圍繞“如何提高研究效度”問題應用和反思方法,才能使運動與鍛煉心理學研究越來越規(guī)范。

表5 研究設計:高管團隊異質性對技術創(chuàng)業(yè)企業(yè)績效的影響(張春雨等,2018)Table 5 Research Design:Influence of Top Management Team Heterogeneity on the Firm Performance of Technology

猜你喜歡
方法研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
學習方法
EMA伺服控制系統(tǒng)研究
新版C-NCAP側面碰撞假人損傷研究
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲色图欧美视频| 美女国产在线| a级毛片毛片免费观看久潮| 中日韩一区二区三区中文免费视频| 欧美性久久久久| 精品成人一区二区三区电影| 中文字幕在线一区二区在线| 福利国产微拍广场一区视频在线| 亚洲成人精品在线| 国产在线98福利播放视频免费| 伊人成人在线视频| 国产精品一区二区在线播放| 88国产经典欧美一区二区三区| 国产爽歪歪免费视频在线观看 | 91www在线观看| 伊人丁香五月天久久综合| 国产欧美在线观看精品一区污| 青青青草国产| 国产伦精品一区二区三区视频优播| 亚洲国语自产一区第二页| 国产导航在线| 久久窝窝国产精品午夜看片| 亚洲娇小与黑人巨大交| 美女被操黄色视频网站| 99热这里只有免费国产精品| 中文字幕亚洲电影| 婷婷久久综合九色综合88| 人妻丰满熟妇av五码区| 无码在线激情片| 无码一区二区三区视频在线播放| 日本午夜三级| 国产在线98福利播放视频免费| 精品国产网| 国产玖玖玖精品视频| 日本在线国产| 91视频国产高清| 欧美人人干| 日韩一级二级三级| 精品无码日韩国产不卡av| 免费看美女自慰的网站| 一区二区三区在线不卡免费| 亚洲综合激情另类专区| 国产精品视频3p| 国产福利拍拍拍| 免费一看一级毛片| 国产精品欧美激情| 欧美激情视频在线观看一区| 激情爆乳一区二区| 中文国产成人久久精品小说| 久久无码高潮喷水| 国产精品手机在线观看你懂的 | 日韩高清一区 | 欧美精品不卡| 国产乱肥老妇精品视频| 国产一区二区福利| 呦女亚洲一区精品| 亚洲三级成人| 91麻豆精品国产高清在线| 亚洲天堂2014| 国产精品自在自线免费观看| 国产精品私拍在线爆乳| 国产激爽大片在线播放| 精品国产一区91在线| 东京热一区二区三区无码视频| 热99精品视频| 国产美女精品一区二区| 国产精彩视频在线观看| 永久免费无码日韩视频| 国产在线视频二区| 久久久久久久久久国产精品| 女人毛片a级大学毛片免费| 人妻精品久久无码区| 久久性视频| 国产综合亚洲欧洲区精品无码| 伊人蕉久影院| 国产日韩欧美视频| 亚洲国产精品日韩专区AV| 色噜噜综合网| 国产福利一区二区在线观看| 97影院午夜在线观看视频| 久久国产精品国产自线拍| 久久特级毛片|