文/葉成城
在社會科學中,方法論的爭論是如此普遍而紛雜,尤其是政治學界普遍認為存在兩種完全不同的范式,即定性方法論范式和定量方法論范式,二者之間存在激烈的爭論。這類方法論的爭端與辯論很大程度上來自加里·金(Gary King)、羅伯特·基歐漢(Robert Keohane)和悉尼·維巴(Sidney Verba)(以下合稱“KKV”)所合著的《社會科學中的研究設計:定性研究中的科學推論》一書的討論。金等人在著作里的討論及對其的批判,事實上存在兩種類型的錯誤,一定程度地導致了方法論研究的困惑,因此有必要予以澄清。
第一種誤區認為,定性研究和定量研究是同一種研究方法,兩者之間的差異僅僅在于樣本數量。KKV的這類錯誤實質上是由于將定量方法作為主要標準,并試圖將這類標準推廣到定性研究的領域。第二種誤區則處于另外一個極端,它認為定量研究和定性研究是兩種截然不同的研究方法。KKV第一種誤區中的許多問題,已經在所謂的“后KKV時代”得到一定的解決。但KKV的絕大多數批評者們過于強調兩者之間的差異,反而導致較少地討論這些方法背后邏輯的相通之處。
本文的目的在于通過探究各類方法理論背后的邏輯,討論各類研究方法的優勢和劣勢的邏輯根源,借此重新審視KKV和后KKV時代對于方法論的誤區和偏見,從而打破定量和定性研究之間的隔閡。本文試圖以科學的研究設計為出發點,探討理論構建過程中的邏輯、樣本與方法的考量。
由于社會科學多數情況下無法進行大規模的重復實驗,因此社會科學的核心思想是通過控制變量來達到準實驗狀態,這需要通過案例比較來實現。比較是控制變量和建立變量間普遍性關系的方法,它是一種歸納推理。約翰·斯圖亞特·密爾(John Stuart Mill)最早在他的《邏輯體系》一書中提到了歸納推理的“密爾五法”,分別是求異法、求同法、求同求異法、共變法和求余法。
(一)求異法即通過最小化差異來求異。求異法核心邏輯是,在其他條件一致時,導致結果不同的差異即為原因。求異法成立的前提是嚴格的準實驗狀態,否則就可能因為無法消除競爭性解釋而降低理論的可信度。求異法的優勢在于可以依賴較少的案例,而其缺陷在于很難找到兩個只有條件不同而其他因素都一樣的案例。因此,研究者在最大程度地控制差異之后,往往還需要解釋為什么其他的差異(競爭性解釋)并不重要。
(二)求同法即通過最大化差異來求同,其核心邏輯是在其他條件都具有極大差異的情況下,如果仍然能夠達到相同的結果,事物間的共性即為其原因。求同法的優勢在于其能夠在存在較大差異的時候仍然維持較少的變量。但求同法是密爾方法中邏輯較弱的一種方法,其缺陷在于,如果無法說明其他因素不重要,由于無法解決變量和結果之間存在的“多重因果性”,即各類變量/原因相加導致的相同結果,就會降低理論的解釋力。
(三)由于求同法的邏輯較弱,密爾提出了求同法和求異法的共同使用,即在小組內部求同,在小組之間求差異。假設將案例分為兩組:在其中一組中,因素A出現(記作A),而在另一組中,因素A不出現(記作~A)。在這兩個小組之間使用求異法,即只有A的差異而其他因素不同,最終它們導致了不同的結果;與此同時,小組內部雖然其他因素存在較大的差異,但是因為共同原因A又達成了相同的結果,這時認為A是結果Y的原因就具有較強的說服力。
(四)共變法是通過控制其他條件不變,觀察到A和Y共同發生變化,可以認為兩者之間存在因果性或者是共同原因導致了變化的一致性。在自然科學中,研究者可以通過控制和重復試驗,明確觀察到A和Y之間的因果性;但是在社會科學中,研究者往往只能事后通過既有數據進行判斷,因此只能觀測到相關性。共變法往往無法直接區分因果倒置和內生性問題,同時也無法區分偽相關,因為自變量和因變量之間的相關性可能是共同原因導致的,而兩者之間不存在因果關系。
(五)求余法即認為存在原因A+B+C導致了結果a+b+c,如果可以確信A是a的原因,而B是b的原因,則可以推斷C是c的原因。上述四種方法本質上屬于歸納法,而求余法則存在演繹邏輯,需要通過推理得出結論。求余法在個案的研究中存在較大的優勢,可以通過排除法迅速找到現象的原因。求余法同樣存在一定的局限,它需要基于原因之間互相獨立的假設,即原因A、B、C之間不存在互相干擾,否則就無法通過排除法進行推理。
前文闡述了案例研究的基本邏輯,在此基礎上文章進一步討論案例比較的方法。對于案例選取的規則恰恰是基于對第二部分所述的各類研究方法的優勢和缺陷。在案例選擇中需要避免三個方面的錯誤。第一,避免簡單的舉例法。事實上,多數情況下我們總能夠找到符合理論的例子,當然這種“理論”也往往會存在諸多反例。第二,避免基于“情懷”或者便利的案例選擇。要在對總體的樣本和理論把握的前提下,依據最小化差異的原則進行篩選,否則,就有可能會出現無法滿足最大相似性的情況,從而損害了案例比較的因果解釋力。第三,避免只關注重大事件。沒有發生的事件——往往是反面案例——同樣重要。
在確立了研究的基本問題之后,恰當的案例選取是實證研究的核心環節,而案例本身的特征也決定了采取何種研究方法,需要以問題而非研究方法為導向。問題性質和時空范圍的限制往往已經決定了可以選擇的樣本數量,而樣本數量又進一步限制了研究方法的選取。
根據樣本數量的多少,研究類型分為單案例研究、小樣本研究、中等樣本研究和大樣本研究。首先,單案例研究往往因為案例的特殊性較強,缺乏相似的案例進行比較,因此只能進行個案研究進行深度挖掘,通常采用過程追蹤的方法。單案例研究的作用是發現理論,其優勢是可以具備更加細致的過程追蹤,但所發掘的理論的推廣性是有限的。其次,小樣本研究更加注重案例本身的細節,以“深度”見長。小樣本研究通常采用定性分析的方法,它更容易發現和提出理論假說,也可以借助控制變量法來檢驗理論。再次,中等樣本的研究是查爾斯·拉金(Charles Ragin)所提出的,認為用定性比較分析(Qualitative Comparative Analysis,QCA)可以解決案例研究和回歸分析無法解決的中等樣本,即樣本數量在12~30之間的情況。中等樣本研究更加重視樣本的同質性和外部效度,往往只能夠檢驗假設,通常不能直接產生機制性的解釋。最后,大樣本研究通常需要樣本數量大于30,更加具備廣度。大樣本研究建立在同質性假設的基礎上,它更加重視樣本的外部效度和平均效應,因此它只能夠進行統計推斷。

表1 案例數量和研究特性
不同的樣本量涉及不同的研究方法,單案例、小樣本、中等樣本和大樣本研究分別對應了過程追蹤、質性比較、QCA和定量分析四種方法。
(一)單案例與過程追蹤。詹姆斯·馬奧尼(James Mahoney)提出了過程追蹤中的幾個基本步驟,包括了三種檢驗方式,分別是尋找線索、進行必要性檢驗和進行充分性檢驗。大衛·科利爾(David Collier)總結了過程追蹤的四個基本步驟:首先,通過可疑線索提供研究基礎;其次,通過必要性檢驗來排除不可能的原因;再次,尋找充分條件確定假設;最后,綜合此前的線索推理得出充分必要條件。
(二)質性比較往往用于小樣本研究,步驟大致如下:(1)聲明案例選擇的理由(排除無關案例);(2)列出變量的類型交叉表格;(3)區分案例的作用,對正面案例和負面案例進行對比,檢驗結果是否在正面案例中出現,而在負面案例中不出現;(4)解釋與理論預期不相符合的反例;(5)通過過程追蹤來明晰從自變量到因變量的因果機制。由于觀測值較少,忽略案例內部特性的討論往往缺乏足夠證據,它需要以案例內部的深度挖掘為主,通過過程追蹤強化因果解釋。例如X→Y只有1~3個樣本,可信度不高;但是如果在這幾個案例中都形成證據鏈,并在因果鏈上都能找到證據,解釋的有效性就大大增強了。
(三)定性比較分析更重視案例間的平均效應,在中等樣本并且存在較多解釋變量時,定性比較分析能夠提供有效的分析。定性比較分析結合定性和定量分析兩種方法的長處,將研究的各個案例都視作整體,并分析案例中的解釋條件及其組合,從而有效處理蘊涵在案例中的復雜因果關系。QCA在政治學和歷史社會學領域使用得更為廣泛,主要方法有清晰集分析、模糊集分析和多值分析,主要處理自變量和因變量全部都是虛擬變量的數據,而模糊集理論的運用則一定程度使其可以處理連續變量。QCA的步驟是一個尋找近似充要條件的過程。首先,需要對單個變量進行必要性檢驗,通常非A相對于非Y的吻合度大于0.9即可以將A視為必要條件;其次,剔除作為必要條件的變量和不具備必要條件的樣本重新檢驗,察看結果出現可能性最高的組合,尋找此前提下的充分條件;最后,結合充分和必要條件,通過布爾代數合并充分條件,計算出最后的充分必要條件。
(四)定量分析是經濟學和社會學中最為常用的方法,它的基本邏輯是基于共變法和對頻數的統計。定量分析通常是基于推斷性統計,回歸分析則是最為常見的定量方法之一,大致分為五個步驟。第一,確定研究問題的自變量和因變量,形成待檢驗的假設。第二,測量變量和生成數據之后,對數據進行處理和描述性統計,例如給出變量之間的相關系數、方差、極值等數據。第三,建立統計模型進行參數估計和假設檢驗。以t檢驗為例,在控制了基本變量后,如果自變量的系數為0的概率低于一定程度(如0.05或者0.01),則可以認為能夠拒絕原假設,從而證實其結論。第四,對檢查模型結果進行穩健性檢驗,通過變換測量方式和控制變量察看模型是否穩健。第五,對統計結果進行分析,通常情況下,由于定量分析往往只能解釋原因和結果之間的相關性,對于結果的分析往往依賴于理論和專業知識。
需要看到的是,上述四種研究方法的邏輯是不一致的。個案追蹤和小樣本比較都可以視作是定性研究,而QCA和回歸分析則更接近于定量研究。定量研究依賴于數據集的觀測值(Data-Set Observation,DSOs),而定性研究則更加依賴于因果過程的觀測值(Causal-Process Observation,CPOs)。這種邏輯的差異也導致了定性研究和定量研究在樣本選擇上的差異。后者通過隨機性使定量分析的殘差符合正態分布,因此強調選擇的隨機性和無偏性;而前者則是基于對因果機制的探索,事實上很多對“半負面案例”的選擇不可避免地會帶來樣本選擇偏差。
在這些方法中,過程追蹤和質性分析更加偏向于案例內部效度,它們的差異在于,質性分析一定程度依賴案例間的比較得出因果推斷,但是離開了對案例的深入研究來談平均效應,質性分析會出現“小樣本謬誤”。QCA和定量分析更重視案例間的平均效應,即通過統計自變量的頻數來討論它們對于因變量的平均影響。而QCA和定量分析的差異在于對頻數的統計,QCA重在尋找類型組合導致結果出現的概率;而定量方法如回歸分析則建立在高斯分布的基礎上,通過拒絕自變量系數為0的原假設來確立自變量對因變量的影響。
前文所述的四種樣本類型對應了四種基本方法,但是這種對應和界線并不是絕對的。這四種方法各自都存在一定的缺陷,這種缺陷源自它們對應的密爾方法,采用混合方法可以一定程度上彌補各自的缺陷和增強解釋力。
混合方法通過結合或者部分結合定量和定性方法來避免單一方法的缺陷?;旌戏椒ǖ闹饕康陌▽で蟛煌椒ǖ难芯拷Y果的聚合、擴大特定項目的廣度和范圍、互相補充或者發現悖論、通過不同方法推進研究等。對于不同混合策略的選擇,往往也受到樣本特性的影響,例如在樣本較大時,定量研究的優勢會更加明顯,反之亦然。
無論是定量還是定性方法都有著各自的優點和局限,在使用任何一種方法或者混合方法時,研究者都要明白它們的適用范圍,而樣本數量和樣本特性則是對適用范圍最基本的限制。社會科學中的研究設計,既是一門科學,也是一種藝術。一方面,社會科學有嚴格的內部邏輯過程,具有一定的操作程序和流程,通過數據集和因果過程的觀測值作為實證證據可以增加因果分析的可信度,即盡可能地提高X是Y的原因的可能性。另一方面,社會科學又是一門藝術,科學方法也僅僅是諸多研究方法中的一種。研究者對于研究問題和解釋變量的選擇,往往受到自身的經歷、價值觀念或者語言文化背景的深刻影響。研究論文本身也有篇幅的限制,無法窮盡方法和案例,因此如何進行謀篇布局也需要經驗和藝術。