彭 瑾,李 娜,郭申陽,2
1.西安交通大學 人文社會科學學院,陜西 西安 710049;2.圣路易斯華盛頓大學 布朗學院,圣路易斯 63130
近年來,一些杰出的社會工作研究者和倡導者在全球發起并推動了社會工作科學化運動。1955年,美國社會工作協會(national association of social workers,NASW)成立,將七個不同的社會工作組織整合到一個專業組織中[1],成為美國社會工作專業化的起點。雖然加強社會工作實務科學性的呼聲在60多年前就已經出現,但遺憾的是,直到今天社會工作還是沒有成為科學的實踐,或者被看作一門科學。2012年,美國社會工作與社會福利科學院院士Brekke[1]提出,社會工作對于科學知識的貢獻是相對有限的。他運用“期刊數量”和“影響因子”兩項指標比較了社會工作和臨近學科,并得出社會工作在擴展科學知識方面的貢獻落后于護理學、臨床心理學、精神病學等臨近學科的結論。他還指出,“科學”一詞在美國社會工作協會《倫理準則》的序言中并沒有被提及,“研究”也只出現過一次。而在美國心理學學會(American psychological association)和美國精神病學學會(American psychiatric association)的類似文件中,“科學研究”得到了更多的重視。
中國的社會工作研究者也在積極倡導社會工作科學化。吳帆[2]從研究方法的視角對2014—2016年發表的社會工作論文進行了系統分析,發現我國社會工作研究方法的使用在很多情況下還處于初級水平,與國際上社會工作的研究相比更顯落后,呼吁中國的社會工作研究提高科學性。拜爭剛等[3]對2015年以前中國的社會工作論文進行了系統分析,認為2009年起循證社會工作文獻數量的增多,體現了社會工作迫切需要有助于中國實際問題的決策和證據。但社會工作領域尚未形成系統的循證方法體系,循證社會工作在理念、方法、服務團隊、監管力度等方面仍然存在挑戰。倡導的同時,研究者們也在積極進行社會工作科學化的研究實踐。筆者以“循證+社會工作”為關鍵詞在中國知網(CNKI)檢索發現,循證社會工作研究從2011年起不斷增加,2016年起呈快速增長趨勢;同時社會工作領域有關干預研究、循證研究、實踐研究的討論也日益豐富[4]。這些都說明,社會工作科學化在中國越來越成為一個被廣泛認可的發展方向。
在上述社會工作科學化的背景下,本文主要討論有關“科學”的一個關鍵性問題:研究的方法論。這一問題是在全球社會工作發展的背景下展開的,立論基礎是中國和美國社會工作的研究現狀與發展趨勢。旨在回答以下問題:定量研究方法在社會工作科學化中應當起到什么樣的作用?在提升社會工作研究科學水平方面,定量研究者應當做些什么?
Weber率先提出了社會科學與自然科學的本質區別,認為“無論是否清楚地表達出來,也無論是有意還是無意,并不存在絕對客觀的對文化或社會現象進行的分析,它們無論在內容的確定、分析的過程或組織方面,總是受到特定的或者片面觀點的影響”(1)HEYDEBRAND W.Max Weber,defination of sociology[EB/OL].1998.http:∥www.marxists.org/reference/subject/philosophy/works/ge/weber.htm.。1972年,瑞典著名經濟學家Myrdal在哈佛大學的演講中總結了自然科學和社會科學的主要區別:第一,社會科學家從來未能探索到一些最基礎的常量(如特定媒介中的光速、聲速或原子與分子的重量),也沒有通用的測量標準(如對能量、電壓、安培等的測量)。第二,語言在社會科學中有著非常重要的作用,某項貢獻的影響往往很大程度上取決于作者的表述能力。這一點在自然科學中很少見。第三,社會科學的理論往往非常抽象,這可能會使社會科學家失去對人類行為更深層次的探索。第四,價值判斷影響著社會科學研究。研究者的價值觀常常包含在他們的觀點及問題中,這種研究者視角的介入是社會科學方法論的一個主要問題。第五,在幾乎所有社會問題的研究中,永遠存在不同學派的不同觀點,這些觀點也會被政治家或公眾根據需要有選擇地使用。第六,偏差的空間。潛在的價值判斷不會公開,這為研究的隨意性提供了空間[5]。
以上觀點對社會科學與自然科學區別的審視提供了進一步的思考,即社會科學究竟有多大的科學性?Brekke有關社會工作研究非科學性的質疑其實根植于所有社會科學之中。這種思考推動了包括社會工作在內的社會科學各領域的“科學化運動”。其中,經濟學領域有關數理經濟學的辯論是最具啟發意義的現象之一。
經濟學科學化運動發生在19世紀最后幾十年,要比社會工作領域早得多[6]。在推進經濟學科學化的過程中,經濟學家們與Brekke感到類似的挑戰和需要。為了提升經濟學在科學體系中的地位,當時的一些經濟學家發起了一場名為“邊際革命”(marginal revolution)的運動,高瞻遠矚地將數學引入經濟學分析。他們想要借鑒物理學的方法創造“經濟學科學”,將經濟學提升到和物理學類似的地位[6-7]。Mirowski在其著作《作為社會領域物理學的經濟學,作為自然領域經濟學的物理學》中對現代經濟學進行了歷史回顧,這一書名本身就很好地概括了這場運動的目標。
隨著數學越來越多地被運用到經濟學中,經濟學家們在20世紀40—50年代開始意識到數理經濟學的優缺點,進而開始討論數學在經濟學分析中的應用程度問題。這場討論持續至今,與提升社會工作研究科學水平密切相關,即經濟學家們的討論能夠啟發社會工作研究者認真地考慮方法論的問題。
數理經濟學的支持者認為,任何科學發展的要素都是對定量方法使用的提升和加強。Koopmans[8]指出,20世紀40—50年代的經濟學和20世紀30年代的物理學非常類似。他發現當時的物理學家也曾討論過物理學界對于數學方法的強調是否過分。但是,物理學的爭論很快平息,因為物理學家認識到,量子力學已經成為廣泛接受的“富有成果”的物理學理論,而量子力學的主要工具是數學[8]377。諾貝爾經濟學獎獲得者薩繆爾森是數理經濟學的提倡者,他發表了一系列文章推動數理經濟學的發展[9]。綜觀薩繆爾森所著的經典教科書《經濟學》及其他經濟學教科書,都清晰地體現出當代經濟學家對數學方法的大量運用,如矩陣代數(matrix algebra)、集合論(set theory)、微積分(calculus)、差分方程(differential equations)、概率論(probability)、隨機理論(stochastic processes)、統計推斷(statistical inference)、博弈論(game theory)、拓撲學(topology)、公理方法(the axiomatic method)等。薩繆爾森對在經濟學領域運用數學方法的原因進行了解釋:“數學是一種語言,演繹方法與歸納方法同樣重要,但是使用數學符號進行演繹更加方便。”[9]
數理經濟學的反對者則認為,過度使用數學已經減弱了當代經濟學與社會問題的聯系,而這些社會問題正是經典政治經濟學的主題。他們還認為經濟學的范圍變得日益狹窄,很大程度上是因為技術統治論影響著整個經濟學[10]。Beed等[11]對20世紀20—90年代批判數理經濟學的文獻進行了系統檢索,歸納了如下幾個方面的批評意見:第一,數理經濟學的公理與現實世界的行為不符;第二,數理經濟學提出的可以通過實證檢驗的假設太少;第三,很多經濟學現象是不可量化的,所以無法對這些現象進行數學表述;第四,對許多經濟過程的描述,從日常語言(如英語)轉換成數學語言,可能是幼稚或不合理的;第五,在數理經濟學與更少使用數學方法的經濟學之間,沒有一種客觀的方法去測量哪一種更精確;第六,不存在一種“最好”的數學邏輯體系;第七,由于以上種種問題,數學方法通常變成了探討現實世界經濟行為的一種不必要的裝飾,服務于與經濟學科學探討無關的其他目的。
上述有關數理經濟學的辯論從根本上使經濟學家重新思考“社會科學究竟具有多大的科學性”這一根本問題[11-12]。盡管自然科學和社會科學存在很大區別,但是經濟學家認為,兩者也存在著可以共享的領域,這就是研究方法。研究方法的改進可以作為增強一個學科科學性的重要路徑。如Mack認為:“什么使我們將特定的知識界定為科學?那就是這些知識獲得的方式,科學性來源于方法。通過這種方式得到的知識被看作是科學的,使用這種方法去增加知識的人我們將他們稱作科學家,通過這種方式得到的知識體系被稱作科學。”[12]201
正因如此,盡管當代經濟學存在對數理經濟學的不同看法,但也的確形成了一定的共識:應該放棄的是對數學的誤用、過度使用或濫用,而不是對數學的使用。Quddus等[6]251認為:“在過去的30年里,這個領域(指數理經濟學)的快速進步已經非常顯著,以至于有時候它已經統治了整個專業。最初數學只是被人們關注,如今它已經成為首選的承載知識的工具。早期數理經濟學僅僅是現代經濟學的支柱之一,如今有些人已經將它看作經濟學的基礎了。”
為了說明這一點,Quddus等[6]廣泛引用諾貝爾獎獲得者對于錯誤運用數學的批評,這一回顧被稱作“諾貝爾的抗拒”(Nobel resistance)。如1988年諾貝爾獎獲得者Maurice Allais嚴厲批評了現代經濟學文獻中對統計工具的濫用:“然而不幸的是,對于數學的濫用不是當前文獻中唯一的失敗。這種頻繁的濫用已經產生出了一大批‘偽理論’,它們來源于脫離現實的思考與理解,對計量經濟學和統計學技術的機械運用,所有這些理論具有相同的特點——精致的相關線性模型。它們在現實中只是虛假的模型,伴隨著數學統計學的華麗裝飾,這種裝飾其實只是一種粗糙的不合理的數理經濟學。對于科學理論來講這種科學是幼稚而空洞的。”[13]13-141973年諾貝爾獎獲得者Wassily Leontief也強調,經濟學模型不能夠取代對于真實經濟系統運行及結構的全面理解,“經濟學理論年復一年地持續生產出大量的數學模型,去做一些形式上的工作。計量經濟學家盡可能地使用代數函數去處理實質上同樣的數據,而這種數據的處理方式并沒有增加人們對于現實經濟系統運行及結構的全面理解”[14]。1970年,諾貝爾獲獎者薩繆爾森對于推動數學在經濟學分析中的應用做出了重要的貢獻,但是他依然警告經濟學家永遠不要高估方法的作用。通過對諾貝爾獲獎者觀點的回顧,Quddus等認為,這些杰出的經濟學家都“認可數學扮演著重要角色,但是堅持數學必須服務于經濟分析的目的,而不是去控制后者”[6]256。
對經濟學領域提高科學研究水平歷史的回顧,可以幫助我們理解所有社會科學家面對的一些基礎性挑戰。總體來說,在推動社會工作科學化的努力中,至少有如下觀點是社會工作者可以從經濟學領域借鑒的。
第一,方法論是增強科學探究水平的核心,無論這種探究是定性的,還是定量的[12]。在社會工作科學化的過程中,研究者應當努力去改善研究方法,增強獲取知識的嚴謹性(如觀察、測量、量化、分析以及對社會工作現象進行理論化)。這一點是通過經濟學領域的辯論形成的共識。
第二,所有科學家面臨的共同任務都是對經驗現實進行描述和概括,定量方法是完成這一任務的有效工具[9]。當前,社會工作研究領域對定量研究方法的使用主要集中在統計分析領域,而豐富的統計方法也只有一部分被用到。事實上,社會工作領域對數學的應用不是過多,而是太少。社會工作研究者有很大空間去使用更多的定量研究方法。當然,定量研究方法的使用要服從于問題的解決,要為有效達到研究目的而服務。
第三,定量研究方法只不過是幫助研究者量化和檢驗理論假設,不應該取代其他科學方法(如理論發展、定性方法、混合方法、干預研究等)。借用Quddus等[6]的觀點,定量研究方法只是社會工作科學的工具之一,目的是完成研究社會工作現象,回答研究問題,它不應當成為統治學科的唯一方法。
第四,社會科學學科具有一些基本的特征,如缺乏基本常量、高度依賴語言、高度抽象、受到價值觀影響、觀點多樣、被人們主觀選擇等[5]。社會工作作為一門社會科學,必然具有這些特征,進而承載了社會科學不可回避的問題——研究偏差的存在。社會工作研究者應當認真、不懈地努力減少這種偏差對學科發展的影響。
第五,放棄對數學方法的錯誤、過度使用或者濫用。這一觀點在有關數理經濟學的辯論中反復出現,同時也被一些杰出的經濟學家所認可。雖然社會工作研究者目前并沒有像經濟學家那樣過多地使用數學,但還是要對此保持警惕:在運用數學加強社會工作研究時,要用經濟學家的經驗加以引導。
第六,消除方法論者和實證研究者之間溝通的障礙。Clark[15]提出,數理經濟學對經濟學有著獨一無二的貢獻,首要的問題是怎樣利用這個貢獻。他進一步呼吁要消除溝通的障礙:對一般的經濟學家來說,應當對于結果證實感到滿意;對于方法論者來說,應該將結果以一種可以被理解的方式呈現出來,使得一般的經濟學家有可能去評價結果。在社會工作科學化的視角下審視這一點,可以看到增加實證研究者與方法論者之間對話的需要:使技術導向的工作更容易被大眾理解和接受,同時有必要加強定量知識和技能的持續教育。
結合對美國和中國社會工作研究的分析,本文提出定量研究者推動社會工作科學化、開展社會工作研究的三個基本原則。
定量研究出現于19世紀20年代,根源于實證主義傳統。實證主義最重要的原則是使用經驗數據去檢驗理論。這些原則早在實證主義傳統的倡導者Comte那里就得到了清晰的表述。根據其觀點,社會科學和自然科學在基礎方法上沒有區別,社會科學家在解釋社會現象時,應該和自然科學一樣,運用觀察、實驗以及比較的方法。這些方法都要求使用經驗數據驗證理論,并且在自然科學中已經得到了成功的運用。雖然實證主義從19世紀開始已經取得了矚目的進展,同時對于經典實證主義的批評和修正推動了所謂后實證主義的出現,但這個基本原則沒有改變,即在客觀地使用經驗數據這一目標上,后實證主義與實證主義的立場是相同的。后實證主義與古典實證主義的區別在于,對于研究者角色的理解不同。后實證主義認為,研究者與研究主題無法分開,理論、背景、知識、研究者的價值觀念會影響他們觀察到的內容[16]。而Popper[17]發展的證偽主義(the approach of falsification)實際上是使用同實證主義同樣的假設演繹路徑,強調用經驗數據檢驗理論。Popper所做的修正,只是使用證偽或者拒絕錯誤觀點,去取代實證主義直接證實的方法。
科學研究的“實證原則”意味著如果沒有被經驗數據驗證,任何理論只能停留在假設的狀態,不能夠被稱為理論。從最初實證主義的先鋒到當代社會科學家,這個原則一直沒有改變。例如Durkheim為了確定自殺這一社會現象受到社會互動的影響,比較了城市和農村地區、夏季和冬季的自殺率。雖然他只是使用了一個簡單的列聯表,但是自殺率支持了研究的核心目標——數據確認了理論假設。沒有這些簡單的百分比,Durkheim的理論不能被看作是“事實”或者被接受。從Durkheim時代的簡單百分比到今天建立在各種統計理論基礎上的證偽模型,“檢驗研究假設”的方法已經取得了很大的進步,但上述原理一直沒有改變。無論研究者的統計學分析多么復雜,檢驗理論假設都在科學的探尋中扮演著核心的角色,引導著研究的始終。
綜上所述,實證原則應當成為社會工作研究的重要基石。一方面,社會工作干預要基于有關社會現象、人類行為與心理的理論解釋,尋找“改變”的路徑與方法。這些理論解釋,必須是由經驗數據所證實的。社會工作者要具備尋找“證據”、檢驗“證據”的能力。另一方面,循證社會工作本身就包含對實證原則的遵循。循證社會工作是循證實踐的理念和方法在社會工作領域的應用[3]。循證實踐(evidence-based practice)(2)evidence-based practice又譯為“證據為本實踐”。源于臨床實踐領域對實務工作有效性的訴求[4],其理念始于20世紀末發展起來的循證醫學,其后迅速延伸到醫學以外的應用社會科學各領域[18]。循證社會工作被認為是“推動社會工作在中國發展并推動社會認同的一個有效策略”,逐漸得到社會工作界的普遍認可[3,18-19]。
需要指出的是,中國循證社會工作研究在數量與質量上仍有很大的提升空間。拜爭剛等[3]分析發現,2015年前“符合循證理念與方法在我國社會工作領域應用的文獻”共27篇。由于2016—2017年是循證社會工作研究迅速發展的起始,本文以“是否遵循實證原則”“是否研究與社會工作實踐直接相關問題”為標準,對《社會建設》《社會工作》兩本社會工作期刊2017—2019年的發文進行了統計分析,發現遵循實證理念開展的與社會工作實踐直接相關的研究共120篇,占期刊總發文量的34%。雖然此類研究占比呈逐年上升趨勢(2017年28%,2018年35%,2019年39%),但總體來說還是較低,實證原則在中國社會工作研究中遠沒有占據其應有的位置。
在推進社會工作科學化的過程中,定量研究者應當更多地貫徹實證傳統,為理論與方法的發展提供科學的證據,并堅持如下原則:任何未經經驗數據檢驗的所謂理論都不能視為理論;任何不使用經驗數據來檢驗理論假設的定量研究新方法都是有問題的,不應被視為科學。
許多強大而有效的統計學模型在相關學科中得到了發展,包括計量經濟學、統計學、生物統計學、計量心理學。其中許多模型都來自嚴格的數學理論,并且被證明在增加基礎知識方面非常有用。為了增強社會工作定量研究的水平,研究者們應該考慮借用這些進展,吸收鄰近學科最新的發展成果。
本文對2012年1月1日—2013年12月16日美國五個重要社會工作期刊(3)這五本期刊分別為Social Work、Social Work Research、Research on Social Work Practice、Social Work Review、The Journal of the Society of Social Work and Research。發表的文章進行了分析,分析聚焦于研究方法的使用。從472篇文章中篩選了213篇報告研究成果的文章,文獻檢索流程如圖1所示。

圖1 文獻檢索流程示意
通過文獻分析發現:第一,到2013年,定量研究方法已經成為美國社會工作研究的主要方法。在213項研究中,24項(11.3%)使用了定性研究方法;16項(7.5%)使用了混合研究方法,173項(81.2%)使用了定量研究方法。這些數據表明,越來越多的社會工作研究者意識到使用定量方法的重要性并開始在研究中運用。這一發現與經濟學家的主流意見是一致的,即定量研究在科學研究中扮演著重要角色,這是實證主義和后實證主義都認可的基本原則。
第二,所有的定量研究都運用統計方法去生產知識或進行假設檢驗。213項研究中沒有一項像邊際經濟學家那樣使用數學方法去形成發展宏觀或微觀的理論。除了回歸模型(regression or regression-typed model)、拓撲學(topology)等之外,沒有社會工作研究使用博弈論(game theory)、差分方程(differential equations)的方法。換句話說,社會工作領域的研究目前遠遠未涉及對于數學過度使用的問題。
第三,在社會工作研究中,定量/統計學方法已經得到了較為廣泛的運用,包括一些高級模型,表1展示了運用定量研究方法的分布情況。在189項使用定量或混合方法的研究中,22項(11.6%)只使用了描述性統計或雙變量分析;167項研究至少使用了一種多變量統計模型;在167項研究中,使用頻率較高的方法包含回歸分析(16.8%)、Logistic回歸或Probit模型(16.8%)、因子分析(包含探索性或驗證性因子分析)(15.6%)、單變量或多變量分析(12.6%)。此外,研究中也用到了一些高級統計方法,如結構方程模型、分層線性模型和傾向值分析,但這些方法使用的比例相對較低。而這些高級模型已經被證明對于解決挑戰性問題非常合適,如數據聚類、選擇性偏差有助于解決結果變量隨時間變化帶來的統計問題以及忽略結果變量的非正態或非連續性帶來的不利影響,等等。因此,社會工作研究在使用高級模型(特別是那些使用頻率少于10%的方法)方面有著很大空間。

表1 使用定量方法的研究中運用的主要分析方法分布情況
2017—2019年,中國社會工作研究中關于定量方法的使用情況如下:2017年循證社會工作研究中使用定量方法的共7篇,其中描述性統計2篇,使用回歸模型2篇(其中1篇用到因子分析),同時使用T檢驗和方差分析1篇,系統評價和Meta分析2篇。7篇混合方法的研究中,6篇使用了描述性統計,1篇使用T檢驗。2018年使用定量方法的共6篇,其中1篇使用描述性統計,2篇同時使用相關分析和回歸模型,1篇同時使用方差分析、T檢驗、相關分析和路徑分析,1篇使用了探索性因子分析和路徑分析,還有1篇使用了Logit模型。5篇混合方法的研究均使用了描述性統計方法。2019年的8篇定量方法研究中,1篇使用模糊綜合評價法,2篇同時使用描述性統計和T檢驗/方差分析/卡方檢驗,1篇使用因子分析(包括探索性因子分析和驗證性因子分析),1篇使用多元回歸模型,2篇使用結構方程模型,還有1篇同時使用Probit模型和傾向值匹配(PSM)。混合方法的6篇研究中,5篇使用描述性統計,1篇使用文獻計量法。上述分析結果表明,使用定量和混合方法的研究在逐年增多,但所占比例仍較低;雖然2019年出現了結構方程模型和傾向值分析方法的使用,但仍以描述性統計分析為主,對于解決因果關系和因果機制問題的研究仍然缺乏;借用計量經濟學和統計學方法最新成果的研究已出現,但數量仍較少。綜上,中國社會工作研究在運用適合的統計方法或發展獨特方法解決問題方面還有很大空間。
在社會工作各個研究領域中,定量方法的應用是不平衡的。在前述對美國研究的分析中發現,雖然高級統計模型的應用已經增加,但不是所有社會工作領域都在相同的水平上使用了這些模型,一些領域本應使用更多的高級方法,表2展示了對美國社會工作研究檢索中定量方法在各個領域的分布情況。其中,14個領域中只有3個較深入地使用了高級定量方法,分別是健康與精神健康(50項)、社會福利與貧困(35項)、兒童福利(30項)。這些領域中定量研究方法使用數量較多,也基本使用了所有的定量模型;其他領域僅有少量研究是定量傾向的,或者缺乏高級方法的運用。

表2 定量研究方法在社會工作各研究領域的分布情況
中國社會工作研究的情況更為緊迫。在2017—2019年社會工作期刊發表的論文中,循證社會工作共涉及24個研究主題,發文排名前5位的研究領域分別為社區治理(12%)、兒童社會工作(1%)、社會組織(12%)、醫務社會工作(9%)、貧困治理(7%)。其中社區治理、社會組織、貧困治理領域的研究均使用定性研究方法,兒童社會工作11篇研究中有5篇使用定量或混合方法,醫務社會工作10篇中有4篇使用定量或混合方法,且均以描述性統計為主。可以說定量研究方法在中國社會工作重要研究議題方面的應用亟需增強。
此外,中國特色社會工作理論與方法的知識生產也是社會工作研究面臨的緊迫問題。但是研究發現,無論使用定量、定性或混合研究方法,中國近期的研究在這一方面沒有體現出明顯的貢獻。對于中國特色社會工作發展的呼吁近年來與日俱增[20],其要點是理論與方法的知識生產。針對2017—2019年發表于《社會工作》與《社會建設》期刊上的循證社會工作研究,本文還從研究類型視角進行分析,并劃分出8種類型:“對已有實踐案例的定性分析”“使用橫截面數據對社會工作實踐進行的描述性/解釋性研究”“基于實驗或準實驗的干預研究”“基于文獻的對干預研究結果的系統評價”“對其他學科研究成果的討論與應用”“政策評估”“行動研究”“測量工具的開發”。這8類研究都應指向中國特色社會工作理論與方法體系的發展,尤其是干預研究、系統評價、行動研究。但事實上,這8類研究的比例非常不均衡,“對已有實踐案例的定性分析”占比最高(40%),“使用橫截面數據對社會工作實踐進行的描述性/解釋性研究”次之(28%),占比第三的為“基于實驗或準實驗的干預研究”,其余5類占比不相上下,均在10%以下。干預研究、系統評價、行動研究比例遠低于國外社會工作研究。筆者在這一分類的基礎上進行逐篇閱讀,發現無論使用的是定性、定量或混合方法,這些研究中試圖在理論上(包括有關方法的理論)有所發展的研究不足。以占比最多的“對已有實踐案例的定性分析”為例,只有少部分研究在案例經驗總結的基礎上開展與已有理論或方法對話,并試圖驗證或發展既有理論。可以說,在運用科學方法解決重大問題、發展中國特色社會工作理論方面,社會工作研究還存在很大發展空間。
作為社會科學研究的一部分,社會工作研究可以在多個維度使用定量研究方法。本文僅依據對中國社會工作研究的現狀與發展方向的分析,從以下幾個方面討論社會工作研究中定量方法的應用。
社會工作的核心是改變,需要有效的“改變方法”。干預研究是以科學方法探索有效“改變方法”的科學研究過程。干預研究已成為國際上社會工作學、心理學、醫學等領域廣泛運用的一種重要研究范式,也是“現階段我國社會工作領域內亟需開展和實施的專業實踐行動”[21]。要發展出有效的干預項目,需要一系列相關的研究活動。根據Fraser的觀點,干預研究的五個基本步驟可以分為“生產性的”和“評估性的”兩種類型,這兩種類型的研究活動貫穿于一系列干預研究活動的始終。其中,“生產性”是指這類研究的目標是對干預項目的設計、構建與完善[22]。
社會工作項目的設計往往源于對一個社會或健康問題的關注。項目設計建立的重要基礎是對問題如何產生的理解,包括去理解引起這個問題的風險因素和可能的保護性因素。也就是了解我們關注問題產生的“風險鏈”,形成干預研究所說的“問題理論”。“問題理論”解釋項目設計者希望解決問題發生的原因與機制,包含對社會或健康問題的結構化理解。發展“問題理論”,可以幫助項目設計者識別干預的“杠桿點”,發現干預中或許可以改變的風險因素和保護性因素。因此,確定“問題理論”是建立某一干預之因果邏輯的第一步[23]55。結構方程模型(structural equation model,SEM)可以對潛變量進行測量,對中介機制展開分析,是非常適合發展“問題理論”的研究工具之一。


圖2 遞歸路徑模型(因果鏈模型)示意[18]
上述只是SEM的基本原理,具體到社會工作研究的應用中,結構方程模型具有一定的優勢:首先,結構方程模型可以用于分析不易觀測和測量的變量,即潛變量。這在社會工作研究中非常重要,如在分析社會現象以及個體的心理和行為問題時,均不能直接用某個指標來測量,需要通過多個指標來反映,結構方程模型可以實現同時對潛變量因子結構和潛變量之間因子關系的分析。這也就體現了結構方程模型的第二個優勢,即解釋變量之間的因果機制:結構方程模型不僅可以分析變量之間的直接效應,還可以分析其中的中介效應。以基于社會信息加工理論來提升兒童社會能力的干預項目為例,結構方程模型不僅可以分析干預對兒童社會能力提升的直接影響,還可以進一步分析兒童社會信息加工能力在干預和兒童社會能力之間的中介作用,這樣就可以更加深刻地理解其中的因果機制,同時還能分析這種因果機制在不同組間的差異。這兩個特點可以幫助研究者更好地了解社會/健康問題產生的復雜因果機制,從而建立良好的“問題理論”。假設研究者對兒童發展有興趣,并想開發一個干預項目,那么Gershoff[25]的研究就有可能成為干預項目的問題理論。研究者研究了家庭收入與家庭物質匱乏對兒童認知發展、社會情緒能力的影響,以及家長因素(家長投入、家長壓力、家長積極教養行為)的中介效應。基于結構方程模型的分析,研究發現了兩條路徑:一條指向兒童認知發展,家庭收入對父母投入產生積極影響,進而促進兒童認知發展;另一條路徑指向兒童社會情緒發展,路徑是家庭收入—物質匱乏—家長壓力—積極家長教養行為—兒童社會情緒能力。該項研究為項目開發者提供了理解兒童認知或兒童社會情緒能力發展問題的證據基礎,從而對干預的“杠桿點”做出選擇[23]51-53。
因果推斷是所有科學的核心興趣,社會工作研究也不例外。如前所述,干預項目的有效性測試和效果測試是干預研究的“評估性”階段。這些“評估性”研究本質上是因果推斷,即評定干預(原因)是否對服務對象的結果產生預期的改變。這里,最關鍵的工作是撇除一切與結果變量有關聯但與干預無關的協變量的影響。迄今為止,能夠達到這個效果的最佳方法就是由費雪創立的“隨機實驗方法”,即用隨機方法將研究對象隨機分配到實驗組和對照組(也稱控制組)中去。但在現實中,實驗設計常常是不可能、不現實、有違倫理甚至不值得的。這就使得準實驗設計在行為和社會科學領域成為主要的研究設計方式。但準實驗設計在項目效果評估方面的確存在固有的問題,這成為其面臨的一個挑戰。
在過去的30多年,研究者不斷尋找更好的方法去改善準實驗設計項目的評估,從而應對這種挑戰。在這一背景下,越來越多的工作聚焦于基于各種假設去估計干預效果。Rosenbaum等[26]統計學家以及Jams Heckman等[27-28]計量經濟學家發展和完善了通過觀察數據估計因果效應的方法,這些方法被統稱作傾向值分析(propensity score analysis,PSA)。在干預項目的評估中,傾向值分析方法可以應對干擾變量或協變量的影響,在準實驗設計或隨機實驗設計平衡檢測不通過,即實驗人群與控制人群在關鍵變量中存在系統性差異時使用,以提高分析的內在有效性。
作為一種新的、快速增長的評估方法,傾向值分析并沒有被看作隨機實驗的最好替代,對于它的優勢和劣勢有著持續的爭論。然而,重要的是研究者們都認為傾向值分析已經達到了一個成熟的水平。傾向值模型的發展是定量研究方法總體發展的一部分。在傾向值分析出現的過程中,行為與社會科學也見證了其他統計方法的發展。例如等級線性模型(hierarchical linear modeling)、穩健標準誤(robust standard error estimation)、運用結構方程模型對潛變量的分析(SEM analyzing latent variables)、時間數據的分析(time-to-event data)以及集群事件(clustered event data)的分析,研究者常常需要將這些新發展的模型與傾向值分析方法結合起來。同樣地,成功地使用傾向值分析也常常需要對數據分析中其他問題仔細檢視,包括處理可能出現的對于統計假設的違背。在過去的35年里,經濟學和統計學已經產生了可應用的8種傾向值分析方法:Heckman的“樣本選擇模型”(sample selection model)和Maddala的“干預效應模型”(treatment effect model)、傾向值貪婪匹配(propensity socore greedy matching)和最佳匹配(optimal matching)、傾向值分類(propensity score subclassification)、傾向值權重(propensity score weighting)、匹配估計量(matching estimators)、以非參數回歸進行的傾向值分析(PSA with nonparametric regression)、劑量分析(dosage analysis)以及解決隱藏抽樣偏差的敏感分析(sensitivity analysis to address hidden selection bias)。此外,Rubin[29]的反事實模型(counterfactual framework)和Heckman[30]的因果性計量經濟學模型(econometric model of causality)也可以幫助研究者解決有關因果關系的挑戰性問題。同時,統計學家和計量經濟學家發現,關于干預分配的強忽略假定(the strongly ignorable treatment assignment assumption)和穩定單位處理值假設(stable unit treatment value assumption)對于所有的因果性探尋至關重要。一些統計學軟件包提供了一系列的程序,讓使用者執行上述所有模型。Guo等[31]提供了一個對于傾向值分析的全面回顧以及逐步的說明(4)這本書示例涉及的所有數據以及Stata語法都可以在其配套的網頁上找到,網址為http:∥ssw.unc.edu/psa/.。
傾向值分析在因果推斷方面的作用應當在社會工作領域得到重視。例如,干預研究的目標就是回答“干預結果與接受干預之間是否存在因果關系”,從而對干預效果做出因果推斷。“讓我們做朋友”及其原始版本“做出選擇”,從開發至今經過了多次測試[32-34]。2018年的“讓我們做朋友——陜西”因為具備良好的實驗條件,使用了隨機控制實驗(RCT)[35]。但大多數的測試采用準實驗設計,其中包含了對傾向值方法的使用。例如在天津對“讓我們做朋友”的一項干預研究就使用了傾向值分析方法。該研究使用準實驗設計,通過數據分析研究者發現實驗組與對照組絕大部分的觀測協變量統計有著顯著不同,因此通過傾向值加權和最優完全匹配法平衡了這些協變量,提升了研究的內部效度[36]。
元分析是用來匯總經驗研究結果的一種方法,應用于行為科學、社會科學和健康科學領域。元分析方法一般可以應用在以下幾種研究結果的綜合分析中:(1)集中趨勢描述,即匯總那些報告了某個變量集中趨勢的研究發現,通常匯總的是均數、中位數、眾數、比例等統計量。(2)前后對照,即匯總那些對同一變量進行前后對照所得到的研究發現。這些研究對同一個變量在不同時間測量其集中趨勢并進行比較。通常,此類研究發現或者以前后兩次測量的集中趨勢之差來表示,或者以每個回答者兩次取值之差的集中趨勢表示。(3)組間比較,即匯總那些針對兩個以上回答者群體,測量一個或多個變量并進行組間比較。元分析者感興趣的組間比較通常包括對實驗性或臨床試驗研究或非實驗條件下根據特定屬性分組產生的組間差異。(4)變量之間的關系,即匯總那些探索兩個變量的協變關系的研究發現,此類研究結果常用相關系數、卡方系數等報告。元分析者通常感興趣的問題包括個體差異研究或測量研究[37]14-16。
循證實踐強調基于證據的有效實踐,循證社會工作也不例外。證據有不同的類型,根據產生證據的研究設計可以將不同類型的證據分為不同的等級,依次為“元分析和對多個隨機對照實驗的系統綜述”“隨機對照實驗”“群組研究”“案例控制研究”“案例系列研究”“橫斷研究和案例報告”“專家意見、使用者證言和參與者報告”[23]13。這一標準在循證實踐領域被奉為經典[38]40。其中,“系統評價與元分析”位于頂級,能夠為實踐提供最有力的證據支持。上述元分析通常涉及四種研究類型,且都是社會工作研究中會遇到的研究類型。其中,對于前后對照、組間比較研究結果的綜合與實踐聯系更為緊密,因而更為常見。具體來說,元分析方法在社會工作領域主要用于對某種干預方法效果的評價,例如“學校社會信息加工干預項目對兒童攻擊性行為的效果評價”“太極拳預防老年抑郁癥有效性的系統評價”[39]等。元分析研究與交流除了常用的學術研究數據庫外,Campbell協作網也是非常重要的平臺,其主要任務是為社會服務、心理、教育、法學及國際發展政策等社會科學領域提供科學、嚴謹的系統評價決策證據[40]224。目前,Campbell已經成立了Campbell中國聯盟(5)Campbell協作網的網址為https:∥www.campbellcollaboration.org/;Campbell中國聯盟的網址為https:∥www.campbellchina.com/index.。
以家庭教養項目Triple P為例。Triple P項目的獨特優勢之一是循證性極強,在1970—2013年有116篇實證研究評估了Triple P的有效性,這些實證研究來自不同國家和地區,都在一定程度上支持了Triple P在兒童社會、情緒和行為問題上的良好效果,反映了Triple P的跨文化適應性[41]。為了匯總這些研究成果,更綜合全面地評估該項目的有效性,多項研究對這些實證研究進行了系統評價。Christoph等[42]對1970—2007年11月用英文或德文發表的關于Triple P的研究進行了綜合,納入的55篇文獻使用分層線性模型(HLM)分析效應量。Sanders等[43]對Triple P的系統評價更為全面,通過對1980—2013年1月發表的Triple P干預研究進行篩選,納入101項文章進行分析。如果將這兩項系統評價得到的結果做進一步分析,還會發現有針對性的方法和治療方法比普遍研究具有更大的效應量,這意味著Triple P系統既具有預防干預的價值,也具有治療的價值。因此,元分析方法對于綜合評估干預方法/項目的有效性非常重要。
最后,社會工作研究者需要按照更加嚴格的方式去應用定量方法。基于對美國社會工作研究的粗略回顧,可以發現一些普遍存在的方法論問題。
第一,大多數使用定量或者混合方法的研究使用了非概率抽樣的方法。這是值得注意的,因為統計學理論已經證明了非概率抽樣的弊端。因此,社會工作研究者應當盡量使用概率抽樣[29]。
第二,避免高昂的成本又能保證使用隨機抽樣的一個好方法是使用全國數據。這些數據資料一般都建立在隨機抽樣基礎上,有著較為復雜的調查設計[29]。然而對美國的文獻檢索發現,只有31項研究(189項的16.4%)使用了基于全國數據的二手資料分析。這31項研究中使用最多的是Add Health:National Longitudinal Study(4項研究使用);其次是National Latino and Asian American Study、Fragile of Child and Adolescent Wellbeing Study、Survey of Income and Program Participation。社會工作研究者應該努力更多地使用二手數據的分析,去解決非隨機抽樣中的局限性。
第三,對文獻的分析顯示,189項研究中,90項(47.6%)使用了動態設計,70項(41.3%)使用了橫截面的設計,18項(9.5%)使用了實驗或者準實驗設計,3項(1.6%)使用了質性的研究設計。值得注意的是,許多研究使用了低水平的設計,比如橫截面設計(41.3%)。社會工作研究者需要提高研究設計的嚴謹性,去增強研究及其結果的內部效度和外部效度。
無論在中國還是美國,Brekke對于社會工作落后于臨近學科的判斷是符合事實的,但是不能否認社會工作研究已經發生重要的變化,并且在過去20年有了很大的進步,也就是說,社會工作研究的精確性在不斷加強。對美國來講,三個重要的因素對這種發展意義重大。首先,美國社會工作及研究協會(the society of social work and research,SSWR)對社會工作發展的推動。SSWR是一個致力于推動社會工作研究發展的獨立組織,自1994年成立以來舉辦了25屆年會,也資助了許多學術活動,這些都推動了社會工作專業研究水平的提高。第二,越來越多的社會工作出版物借用和吸收先進的定量研究方法,去解決專業最緊迫、最具挑戰性的問題。第三,信息技術革命已經極大地影響了學科,提高了社會工作研究的品質。近年來,中國社會工作領域也在上述三個方面呈現出了一定的趨勢,但仍需要更多借鑒國際社會工作的有效發展路徑,更有力地推動社會工作科學化的發展。同時,盡管國際社會工作研究者在提高研究科學性方面已經取得了很大的進展,但是面對21世紀社會工作的各種新的挑戰,推動社會工作科學化仍然是研究者的重任,在中國這一任務尤其重要。在這一方面,Brekke的研究及其結論應當受到重視。正如本研究所證明的,方法論是一種知識能夠被看作科學的重要因素。
本文討論了定量研究者在推動社會工作科學化方面的三個原則,并結合中國社會工作研究進行了分析,對一些定量研究方法的應用做了初步討論。每一個原則都需要對于社會工作問題的深入理解。而且,無論這些問題是來自于研究還是實踐,對于現有研究方法的嚴格運用,或者對新方法的發展以適應特定的研究問題或者數據,都將對科學知識的增加產生重要意義。