吳 煒
(南京大學 社會學院,江蘇 南京210093)
在社會科學的調查研究中,調查回收率作為評價一個調查的質量的重要指標,正如福勒(2004)所說“從被選擇的樣本中收集資料失敗的比例過高是調查誤差的主要來源”。要求研究者重視調查回收率,在論文中如實地報告。然而令人疑惑的是,一方面,目前國內的很多社會科學調查研究論文,并未提供這個數字;另一方面,很多提供或者能計算出回收率的調查項目,它們的回收率與國際上重要的調查研究(如GSS)的回收率相比高出一大截,這是一個不大正常的現象(風笑天2007)。更有資料顯示,華人社會所進行的社會調查應答率較低(郝大海,2007)。那么,國內調查的回收率到底是什么情況?真的是高嗎?哪些因素影響了國內目前的調查回收率呢?本文將對國內社會調查回收率這個看似簡單的問題進行反思。
要對國內的調查回收率進行討論,有必要了解調查回收率這一概念到底指的是什么。以下羅列國內外其實不同學者對調查回收率的定義。
社會調查中的回收率(也稱回答率或應答率)指的是調查者實際調查的樣本數與計劃調查的樣本數之比,也就是社會調查過程中成功完成調查詢問的個案數占計劃完成的總個案數的百分比(風笑天,2007)。
艾爾·巴比(2009)在他的《社會研究方法》中認為回答率是參與調查的人數與樣本總數之比(百分比的形式),也稱完成率,回收率,在自填式問卷調查中葉稱為返還率,即返還問卷在所發出問卷的比例。
福勒(2004)認為應答率是評估收集資料有效性的基本參數,即接受訪談(或應答者)的人數除以樣本的人數(或單元數)。分母包括了從總體上所抽取的所有人,即包括那些雖被抽中但因拒絕、語言問題、疾病或者缺乏易得性而沒有應答的人。
扎加和布萊爾(2007)認為,所謂回答率是已經做完調查的樣本單位的百分比。
比較以上幾個定義可知,學者們對調查回收率的界定是一致的和清晰的。風笑天還指出,在實際調查中,真正嚴格意義上的回收率(有效回收率)指的是通過對問卷的審核,剔除那些填答不全或明顯亂填的廢卷后所剩下的問卷數(即有效問卷數)占樣本總個案數的百分比(風笑天,2007)。以定義為依據,風笑天(2007)給出了回收率的計算公式:

從公式中可見,調查回收率的計算是簡單的,其中涉及的概念只有一個,即樣本規模。只要知道了樣本規模大小和實際完成的詢問個案數量,調查回收率呼之欲出。
之所以要探討調查回收率,這是因為,即便有了科學的、規范的抽樣方法,能夠從總體中得到一個很有代表性的樣本,這一樣本僅僅還是理論上的樣本。“研究者必須牢記,樣本精度是根據目標總體中能實際收集到數據的成員數估計的,我們有時候無法從樣本中的某些成員那里收集到有用的信息,其原因有以下兩種:樣本框中包含不合格的成員和無回答”(亨利,2008)。也就是說,社會調查中,存在一個十分常見的現象,那就是研究者所抽取的樣本中的對象往往不可能百分之百地成功接受調查(風笑天,2010)。研究者用于推論總體的樣本是實際成功調查的樣本而非抽樣設計時所計劃調查的樣本,調查回收率的高低會直接影響樣本對總體的代表性,如果回收率過低即使抽樣過程遵照隨機性原理,調查過程十分嚴格也會降低研究結論的信度。正因如此,艾爾巴比(2009)認為問卷回收率在50%才是足夠的,要至少達到60%的回收率才是好的,達到70%就非常好。風笑天(2007)認為,回收率低于樣本總量的2/3時,調查結果就可能出現大的偏差。
既然回收率的計算如此簡單,回收率又如此重要,所以在社會調查研究中,一般需要報告調查的回收率,以便讀者對調查開展情況進行一個直觀評價。那么國內調查研究中調查回收率的狀況是什么樣子呢?這也是本文接下來要討論的。
風文笑天(2007)對發表在《社會學研究》上的2004年第2期至2006年第3期所有論文中利用抽樣調查數據撰寫的全部研究中的論文中的回收率進行了統計,發現在27篇論文中,有8篇沒有報告調查回收率,甚至有4篇沒有辦法通過其他方式計算其回收率。在通過各種方式能夠得到調查回收率的23篇論文中(涉及16項調查),有17篇(屬于11項調查)回收率超過了90%。特別是其中兩項全國范圍的大規模調查(樣本量在6000份左右)的回收率更是達到了99.2%和99.9%。這兩個調查分別為“中國社會結構變遷調查”和“2003年度中國綜合社會調查(簡稱CGSS)”,筆者選擇對CGSS2003做一分析,原因有三個:一是CGSS的影響范圍較大,是國內目前比較正規、調查質量比較好的一項全國范圍的調查項目;二是CGSS2003的調查回收率比中國社會結構變遷調查還高,達到驚人的99.9%;三是與筆者的經歷有關,如此高的回收率與筆者所了解的CGSS調查情況完全不符,筆者曾經接觸過CGSS的調查員與督導員,他們給筆者的反饋是調查進行得并不十分順利,經常會被拒訪,這么高的回收率與事實是不符的。
筆者認為,比較分析作為一種思維方式和分析方法,能夠更深刻的認識調查回收率。因此,本文將美國綜合社會調查回收率與中國綜合社會調查回收率做一對比分析,以便更好的展現國內調查回收率的現狀。
美國的全國綜合調查(簡稱GSS)是一項從1973年開始實行的、面向全美國的、連續的大型社會調查計劃。在這個調查的支持下,美國芝加哥大學以此為基礎建立了一個規模龐大的、開放性的抽樣調查數據庫,免費為全世界的社會科學研究者使用,為推動社會科學和社會政策研究的發展發揮了重要作用。
2003年之前,大型的、連續開展多年的、開放的全國性數據庫在我國社會科學研究領域還是一個空白。這一年,參照美國GSS,由中國人民大學社會學系和香港科技大學調查研究中心共同推進中國大陸的綜合社會調查(簡稱CGSS)項目啟動,從2003年開始至2008年度的調查是這一項目的第一期(每年一次,其中2007年暫停了一年),目前在中國綜合社會調查項目的官方網站上已經公開了2003~2006年的4次調查數據。在官方網站中,筆者并未看到調查回收率的狀況,甚至連樣本規模也未作說明,能看到的只是其列出的完成有效樣本規模。為了計算其調查回收率,筆者查閱了其中國綜合社會調查項目組編寫的《中國綜合社會調查報告(2003~2008)》,在書中對樣本規模進行了說明,所計算得到的調查回收率具體情況見表1。

表1 CGSS與GSS樣本量與回收率比較
由表1可知,美國綜合社會調查的歷年計劃調查樣本規模、完成的有效樣本規模和回收率都被明確的給出或者可以經過計算得出,都穩定在70~80%之間。而中國綜合社會調查通過計算得出以上的回收率結果,讀者稍微看一眼,就肯定會問,為什么CGSS的調查回收率如此奇怪?其回收率接近等于甚至都超過了100%。這也是本文所要分析的第三個問題。
根據調查回收率的定義和計算公式,可知其涉及的是樣本規模和實際完成的有效樣本量。
除非普查或者所有被調查者的特征都一樣,否則所有旨在根據樣本特征來推論總體特征的抽樣調查,都面臨一個如何確定樣本規模的問題。因為,在一項抽樣調查研究中,按照一般程序,在研究設計階段,研究者在界定了總體之后會制定一個抽樣框,按照一定的規則從這一抽樣框中抽取樣本。在實際抽取樣本之前,需要確定樣本規模。一般來說,樣本規模的大小與總體規模、估計的把握性與精確性要求、總體的異質性程度以及研究者所擁有的經費、人力和時間有關(風笑天,2009),樣本規模往往是研究者綜合考慮有關影響因素之后進行主觀判斷的一個結果。
以CGSS為例,其計劃調查的總體樣本規模的大小的確定考慮了很多因素才最終確定的。在中國人民大學中國調查與數據中心中國綜合社會調查項目編組編寫的《中國綜合社會調查報告(2003~2008)》中明確寫到:
“綜合考慮精確度、費用以及調查實施的可行性等因素,以及以往若干全國社會調查的經驗,再加上考慮到調查實施中通常會存在一部分戶內找不到、或沒有合格調查對象以及各種原因造成的無回答等情況,根據對回答率的估計,以及總體劃分為五個抽樣框,我們把樣本量確定為10000。這10000個樣本不僅能滿足對總體的估計,而且也能滿足抽樣框各自總體的估計,所以是比較合適的樣本量”(李路路等,2009)。
筆者認為,CGSS在研究設計時確定的計劃調查樣本規模是十分明確的,即10000個,那么根據調查回收率的計算公式,作為分母的計劃調查樣本量為10000個,如果問題并非出在抽樣設計中的樣本規模這一分母上,那么就只能出在作為分子的完成的有效樣本規模上。完成的有效樣本規模表明的是調查的具體開展過程中的完成了多少個有效的樣本量,這涉及到了調查的具體實施過程。根據CGSS歷年調查結果(見表1),可以發現實際完成的有效樣本規模居然和計劃完成的樣本規模幾乎一致、或甚至比計劃完成的樣本規模還要多。因而,對第三個問題的回答引出了筆者所要分析的第四個問題:在實際實地執行過程中發生了什么,從而導致實際完成的有效樣本規模出現這樣的情形。
CGSS依據其抽樣方案(具體抽樣方案見其官方網站或《中國綜合社會調查報告(2003~208)》一書)可以確定到居委會或村委會,在抽中的居委會/村委會中如何抽取居民戶和抽中的居民戶中如何抽取被調查者,則是實地執行的內容。那么在這個實地執行過程中發生了什么呢?
仔細分析實地執行過程的程序,可以發現問題出現在居民戶抽樣的過程中,如在城市居民戶抽樣中:
“隨機選取起點之后(可以是翻一本書看頁數或看一下表等方式),按右手原則,隔六抽一(如果起點是第三戶,中間凈隔六戶,即第二戶應抽取第十戶),同時標注其+1(下一戶)及-1(上一戶)戶地址,并多抽3倍的備用地址”(李路路等,2009)。
不難看出,問題就出在最后一段話上面——并多抽3倍的備用地址。那么這些備用地址來干什么的?再看下面一段話:
“如果所抽取的地址不夠使用,則由抽樣員在此居委會繼續抽取,如果該居委會地址全部抽完,訪問中仍然不夠用,則繼續按右手原則在相鄰居/村委會進行抽取”(李路路等,2009)。
這多抽的3倍備用地址是用來干什么的?答案已經很明顯了。由于現實被調查者和調查者的各種特殊情況,總會導致樣本中的某些個體無法成功訪問,或者說總有一部分樣本會訪問失敗,那么多抽的這3倍的備用地址的居民戶就是用來作為替補那么訪問失敗的樣本的,甚至于在多抽的3倍備用地址仍不夠用時,還需繼續在相鄰的居委會/村委會抽取備用地址以彌補訪問失敗的樣本。
為了更好的理解這種備用地址導致所發生的變化,筆者舉一個例子:
一項調查計劃從總體抽取400個調查對象作為樣本,研究者采用結構式訪問的方式收集資料,實地執行中訪問了400人,實際成功訪問240人,那么該項調查回收率為60%。
而遵循CGSS的方式,則以上調查則變成為:
一項調查計劃從總體中抽取400個調查對象作為樣本,研究者采用結構式訪問的方式收集資料,實地執行中第一步抽取400人作為調查對象,筆者稱之為樣本1;第二步抽取另外1200人作為替補調查對象,筆者稱之為樣本2;第三步對第一步所抽取的400個樣本進行訪問,如果全部成功則到此結束;如果未能成功,如成功訪問了240人,則缺少的160人,則從第二步選擇的1200人即樣本2中選擇替代者進行訪問,直到訪問成功160人,調查結束。如果這樣本2中的1200人種未能成功訪問160人,則還需要在其它地域如相鄰的居委會抽取人員作為調查對象進行訪問,這部分被抽取的調查對象筆者稱之為樣本3,直到160人滿為止,調查結束。該項的回收率理論上按照調查回收率的公式計算為100%。
任何一個讀者看到這里對100%回收率都會存在疑問,即是不是公式本身有問題?筆者認為,問題不是出現在公式上,而是由于實地執行過程中的操作導致按照這一個公式進行計算得到的回收率變得毫無意義。
根據CGSS的調查方式,原本作為計劃調查樣本的規模變成了實際調查過的完成的有效樣本規模,即在計算公式中本應作為分母的樣本規模變成了作為分子的完成的有效樣本規模,那么分母在哪里呢?
筆者認為,實地執行過程中所調查的所有樣本,不論是訪問成功還是訪問失敗,構成實際調查回收率的分母即實際發生的訪談數量,那么這個分母的數字是究竟為多少呢?從調查的實際過程來看,樣本1肯定是包含在分母中的,樣本2和樣本3也或多或少的包含在分母之中。用公式表示為:
實際調查回收率=計劃完成的樣本量/(計劃完成的樣本量+備用樣本的使用量)=樣本1/(樣本1+樣本2(部分或全部)+樣本3(0或部分或全部))
從以上公式中可見,分母數字究竟多大,已經很難確定,因為在實地調查的執行中一旦完成了樣本1規模的數量,調查就已經結束,此時,已經調查了的樣本2和樣本3中調查對象屬于分母,尚未調查的樣本2和樣本3中的調查對象不屬于分母。在CGSS調查中,實地執行過程是由具體調查單位執行的,他們對訪問過程的記錄是不全面和不詳細的,甚至可以說是有問題的,使得這些調查人員究竟調查了多少個樣本2和樣本3,CGSS項目組是無從得知或者很難統計的。一方面,實際調查回收率的分母的確切數字無法得知,導致實際的調查回收率已經成謎;另一方面,CGSS按照回收率的定義進行計算,其調查回收率就變的如此奇怪,甚至調查回收率超過100%。
基于以上分析,筆者認為,CGSS在實地執行過程中發生了一些重大改變,樣本規模被替換了,即實地調查的樣本規模并非計劃調查的樣本規模,而是實際發生的訪談數量。實地執行中的樣本規模除了包含研究設計中計劃調查的樣本量之外,還包含了計劃外的替代樣本,這種將樣本規模引入實地調查過程的做法,導致的結果是其調查回收率已經不可知了。
筆者認為,樣本規模與調查中的無應答數量是相關的,然而,無應答數量對于樣本規模的影響是發生在研究設計階段時確定樣本規模中的,無應答個案的存在導致樣本規模會大于研究需要的被調查者數量。
抽樣調查是通過樣本來推論總體,樣本的質量直接決定了總體推論的可信度,因此,抽樣調查中必須以規范調查和提高總體推論可信度為目標。從前一部分的分析中,可知,在目前中國的CGSS實地調查中,發生了一種樣本替換的過程,導致按照調查回收率的公式計算得到的回收率數據虛高。
在前文所提到的另外一個回收率超過99%的調查為陸學藝主持的“中國社會結構變遷調查”,通過仔細查閱相關資料,在其以此調查為基礎出版的《當代中國社會流動》一書中,在介紹研究方法時寫到“調查員持抽樣名單、選樣表和問卷進入被調查戶選擇被訪人;如果選樣順利則繼續進行訪問,如果選樣失敗,則需要告知督導員,由后者根據備訪戶名單進行更換,再度入戶選樣”(陸學藝,2004)。也即在這個調查中同樣發生了類似CGSS調查的情況。這種情況的發生是造成其回收率畸高的原因。
以上兩個發生了樣本替換導致調查回收率虛高的全國性的調查中,都是由較為有名的調研機構和和社會科學研究者所主持的,促使筆者不得不思考是否國內的調查研究在實地執行中是否普遍發生了這種情況。如果這種情況較為普遍,那么有學者指出的國內調查回收率較高的現狀(風笑天,2007)就能夠得到一個較好的解釋。
筆者至今參與的大大小小近10項社會調查項目,均為發生樣本替換導致回收率虛高甚至回收率不可計算。例如邊燕杰所主持的“社會資本與職業經歷”大型問卷調查,筆者作為調查員參與了這一項目的濟南部分,其抽樣方式和CGSS完全一樣,實地執行中也發生了樣本替換現象,但是在替換樣本的選擇方法上和CGSS有較大差別,CGSS使用的是隨機方法。而這次調查為非隨機方法,具體為其替換樣本為是抽中的戶的上一戶和下一戶(如果訪問失敗,先訪問上一戶,如果繼續失敗則訪問下一戶,如果仍然失敗,訪問所抽中戶的上上一戶,以此類推)。從筆者的調查對象來看,第一批入戶名單中訪問成功率沒有達到50%,在超過一半的不成功的案例中,拒訪占了絕大部分。在調查完成之后,項目組只是在成功完成的訪問問卷中剔除了一些無效的問卷,得出完成的有效樣本規模,并最終未計算調查回收率。
在國內目前所開展的社會學調查研究中,樣本替換現象較為常見。有相當多的調查對無應答單位進行了替換處理。樣本替換也是社會調查中經常使用的一種方法,使用得當會在很大程度上提高調查的質量。這里并不想專門討論樣本替換問題,筆者想強調的是,這些對無應答單位進行替換處理的調查中,有一些甚至是大部分并未全面保存有關初始應答單位的替換記錄(郝大海,2008),甚至完全沒有這方面的記錄。在這些調查之中,真實的調查回收率已經被隱藏起來了,而根據回收率定義所得到的理論上的回收率卻是虛高的,是不真實的。回收率作為樣本代表性的一個重要指標,缺失或者不真實的狀況將嚴重動搖其研究結論的可靠性。為了保證推論的有效,部分調查研究發布的調查回收率往往是一個理論上的虛假回收率,并非其實際的回收率,甚至有些調查發布的回收率可能僅僅是完成的有效樣本規模與完成的樣本規模之比(百分比的形式)。
調查研究作為社會學研究中最重要的一種“科學”方法,必須遵循一套嚴格的程序,確保資料的信度和效度。但是實地執行過程中的對樣本替換的不規范操作,使這一“科學”方法偏離了軌道,無法得出能代表其樣本質量的調查回收率,甚至產生一個虛假的調查回收率。
對此,風笑天(2007)認為對于調查中的無回答現象,比較合適的做法是先按照正規的抽樣設計,將可能的無回答比例考慮進去,計算出相對較大的樣本容量。這樣能方便計算調查回答率。如果要采用樣本替換,則需要研究者實地執行過程中,嚴格遵循研究設計,同時要考慮樣本替換對整個調查的影響。在整個調查過程中要全面保存替換記錄,并在調查結果中如實地呈現給讀者。國內一些調查正是由于沒有能夠保存這些數據,而在回收率上出現了問題。在今后的社會調查中,應該制定出保存調查執行數據的辦法,嚴格執行,以確保調查的信度和質量。
[1]艾爾·巴比.社會研究方法(第11版)[M].北京:華夏出版社,2009.
[2]風笑天.高回收率好嗎?[J].社會學研究,2007,(3).
[3]風笑天.社會調查中的無回答和樣本替換[J].南京大學學(哲學社科版),2010,(5).
[4]風笑天.社會學研究方法(第3版)[M].北京:中國人民大學出版社,2010.
[5]福勒.社會調查研究方法[M].重慶:重慶大學出版社,2004.
[6]郝大海.應答率的意義及其他——對中國“高”調查回收率的另一種解讀[J].社會學研究,2007,(6).
[7]郝大海.抽樣調查中的無應答替換與應答率[J].統計與決策,2008,(11).
[8]加里·T·亨利.實用抽樣方法[M].重慶:重慶大學出版社,2008.
[9]陸學藝主編.當代中國社會流動[M].北京:社會科學文獻出版社,2004.
[10]扎加,布萊爾.抽樣調查設計導論[M].重慶:重慶大學出版社,2007.
[11]中國人民大學中國調查與數據中心中國綜合社會調查項目組編.中國綜合社會調查報告(2003~2008)[M].北京:中國社會出版社,2009.