[摘 要]計算機輔助電話采訪的使用越來越多,但其中的受訪人選擇方法卻未受到應有的重視。國外的一些學者不僅發展出了一系列的受訪人選擇方法,而且對這些方法進行了實證的比較研究。本文使用北京大學國情中心一個電話采訪項目的數據,從樣本的性別構成、訪問的完成率和拒訪率、完成問卷的平均訪問次數和平均訪問時間等方面,比較了下個生日者法和不加選擇法的差別。
[關鍵詞]計算機輔助電話采訪 下個生日者法 不加選擇法
電話采訪是一種重要的社會調查方式。20世紀70年代,在美國的市場調查領域出現了計算機輔助電話采訪技術(Computer Assisted Telephone Interview, CATI);90年代中期,我國的一些專業調查機構開始采用CATI技術(苗興狀,2001)。CATI的發展十分迅速,目前已廣泛應用到市場調查、民意測驗和醫療衛生等領域。
為了保證樣本的代表性,CATI不僅需要隨機抽取電話號碼,還要在撥通電話之后通過適當的方法來選擇符合資格的受訪人,因為電話號碼仍然是一個抽樣單位。Kish (1949: 381)曾經指出:“我們需要一個選擇方法,以便將一個由住戶構成的樣本轉變為一個由合格受訪人構成的樣本。”為了保證樣本的代表性,這種選擇方法應該是隨機的;但由于完成率和成本的限制,通常需要綜合考慮隨機性和拒訪率的影響。
Gaziano (2005)指出,研究者們至少發展出了14種方法來選擇最終的受訪人,并對相關文獻進行了整理和比較研究。他發現,使用不同的受訪人選擇方法進行CATI調查,在樣本代表性、回答率與拒訪率以及采訪成本等方面存在著差異。同時,不同研究的發現并不一致;原因可能是研究總體的不同、所使用調查程序的不同以及訪員所受訓練的不同等(Oldendick et al. 1988, Forsman 1993)。
目前國內學者關于CATI的研究,多集中于對CATI的概況、各種受訪人選擇方法以及電話采訪技巧等方面介紹(例如苗興狀(2001)、肖明(2002)、向繼紅、沙瑛(2004)等)。肖明(2002: 70)指出:“在中國內地,由于電話調查開始的比較晚,有關調查抽樣方法的實證研究還比較少,對于居民家庭接聽電話的習慣也缺乏了解。”
因此,需要在我國的背景下對受訪人選擇方法進行研究。作為一個探索性研究,本文主要包括兩方面的內容:
(1)簡要介紹國外學者關于CATI中受訪人選擇方法的研究概況;
(2)使用北京大學中國國情研究中心一個CATI調查項目的數據,比較下個生日者法與不加選擇法 在實際應用中的差別。這既是由于數據可得性的限制,也是因為這兩種方法在實踐中經常被使用。
一、國外學者關于CATI中受訪人選擇方法的研究
Gaziano (2005)對CATI中所使用的受訪人選擇方法進行了總結,認為目前至少有14種方法來選擇最終的受訪人,并進行了分類說明:
1.概率方法(Probability Methods):包括Kish法(the Kish Method),年齡順序法(Age-Order或Age Only)以及全部列舉法(Full Enumeration)。
2.半概率方法(Quasi-probability Methods):即生日法,包括下個生日者法(Next Birthday)和上個生日者法(Last Birthday或Most Recent Birthday)。
3.非概率、配額以及目標選擇法(Nonprobability, Quota, and Targeted Selection Methods):主要是楚德-卡特法(Troldahl-Carter, T-C)及其六種變體或修正方法 。
4.任意方便抽樣(Arbitrary Convenience Methods):即采訪接電話的任一符合其它條件的成員,包括不加選擇法(No Selection)和男女戶主輪流選擇法(Alternating Male and Female Heads of Household)。
回顧地來看,從Kish (1949)開始,每一位新方法的提出者都對其方法的可用性進行了說明,或者從理論上,或者用實證數據來支持。而促進方法革新的,除了隨機性和代表性方面的考慮,還有隨著社會的發展而出現的拒訪率的增加、家庭結構的變化等因素。
為了對這些方法的應用效果進行實證比較,Gaziano (2005)搜集了相關的至少17項比較研究,并從人口學特征、簡單完成率和拒訪率以及成本費用等方面,分別對上個生日者法與Kish法、上個生日者法與最小男性/最大女性法、下個生日者法與其它方法、楚德-卡特法及其修正方法、不加選擇法與其它方法進行了比較。他發現,雖然不同的受訪人選擇方法在應用中存在一些差異,但不同研究的發現并不一致,也無法就受訪人選擇方法的確定給出一個統一的結論。Gaziano (2005: 124)在論文的摘要中指出:“隨著回答率的降低,盡管對保持調查質量和精確性以及降低成本的需求不斷增加,但缺乏系統的、可獲得的證據來指導我們確定合適的受訪人選擇方法。”
Yang (2009)注意到了這一問題,并使用元分析技術對不同受訪人選擇方法的影響進行量化分析。通過數據庫和網絡檢索以及與相關的研究團體和個人進行聯系,在放棄了一些不能提供足夠信息或不適合進行元分析的文獻后,他對剩余的23項研究使用Comprehensive Meta-Analysis軟件包進行了元分析。按照與Gaziano (2005)相同的受訪人選擇方法的比較順序,Yang (2009)主要比較了女性性別比例(作為人口學代表性的測量)和簡單完成率(作為回答率和合作率的測量)。他的主要發現是:概率法會降低女性比例,代價是較高的拒訪率;生日法總的來說傾向于增加女性比例,但在完成率方面并無優勢(除了Kish法);任何選擇方法都會比不加選擇法更能減少女性的發生比。
二、下個生日者法與不加選擇法的應用效果比較
本部分主要從以下三方面來比較下個生日者法與不加選擇法的實際應用效果:樣本的性別構成、訪問的完成率和拒訪率、完成問卷的平均訪問次數和平均訪問時間。所使用的數據是北京大學中國國情研究中心2008年初進行的一次CATI調查。
1.樣本的性別構成
根據Gaziano (2005)和Yang (2009),在相關的比較研究中,性別構成是樣本人口學代表性的一個主要測量。表1是用下個生日者法和不加選擇法得到的西城區樣本的性別構成,以及《北京市統計年鑒》(2008)的相關數據。
從表1可以看出:在0.05的顯著性水平下,下個生日者法與不加選擇法在樣本的性別構成上存在顯著差異(χ2=4.23,p=0.040);與《北京市統計年鑒》的男性比例相比,下個生日者法約低11個百分點,而不加選擇法約低21個百分點。
對樣本中男性比例偏低的一個解釋是,女性首先接聽電話的比例要高于男性。肖明(2002: 70)指出:“當電話鈴聲響起時,女性接聽電話的比例通常是男性的兩倍。”但對于下個生日者法,即使女性首先接聽電話,如果她不是該住戶中下一個過生日的人,仍然不能接受采訪。從實際執行情況來看,這可能與訪員和首先接聽電話的女性在生日甄別問題上含糊而過有關。但即便存在這樣的情況,兩種方法所得到的樣本在性別構成上還是存在著顯著差異,這說明下個生日者法在提高樣本的代表性方面是起作用的。
2.訪問的完成率和拒訪率
為了比較下個生日者法與不加選擇法的完成率和拒訪率,本文根據美國民意調查協會(The American Association for Public Opinion Research, AAPOR, 2006)公布的回答率公式5和拒訪率公式3來計算。相應的公式是:,。 按此計算的下個生日者法與不加選擇法的完成率和拒訪率如表2所示:
從表2可以看出,下個生日者法的完成率比不加選擇法要低4.8個百分點,拒訪率則要高5.2個百分點。這符合我們的預期,因為生日問題可能涉及到了接電話者及其家庭成員的個人隱私,會使其懷疑訪問者的動機,或認為這樣的問題不合適、不必要而拒訪。在項目執行過程中我們也發現,訪員經常需要和接電話的人解釋類似“為什么要問生日”、“問生日和調查有什么關系”這樣的問題。
3.完成問卷的平均訪問次數和平均訪問時間
本部分進行調查成本方面的比較。使用兩種選擇方法所得到的完成問卷的平均訪問次數和平均訪問時間如表3所示:
從表3可以看出,下個生日者法和不加選擇法在平均訪問次數上的差別不大,下個過生日者法的平均訪問次數甚至略低于不加選擇法 。回顧項目的執行過程,這可能與項目的執行策略有關。預調查在撥打完“未接觸”狀態的樣本后,繼續撥打了“無人接聽”和“占線”等樣本;而正式調查由于樣本量較大,主要撥打的是“未接觸”樣本。
在平均訪問時間上,下個生日者法比不加選擇法要多20秒。這是容易理解的。下個生日者法的受訪人選擇程序不僅問題本身需要訪問時間,還會因為向對方解釋為什么要這樣做而增加訪問時間。
三、結論與討論
通過以上的比較,可以發現:(1)下個生日者法與不加選擇法在樣本的性別構成上存在顯著差異,且下個生日者法的性別構成更接近于年鑒數據。(2)下個生日者法的完成率比不加選擇法低4.8個百分點,拒訪率則要高5.2個百分點。(3)下個生日者法完成問卷的平均訪問時間比不加選擇法要多20秒。
可以說,這些結果基本是在意料之中的,本文所進行的分析只是提供了實證數據上的支持。不過,這些結果與相關研究既有相同之處,也有不同之處。在性別方面,本文的結果與Salmon and Nichols (1983)的結果一致,而與Praire Research Associates (2001)的結果不一致;而在后兩個方面,則與Praire Research Associates (2001)的結果一致,而與Salmon and Nichols (1983)的結果不一致。其中的原因可能如Oldendick et al. (1988)以及Forsman 1993所指出的,涉及研究總體的不同、所使用調查程序的不同以及訪員所受訓練的不同等。
本文的結果反映了社會調查中一個經常遇到的問題,即如何在隨機性和拒訪率之間取得適當的平衡。在實際應用中,應該根據調查目的以及研究經費等來確定適當的受訪人選擇方法。這也需要我們對各種受訪人選擇方法進行比較研究。Gaziano (2005)的比較研究以及Yang (2009)的元分析研究在這方面有著重要的參考意義。限于數據,本文只是比較了下個生日者法和不加選擇法,其他的受訪人選擇方法的比較還有待于進一步的研究。
參考文獻:
[1]苗興狀:CATI技術在市場調查中的應用及質量保證[J].工業經濟技術,2001,(6):60-61
[2]向繼紅、沙瑛:如何掌握電話調查中的訪問技巧[J].市場研究,2004,(9):22-23
3]肖明:電話調查中如何進行抽樣設計[J].北京廣播學院學報(自然科學版),2002,9(2):67-72
[4]Forsman, Gosta. Sampling Individuals within Households in Telephone Surveys[EB/OL]. [2010-09-16]. http://www.amstat.org/Sections/Srms/Proceedings/, 1993
[5]Gaziano, Cecilie. Comparative Analysis of Within-Household Respondent Selection Techniques[J]. Public Opinion Quarterly, 2005, 69(1): 124-157
[6]Kish, Leslie. A Procedure for Objective Respondent Selection within the Household[J]. Journal of the American Statistical Association, 1949, 44(247): 380-387
[7]Oldendick, Robert W., George F. Bishop, Susan B. Sorenson, and Alfred J. Tuchfaber. A Comparison of the Kish and Last Birthday Methods of Respondent Selection in Telephone Surveys[J]. Journal of Official Statistics, 1988, 4(4): 307-318
[8]Prairie Research Associates, Inc. Comparing Two Respondent Selection Methods in Telephone Surveys[EB/OL]. (2001) [2010-09-16]. http://www.pra.ca/resources/birthday_e.pdf
[9]Salmon, Charles T., and John Spicer Nichols. The Next-Birthday Method of Respondent Selection[J]. The Public Opinion Quarterly, 1983, 47(2): 270-276
[10]The American Association for Public Opinion Research (AAPOR). Standard Definitions: Final Dispositions of Case Codes and Outcome Rates for Surveys[EB/OL]. (2006) [2009-03-06]
[11]http://www.aapor.org/responseratesanoverview?s=standard%20definition
[12]Yang, Ting. A Meta-analysis of Within-Household Respondent Selection Methods[EB/OL]. (2009) [2010-09-16]. http://www.amstat.org/sections/SRMS/Proceedings/y2009/Files/400064.pdf