楊飛
(浙江省統(tǒng)計局民生民意調(diào)查中心,浙江杭州 310012)
研究探索
移動電話抽樣在CATI調(diào)查中的應(yīng)用與實踐
楊飛
(浙江省統(tǒng)計局民生民意調(diào)查中心,浙江杭州310012)
本文在理論和實踐相結(jié)合的基礎(chǔ)上,結(jié)合2014-2015年多個政府滿意度調(diào)查實例,從定性和定量的角度對當(dāng)前的CATI調(diào)查抽樣技術(shù)進(jìn)行較為初步的總結(jié),對移動電話抽樣技術(shù)在CATI調(diào)查中的實踐與應(yīng)用做了歸納,并對CATI中存在的誤差問題進(jìn)行了分析。
移動電話抽樣;CATI;實踐
在政府決策過程中積極開展民意調(diào)查工作,傾聽民眾呼聲,吸納民意,積極引導(dǎo)人民群眾參與政府決策和公共服務(wù)管理,充分發(fā)揮人民群眾在建設(shè)中國特色社會主義事業(yè)中的主體地位和作用,是當(dāng)前推進(jìn)服務(wù)型政府建設(shè)、不斷改進(jìn)政務(wù)工作的重要途徑;是提高政府決策科學(xué)化、民主化程度的重要環(huán)節(jié);同時又是提高政府決策透明度和民眾參與度的重要舉措。近年來,隨著居民隱私保護(hù)和安全防范意識的增強(qiáng),入戶調(diào)查訪問的配合程度一直呈下降趨勢,特別是城市市區(qū)的入戶調(diào)查,小區(qū)保安制度越來越嚴(yán)格,居民樓門禁系統(tǒng)的應(yīng)用越來越多,居民戶的防范意識越來越強(qiáng),調(diào)查員入戶難度也越來越大,由此帶來了較大的調(diào)查樣本分布誤差。面對入戶難問題,各地的統(tǒng)計調(diào)查員普遍采用由社區(qū)干部或地方工作人員陪同入戶的方法來降低拒訪率,提高入戶成功率。但由此帶來的問題是,對于涉及到地方政績考核的敏感性指標(biāo),受訪者由于顧慮到有當(dāng)?shù)卣ぷ魅藛T在調(diào)查現(xiàn)場,往往不敢作出真實意愿的表達(dá),從而影響到調(diào)查結(jié)果的可信度。
CATI調(diào)查是新興事物,就目前來看,其主要優(yōu)點是:調(diào)查成本低,調(diào)查效率高,而且調(diào)查全過程由計算機(jī)主導(dǎo),能較好地避免人為因素對調(diào)查數(shù)據(jù)的影響,調(diào)查結(jié)果客觀公正。但電話調(diào)查由于自身的特殊性,存在問題內(nèi)容不能過于深入、問題數(shù)量不宜過多等限制,而且從近年來的調(diào)查實踐來看,還面臨拒訪率增加、樣本代表性變差等問題,亟待解決。
當(dāng)前,大多數(shù)CATI調(diào)查出于調(diào)查樣本定位(通常要求定位到縣一級,移動電話抽樣定位上暫不支持)和調(diào)查樣本代表性(通常要求訪問者為本地常住居民回答)的考慮,多僅采用固定電話局號抽樣的方法。近年來,隨著移動電話的快速普及,固定電話普及率一直呈逐年降低趨勢,據(jù)國家統(tǒng)計局2016年2月發(fā)布的《2015年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》顯示,2015年末全國電話用戶總數(shù)達(dá)到153673萬戶,其中移動電話用戶130574萬戶,固定電話用戶23099萬戶,移動電話普及率上升至95.5部/百人,固定電話普及率下降至16.9部/百人。浙江省統(tǒng)計局、國家統(tǒng)計局浙江調(diào)查總隊同月發(fā)布的《2015年浙江省國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》顯示:2015年末浙江省移動電話用戶7466萬戶,比上年增加95萬戶,移動電話普及率為135.6部/百人;固定電話用戶1500萬戶,減少142萬戶,固定電話普及率27.2部/百人。而近十年的統(tǒng)計數(shù)據(jù)也顯示:浙江省的固定電話普及率已由2006年的48.0部/百人減少到2015年的27.2部/百人,全國的固定電話普及率由2006年的28.1部/百人減少到2015年的16.9部/百人;另一方面,浙江省的移動電話普及率由2006年的60.5部/百人增加到2015年的135.6部/百人,全國移動電話普及率由2006年的35.3部/百人增加到2015年的95.5部/百人。由此不難看出,固定電話的抽樣人群代表性誤差正逐年增大,當(dāng)前僅使用固定電話局號抽樣已很難滿足CATI調(diào)查發(fā)展的需求,在CATI抽樣中引入移動電話抽樣是當(dāng)前CATI調(diào)查的必然趨勢。

圖1 2006-2015年固定電話及移動電話普及率變化情況(部/百人)
(一)CATI調(diào)查中常用的抽樣方法
根據(jù)CATI調(diào)查的特點,抽樣方法既可以是概率抽樣也可以是非概率抽樣,然而在實際操作中,嚴(yán)格意義上的概率抽樣幾乎無法進(jìn)行,所以非概率抽樣一般更具有實踐意義。常用的CATI電話號碼的抽取方式有以下幾種,每種方式的限制條件不同,各有利弊。
1.電話全碼抽樣。電話全碼抽樣又稱電話號碼本抽樣(sampling telephone directory),是把合適的、包括完整的電話名錄作為抽樣框,采用隨機(jī)抽樣或系統(tǒng)抽樣的方式隨機(jī)抽取電話號碼。采用該抽樣方式,出現(xiàn)所撥號碼為空號、停機(jī)、傳真電話等無效號碼的情形比較少。如湖南省統(tǒng)計局聯(lián)合本地移動運營商建立了覆蓋全省的移動電話全碼資源;浙江省臺州市統(tǒng)計局聯(lián)合臺州電信建立了覆蓋全市全體電信用戶的固定電話全碼資源。采用全碼抽樣方式具有空號率低、執(zhí)行效率高、樣本代表性好等優(yōu)點,但需要注意的是,當(dāng)前固定電話和移動電話的普及率正處于快速變化的階段,如不能及時更新樣本框,則會出現(xiàn)新入網(wǎng)的用戶因未納入樣本框無法被抽取,停機(jī)減少的用戶無法在樣本框中被剔除而造成抽樣效率下降等現(xiàn)象。以浙江省為例,《2015年浙江省國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》顯示:2015年底移動電話用戶比上年增加95萬戶,平均每月增加7.9萬戶;而固定電話用戶比2014年底減少142萬戶,平均每月減少11.8萬戶。如果樣本框更新不及時,抽取樣本的代表性和抽樣的執(zhí)行效率就會受到影響。因此,如果要利用電話全碼進(jìn)行抽樣,為保證抽樣人群的代表性、科學(xué)性,必須及時更新作為抽樣框的電話號碼目錄,如協(xié)調(diào)相關(guān)通信管理部門或運營商,按半年度或年度更新一次。
需要指出,由于中華人民共和國工業(yè)和信息化部2013年公布的《電話用戶真實身份信息登記規(guī)定》中規(guī)定“電信業(yè)務(wù)經(jīng)營者及其工作人員對在提供服務(wù)過程中登記的用戶真實身份信息應(yīng)當(dāng)嚴(yán)格保密,不得泄露、篡改或者毀損,不得出售或者非法向他人提供,不得用于提供服務(wù)之外的目的。”即便是政府部門出于公益性要求的調(diào)查需求,真正能從通信管理部門或者運營商處拿到一個地區(qū)完整的電話名錄的情況并不多。因此,實際中很少采用這種方法。
2.固定電話局號隨機(jī)抽樣法。目前,我國的固定電話號碼是由區(qū)號、局號(四位或三位數(shù)字)加后四位數(shù)字構(gòu)成的,如浙江省內(nèi)的杭州、寧波和溫州等城市,區(qū)號為四位0571、0574和0577,這三個市內(nèi)電話號碼為八位,局號為四位,后四位是局號后數(shù)字;另外還有一些城市如浙江的湖州、舟山和麗水,區(qū)號分別為0572、0580和0578,這三個市內(nèi)電話號碼為七位,局號為三位,后四位是局號后數(shù)字。就每個地區(qū)而言,區(qū)號是唯一的、固定的,而局號抽樣框可通過與電信部門聯(lián)系或查找有關(guān)資料找到,局號后的四位數(shù)字則可通過計算機(jī)軟件自動隨機(jī)生成。這種抽樣方法的隨機(jī)性很強(qiáng),樣本的代表性與實際相對較吻合,在國內(nèi)外的民意調(diào)查實踐中經(jīng)常被采用。目前全國統(tǒng)計系統(tǒng)普遍采用的就是這種后四位號碼隨機(jī)生成的抽樣方法。浙江省統(tǒng)計局民生民意調(diào)查中心自2008年開始探索6位電話局號抽樣方法,從全省統(tǒng)計系統(tǒng)基本單位名錄庫中提取6位電話局號作為調(diào)查樣本框,并按年度進(jìn)行更新,目前6位樣本框中全省共有不重復(fù)局號段28.86萬條,覆蓋全省11個設(shè)區(qū)市、90個縣(市、區(qū))。與4位電話局號相比,6位電話局號具有以下特點:(1)定位信息全。目前6位電話局號理論上已可支持定位到社區(qū)(村)一級,但定位差錯率還較高,但對于定位街道(鄉(xiāng)鎮(zhèn))的要求已能較好滿足。(2)定位效率高。監(jiān)測數(shù)據(jù)顯示,目前6位電話局號定位縣(市、區(qū))差錯率相對較低,定位準(zhǔn)確率更高。(3)空號率低。采用后四位(或兩位)號碼隨機(jī)生成的抽樣方法隨機(jī)性非常強(qiáng),不可避免地出現(xiàn)了較高的空號率,但通過CATI系統(tǒng)自帶的智能預(yù)撥號和空號過濾系統(tǒng),可以將系統(tǒng)隨機(jī)生成的空號等無效號碼快速過濾,提高執(zhí)行效率。目前6位電話局號抽樣抽中的空號率相對低些,相應(yīng)的抽樣執(zhí)行效率也更高一些。
3.移動電話局號隨機(jī)抽樣法。目前移動電話號碼組成是由局號(前七位數(shù)字)加后四位數(shù)字構(gòu)成的,通過七位的移動電話局號已可確定號碼歸屬地、運營商名稱等信息,如“1370571”的局號段,定義為杭州市移動通信公司的全球通卡。因此,在配置了全省7位移動電話局號樣本框后,再采用后四位號碼隨機(jī)生成的方法也能對移動電話用戶進(jìn)行CATI抽樣訪問。在移動電話樣本框配置方面,2014年5月,浙江省統(tǒng)計局民生民意調(diào)查中心在省通信管理局的大力協(xié)助下,建立了包含三大移動運營商(移動、聯(lián)通、電信)覆蓋全省11個設(shè)區(qū)市的移動電話號碼局號段,并按年度進(jìn)行更新。目前在用的7位樣本框中全省共有局號段16747條,覆蓋全省11個設(shè)區(qū)市、90個縣(市、區(qū))移動電話用戶。需要特別注意的是,移動電話局號隨機(jī)抽樣法與固定電話局號隨機(jī)抽樣法相比,目前7位移動電話局號只支持定位到設(shè)區(qū)市一級,如果需要定位到縣(市、區(qū))或者街道(鄉(xiāng)鎮(zhèn)),必須通過訪問員人工詢問受訪者來進(jìn)行確定。
需要指出,局號后可排列出來的四位數(shù)字并不都是有效電話號碼,通信管理部門或運營商在發(fā)放號碼時不會一次把所有電話號碼都分配出去,通常考慮到未來的發(fā)展,會預(yù)留一定的號碼;另外由于所處地理位置的不同,每個局號下的電話的數(shù)目也是不同,如商業(yè)區(qū)局號下辦公電話多,住宅電話少;而處于居民區(qū)的局號,則是住宅電話多,辦公電話少。由于每個局號下所包含的電話數(shù)目是不同的,所以不同局號下的電話號碼被抽中的機(jī)會不同,比如以135、136、137、138、139等開頭的移動電話局號肯定比147、157、177、187開頭的局號所包含的有效號碼要多。因此,為保證抽樣樣本近似于自加權(quán)樣本,理論上此階段要事后加權(quán),事后加權(quán)系數(shù)等于每個局號下電話數(shù)目占全部電話號碼數(shù)目的比例,但實際上這個數(shù)據(jù)沒有辦法得到,只能利用撥打電話時獲得的有關(guān)記錄(如每個局號下有人接聽電話的比例)去估計,并在今后的調(diào)查實踐中不斷完善樣本框。
全國社情民意調(diào)查系統(tǒng)對移動電話抽樣的官方實踐探索起源于2014年。2014年6月,國家統(tǒng)計局社情民意調(diào)查中心在其組織的2014年上半年全國安全感調(diào)查中首次使用了移動電話抽樣調(diào)查。調(diào)查中對移動電話的抽樣采用全碼抽樣方式,即根據(jù)有關(guān)部門提供的移動電話號碼庫(非全體樣本庫,是按照設(shè)區(qū)市樣本配額1比10提供的部分樣本庫),按照分層隨機(jī)抽樣的方法完成規(guī)定的樣本數(shù)量。為保證調(diào)查數(shù)據(jù)前后年度的可比性,2014年上半年全國安全感調(diào)查移動電話樣本占全體樣本的比例為12%,下半年為18%,2015年上半年為23%,下半年為30%,移動電話樣本比例占總體樣本的比例呈現(xiàn)遞增趨勢。
浙江省統(tǒng)計系統(tǒng)對移動電話抽樣的探索也開始于2014年,浙江省統(tǒng)計局民生民意調(diào)查中心在自主組織的全省民生改善居民感知度調(diào)查中首次嘗試使用了移動電話抽樣調(diào)查,調(diào)查采用的是移動電話局號隨機(jī)抽樣調(diào)查方法,通過分層抽取移動電話局號,后四位由CATI系統(tǒng)隨機(jī)生成的方式,在定位受訪者居住地時,采用人工詢問確定的方法。調(diào)查中移動電話樣本占總樣本量的比例為25%左右。此后,還在多個省委省政府及其相關(guān)部門的委托調(diào)查和自主調(diào)查中嘗試使用了移動電話抽樣,如2015年3月的全省法治建設(shè)群眾滿意度調(diào)查,移動電話占社會公眾樣本量的10%;2015年5月的全省社會道德環(huán)境和公共文化服務(wù)公眾滿意度調(diào)查,移動電話占總樣本量的15%;2015年11月的平安浙江群眾安全感電話調(diào)查,移動電話占總樣本量的20%等等。
作為一種調(diào)查方法和技術(shù),CATI已在歐美發(fā)達(dá)國家使用了30多個年頭,目前國際上90%以上的社情民意調(diào)查是采用計算機(jī)輔助電話調(diào)查系統(tǒng)(CATI)開展的。現(xiàn)如今,CATI理論及技術(shù)已經(jīng)相當(dāng)成熟,并廣泛地應(yīng)用于多種調(diào)查研究領(lǐng)域,如政府公共服務(wù)的滿意度調(diào)查、政府政策的成效評估、企業(yè)品牌知名度研究、服務(wù)質(zhì)量跟蹤調(diào)查及選舉支持率民意測驗等等。雖然CATI調(diào)查具有其他傳統(tǒng)民意調(diào)查所不具有的許多優(yōu)點,但限于CATI調(diào)查是通過電話進(jìn)行的,存在訪問主題不宜過于深入、訪問時間不宜過長等不足。另外,CATI調(diào)查在抽樣過程中還存在一些問題,主要是誤差問題,應(yīng)該引起重視。
在CATI調(diào)查的執(zhí)行過程中,主要存在兩類誤差:抽樣誤差和非抽樣誤差。抽樣誤差在統(tǒng)計學(xué)上已經(jīng)有一套比較成熟的理論與方法,這種誤差是不可避免的,它會隨著抽樣規(guī)模的增加而減少,并可以根據(jù)一定的置信水平來估計抽樣誤差。而與之相比的非抽樣誤差就很難測定和評價。實際上,CATI調(diào)查的質(zhì)量控制主要就是對非抽樣誤差的控制。非抽樣誤差包括樣本設(shè)計誤差和計量誤差。樣本設(shè)計誤差是在樣本設(shè)計或樣本抽樣中而產(chǎn)生的誤差,如空號誤差,每個CATI調(diào)查中都會存在相當(dāng)數(shù)量的空號或無效號碼,這些號碼可能是系統(tǒng)隨機(jī)生成的空號,也可能是近期才停機(jī)的號碼,如果這部分號碼所對應(yīng)的個體分布與調(diào)查總體分布存在顯著差異,則必然出現(xiàn)調(diào)查的系統(tǒng)性偏差,但這并不是CATI調(diào)查誤差的主要來源,CATI調(diào)查的誤差主要是來自于計量誤差。計量誤差是所得到的計量結(jié)果與原始真實信息不符而引起的差異。與傳統(tǒng)的調(diào)查方法相比,由于CATI調(diào)查全過程的智能化設(shè)置,可以大大減少調(diào)查員由于工作疏忽造成的計量誤差和登記、匯總等過程中產(chǎn)生的計量誤差,CATI調(diào)查的計量誤差主要包括:拒訪誤差和回答誤差等。
1.拒訪誤差。拒訪誤差是指由于被調(diào)查中部分個體不愿意或者無法完成調(diào)查或者被調(diào)查者有能力回答而未回答而產(chǎn)生的誤差,目前拒訪現(xiàn)象一直存在并保持在較高的水平,并且拒訪個體具有相對同質(zhì)性,從而又導(dǎo)致樣本的代表性問題。拒訪的原因一般包括:如由于監(jiān)管缺位,當(dāng)前電話詐騙、電話營銷等不良現(xiàn)象比較猖獗,受訪者在接到電話訪問后容易對電話訪問產(chǎn)生強(qiáng)烈的防備心理,被調(diào)查者很容易把這種情緒轉(zhuǎn)嫁到調(diào)查上,從而拒絕配合進(jìn)行調(diào)查;另外對于一些綜合性復(fù)雜性比較高的調(diào)查主題、或者指標(biāo)設(shè)置不合理,指標(biāo)、選項過長過多的調(diào)查,被調(diào)查者認(rèn)為回答問題比較麻煩,不愿意接受調(diào)查等等。
2.回答誤差。如果被調(diào)查者在某一特定問題的回答中有特定的偏向,就容易產(chǎn)生回答誤差。回答誤差的產(chǎn)生有兩種基本形式:有意識誤差和無意識誤差。有意識的誤差產(chǎn)生是由于被調(diào)查者故意對所提問題做出不真實的回答。他們可能是隱瞞他們認(rèn)為屬于個人隱私的內(nèi)容,比如,在一個有關(guān)政府辦事窗口的滿意度調(diào)查中,被調(diào)查者對于過去3個月內(nèi)去過幾次辦事大廳,他可能記不清了,但對于這類問題,他們可能寧愿進(jìn)行簡單的推斷,也不愿意寫上“不知道”。無意識誤差是指被調(diào)查者希望能夠給出真實準(zhǔn)確的回答,但卻給了不正確的答案,這種類型的誤差可能是由于問題的格式、內(nèi)容或概念偏差所造成的。
對于在CATI調(diào)查過程中存在的誤差問題,根本措施還是在于完善調(diào)查方案設(shè)計的科學(xué)性。合理設(shè)計調(diào)查問卷對于CATI調(diào)查起到至關(guān)重要的作用。為了減少回答誤差,對問卷的要求就更為嚴(yán)格,問卷力求能夠更易于理解,來保證被調(diào)查者填寫準(zhǔn)確而真實的回答;問卷的內(nèi)容也需要簡明扼要,答題形式要力求簡單,方便操作,最好全部使用選擇式答題,避免出現(xiàn)開放性問題。同時,要努力爭取被調(diào)查者的合作,給予被調(diào)查者適當(dāng)?shù)莫剟詈痛鹬x,比如贈送話費、積分兌換等,這將有利于被調(diào)查者參與CATI調(diào)查的積極性。
(責(zé)任編輯:牛域?qū)帲?/p>