俞桂芳
( 富陽市統計局, 浙江 富陽 311400 )
杭州富陽市城鄉住戶一體化調查誤差控制分析探討
俞桂芳
( 富陽市統計局, 浙江 富陽 311400 )
本文結合城鄉住戶一體化調查工作的實際,介紹了一體化調查誤差的類別,分析了抽樣調查誤差、記賬誤差、數據處理誤差,提出優化樣本結構、提高記賬質量、減少數據處理誤差三個層面的誤差控制措施。
住戶調查;一體化;誤差控制
住戶調查是指以家庭為調查對象,為收集各種社會經濟統計資料而組織的各項調查的總稱[1]。作為民生統計之一,其重要性不言而喻。但是受城鄉二元結構的制約,我國住戶調查一直由城鎮和農村實行不同的住戶調查制度,兩者在指標、標準、口徑和方法上自成體系,收支水平和結構等統計數據不完全對稱,沒有形成涵蓋全國城鄉全體居民的可支配收入和消費性支出數據,也難以精確測算全體居民內部的收入差距和支出結構。隨著以人為本、統籌城鄉發展的持續深入,國家統計局初步制定城鄉住戶調查一體化改革總體方案,2012年底統一實施城鄉住戶一體化調查。由于城鄉居民收入組成和消費結構變化顯著、居民配合程度不高等原因,在主客觀方面很容易引起調查誤差,影響數據的準確性。如何最大限度地提高住戶調查居民配合程度和控制調查數據誤差,保證居民收支數據的準確性和透明度,始終是城鄉住戶一體化調查的重要課題之一。本文以富陽市為例,對一體化調查誤差的類別、表現來源、控制措施進行了分析探討。
調查誤差(Error in Survey)是指調查戶對自身家庭經濟狀況和收支水平記錄與其客觀實際情況的符合程度,即記賬質量的可靠性[2]。按照城鄉住戶一體化調查工作的實施流程,大致可分為抽樣和非抽樣調查誤差。
抽樣調查誤差,主要體現在樣本選擇過程中的樣本誤差。樣本抽選包括抽樣方法設計、調查小區抽選以及摸底調查、調查戶落實等現場抽樣工作[3]。抽樣誤差主要決定于抽樣方法和樣本量的多少。
非抽樣調查誤差,也稱為登記誤差,主要是指樣本戶確定以后,在進行實際調查過程中,由于樣本戶家庭和調查人員兩方面原因造成的誤差[4]。主要有記賬誤差、數據處理誤差,這是現階段影響住戶數據質量的主要因素。
調查誤差來源指的是引起調查誤差的主客觀因素。研究城鄉住戶一體化調查誤差表現及來源,便于制定調查誤差針對性的控制措施。從實踐來看,住戶調查中產生的誤差主要表現為三種形式:
(一)抽樣調查誤差。城鄉住戶一體化調查的調查樣本是以第六次人口普查的調查小區為抽樣框抽取調查小區,采用隨機起點、等距抽樣方法抽選調查住宅。根據滿足省、市兩級樣本代表性和分區、縣(市)出數據的需要,富陽市的樣本量確定為300戶。無論從抽樣方法還是從樣本量看,300戶的樣本量是綜合了人口規模、收入差距等因素,科學合理,抽樣調查誤差處于可控范圍。但是受主客觀因素的制約,會出現由于樣本覆蓋面不全而產生樣本代表性偏低的非數量性誤差。主要原因是:
1.低收入家庭占比偏高引起樣本覆蓋不全。就城鎮點來說,富春街道抽中點收入明顯偏低的有兩個,占25%:鳳浦社區第029普查小區為農居點(即老小產權房),小產權房的特點決定了樣本戶本質上還是農村人員,收入水平偏低;金橋社區第029普查小區本地居民較少,抽中的樣本戶均為外來戶,流動人口的收入普遍偏低。新登鎮作為富陽市副中心城市,兩個抽中調查小區的居民收入完全不能與富春街道社區的居民收入相提并論。就農村點來說,抽中調查小區地理位置較偏、經濟較差的有六個,占27.3%。
2.高收入家庭不配合引起樣本覆蓋不全。越是收入高的家庭,對記賬工作越是不肯配合,甚至直接拒絕記賬,就算勉強“接受任務”,也是為完成任務而“選擇性記賬”?!昂ε赂Q視”,這有居民對住戶調查認知、意識上不足的原因,說到底還是缺乏對住戶調查明確的法律約束,這樣導致的結果就是高收入家庭占樣本量的比例過低而引起樣本覆蓋不全。
3.行政區劃不對等引起樣本覆蓋不全。一些新建成的小區,因為入住率、配套設施等原因,沒有納入行政區劃抽樣框;部分村變社區,行政區劃由農村變為城鎮,但村進社區的配套工作并未同步完成,生活狀況與農村類同,諸如此類導致抽樣框本身存在問題。
(二)記賬誤差。記賬誤差主要來源于住戶調查過程中住戶配合程度和調查員業務素質。產生記賬誤差主要原因是:
1.記賬戶不穩定。富陽市一季度樣本戶配合程度評價顯示,記賬戶不穩定的占20.3%。記賬戶記賬不穩定有主觀和客觀的原因。主觀上的原因,一是配合程度不夠,一季度樣本戶配合程度很好和較好的占75.6%,一般的有15%,較差和很差的8.8%;二是記賬戶負擔重,場口、大源、萬市、新登部分樣本戶還承擔了杭州市中心鎮住戶收支與生活狀況記賬工作,部分城鎮樣本戶參加了“十個更好收入倍增”和“消費意向”問卷調查,可能讓這些記賬戶產生畏難情緒??陀^上的原因,一是流動人口不定期返鄉,存在記賬不連續和樣本流失的壓力。二是其他原因而不能繼續記賬,如偏遠鄉鎮樣本戶舉家外出打工、獨居老人搬去子女家居住而成為空宅。
2.記賬戶漏報瞞報。城鄉住戶一體化調查工作的難點是收支漏報瞞報,收支水平較高的家庭漏報瞞報情況尤為嚴重。一是多代家庭的漏記,由于觀念不同,多數子女對收支的內容與金額,采取保守的“匯報”,客觀上造成漏瞞;二是隱性消費的漏記,網絡及服務性消費的非實物性,容易忽視這部分消費支出;三是實物產品和服務收入漏記,比如單位食堂的免費工作餐、有價券、農村自產自用實物,由于不是現金收入,也容易漏記。
3.輔助調查員編碼差錯。這部分的誤差是由于輔助調查員在賬本審核、編碼的過程中產生的。如調查中發現某個調查點出現多條大額的“房屋租賃支出”,經核實是輔助調查員在編碼的時候,把“出租房屋收入(收入)”編成“租賃私房房租(支出)”。這種編碼差錯程序無法審核出,但是對收支兩方面的影響是巨大的。輔助調查員負責的調查業務偏多、工作強度大、編制收支平衡表能力欠缺是主要原因。
(三)數據處理誤差。城鄉住戶一體化調查數據先審后錄,后期數據可以通過iHaps一體化住戶調查數據處理系統的奇異值審核、控制范圍審核、邏輯審核等進行一定程度的誤差控制,但是人為誤差還是普遍存在。主要原因是:
1.審核誤差。收支的部分指標需要填寫人碼,如工資性收入和非農業生產經營收入、報銷醫療費、農村外出從業寄回帶回收入、非農生產經營費用等。只有在數據錄入時通過顯示的人名才能準確判定人碼填寫是否有差錯,因此在賬頁錄入的過程中還需要額外承擔不斷糾正賬本剩余差錯的任務。
2.操作誤差。在較短時間內錄入所有的賬本數據,高強度任務下,手工錄入不可避免出現誤差。如數字多錄入一位、重復錄入;對計量單位較多的指標,如畝/公斤、頭/元/公斤在iHaps一體化住戶調查數據處理系統上并沒有相同的單位名稱,相對應的是數量/金額、數量/金額/備注,錄入位置容易出錯。手工錄入誤差的逐步累積,對收支數據的影響有時候是災難性的。
在總結、借鑒城鄉住戶一體化調查的實踐和經驗的基礎上,城鄉住戶一體化住戶調查可以采取如下誤差控制措施:
(一)優化樣本結構。對于不夠符合實際現狀的樣本結構,在居民人均可支配收入、現金消費支出數據的變化趨勢進行對比分析評估的基礎上,建議通過調整個別樣本點和零星換戶的方式對樣本結構進行微調。零星換戶需要對新老戶的基本情況,如家庭規模、就業人口、職業、收入等情況進行詳細比對,同時充分考慮高收入群體對記賬配合程度較低的因素,適當增加高收入群體的樣本分配比例,以保證高收入層足夠的有效樣本數。通過這樣的方式,合理修正樣本結構,逐漸減小因樣本代表性不足帶來的誤差,讓樣本代表性合理回歸。
(二)提高記賬質量。記賬質量對一體化調查工作至關重要。可以從三個方面來提高。1.調動記賬積極性。一是培養記賬習慣。調查中發現很多家庭都沒有記賬的習慣,也不知曉記賬方法,需要多次上門輔導記賬方法,逐步讓記賬內化為一種習慣。二是提高記賬補貼。雖然記賬是一種社會義務,也是一種勞動,物質報酬是勞動價值的體現;2.夯實記賬基礎。一是設定試記賬周期。實踐證明,試記賬周期必不可少。輔助調查員與新記賬戶在試記賬周期深入溝通,基本能發現記賬漏記瞞記之處。二是及時反饋記賬差錯。記賬質量需要在不斷修正中提高,每月將記賬差錯進行上門反饋、指導;3.科學管理輔助調查員。輔助調查員作為與記賬戶的直接聯系人,他們責任心、溝通能力、業務素質的優劣,直接影響住戶數據質量。一是提高業務能力,使“死賬”(住戶的記賬)變為“活賬”(真實反映居民生活狀況的記賬)。通過輔助調查員例會,系統學習住戶收支調查方案,交流新情況、新問題,提高質量審核把關能力。二是強化臺賬建設。加強分戶分人收支臺賬、分戶常規收支臺賬、訪戶臺賬、大筆收支臺賬建設,促進輔助調查員的基礎工作。
(三)減少數據處理誤差。數據處理過程很難做到零誤差。目前能做到的就是最大限度地減少人工操作誤差,將數據處理誤差的不利影響降到最低。1.提高賬本質量審核的標準,采取自審、互審、專審等多種審核方式,注重平衡關系、邏輯關系、對應關系等方面的審核。2.提高數據錄入人員的責任心,關注大額數據錄入,保證錄入準確度。3.將人工審核與程序審核相結合,減少因錄入失誤造成的誤差。
[1]堯聲.住戶調查.中國統計,1983,4.
[2]百度百科調查誤差詞條. http://baike.baidu.com/link?url =3DAGq7BEw8fITGkZFwXioDkVBhTWGvtOGtw9OwXB49q2 QZrNeq-_o6guP3qase_1jwsSDsS8iZ9QDWalO_UDHq.2012.
[3]浙江省收支與生活狀況調查方案(試行).2012.
[4]宮春子.減少城市住戶調查誤差.中國統計.2005,10:53-54.
10.3969/j.issn.1674-8905.2014.02.021
牛域寧)