林坪
(溫州市龍灣區統計局/局長,浙江 龍灣 325058)
淺議人口普查數據編審工作的難點與對策
林坪
(溫州市龍灣區統計局/局長,浙江 龍灣 325058)
人口普查數據編審工作是提高普查數據質量的關鍵環節,因此其意義重大。當前,數據編審工作存在時間緊、任務重、審核程序不完善等諸多難點。建議科學合理安排、創新編審方法、嚴把審核質量。
人口普查;數據編審
人口普查是一項重大的國情國力調查,是和平時期最大的社會總動員。普查數據質量是普查工作的生命,而做好計算機數據編審工作是提高數據質量的關鍵環節,其工作質量高低直接影響普查數據質量和最終成果。本文將簡要談談做好人口普查數據編審工作的重要意義、難點和對策。
人口普查數據編審工作是提高普查數據質量的最后環節,也是關鍵環節,因此其意義重大。
1.人口普查數據編審工作是提高普查數據質量的主要抓手。普查工作一環緊扣一環,任何一個環節出現了問題,對整個普查工作都會產生嚴重影響。普查數據編審工作是光電錄入工作的后續環節,也是普查數據公布前質量控制的最后環節,因此此項工作至關重要。但普查數據因為各種主、客觀原因,會存在誤差,而如何將誤差降低到合理區間內,數據編審工作就是一個主要抓手。因為編審工作借助計算機設置條件進行審核,從而可以及時發現普查員在填表、移碼、編碼過程中產生的漏填、錯填、錯編等人工審核過程中難以發現的差錯,并結合查詢行政部門資料、電話訪問、實地核實等方式進行差錯核對,這樣將會大大提高普查數據的質量。
2.人口普查數據編審工作是客觀反映實際人口情況的有力手段。數據編審工作除了能發現各類邏輯性差錯外,還可以通過對人口結構的分析來判斷普查數據是否符合客觀實際。比如百歲老人人口數、少數民族人口數、戶籍人口各年齡段性別比、外來人口各年齡段性別比等等,通過人口普查數據分類匯總,再參考歷次普查數據、日常統計數據和行政部門資料,結合實地走訪、調查,最后得出反映客觀實際的人口數據,能經受起歷史、社會群眾的檢驗。
3.人口普查數據編審工作是考核評價普查工作的重要依據。每次普查工作,各級普查部門都要開展對下級普查部門的考核和評價,人口普查也不例外。如何科學、公正、客觀地評價普查工作,是各級普查機構都需要面對和思考的問題。統計工作都是用數字說話,而人口普查數據編審工作就可以通過各種數據來科學評價普查工作。比如通過數據編審就可以發現下級普查區域普查表的填表質量、編碼質量、人口結構是否符合客觀實際等問題。作為普查數據公布前的一個關鍵環節,如果數據編審工作沒有做好,即使普查的前期準備、登記等工作做的非常充足,也會影響數據質量。
當前,人口普查數據編審工作存在諸多難點,主要有以下幾方面。
1.數據編審時間緊、任務重,導致審核修改工作不充分。就溫州而言,全市有400多萬張普查表、2.2億筆指標數據、80萬普查對象的行職業碼需要進行審核,數據量之大列所有普查之最,工作任務十分繁重。而此次人口普查數據處理工作時間較“五普”縮短很多,以致于數據編審工作的時間非常緊,一些地方為了趕進度,沒有足夠時間對普查數據進行二審、再審,審核修改工作不充分,導致一些差錯的存在。
2.編碼質量不高,光電誤識多,再生性差錯大量增加,影響數據編審的質量和工作效率。根據《第六次全國人口普查方案》規定,普查表的非專項編碼工作由普查員負責編寫。由于普查員量多、素質參差不齊,編碼質量無法全面控制,出現移碼出錯、漏編和編寫不規范等現象,特別是一些數字誤識現象比較嚴重,如:7、9被誤識為1,2被誤識為7等。從前期普查表短表的編審情況看,高齡人口大量增加主要原因是一些數字被誤識所致。這些差錯將導致普查數據再生性差錯大量增加,而這些差錯往往難以被發現,導致數據編審工作的效率和質量受到很大影響。
3.數據編審過程中往往存在幾個誤區,導致編審工作不徹底。一是重個體審核,輕總量和結構分析。個別地方可能會存在趕進度現象,只求通過計算機審核,而忽略從宏觀角度分析數據總量和結構上存在的問題,或者總體評估工作太靠后,待發現后無法補救。二是重必要審核,輕核實性審核。個別地方存在只求通過必要審核,而對核實性差錯不夠重視,雖然核實性差錯中會有特殊的客觀存在,但大部分還是不合理的數據,仍需要仔細去核實。三是重主觀判斷,輕實地核實。在編審中有些編審人員容易產生主觀判斷,輕率的去修改數據,而不反饋給基層實地核實,這又將產生再生性差錯。
4.計算機審核功能不完善,數據編審存在盲區。盡管國普辦已編制了大量審核條件,省人普辦也增加了審核條件,但審核功能仍不完善,一些審核差錯仍無法通過審核發現,如:地址代碼出錯無法審核、未取名的現有人口卻有戶口等,普遍存在一些實際差錯卻無法被發現的現象。同時,行職業碼編制的準確性無法審核;核實性差錯無法做標記,導致一些核實性差錯重復審核而增加工作量,或被遺漏審核而差錯修改不及時。
5.編審人員業務水平、責任心參差不齊,編審質量難以保證。編審工作量大,需要大量的編審人員,個別地方雖然人數夠了,但業務水平、責任心參差不齊。個別編審人員為了追求速度,未查看圖像便直接修改個別指標數據,造成了大量顯性差錯轉化為隱性差錯,無法被發現,如:出現的必改性差錯信息為“ 戶主與配偶的性別相同,矛盾”,個別數據編審人員不查看圖像就將R3性別進行修改,其實該對象性別是對的,而“與戶主關系”為“7”(孫子女),被誤識為“1”(配偶),造成了戶主與配偶性別相同。編審人員的業務水平和責任心問題,都會影響到普查數據質量。
要做好數據編審工作,提高普查數據質量,筆者特建議如下。
1.科學合理安排數據編審工作,確保數據編審正常、有序進行。由于數據編審工作時間緊、任務重,因此各級普查機構必須科學合理安排數據編審工作。一是要采取時間“倒逼法”來安排數據編審工作的計劃。二是要明確數據編審工作流程。應事先完成各類計算機差錯審核,然后結合總量評估、結構分析來發現某個指標與日常統計、部門數據相差較大的原因,并有針對性的安排單個指標審核。三是要配足、配強編審工作人員,做好業務培訓。由于本次人口普查涉及對象多,指標關聯性強,計算機審核工作量非常大,因此各級人普辦要根據本地區審核的工作量來測算審核工作強度(每日人均編審數量),配足、配強數據編審工作人員。另外,編審人員上崗前必須進行普查業務知識和計算機操作培訓,使他們掌握編審的基本要領和工作技巧,從而順利開展工作。四要對各項編審工作進行分工,明確責任。
2.多形式創新數據編審方法,提高編審工作效率。由于人口普查情況復雜,差錯類型無奇不有,而傳統的計算機審核條件不能發現一些隱性差錯,所以無法確保數據質量。因此,建議數據編審工作要突破只通過算機審核的傳統做法,創新思路,做到“五個結合”。一是國家審核程序和自編審核程序相結合。國家審核程序的審核條件具有普遍性,各級普查機構應結合本地實際,自編審核條件,多角度、多層次的發現潛在差錯。如:地址代碼無法審核的問題、14周歲以下離開戶地原因為工作調動或婚姻嫁娶等問題,進一步予以審核糾錯。二是數據編審與圖表分析相結合。收集 “四普”、“五普”等相關數據,填寫相關分析表,并制作數據圖表,可以通過圖表觀察人口相關指標數據的結構、趨勢是否合理,是否存在奇異值。如:年齡結構、分年齡段性別比等資料。從經濟發展、人口流動等角度對奇異值進行辯證分析,判斷是否存在錯登、漏編、誤識、亂改等現象。三是個體審核修改與總量分析相結合。通過對人口普查初步數據進行不同分組匯總,分析局部數據存在的合理性和準確性,并及時進行糾正。如:通過總量數據分析,及時糾正少數民族人口、百歲老人、低年齡高學歷人口等因編碼和光電錄入誤識造成的差錯。四是分散審核和集中會審相結合。在縣級自行組織審核的基礎上,市級抽調各地業務精英進行集中會審,并將會審差錯結果反饋到基層進行核實修改。集中會審能夠較好地克服因極個別編審人員專業水平不高、責任心不強造成的數據修改不正確、不到位的現象。通過會審,能真正做到必改性差錯一條不留,核實性差錯據實糾正,數據符合邏輯關系,使差錯率降到最低程度。五是人工復查與專項計算機審核程序復查相結合。由于行業和職業碼是長表中兩個重要指標,如果單靠人工去復查紙質報表,費時費力,且效率低下,因此必須借助計算機來審核。在做好人工審核的基礎上,及時開發長表行業、職業專項審核程序,通過截取每個人記錄中R18(行業)、R19(職業)兩個指標區域的圖像,再讀取數據庫中相對應的行業、職業代碼,最后按行業、職業碼排序,逐類檢查編碼質量,發現差錯的進行記錄、修改,從而提高長表行職業的編碼質量。
3.嚴格把好數據編審質量控制關,確保數據質量。做好數據編審工作,不僅要工作人員、時間、方法和程序到位,還要做好數據編審質量控制和檢查工作。因此在數據編審過程中,建議做好質量控制的責任落實,明確專人對數據審核改錯情況進行跟蹤檢查和隨機質量抽查,并做到隨時發現問題,及時糾正。此外,明確審核改錯必須要根據填報普查表的實際情況進行改錯,堅決杜絕未查看圖像便隨意修改數據;要克服避重就輕、棄繁從簡現象,尤其是對一些核實性差錯要認真對待,不得輕易放過,確保審核率和必改項目的改錯到位率達到100%。
10.3969/j.issn.1674-8905.2011.03.015
(責任編輯:張巧燕)