人口普查多報估計研究

2022-06-02 10:45:24胡桂華劉譽環

人口與經濟 2022年3期

胡桂華，劉譽環，文婷

(1.重慶工商大學數學與統計學院，重慶 400067；2.重慶工商大學經濟社會應用統計重慶市重點實驗室，重慶 400067)

一、引言

每個國家的人口普查都會不同程度地發生多報與漏報，使普查登記人口數偏離實際人口數。多報包括重報與誤報。重報指普查員登記了普查目標總體內的人一次以上。誤報指普查員登記目標總體外的人。目標總體是指人口普查對象，即應該在本次普查中進行登記的那些人的集合。漏報指普查員未登記目標總體內應該登記的人。一般來講，漏報比多報嚴重,但也有特例。本文只研究多報，對漏報感興趣的讀者，請見胡桂華等作者發表的相關論文。

普查多報是一個客觀存在的問題，應當采取恰當的方法進行研究。人口普查多報估計工作由各國政府統計部門采取抽樣調查方法實施。為使研究成果服務于政府統計部門需要，提高其普查多報估計水平，本文采取抽樣調查中的分層二重抽樣技術構造普查多報率指標體系中的各個指標的估計量及其抽樣方差估計量。

本文研究目標是，在深度剖析現行普查多報估計方法所存在的若干缺陷的基礎上，建立起一套全新的人口普查多報率指標體系及其估計理論體系，以及設計普查誤報人口、重報人口識別及其計數程序。

本文學術價值體現在三個方面：其一，針對普查多報的具體情況，建立起與之相適應的普查多報率指標體系。該體系由重報人次率、重報案例率、誤報率和總多報率四個指標構成。對重報，從兩個視角來考察:一是重報人次，二是重報案例人數。一個目標總體的人在普查中登記了 3 次，那么重報人次為 2，重報案例人數為 1。其二，每個指標的估計量使用線性估計量和比率估計量構建。在分層二重抽樣下，各個指標估計量構成元素的估計量使用雙重擴張估計量構造。其三，采用分層刀切抽樣方差估計量近似計算各個多報率估計量的抽樣方差、偏差和均方誤差。

本文應用價值也體現在三個方面：一是對如何識別普查重報人口和誤報人口，以及構建普查多報率指標體系及其估計量提出了具體操作方法。這對政府統計部門制定普查多報估計方案具有一定的參考價值。二是有望應用于我國2030年及以后人口普查多報估計，提高其估計精度。三是可拓展到其他相關領域。例如，估計農業普查和經濟普查的多報率、戶籍登記系統的多報率，等等。

二、文獻綜述

自1982年到2020年，我國采用質量評估抽樣調查估計重報人次率，從未估計重報案例率和誤報率。這與未在普查表中設置項目“出生或死亡年月日時點”有關。2021年5月11日發布的2020年人口普查的凈漏報率為0.05%。凈漏報率不是多報率，是漏報率與多報率之差。我國只對外發布凈漏報率,所估計的漏報率和多報率作為內部參考使用。

從1950年起，美國開始正式的人口普查質量評估。美國普查局對外發布的2010年全國總多報人口數為10041千人，總多報率為3.339507%。其中，重報人次為8521千人，重報人次率為2.833693%；誤報人數1520千人，誤報率為0.505482%。

現在，世界各國都在人口普查質量評估中估計普查多報。然而，各國的做法尚有若干缺陷亟待改進。主要存在以下四個方面的問題。

第一，尚未構建完整的人口普查多報率指標體系。人口普查多報率指標體系應該包括四個指標：①重報人次率；②重報案例率；③誤報率；④總多報率。然而所有國家到目前為止，都未估計全部普查多報率指標。南非和澳大利亞等國家只估計總多報率，加拿大等國家只估計重報人次率。除美國等少數國家外，其他國家都未估計誤報率。至于重報案例率，則所有國家都未估計。

第二，對普查多報的界定不盡合理。聯合國統計司在其撰寫的《人口普查質量評估手冊》中，把地址登記錯誤當作普查多報。雖然地址登記錯誤是一種錯誤，但如果相應于這個登記的人屬于普查目標總體，并且在普查中只登記一次，就應該認定這個登記不是多報。將地址登記錯誤當作普查多報，不符合普查多報的本質特征，虛增了普查多報人數。

第三，對重報考查對象未作明確規定。審查人口普查登記結果，要把目標總體內的登記和目標總體外的登記區別開來。這是第一層次的甄別。其他次級層次的甄別只能在這兩個部分中分別進行?？墒怯行﹪疫`背了這個原則。如加拿大和美國把目標總體內的重復登記(重報)和目標總體外的重復登記都當作重復登記。這是兩種不同性質的重復登記，應該分別處理。其中，前者作為重報，后者作為誤報。

第四，不恰當地使用間接推算法估計總多報率。如瑞士使用“普查登記人數估計量與普查正確登記人數估計量之差”與“普查登記人數估計量”的比值來間接推算普查總多報率。進行人口普查多報估計，不只是要算出總多報率，還要從本次普查的多報現象中總結經驗教訓，提高下一次人口普查工作質量?；诖朔N目的，需要收集目標總體外的誤報人員以及目標總體內重報者的原始數據以及相應的活動情況。在這樣的要求下，總多報率指標自然應該用原始數據直接估計，而不應該間接推算。

通過上面的綜述可以看出：①目前所有國家在人口普查多報估計中均存在這樣或那樣的問題；②如何估計人口普查多報率，各國并未達成共識；③對這一領域中的錯誤觀點和錯誤做法，并未有人提出異議，導致這一領域的科學研究長期處于停滯狀態。

三、人口普查多報估計理論

該理論由五部分構成：設計普查多報率指標體系；構造每個指標的線性多報率估計量和比率多報率估計量；計算這些估計量的抽樣方差；計算比率多報率估計量的偏差；抽取樣本及采集樣本多報數據。

1.設計人口普查多報率指標體系

為了評估人口普查多報，需要建立全面系統的普查多報率指標體系，體系中的每一個指標要相互關聯，各自承擔自己的任務。也就是說，每一個多報率指標要有獨立的功能，確切的含義、概念、空間范圍和計算方法。

我們以“率”的方式建立普查多報率指標體系。該體系包括四個指標：一是重報人次率，定義為普查目標總體內人口重復登記的人次與原始普查登記人口數的比值。二是重報案例率，定義為普查目標總體內發生重報行為的人口數與原始普查登記人口數的比值。三是誤報率，定義為普查目標總體外的誤報人口數與原始普查登記人口數的比值。四是總多報率，定義為普查目標總體內的重報人口數與普查目標總體外的誤報人口數之和與原始普查登記人口數的比值。在這四個多報率指標中，重報人次率是核心指標。相比誤報率，重報人次率更大。核心指標不是固定不變的，它取決于許多因素。

每個指標的計算范圍不同。重報人次率和重報案例率的計算范圍是目標總體內的普查登記，誤報率的計算范圍是目標總體外的普查登記，總多報率的計算范圍是普查目標總體內外的普查登記。每個指標的計算方法是線性多報率指標估計量和比率多報率指標估計量。每個指標均是時點指標，而不是時期指標。這四個指標之間的數量關系是：總多報率為重報人次率和誤報率之和。

(1)重報人次率。有些人在本次普查中除了應該登記的那一次之外，還多登記了幾次，形成了重報人次。它虛增了普查登記人數。通過重報人次率指標，可以獲悉重報的程度。如加拿大等國家在每次人口普查質量評估中，從普查登記人數中剔除估計的重報人次，以及添加估計的漏報人數，進而得到修正后的普查登記人數。

(2)重報案例率。該指標雖然不影響普查登記人數，但它提供一個重要信息，即在本次普查中總共有多少人重復登記過。通過普查表，可以獲悉重報者的年齡、性別、文化程度、戶籍所在地、現住地、婚姻狀況，以及重報的原因，即是否有多個住處，在各個住處都進行了普查登記，或者在居住地和工作地同時進行了普查登記，如普查期間在外流動，在流出地和流入地分別進行了普查登記。

(3)誤報率。誤報人數與重報人次一樣，會虛增普查登記人數。不過，相比重報人次，誤報人數少許多。由于這個原因，中國、烏干達、南非和加拿大等一些國家在普查多報估計中忽略誤報人數，從而低估誤報率和總多報率。如美國每次普查多報估計，都把誤報估計納入其中，并且將誤報和重報分開列示。這么做的理由是誤報與重報的來源不同:誤報來源于普查目標總體外，而重報來源于目標總體內;除了來源不同外，誤報與重報的發生機制也不同:誤報是普查員錯誤登記了不應該登記的人，而重報是多登記了應該登記的人。

(4)總多報率。這個指標是重報人次率與誤報率的總和。美國、瑞士等國計算這個指標。加拿大和中國分別在2016年和2010年計算重報人次率，把重報人次率當作總多報率。

2.構造普查多報率指標估計量

在分層二重抽樣中，用表示第一重樣本抽樣層的總層數，為任意層，為層的普查小區總數，為從層抽取的樣本普查小區總數。用表示從層抽取的樣本普查小區進一步分層得到的總層數，為層的普查小區集合，為層的樣本普查小區集合，為層的普查小區總數，為層的樣本普查小區總數。用表示示性函數，如果第一重樣本普查小區屬于層，那么=1，否則=0。用表示另外一個示性函數。如果第一重樣本普查小區進入，那么=1，否則=0。為進入第二重樣本的樣本普查小區的抽樣權數。

輔助變量是抽樣調查中需要用到的一個變量。在抽樣調查中，變量按具體作用可分為主變量和輔助變量兩種。輔助變量指的是和主變量具有統計相關或相依關系的變量，可以是已知數，也可以是估計值。在能夠獲得這種輔助變量資料的條件下，如果能夠把它利用起來，往往可以提高估計值的抽樣估計精度。輔助變量的作用比較多。例如，用它來分層，提高樣本對總體的代表性，用它來構造比率估計量，用它來構造回歸估計量，用它來做不等概率抽樣，等等。其中，前四個估計量的計算公式如下：

比率重報人次率估計量：

(1)

比率重報案例率估計量：

(2)

比率誤報率估計量：

(3)

比率總多報率估計量：

(4)

在將式(1)—式(3)代入式(4)后，式(1)—式(4)有兩個共同特征：第一，等號右邊的每一項都是估計量，其中比率中的分子或分母均是較為復雜的線性估計量，各自有2個示性函數、1個抽樣權數及樣本普查小區的多報人口數。第二，各個多報率估計量采用的輔助變量都是總體的普查項目登記完整人數的估計值。

后四個估計量的計算公式如下：

線性重報人次率估計量：

(5)

線性重報案例率估計量：

(6)

線性誤報率估計量：

(7)

線性總多報率估計量：

(8)

式(1)—式(8)中的為第二重樣本普查小區的抽樣權數。如果第一重和第二重抽樣均采取簡單隨機抽樣，那么=()()。

3.普查多報率估計量的方差估計

相比式(1)—式(4)，式(5)—式(8)形式上相對簡單一些。中國、南非和烏干達等發展中國家采用線性多報率估計量提供多報率估計值。如果將式(5)—式(8)中的分層二重抽樣換成簡單隨機抽樣或分層抽樣，其抽樣方差可以采用精確抽樣方差公式計算。在式(5)—式(8)實際上采取分層二重抽樣(兩次分層變量不同)的情況下，其抽樣方差無精確公式計算。抽樣理論指出，雖然估計量簡單，例如，簡單隨機抽樣下的均值或總體總值估計量，但如果抽樣方式復雜，即抽取的是復雜樣本，那么基于復雜樣本的簡單估計量也變得相應復雜，其抽樣方差也只能近似估計。由于式(1)—式(8)具有類似性，為節省篇幅，只給出式(1)的分層刀切抽樣方差估計量公式。

(9)

(10)

(11)

4.比率多報率估計量偏差及均方誤差估計

式(1)的偏差計算公式為：

(12)

(13)

5.樣本的抽取及樣本多報人口的識別與計數

(1)抽取樣本的方法。本文采取分層二重抽樣抽取普查小區樣本。在抽取第一重樣本前，對研究總體的普查小區按照其所屬的社區和行政村分層，在社區層和行政村層，分別獨立抽取第一重樣本。對從社區層和行政村層抽取的第一重樣本，按照調查難度再分層，在每個新層，仍然以普查小區為抽樣單位抽取第二重樣本。在普查多報估計中采取分層二重抽樣，基于兩個理由：一是確定第二重抽樣的分層變量；二是壓縮第一重樣本，節約成本和調查時間。

(2)樣本小區普查多報人口的識別與計數。這包括三方面內容：一是普查目標總體外誤報人口的識別。二是目標總體內重報人口的識別。三是目標總體內重報人口的計數。

首先來看目標總體外誤報人口的識別。樣本普查小區的普查表可能填寫普查標準時點前死亡和之后出生的人口，或者登記暫時停留在中國境內的外國人。這類人口是誤報人口。如果普查表設計了項目“出生或死亡的年月日時點”，而普查表又登記了標準時點前死亡和之后出生的人口，就很容易識別誤報人口。然而在實際中，幾乎所有國家的普查表都未設置項目“出生或死亡的年月日時點”，這就難以判斷普查表是否填寫了誤報人口。為判斷普查表是否登記了誤報人口，可以考慮比較同一樣本普查小區的普查表與出生醫學證明登記冊和死亡醫學證明登記冊。這兩個登記冊清晰地記錄了每個人具體的出生及死亡時間。如果出生醫學證明登記冊顯示某人在本次普查標準時點之后出生，而普查表又登記了他，就將其作為誤報人口。同樣，如果死亡醫學證明登記冊顯示某人在本次普查標準時點之前死亡，而普查表又登記了他，也將其作為誤報人口。由于誤報人口較少，使用出生醫學證明登記冊和死亡醫學證明登記冊判斷誤報人口工作量并不大。當然，獲得這兩個登記冊需要當地衛生健康委員會的配合與支持。另外，要從出生醫學證明登記冊和死亡醫學證明登記冊分離出本樣本普查小區的出生和死亡人口。為便于進行第七次全國人口普查及其質量評估抽樣調查，中國國家統計局從國家衛生健康委員會取得了全國各個省(自治區、直轄市)的出生和死亡醫學證明登記冊的使用權。

再來看目標總體內重報人口的識別?，F代社會一些人有多個住處，流動性大，在普查期間也是如此。這使得同一人可能在多個地方接受普查登記。也有些人替代別人填寫普查表，導致別人在普查中登記兩次或兩次以上。為識別樣本小區的重報人口，可采取以下五種方法：一是在全國人口普查微觀數據庫尋找，看能否找到與樣本普查小區同樣的人，以及有多少個與其相同的人。這種方法的優勢能查找到所有重報人口，缺陷是工作量很大，只有政府統計部門才有能力這么做。美國和加拿大在每次重報估計中都是在全國范圍查找重報人口。中國尚未在全國范圍識別重報人口。二是在每個樣本小區及其周圍區域識別，這可能發現一定數量的重報人口，畢竟在全國各個地方有住處的人不多。三是在樣本小區內識別，這是目前許多國家采用的方法。這種方法優勢是便于找到重報人口和構造重報估計量，缺陷是識別到的重報人口數目有限。四是在質量評估抽樣調查表設計項目“您在普查中登記的次數”及“您在普查中登記的地點”。如果答復一次以上，就是重報者。這種方法快速便利。如果答復者提供真實答復，并且在答復之前，詢問其朋友及家人是否在普查中登記過他，是能夠獲得重報的準確次數的。五是比較同一樣本小區的行政記錄人口名單與普查人口名單。人口行政記錄在識別難以發現的重報人口方面有獨到作用。例如，某人有兩個名字，一個是現在的名字，另外一個是曾用名。他在一個地方的普查表中填寫的是現在的名字，在另外一個地方的普查表中填寫的是曾用名。該人的個人檔案填寫了這兩個名字。如果只是通過查詢普查表，就很可能把這兩個名字當作不同的人，其實是同一人，其中一個名字是另外一個名字的重復，但如果比較普查表和行政記錄，就能判斷這兩人是同一人，在普查中登記了兩次，其中一次是重復登記，另外一次是應該登記的。

最后來看目標總體內重報人口的計數。必須制定出一個科學、明晰的對普查重報的計數規則，否則所進行的計數很可能會發生重復或遺漏。這是一項困難的工作。對這項工作，擬從全面調查的情景入手來厘清思考路徑。假定人口普查的質量評估抽樣調查是對全國所有普查小區的全面登記。為了觀察重報現象，需要對普查登記中屬于目標總體的每一個人在全國范圍內進行查重。經過這項工作，可以一個一個地羅列出全國所有的重報案例。假定其中一個案例是這樣的：一個屬于目標總體的人，他分別在全國的四個普查小區進行了普查登記。無疑，在這四個登記中，必須要選定其中的一個登記為“有效登記”，即用這個登記來參加全國人數的計數；而另外的三個登記則是“無效登記”，屬于普查重報人數。那么，應該把哪一個登記選為有效登記呢？假若這個人進行登記的四個小區中，有一個是他的常住地，即按照人口普查的規定，他本來就應在這個小區進行人口普查登記，那么就把他在這個小區的登記選定為有效登記；假若這個人進行登記的四個小區，全都不是他的常住地，那么就選擇這四個小區中他居住時間最長的那個小區的登記為有效登記。于是，這個人在選定為有效登記的那個小區，應該向質量評估抽樣調查員報告：“我做了三個無效登記”；而在該人進行無效登記的那三個小區，則對該人的無效登記不予理會(對這三個登記視而不見)。進行抽樣調查的時候，如果這四個小區進入樣本，就這樣計數：在該人進行有效登記的小區，按該人的報告，記重復登記人數為3，與此同時，記重復登記案例數為1；在該人進行無效登記的小區，不進行有關該人的任何計數。顯然，如果該人進行有效登記的小區未進入樣本，則該重復登記案例在樣本中也就看不到了，即便是該人進行無效登記的小區進入樣本，也仍是如此。依照這樣的思路，規定普查重報的數據采集途徑和計數規則就不困難了。

四、實證分析

1.樣本及樣本數據

實證對象為一個行政區。實證目標為估計該行政區2010年11月1日零時的重報人次率、重報案例率、誤報率和總多報率。實證數據來源于該行政區的人口普查辦公室，以及對其部分普查小區的再調查。為便于討論問題，未考慮樣本數據缺失問題。抽樣方法為分層二重抽樣。采用的估計量為線性多報率估計量和比率多報率估計量，以及近似計算它們方差的分層刀切抽樣方差估計量。本行政區2010年普查登記人口數為560025人。使用第一重樣本估計的普查項目登記完整人口數為557016人，使用第二重樣本估計的普查項目登記完整人口數為559055人。

該行政區按照行政性質分為兩層，即社區層和行政村層，分別用=1和=2表示。社區層共有普查小區1000個，行政村層共有普查小區1100個。從社區層和行政村層，采取簡單隨機抽樣分別抽取10個和9個小區。按照調查難度，將第一重樣本小區分為三層，即調查難度較小層、調查難度中等層及調查難度較大層，分別用符號=1，=2和=3表示。所有樣本小區及其個人100%提供答復。此時，樣本個人抽樣權數等于樣本小區的抽樣權數，否則要根據調查答復率調整樣本小區抽樣權數，以得到樣本個人抽樣權數。抽樣層、抽樣權數及樣本數據見表1和表2。其中，和分別表示層的普查小區總數及樣本小區數，和分別表示層的小區數及從中抽取的第二重樣本小區數，表示樣本小區。表1和表2中的(2)表示第一重樣本小區進入到第二重樣本。為最終樣本小區的抽樣權數。第二重樣本小區數12個，其中社區層和行政村層各6個。表2中的樣本數據依據普查多報人口所在樣本小區的現住地來確定的。

表1 抽樣層及樣本普查小區的抽樣權數

表2 樣本普查小區的未加權數據

2.普查多報率估計值

依據表1和表2數據，使用式(1)—式(8)得到重報人次率、重報案例率、誤報率和總多報率,見表3。

表3 普查多報率估計值 %

從表3可以看出如下兩點重要信息。

第一，線性多報率估計量與比率多報率估計量計算的重報人次率、重報案例率、誤報率和總多報率差異小。這表明它們都適合于普查多報率估計，估計結果可信度較高。這一方面表明分層二重抽樣技術對普查多報率估計有比較好的適應性，另一方面也說明雖然線性多報率估計量未利用輔助變量，在抽樣估計精度上有所欠缺，但仍然可以應用于普查多報率估計。這也是許多國家一直使用線性多報率估計量的原因，也是本文研究線性多報率估計量的重要考量。對許多國家的政府統計部門來說，它們更關注的是估計值，而不是估計值的抽樣方差。一些國家在發布人口普查多報率、漏報率和凈覆蓋誤差率時，往往并不提供估計值的抽樣標準誤差。中國2020年在發布凈漏報率為0.05%時，也并未提供它的抽樣標準誤差(即抽樣方差的平方根)。

第二，①從重報人次率來看，使用比率多報率估計量估計的結果是1.176%，表明100人中有1.176個人是重報登記，是不應該在普查中登記的，虛增普查登記人口數1.176人；而使用線性多報率估計量估計的結果是1.180%，表明本次普查每100人中就有1.180個人是不應該在普查中登記的，使普查登記人口數虛增1.180人。②從重報案例率來看，采用比率多報率估計量估計的結果是1.019%，這意味著每100人中有1.019人在本次普查中發生了重復登記。雖然重報案例人口數不影響普查登記人口數，但計算這個指標還是很有實際意義的，其可以發現重報者的特征及發生重報行為者的廣度，即有多少人在本次普查中登記一次以上。③從誤報率來看，使用比率多報率估計量估計的結果是0.651%，表明每100人中有0.651人是普查目標總體外的人，例如普查標準時間點前死亡者或之后出生的嬰兒，虛增普查登記人口數0.651人。忽視誤報人口，不只是掩蓋了誤報人口的存在，而且虛減總多報率，這不利于下次普查操作方案的改進及普查登記數據質量的提高。④從總多報率來看，使用比率多報率估計量估計的結果是1.827%，它是重報人次率1.176%和誤報率0.651%的總和，表明每100人中有1.827人是不應該在本次普查中登記的，虛增普查登記人口數1.827人。

3.普查多報率估計值的抽樣標準誤差、偏差及均方誤差平方根

利用表1—表3數據，使用式(9)—式(13)，得到每個多報率估計值的抽樣標準誤差、偏差及均方誤差平方根，見表4。表4傳遞出如下五點信息。

表4 普查多報率估計值的抽樣標準誤差、偏差及均方誤差平方根 %

其一，使用抽樣調查方法估計普查多報率，不只是要計算每個多報率估計值的抽樣方差，還要計算其偏差，抽樣方差與偏差的平方之和是均方誤差。為了說明估計值的抽樣估計精度，需要使用抽樣標準誤差、偏差及均方誤差平方根。線性多報率估計量為無偏估計量，其均值與真值相等，偏差為零。比率多報率估計量為有偏估計量，需要計算其偏差。

其二，偏差所要傳遞的信息是估計量系統性地低估或高估實際值。對重報人次率而言，0.0085%表明采用比率多報率估計量估計的結果1.169%系統性地高估總體的重報人次率為0.0085%。

其三，除誤報率估計值外，使用比率多報率估計量計算的其他多報率估計值的均方誤差平方根，均小于采用線性多報率估計量估計的其他多報率估計值的均方誤差平方根。例如，比率重報人次率的均方誤差平方根0.2792%小于其線性多報率的均方誤差平方根0.2837%。這表明，比率多報率估計量在多目標(估計四個多報率)抽樣調查中擁有更高的抽樣估計精度。均方誤差平方根和抽樣標準誤差是衡量樣本代表性或估計量優劣的重要標準。多目標抽樣調查不要求估計量對每個目標指標的抽樣方差都小，只要在主要目標指標(重報人次率)或絕大部分估計目標指標上抽樣標準誤差或均方誤差平方根較小即可。

其四，在采用比率多報率估計量還是線性多報率估計量這個問題上，要根據各國人口普查質量評估的能力，對普查多報率估計精度的要求，進行抽樣估計精度比較的需要綜合權衡。

其五，相較于抽樣標準誤差，偏差小許多。這就是為什么各國政府統計部門在人口普查質量評估中只計算抽樣標準誤差，而不計算偏差的原因。美國普查局使用雙系統估計量估計總體實際人口數及凈覆蓋誤差，從未計算過偏差及均方誤差平方根，只計算抽樣標準誤差。

五、結論與建議

通過前面的理論研究和實證研究，得出一些重要結論，并對我國政府統計部門在人口普查多報估計中提出若干建議。

第一，普查目標總體是判斷人口普查多報的重要標準。對一個普查登記，需要關注的是，這個登記是否屬于目標總體，而不是這個登記的地點是否正確。采用登記者是否屬于目標總體這一標準，可避免普查多報誤判，也體現了普查多報的本質特征。如果在普查中登記一次以上，就把其中的一次當作有效登記，其他幾次作為無效登記。有效登記是指發生在應該登記地點上的普查登記。如果能夠確切知道一個人的應該登記地點，就把發生在這個地點上的有效登記計作重報案例人數，其他地點的無效登記也計作這個地點的重報人數，其他地點不做任何統計。如果無法獲悉一個人的確切應該登記地點，就采取簡單平均法，在其登記的各個地點平均計算重報案例人數和重報人次。建議國家統計局深入研究普查多報人口的認定問題，將是否屬于普查目標總體作為判斷多報人口的核心標準，合理確定普查多報人口的計數地點，避免虛增普查多報人數。

第二，不能忽視普查目標總體外誤報人口的存在，在普查多報估計中應該單獨估計。即使誤報人員數為零，也要在研究報告中列示，并且說明為什么為零。事實上，這個數不可能為零。為估計誤報人數，需要在普查表設置“出生或死亡年月日時點”，使用出生或死亡醫學證明判斷普查標準時點前后出生或死亡的人是否屬于誤報人口。我國在歷次人口普查質量評估中，只估計重報，忽視誤報，從而低估總體普查多報人數或多報率。建議國家統計局既要估計重報人數，還要估計誤報人數。

第三，在重報估計中，要設置重報人次率指標和重報案例率指標。普查重報指標考察目標總體內人員的重報。這一規定為重報指標制定了統計標準，規范了這一指標的口徑范圍，杜絕了把不屬于目標總體人員的多次登記混入普查重報人次的歧義計數。重報案例率指標的設置，增加了對普查重報現象的考查視角。目前各國普遍使用的重報人次率考察重報行為的發生頻次，而增加的重報案例率則是考察重報行為人的廣度?？疾旌笳?，有助于發現重報者的特征，為下次普查避免重報提供依據。建議國家統計局改變一直以來只估計重報人次率，而忽視重報案例率估計的做法，將我國重報估計水平提升到一個新的高度。

人口與經濟2022年3期

人口與經濟的其它文章: 市民化與農業轉移人口的共同富裕
——對“農轉非”居民工資同化過程的分析; 老齡化對技術創新的結構性影響
——總效應、異質性與時間上的結構性特征; 人口普查數據與行政統計數據偏離現象研究
——以中國四大城市為例; 代際互動與低齡老人勞動供給; 人口視角下中國城市收縮的演變特征與時空格局
——基于第七次全國人口普查公報數據的分析; 家庭養育成本對已育一孩夫婦生育意愿的影響
——基于2019年西安市五城區調查數據的分析

人口普查多報估計研究

一、引言

二、文獻綜述

三、人口普查多報估計理論

四、實證分析

五、結論與建議

一、引言

二、文獻綜述

三、人口普查多報估計理論

四、實證分析