陳友華,孫永健
(南京大學 社會學院,江蘇 南京 210023)
人口是一切社會經濟活動的基礎,人口統計數據是政府中長期規劃與各項經濟社會政策制定的基礎與依據。我國人口統計數據的收集主要以國家統計局組織的人口普查為基礎,兩次普查之間的1%人口變動抽樣調查和每年一次的人口變動抽樣調查作為收集人口數據的輔助手段,形成了定期人口普查、人口變動抽樣調查與常規行政統計等多元人口統計體系。
然而,我國不同渠道與口徑下的人口統計數據之間卻存在明顯的差異。例如,第七次全國人口普查公報一經公布,便引起了社會各界的廣泛熱議,特別是第七次全國人口普查數據與往年人口數據之間難以相洽而導致了所謂的“數據之惑”。其實,以往研究早已捕捉到了人口普查數據與行政統計數據之間的某種偏離現象。鐘水映在中國人口統計誤差分析中提及,常規的人口統計和人口普查之間存在人口規模上的差異。楊貴軍等也發現中國非普查年度人口總數常常與普查年度人口總數之間存在較大差異。還有很多研究則從流動人口、出生人口、生育率等維度出發,探討了不同統計渠道的人口指標之間的區別與矛盾。不過,上述研究往往對這種差異本身的縱向特征、形成原因與對策建議討論不足,且缺少有針對性的區域視角的研究。
本文選取北京、上海、廣州、深圳四大城市為研究對象,旨在回顧與總結以往大城市人口普查數據與行政統計數據之間的差距,描述兩者之間的偏離程度和縱向變化特征,進而分析偏差來源及其形成原因,提出相應的治理對策,以期在未來政策文本與規劃編制中盡量規避統計偏差所引發的種種負面效應。
1.數據說明
人口普查是世界各國或地區人口統計的基本方法,中國人口普查每十年組織一次,并且在嚴謹調查設計基礎上,投入了大量的人力、物力和財力。盡管也有不少學者質疑人口普查本身的質量,但當其他類型人口調查與人口普查數據發生矛盾時,一般還是以人口普查為基準來糾正、覆蓋其他類型人口調查數據,而不是相反。人口普查相較于其他人口調查,屬于更全面、更準確的權威數據源,通常被作為基期資料使用。特別是第七次全國人口普查首次使用了電子登記與身份證驗證等信息技術,加之疫情防控與不經地方匯總的影響,“七普”數據質量得以極大提升。實際上,許多西方國家和聯合國人口統計司都會在人口普查數據公布之后,對以往非人口普查年度的各類社會經濟指標進行修訂,中國自然也不例外。
本文選取四大城市行政統計人口數和普查修正人口數作為關鍵研究變量。行政統計人口數來自于各地方政府歷年發布的《國民經濟和社會發展統計公報》,該系列數據由地方統計局或國家統計局地方調查隊負責收集,數據公布較為及時,但僅涉及總人口及其年齡與城鄉構成、出生、死亡、流動等少數幾個主要人口數據。
經人口普查數據修正后的人口數值主要來源于各級統計部門發布的《統計年鑒》。該類《統計年鑒》為按年連續出版的大型統計資料書,大部分城市的《統計年鑒》會根據最新人口普查數據對以往年份常住人口行政統計數據進行修正,以此來糾正先前的數據記錄。例如,《北京統計年鑒2021》在“常住人口(1978—2019年)”數據集中就注明“2006—2009年常住人口、出生率、死亡率等數據根據2010年人口普查數據進行了修訂;2011—2019年數據根據2010年、2020年兩次人口普查結果進行了修訂”,而此前根據《北京市國民經濟和社會發展統計公報》匯總的人口數據則被更正。
2.指標構建與方法設計
第一步,本文借助“人口增長速度”作為輔助考察指標。人口增長速度是指該年的行政統計人口增加數與上一年度人口數之比,計算方法如下:

(1)
可以用上述公式考察行政統計公布的相鄰兩年的人口增長之間的非連續性或跳躍性,該指標更加直觀地反映行政統計值的變化規律,由此判斷人口統計數值的合理性。
第二步,本文以人口普查修正后的人口數為準線,構建了行政統計人口數的偏差率指標,進而對各地區不同年度的人口普查與行政統計展開差距分析,計算方法如下:

(2)
如果該指標大于0,意味著行政統計人口數大于人口普查修正數,非人口普查年度行政統計人口數高估了人口規模,反之則意味著行政統計人口數小于人口普查修正數,非人口普查年度行政統計人口數低估了人口規模。相對于其他社會經濟指標而言,人口規模是一個惰性與累積變量,即使考慮到城際間的人口流動,人口規模在短時間內的變動幅度一般也很小。此外,北上廣深等超大城市的人口體量龐大,哪怕是1%的偏差也可能導致十萬級的人口誤差。鑒于此,本文在定義偏差率的判別標準時給出的閾值都較低,即判定數值都相對很小:以0為臨界值,當該指標的絕對值小于1%時,表示行政統計人口數較為準確;當該指標的絕對值介于1%到2%時,表示行政統計人口數存在輕微偏差;而當該指標的絕對值大于2%時,則表示行政統計人口數出現了嚴重偏差。
1.2000—2020年行政統計口徑下的人口增長速度
表1匯總了2000年以來北上廣深四大城市在行政統計口徑下的人口增長速度,結果表明:第一,四大城市作為人口大規模遷入地,城市人口規模長期保持增長。第二,受到種種人口與政策因素,特別是超大城市人口調控政策的影響,自2015年后,北京和上海部分年份的人口規模開始下降。第三,人口變動存在明顯的跳躍性或非連續性,具體表現為每逢人口普查年,人口會“突生性”地增長,遠遠高于相鄰非人口普查年份的人口增長速度。由此可以推斷,大城市非人口普查年份的人口增長速度存在被嚴重低估的傾向,并且這種低估具有系統性與長期性,期間“遺漏”的部分人口會以人口普查年份“突生性增長”的方式得到“補償”。

表1 2001—2020年四大城市行政統計人口增長速度 %
2.2000—2010年普查與行政統計間差距分析
如果行政統計數據質量較高,則行政統計人口數與人口普查修正值之間應該比較接近,行政統計偏差率理應圍繞0上下浮動,系統性高估或低估均表明行政統計出現了較嚴重的偏差。表2呈現出四大城市在“五普”與“六普”期間(2001—2009年)的行政統計人口數及偏差率,揭示出某些人口是如何在非普查年份被系統性遺漏,又如何在“六普”結果公布后被一次性修正。具體而言,北上廣深四大城市的行政統計值在人口普查年會定時回歸人口普查值,但在非人口普查年份均系統性地低于人口普查修正值,從而長期低估了城市的人口規模,其中上海最為嚴重,廣州、深圳和北京次之。

表2 2001—2009年四大城市人口行政統計及系統性低估 萬人,%
從偏差率的變動趨勢來看:北京2001—2005年常住人口的低估程度相對較小,而越接近2010年低估的程度越嚴重,偏差率的絕對值呈逐年放大之勢,反映出系統性偏差的累積效應。上海2001年常住人口的低估程度已較為明顯,而越接近2010年低估的程度越嚴重,偏差率的絕對值同樣呈逐年放大之勢。自2005年起,廣州和深圳的偏差率也呈現類似的變動規律。
3.2010—2020年普查與行政統計間差距分析
表3同樣以北上廣深四大城市為例,考察其“六普”與“七普”之間(2011—2019年)行政統計人口數及偏差率,再次揭示了常住人口“從系統性遺漏到一次性修正”的偏離怪象。相較之下,此階段各市人口的行政統計均存在系統性低估問題,且愈發明顯。其中,廣州和深圳最為嚴重,廣州最大偏差率高達-17.11%,深圳更是達到了-21.81%。上海、北京次之,上海最大偏差率為-2.14%,而北京則不超過-2%,這或與近年來北京市、上海市人口調控政策實施有關,也可能受到生育政策逐步放開的少許影響。

表3 2011—2019年四大城市人口行政統計及系統性低估 萬人,%
從偏差率的變動趨勢來看,廣州、深圳、上海和北京的偏差率的絕對值呈逐年放大態勢,同樣出現了系統性低估的累積效應。
4.偏離曲線:從系統性遺漏到一次性修正
總體而言,我國諸多大城市出于對人口總量控制、流入人口限制以及計劃生育的響應,這些城市的行政統計人口數常年低于人口普查修正數,存在系統性低估。大城市流動人口占流入地人口比重大,對流入地人口指標的影響顯著,加之北上廣深等特大城市作為重要的經濟或政治中心,其人口數量問題常年飽受社會各界熱議。因此,本文聚焦于此類人口集聚與經濟發達城市的人口統計問題,由此勾勒出人口行政統計“從系統性遺漏到一次性修正”的偏離曲線,呈現出人口普查與行政統計之間的偏離怪象,如圖1所示。

圖1 大城市人口行政統計數據“從系統性遺漏到一次性修正”的偏離曲線
分析偏離曲線可知:①非人口普查年份,大城市人口的行政統計值系統性地低于普查修正值,期間每年都會“遺漏”部分人口;②隨著時間的推移,行政統計“系統性遺漏”的人口會累積,造成人口普查年度的前一年(如+9年、+19年……)產生明顯的“數量缺口”;③每逢人口普查年,人口的行政統計值便以普查值為準進行糾偏,“一次性修正”前9年中累積的“遺漏人口”,兩條曲線發生短暫重合;④行政統計口徑的人口增長速度會明顯小于普查口徑的人口增長速度,并且前者的縱向變化具有明顯的非連續性。
需要說明的是,偏離曲線的勾勒是基于對典型大城市的實證考察與理論抽象而形成的,實際的行政統計人口數與人口普查修改人口數之間的關系要比偏離曲線復雜得多。這里的偏離曲線十分類似于韋伯(Weber)所說的“理想類型”,在現實生活中可能并不完整存在。換言之,現實人口的行政統計值與人口普查修正值均不是完美的線性曲線,常出現波動式變化。此外,并非所有大城市的人口行政統計均符合偏離曲線的變動規律,部分城市在某些時間節點上可能具有理想類型的主要特征,但其余時間段則表現不明顯。
1.人口普查與行政統計之間偏離的成因
大城市行政統計人口數與人口普查修正人口數之間發生偏離有其復雜的成因,既有客觀層面的因素,這是任何社會科學調查研究都難以避免的,屬于內在固有因素;也有主觀層面的成分,即會受到制度、經濟和社會等諸多因素的影響,它們屬于外在干擾因素。
第一,人口調查對象具有復雜性和不可重復性。任何形式的人口調查,無論調查方案設計得如何科學、調查過程控制得如何嚴密、資料處理得如何規范,都仍將受制于調查者和被調查者自身的主觀傾向、客觀條件、調查目的等因素的影響與制約。因此,在種種現實條件束縛下,人口統計中出現的某些偏差本就不可能徹底消除。
第二,相對于人口普查而言,行政統計所需的人力、財力、時間等基礎條件相對缺乏。政府統計工作者和基層單位統計人員承擔的調查任務非常繁重,除了定期開展的各項社會經濟普查與抽查,還包括其他規模不等的調查和定期統計報表等。加之,行政統計填報時間短、調查頻率較高、經費相對不足、實際調查難度大,種種因素致使行政統計對人口總量的精準統計更加棘手。
第三,人口遷移與流動為人口統計調查帶來了極大挑戰。隨著對人口遷移流動限制的逐步松動,大規模的人口遷移流動成為常態,2020年第七次全國人口普查資料顯示,中國的遷移流動人口數量仍在持續增加。人口遷移流動更可能導致區域人口統計指標失真。更為重要的是,人口普查與行政統計有關流動人口的調查口徑在流動時間、空間單元和登記方式等方面并不完全統一,進而導致統計結果之間的偏差。例如,針對流動人口數量龐大的現實,“六普”采用了雙口徑方法,流動人口在戶籍地和常住地同時登記,再由人口普查部門進行“去重”,大大降低了漏登率。而大城市在行政統計過程中,一方面僅能從本地(即人口流入地)展開調查,難以實施雙口徑法,另一方面對于常住人口的判定也更為嚴格,結果促成了“系統性的遺漏”。
第四,與人口普查相比,人口行政統計的規范性和客觀性有待提升。郭志剛對歷年統計公報中人口指標的研究發現,在沒有嚴格、詳細的人口推算與統計測算的前提下,個別指標經歷了有針對性的明顯調整,結果是歷年公報的人口統計與實際調查結果之間出現了一定的差異。而一旦統計年報中的人口統計值被大大低估,由此進行各項人均指標換算與檢驗時,就會產生人均占有數高估的現象,最典型的是北上廣深等流動人口流入較多的大城市的人均GDP、人均收入等統計指標可能被大大高估。
2.人口行政統計偏差的治理對策
(1)辯證看待人口行政統計的作用與限度。本文所揭示出的系統性遺漏這一客觀事實,無疑促使我們重新審視與反思人口行政統計的作用。
一方面,政府與學界應當充分正視行政統計的偏差所在,在相關政策制定與學術研究中要特別重視大城市常住人口被低估以及其后果。行政統計得到的人口年報是中央和地方政府決策時的重要依據,也是事后考核國民經濟和社會發展成果、居民生活水平的關鍵指標。各區域人口是最基本、最重要的國情國力統計,嚴重偏誤的人口數據不僅對國民經濟與社會發展規劃極為不利,也將誤導后續政策制定與變革,無益于諸多社會經濟問題的化解。因此,在對區域人口(特別是大城市人口)進行抓取與分析時,應當主要以人口普查數據為準,非普查年則以事后人口普查修正值為準。若暫時無法獲取最新《統計年鑒》或還未等到新一輪人口普查數據,則應對行政調查數據有甄選、有條件地使用,必要時可進行適當的調整與修正。
另一方面,也不可全盤否定人口行政統計的價值。行政統計存在的意義本就是為了彌補人口普查耗時耗力的缺陷,從而在有限的時間與資源約束下,為人們連續性地了解人口數量及其變化提供某種可能。人口普查與行政統計的定位在根本上存在差異,因此不能以前者的高標準來要求后者,要辯證地看待行政統計的作用和限度。
(2)轉變人口控制為主的政策理念與實踐。首先,深刻反思過去以人口控制為主基調的人口政策理念。我國人口政策長期以來是以人口預測為基礎,以人口與計劃生育政策為干預手段,以實現預期的人口控制目標。無論是全國層面持續數十年的嚴厲計劃生育政策,還是區域層面“控制大城市規模,合理發展中等城市,積極發展小城市”的政策指導,都使人們對待人口數量問題特別敏感與謹慎,對于人口集中與產業集聚的大城市而言更是如此。及時改變人口控制思想,有利于人口統計工作回歸科學范疇,也可促使人口普查與行政統計之間的偏差分布呈現方向隨機性而非單一性。
其次,盡快推動戶籍制度的改革與完善。人口變動有其自身的發展變化規律,并不完全取決于人口政策規定。例如,不少學者考察了北京市人口規劃工作的發展歷史,發現北京近30年來的人口發展是一個不斷突破總規化目標的過程,人口規模預期指標長期低于實際人口。其實,人口本就存在一種基于理性選擇下的自合理分布機制,但戶籍制度及在此基礎上的包括教育、就業、醫療與社會保障在內的一整套制度安排卻事實上制約著勞動力的自由流動,使得許多大城市常住居民遲遲未能享有同等的勞動力市場機會、社會保障和公共服務。因此,流動人口很難在流入地定居下來并獲得當地的戶籍,取而代之的是頻繁的短期流動,而這在春節等時期表現得尤為明顯,不僅給人口的年度統計帶來了巨大困難,而且還可能因人口流動導致疫情擴散等社會問題。
最后,重新審視由系統性遺漏所帶來的政策偏差與風險,并采取相應的補救措施。對大城市而言,系統性遺漏可能會導致政府規劃對城市規模的預計不足,引發公共服務供給不足,所提供的土地、住宅、基礎設施、公共服務將不能滿足實際人口需要。如若政府不能意識到行政統計對人口的低估并及時糾偏,反而將各類“大城市病”歸咎于外來人口,就會引發新一輪對人口規模的擔憂與低估。因此,借助人口普查及修正值,應重新評估與反思過往的部分政策實踐,對于由系統性低估造成的公共資源配置不足,要及時補充與完善,更好地平衡人口與經濟社會之間的關系。
(3)加強人口行政統計的科學管理。首先,明確與統一人口指標(特別是遷移流動人口)的概念與口徑。西方國家由于實行自由遷徙,并且建立了覆蓋全國的社會保障體系,因此對人口遷移、流動的概念界定相對單純。基于中國的戶籍制度,統計、公安、衛生健康等部門出于不同的行政目的,常常對同一群體展開調查,過程中采用的概念分類與統計口徑不盡相同,其結果會造成不同來源渠道數據之間的偏差。故而,為了提高人口行政統計的準確性與可比性,應盡快明確和統一不同區域、各級政府在人口調查中的指標使用,盡可能以人口普查的概念界定與統計口徑為指導標準。
其次,進一步明晰人口統計工作的責任主體,建立信息共享機制。盡管統計局是中國各級政府的官方統計機構與官方權威發布機構,但人口行政統計主要有國家統計局、公安部、國家衛生健康委員會(主要是出生數據)三大數據來源。此外,也與民政、教育、人社、街道社區、企業的信息系統密切關聯。人口行政統計質量的提高有賴于責任制的健全,應將責任落實到少數且具體的機構,為后續偏差追責與質量監管提供明確主體。
再次,保障行政統計的經費投入,提高統計隊伍的政策水平和工作能力。要確保人口統計數據質量,需要有充足的資金輔助運轉,進而才能夠在保證統計工作順利完成的基礎上提升人口統計數據的質量。但與此同時,人口統計也要注重提高資金利用率,將經費使用情況納入年終考核目標,防止財政資源的錯配與浪費。在“財力”有所保障的前提下,不斷強化“人力”支持,加強統計隊伍建設,加大統計工作培訓力度,不斷夯實年度人口統計基礎工作。
最后,充分利用現代信息技術與手段。隨著科技進步,我國已經步入數字信息時代,人口統計調查也需要緊跟時代步伐。現代信息技術可以幫助人口調查簡化工作流程、提高工作效率、改善數據質量。例如,大數據與云計算技術便能夠搜集全國統一且人人獨有的鑒別碼來提高人口數據匹配的速度和準確性,從而更好地剔除統計中的重報,“七普”人口數據質量的顯著提升便得益于此。作為經濟發達地區,大城市具備更優越的科技支持與數字條件,因此其人口行政統計與信息技術展開融合會更為便捷,也更容易向“七普”技術看齊。
本文匯總了2000—2020年間中國四大城市的人口普查與行政統計數據,通過構建“行政統計偏差率”這一指標,對各市歷年人口普查修正值與行政統計值進行差距分析。結果顯示,北京、上海、廣州、深圳等經濟發達地區的行政統計人口數常年低于人口普查數,存在系統性低估。基于對偏差率的縱向分析,本文勾勒出人口行政統計“從系統性遺漏到一次性修正”的偏離曲線,揭示了人口普查與行政統計之間的偏離怪象。這種系統性偏離,既源于社會調查固有局限等客觀因素,也受到制度、經濟和社會等諸多干擾因素的影響。
針對大城市人口行政統計的系統性遺漏問題,本文提出相應的治理對策:一是辯證地看待人口行政統計的作用與限度,既要充分正視行政統計的偏差所在,在相關政策制定與學術研究中要重視大城市常住人口的低估及其后果,也要理解行政統計自身的局限,不可吹毛求疵;二是轉變人口控制為主的政策理念與實踐,盡快推動戶籍制度及其在此基礎上的一整套制度的改革與完善,重新審視由系統性遺漏所帶來的政策偏差與風險;三是加強人口行政統計的科學管理,明確與統一人口指標的概念與口徑,明晰人口統計工作的責任主體,保障行政統計的經費投入量與資金利用率,提高統計人才隊伍的政策水平和工作能力,充分結合現代信息技術與手段。
“中國究竟有多少人”、“大城市究竟能容下多少人”等均是嚴肅且重要的議題,我們要充分認識到幾個百分點的偏差也可能造成相去甚遠的結論,任何政策制定與科學研究對于人口數據的使用都應該審慎為之。本文在有限數據資料的基礎上對人口普查與行政統計之間的偏離現象進行了初步研究,揭示出行政統計對大城市人口的系統性誤判及其成因。盡管人口統計調查中存在不可回避的本源性缺陷,但很多人為干擾因素是能夠通過制度規范得到解決的。本文無意于否定人口行政統計的意義,反而希望未來各項人口調查質量能有所提升。希冀更多的人加入相關研究中來,以推動中國人口統計更好地回歸科學價值與政策指導意義。