樊佳佳
(上海市統計局,上海 200003)
人口常態化統計方法初探
樊佳佳
(上海市統計局,上海 200003)
當前,人口問題已成為影響上海這個特大型城市經濟社會發展的關鍵因素。對人口統計來說,現有人口統計制度框架下的人口統計成果已不能滿足現實需要。探索研究人口常態化統計,研究建立一套科學、完整的市區兩級常態化人口統計制度的可行性,以及探索完善人口數據評估方法,對跟蹤監測人口總量和分布、及時反映人口變化趨勢具有重要的現實意義。
人口管理;人口統計;常態化
人口是一個國家的最基本國情國力信息,世界各國都把掌握準確的人口數量、人口素質、人口結構和人口分布等情況,作為科學治國和宏觀決策的基礎。不同時期和不同地區有不同的人口問題①《轉型時期的中國社會人口》,黃榮清等,遼寧教育出版社。,為了保障人的生存和促進人的發展,實現人口和資源環境以及社會經濟協調發展,則必須有研究人口的科學,稱之為“人口學”。
人口統計學的研究是人口學的重要組成部分,主要是研究人口變動及其發展規律的,包括兩個基本方面的內容:一是人口變動,包括人口總量、出生、死亡和遷移的變動,也包括人口的性別、年齡的自然結構變動以及城鄉、地域、文化、民族、職業、婚姻和家庭等非自然結構變動;二是人口發展,即人口在與資源、環境、經濟和社會的相互作用下的發展。對上海這樣一個特大型城市來說,做好人口統計工作顯得尤為重要。
上海是全國人口最密集的城市。一直以來,上海的人口統計工作適時為全市提供人口統計數據。通過十年一次的人口普查、每十年一次的1%人口抽樣調查、其他年份的人口變動抽樣調查,提供上海人口總量、結構、分布等各方面的信息,為制定正確的經濟社會發展規劃和人口綜合管理政策起到了積極的作用。
隨著外來人口的成倍增長,上海人口規模在不斷擴大。戶籍人口人戶分離現象的日益突出,戶籍人口老齡化與外來人口老少人口的增長不斷沖擊著上海市“人口紅利”,上海市的人口問題越來越復雜。人口與資源環境、公共服務配置的矛盾、人口對城市承載力的壓力、人口未來發展等一系列的問題也越來越受到外界各方普遍的關注、關心與重視,對上海的人口統計工作也提出了更高的要求。
國際上,各國進行人口統計同樣采取人口普查與其他人口調查相結合的方式。如美國的人口統計調查就由十年一次的人口普查、每年開展的社區人口調查和其他人口專項調查組成。我國盡管現行的人口統計制度已基本與國際接軌,但由于戶籍二元體制、信息共享與安全性等因素影響,使得人口統計難度遠高于美國等其他國家。
(一)入戶調查的難度不斷增加
1.被調查戶的配合程度不斷下降。進入市場經濟時代后,政府干預力量退居幕后,居民保護個人隱私的意識不斷加強,市場各類商業調查擾民甚至冒用調查名義實施違法犯罪的活動時有發生,因此,居民對入戶調查的配合程度逐年下降。這是一定經濟發展時期的普遍現象。以美國的人口普查為例,1970年大約78%的家庭戶回復了調查問卷,1980年為75%,1990年為65%,2000年則下降為61%左右。
2.被調查戶的流動性不斷加大。具體表現為,一是戶籍人口人戶分離現象愈加嚴重,二是外來人口的流動特別頻繁。根據2010年第六次人口普查資料分析,上海戶籍常住人口共1404.71萬,按鄉鎮街道計算的人戶分離比例已達到了27.4%。根據現行的人口統計原則,被抽中調查的小區內的調查對象無論是戶口還是人口均要進行調查。因此,對那些長期人戶分離的人口的“戶口所在地”進行入戶調查填表,難度相當大。對外來人口來說,上海在近十年里增加了近600萬人,相當于一個中等城市的人口規模,2013年末,外來常住人口總量更達到了990萬人。而相當一部分外來人口的最大特點是居住地和工作崗位不穩定,入戶訪問遇到的難度很大,不易查準。
(二)非普查年份的抽樣調查對細分結構的數據代表性不足
雖然我國在兩次普查之間的間隔年份中,開展1%或1‰人口抽樣調查進行補充,但是無法取得與人口普查一樣完整的人口總量與結構數據。每年的1‰人口變動抽樣調查結合多種人口數據評估手段,基本滿足推算全市常住人口總量和幾個主要人口指標的要求。但受樣本規模大小的制約,其他細分結構數據如分年齡、分教育程度等人口結構,以及分區縣人口主要數據等信息,1‰人口變動抽樣調查樣本代表性不足。而每十年一次的1%人口抽樣調查的抽樣比雖更高些,但也是作為普查間隔年中五年的數據補充,只能基本滿足每五年人口結構數據的要求,無法得到連續年份的人口結構數據。因此無法滿足市政府開展人口管理工作中對各區縣人口匡算和分配提出的更密集、更精準的數據要求,無法實現人口統計科學、持續的結構數據服務的要求。
(三)人口統計基礎力量比較薄弱
1.受制于區縣及基層統計力量的薄弱等因素的影響,不少區縣對這項工作的重視程度不高,投入的人力精力有所欠缺,數據評估能力和水平提升不快。
2.通過評估雖然能較好地掌握全市人口總量,但由于外來人口的流動性較大,上海市戶籍居民的人戶分離現象日趨普遍,區縣統計局人口評估工作能力尚不足,對區縣人口的準確性缺乏把握,對鄉(鎮、街道)乃至村(居)委會人口的準確掌握更加薄弱。
3.數據評估主要依靠每年末開展的人口變動抽樣調查結果和相關部門的數據資料,由于調查匯總結果和統計報表的時間周期較長,所以在反映上海市人口總量等數據的頻率和時效性上存在明顯的不足,尚不能做到類似行政記錄一樣的即時反饋。
人口常態化統計,是指形成人口數據常規化統計制度,提供數據發布更頻繁、數據內容更豐富、數據實用性更強的人口數據。這其中,包含了人口統計調查、人口數據評估以及人口數據戰略分析的整體概念,在人口數據的廣度、深度、頻度等各個層次突破現有人口統計的瓶頸。
(一)進一步完善現有的人口統計制度
每一次的人口普查均會經歷很長一段時間的社會各界的經驗反饋與方案制定上的商討,對于普查的更新,主要由國家統計局主導。對上海來說,更多的可發揮的是非普查年份的人口抽樣調查,建議從改變調查制度和調查方式入手。一是使調查問卷設計更簡潔,包括姓名、性別、年齡、受教育程度、地址、就業情況等主要人口指標,盡量減少涉及個人隱私的問題;二是革新傳統入戶調查方式,使用電話訪問、網絡調查、自愿填寫問卷郵寄等多種方式相結合,來提高調查的成功率。除此之外,從提高數據質量和增強數據的銜接性方面提出兩點建議,一是不斷改進數據采集與錄入方式,降低調查誤差、提高調查效率;二是注重普查方案的可持續性,為歷史數據銜接與對比提供基礎。
(二)提高人口抽樣調查的代表性
目前,普查間隔年份開展的人口變動抽樣調查主要是為了推算全市人口總量服務的,而人口常態化統計的主要目的是為了取得每年度的全市人口結構數據與分區縣的人口數據。因此,在兼顧科學性與可操作性的原則下,我們必須對人口變動抽樣調查進行適當的擴樣處理。
考慮到調查數據結果的科學性,在現今調查經費制約條件下,我們對調查的目標指標、置信區間、允許誤差進行計算,根據上海的實際情況,我們主要的目標指標是分區縣戶籍常住人口與分區縣外來常住人口,樣本擬分布所有鄉鎮街道,涉及全市20%左右的村(居)委會。因此,針對不同區縣的戶籍常住人口的人戶分離情況與外來常住人口比重來計算抽樣方案。通過計算,當全市各區縣常住人口總量的相對誤差控制在5%左右,調查的把握程度為95%(t=1.96),共需要調查樣本量71萬人左右。這意味著,要將平常年份的人口變動抽樣調查1.5‰的抽樣比提高至3%左右。
擴樣抽樣調查雖然是目前公認最科學地獲取人口數據的統計手段,但對非普查年份的人口變動抽樣調查進行擴樣,每年需要付出大量的人力、物力和財力。在統計基層力量比較薄弱、入戶調查環境比較嚴峻的形勢下,進行大樣本抽樣調查的工作壓力相對較大。
(三)完善大數據平臺進行人口數據評估
由于人口的流動性與不可預測性,人口統計的難度遠大于經濟統計。人口總量的變動與人口結構的變化受到政治、社會、經濟和文化等各方面因素的影響,上海的人口數據不僅需要從抽樣調查結果中進行科學測算,也需要利用更多與人口相關信息資源對數據結果進行科學嚴謹的深入分析與評估。
設想通過完善現有的人口數據平臺,充分利用與人口相關的各類大數據對現有數據資源進行評估,一方面包括官方人口數據,另一方面包括社會各領域的人口大數據信息,進一步整合兩方面的大數據資源,在抽樣調查結果的基礎上,通過信息數據評估手段來實現人口常態化統計,具體思路如下圖所示。

圖1 建立大數據平臺的思路示意圖
(一)整合官方人口數據資源,增加人口數據發布頻率、豐富數據內容
目前來看,全市各委辦部門涉及人口數據的口徑繁多,數出多門,主要包括公安系統的“兩個實有”人口信息管理系統、衛計委的流動人口動態監測、疾控中心的生命統計數據、老齡委的老年人口監測、出入境管理部門的境外人口數據、教育部門的學前及學籍人口數據等。這些分散在各委辦部門的相關人口數據,一直以來都是市統計局每半年對全市人口總量進行評估時參考的重要資料。但是,由于缺乏牽頭部門進行統一整合利用,這些政府部門的人口數據資源目前還處于指標口徑不統一,統計時間不固定、統計范圍不一致、數據庫無法共享的階段,對人口統計數據的評估帶來一定的難度。
在加強人口管理的大背景下,我們需要對各方人口信息進行整理規范,并對數據統計發布與數據共享進行統一。但是,官方人口數據庫的建立與維護是項龐大的工程,需要由市政府出面,確定牽頭單位,整合各相關部門共同開展。
根據現行政策要求,所有數據必須由統計局進行發布,故統計部門必須承擔起對人口數據庫進行系統、規范、大規模的數據整合的責任,主要包括:
1.整合現有部門人口數據。目前,上海各委辦部門的人口數據雖然看上去種類繁多、數據豐富,但由于指標口徑、統計時間、登記范圍等因素的影響,數據并不能通用,需要對各部門數據進行整合(表1)。

表1 各部門人口指標比對表
比如,公安部門的“實有人口”數據涵蓋了全市所有區域的實際居住人口,是個非常有價值的人口數據信息庫。自2009年開始建立“實有人口”信息系統以來,該系統通過全市1.4萬名人口協管員的實地監測,打通戶籍與非戶籍之分,不僅包括了實有房屋和實有人口的數據,更將所有持有居住證與臨時證件的外來人口全部登記在內,使得上海的人口管理實現完全信息化。但是,由于實有人口信息庫中判定外來人口的依據主要是以居住證為主,對那些持臨時證件或未持證的外來人員,則以“居住在上海時間超過一天”為標準。因此與統計口徑“常住人口”的“離開戶籍地半年”判斷標準無法吻合,這就造成了兩家數據“名稱相似、口徑不同”的局面,使得外來人口這一數據的相互校核與分析上產生了問題。
對此,可以通過在實有人口登記表上增設“離開戶籍地半年與否”的指標來解決這一問題,從而解決數據整合分析上的困難。
又如,早在2009年市統計局就提出過利用社保卡信息進行數據校核與評估的辦法。社保卡的優勢在于,一是人口覆蓋率高,二是數據信息豐富。自1999年發放至今,全市社保卡發卡數量已達1400余萬張,戶籍人口基本人手一卡,卡內收集包含了姓名、性別、受教育情況、婚姻情況、就業情況等基本人口信息。但是,它也存在先天缺陷,即信息更新不夠快。對戶籍人口來說,如果沒有就學、就業、就醫等行為,那么卡內信息就基本維持在登記開戶時的內容,這使受教育情況、婚姻狀況、就業情況等信息有所滯后。
對此,建議將社保卡信息與公安部門的戶籍人口信息進行整合,再輔以人口普查的戶籍人口信息庫進行補充,基本可以掌握實時的戶籍人口基本結構狀況。
2.評估部門數據后進行常態化發布。一部分數據經過整合與綜合評估后,可以每月發布,比如:戶籍人口的自然變動情況(出生人數、死亡人數)、戶籍人口遷移情況(戶籍遷入遷出人數)、常住人口婚姻生育情況(結婚、離婚人數與生育數據)、出入境數據等。
另一部分數據可以按季度發布,比如:戶籍人口就業情況(就業人員數、新增就業人數、失業率)、分年齡戶籍人口數等。
更多的詳細數據按年度發布,比如:全市常住人口總量、人口主要結構(戶籍人口、外來人口等)、人口區域分布(分區縣常住人口總量、戶籍人口與外來人口分布)、人口年齡結構(各主要年齡段人口、老齡化率、戶籍人口與外來人口年齡分布、社會撫養比)、城鎮化率(質量評價體系)、勞動力數據(就業人口、失業率)等。
基于官方數據建立的人口統計數據評估平臺,將成為最權威的人口統計數據發布和各部門人口數據共享互利的平臺,這是實現全市人口數據常態化統計的重要基礎。
(二)創建社會各領域的人口數據平臺
隨著社會發展速度不斷加快,社會各類信息愈加豐富,更多的與人口相關的影響因素也在不斷增加。充分利用社會各界與人口相關的數據資源,建立一個“人口大數據平臺”通過對大數據的時點跟蹤分析,對人口數據趨勢進行研判,使其成為人口評估的重要手段。與其他城市相比,上海在人口大數據的建立上已具有一定實力與基礎。
1.搜集社會領域人口數據創建平臺。近兩年來,除了依靠對官方人口行政記錄的整合分析進行人口數據評估,更多的在通過市、區、街(鎮)、居(村)委多級統計力量在做基礎資料的搜集與分析。每半年,市統計局都會根據評估數據的要求,從統計局層面進行經濟類數據、社會保障類數據的整理,從街鎮層面進行各區域的影響人口變動因素的數據的收集(表2)。

表2 現有人口數據評估數據體系表
2.把握“智慧城市”的契機創建平臺。上海的誠信體系建設相對比較完善。通信業、銀行業、房地產業以及公共資源服務提供領域,都建立了相對比較完善可信的用戶數據庫。上海產業界各類數據資源積累非常豐富,僅以全市通信基礎設施來看,目前全市光纖接入使用用戶超過320萬戶,全市家庭寬帶普及率超過60%,WLAN覆蓋場所總量已達1.8萬處,完成全部456處場所i-Shanghai建設并投入試運行,4G建設完成TD-LTE網絡800個宏基站和300個室內覆蓋站點建設。此外,上海近年來重點推進云計算、物聯網、移動互聯網產業的發展,這些都為大數據應用提供了基礎性條件。我們可以充分利用這些產業界的積累資源來進行人口數據的分析。
3.更多的有實用性的目標數據資源。
(1)移動、電信等手機用戶信息。由于上海的手機普及率相當高,通過對手機持有人規模、變動等信息的分析,可以對全市及各區域人口結構、遷移情況進行校核。
(2)居民用水電煤用量等居民日常生活消耗信息。人口消耗的日常品數據是判斷人口規模變動趨勢的重要信息,通過跟蹤比對居民用水電煤、鹽等有關數據,可以獲取全市及各區域的人口變動趨勢。
(3)房地產行業的用地情況、房屋售賣與空置情況等。人口與土地的關系是眾多超大型城市研究的課題,分析上海土地與人口關系,有助于評價全市人口總量及城市人口承載力發展的趨勢。
(4)公共服務資源類信息,包括交通、就學、就醫、買房等各類信息。跟蹤比對此類信息也可起到對人口總量校核的作用。
目前,建立“人口大數據平臺”還只是設想,平臺的建立需要進行綜合全面的分析與研究,如何在浩瀚繁雜的人口數據信息中選擇實用性強、代表性強、操作簡便且數據指向性意義高的內容進行整理與分析,是一項嚴峻的課題。
首先,要明確所需人口資料的來源,主要是搜集相關產業的各類人口資源,并對數據資料進行科學性與可操作性的分析判斷。
其次,要進行數據處理的“統計化”處理,也就是將各類不合規范、無法統一使用的數據進行規范化處理,包括統計口徑的規范化處理,數據代表性不足的結構性補充等。
另外,還需要提供強大的數據信息處理后臺服務。所謂“大數據”(Big Data)就是指需要新的處理模式、能夠具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從技術上看,大數據必須依靠云計算進行分布式架構的數據挖掘、云存儲與虛擬化技術。因此,有了軟實力上的數據需求分析,也需要硬實力上的服務器支持與云計算分析。
以此為基礎,隨著不斷充實與更新不同渠道、資源的人口信息,滴水穿石、累沙成丘。建立起海量人口類數據平臺后,經過多樣化的信息處理與數據挖掘,我們就能突破以往的單純依靠抽樣調查進行數據發布的舊模式,向數據發布更頻繁、數據內容更豐富、數據實用性更強的新模式轉變。
[參考資料]
[1]轉型時期的中國社會人口,黃榮清等,2004年,遼寧教育出版社;
[2]從美國社區調查看美國人口統計方法制度的改革,胡英,2004年,市場與人口分析;
[3]美國人口普查局網:http://www.census.gov/。
(責任編輯:曹家樂)