王 鑫,周景博,鮑 勁,安海蓉,董廣霞,李 巍,丁 凱
1.中國環境監測總站國家環境保護監測質量控制重點實驗室,北京100012
2.中國人民大學環境學院,北京100872
中國環境統計制度始建于1980年,經過30多年的發展,已有一定的基礎,尤其是第一次污染源普查和其后隔年一次的污染源普查動態更新調查,為及時和準確了解污染源及污染物產排情況提供了良好的信息支持。但隨著對污染源情況的準確把握,現行環境統計中存在的一些問題也暴露出來,其中一個技術問題就是工業源重點調查單位的篩選原則問題,即重點污染源與非重點污染源的分界點確定問題[1]。分界點的確定直接關系到環境統計數據質量,根據工業污染產排的實際情況來確定新的分界點,是環境統計實務的切實需求,但在研究領域,尚未有對這一研究需求的回應,文章從理論和實證層面的探索是首次。
按目前環境統計制度規定,工業企業污染排放及處理利用情況的調查方法為對重點調查單位逐個發表填報匯總,對非重點調查單位的排污情況實行整體估算,其中,重點調查單位的定義是其主要污染物排放量占各地區(以區縣為基本單位)全年排放量的85%以上。85%這一分界點的確定由來已久,且根據環境統計要求最基層環保部門的統計重點調查范圍的排放量達到85%的要求,下級篩選的重點調查單位名單中必須包括上級重點調查單位名單中位于本轄區的企業,結果造成市、省和國家級統計中重點調查單位所占比例的逐級升高,繼而在非重點調查單位估算中仍按照15%的比例估算,造成環境統計數據偏大的問題[2]。
目前分界點確定存在的主要問題,一是缺少明確的統計理論支持,二是未能反映污染產排的現實情況。針對這些問題,文章首先基于統計分布和抽樣調查基本理論,提出工業重點調查單位分界點確定的基本思路:確定目前工業污染物產排指標的分布情況,確認將污染源區分為重點和非重點的目錄抽樣調查方法的可行性,進而,采用離散系數法和分組法來確定分界點,并將之與現行環境統計調查的分界點進行比較;之后,采用河南污染源普查動態更新調查數據(2010年數據)進行實證研究,確定新的分界點。
應用河南省數據進行實證研究,數據來源于中國環境監測總站于2011年開展的全國污染源普查動態更新調查,數據時點為2010年,數據質量經過核查,較為可靠。數據為企業數據,包括45 213家工業企業。河南省是中國工業大省,工業部門較齊全,工業污染源產排情況在全國有一定的代表性。文章選擇了38個指標,如表1所示,涵蓋了幾乎全部污染物產排指標。指標包括兩類,一般指標和重點監察指標,對于一般指標,按現行環境統計制度,以產排累計量85%為分界點區分重點單位和非重點單位;對于重點監察指標,則凡有產排的企業均計為重點單位,參與全面調查。

表1 工業污染源污染物產排指標清單
確定分界點的基本思路是,首先要分析總體分布特征,確定其是否適合于通過選擇分界點來區分重點和非重點污染源;其次,分界點的確定方法有多種,要通過比較來選擇合適的分界點。
總體分布特征是決定環境統計調查方法的前提,確定分界點的目的是為了采用目錄抽樣法來進行調查。目錄抽樣是全面調查和抽樣調查相結合的一種調查方法,對重點單位進行全面調查,對非重點單位進行抽樣調查;目錄抽樣也是一種特殊的分層抽樣,將總體分為重點和非重點兩層。理論上說,目錄抽樣適合于高度偏斜總體,即總體由指標值較大而數目較少的單位和指標值較小而數目較多的單位兩部分組成,只有這樣的總體才適合把重點和非重點區分開,對不同的樣本采用不同的調查方法[3]。現行環境統計制度把污染源區分為重點和非重點,本質上是目錄抽樣的思路,但是否適用這種思路,還是需要首先來對總體是否符合偏斜總體的特征進行確認。
對全部38個指標的總體分布進行描述統計分析,發現所有變量均為尖峰(峰度大于3)、右偏(偏度大于零)分布。進一步的分析表明,所有污染物產排指標都呈現高度偏斜,以SO2產生量指標為例,如表2所示,可以看到,0.34%的企業產生了25%的SO2,29.11%的企業產生了95%的SO2,意味著70.89%的企業產生了5%的 SO2。其他指標也有類似特征。即,各污染物產排指標的總體均大致包括兩個部分:少量指標值非常大的單位,大量指標值非常小的單位。這種特征非常適合于采用目錄抽樣,將總體分成兩層,少數指標值較大的單位構成重點單位層,大量指標較小的單位構成抽樣調查層,前者進行全面調查,后者進行估算。下一步的關鍵就是找到和選擇分界點。

表2 SO2產生量與企業數累積比例比較 %
目錄抽樣方法有效應用的關鍵在于尋找出一個最優的分界點,來劃分企業的重點(大)和非重點(小)界限。確定分界點的主要方法有主觀判斷法、圖示法、離散系數法、分組法和偏度、峰度測度法。無論哪種方法,其基本目的都是一致的,即把具有大指標值的重點單位和具有小指標值的非重點單位區分開,但具體做法有差異。其中,主觀判斷法和圖示法都在很大程度上依賴于主觀判斷,偏度、峰度測度法對歷史數據需求較高且必須有相應的軟件或程序支持,否則工作量龐大無法接受[3]。因此,主要采取離散系數法和分組法來確定分界點。
離散系數法的基本思路是,高度偏斜總體的離散程度很大,這主要是由極端值(重點單位指標值)的存在引起的,隨著極端值的逐步剔除,總體的離散系數將呈減少趨勢,剔除的極端值越大,總體離散系數減少得越多越快,當全部極端值剔除后,繼續向外剔值(非重點單位指標值),離散系數仍將繼續減少,但減少的速度和幅度都比剔除極端值時大。因此,可以根據離散系數下降的情況來確定分界點。具體做法是,先將總體按指標值大小排隊,計算總體離散系數Vσ=σ/X。其中,Vσ表示總體離散系數,σ表示總體標準差,表示總體均值。在總體呈高度偏態分布時,Vσ必然很大。從總體中剔除指標值最大的單位,重新計算。逐個剔除指標值大的單位,直至Vσ變動成穩步減少為止。離散系數法對穩步減少并沒有嚴格的界定,一般由分析者根據具體情況來定。這里,定義穩步減少為離散系數的減少幅度很小(小于1%)且減少的幅度和絕對值保持穩定、緩慢變動。
分組法首先也是將總體按指標值大小排隊,然后將之分為離散程度相當的若干組(一般最多分為6組),將其中標志值最大的組作為重點單位組,全面調查,其余的組作為非重點單位組。要找到這一分組,首先需要將總體等距分成較多的層,然后不斷調整,直至將總體劃分為離散程度相當的組。分組法的算法分為2種,樣本含量(容量)的最優配置法(下稱為分組法1)和總體分布函數已知時的最優分層法(分組法2),兩者計算復雜,這里不贅述,具體算法詳見參考文獻[4]。
哪種方法更理想,理論界和應用界都無定論,最終將在比較具體計算結果的基礎上進行選擇。
采用離散系數法、分組法1和分組法2來分別計算分界點,同時,基于現有環境統計制度,把污染物產排累計量85%(對于重點監察指標,這一比例為100%,只是為了敘述方便,下文未做區別)也作為一個分界點確定的方法作為與其他3種方法的對比,這里稱之為累計比例法。即,該文共采用4種方法來確定分界點。
理論上說,分界點應為污染物產品量的具體數值,譬如,COD排放量指標的分界點為500 t,表示COD排放量大于500 t的企業為重點調查單位,小于500 t的企業為非重點調查單位。但為了與目前環境統計制度保持敘述一致,采用累計產排量比例來表述分界點,即,如果COD排放量指標的分界點為500 t,則計算全部COD排放量大于500 t的企業的排放量之和,然后計算這個合計值占全部企業COD總排放量的比例,假設這一比例為50%,則以50%來作為COD排放量分界點的表述。即,對于COD排放量指標而言,重點調查單位的定義是COD排放量占地區總排放量的50%以上。
幾種方法的計算結果如表3所示,表中列1~列3依次為離散系數法、分組法1、分組法2的計算結果;列4為前3種方法計算結果的離散系數,即3種方法計算結果的標準差與均值之比,用來反映這3種方法計算結果的差異;列5為前3種方法計算結果均值;列6為作為對比的現行環境統計制度的分界點;列7為累計比例法結果與前3種方法結果均值之差,用來反映新方法計算結果與現行統計制度的平均差異。對多數計算和比較結果,還計算了最大值、最小值、標準差和均值,在表3最末4行。
比較幾種方法的分界點計算結果,可以看到:
1)對不同指標,采用不同方法計算得到的分界點有差異,但差異不大。列5離散系數最高為0.27,最低為 0。
2)3種方法比較而言,分組法1得到的分界點平均最高,為87.10%,也略高于現行環境統計制度,離散系數法和分組法2得到的分界點相對較低,分別為77.92%和73.82%,都明顯低于現行環境統計制度85%的分界點;如果不考慮需要100%全面調查的重點監察指標,則分組法1得到的分界點平均最高,為84.22%,略低于現在的85%,離散系數法和分組法2的分界點近似,分別為72.19%和73.05%。
3)離散系數法得到的分界點差異相對較大(標準差為17.20和16.68),分組法1和分組法2得到的分界點差異相對較小(標準差分別為10.47、11.16 和 8.84、8.69)。
4)3種方法計算得到的分界點均值最高為95.82,出現在汞產生量指標(現行統計制度在這一指標上的分界點為100%),最低只有57.82%,平均為79.61%,近似為80%,不考慮重點監察指標的話,為76.49%。

表3 分界點計算結果(指標值累計比例) %
根據污染源現實情況來驗證、調整或修正已有環境統計制度,是污染源普查和更新調查的重要目的。污染源普查動態更新調查數據是目前較能反映工業污染源產排現狀的信息,該研究基于河南省的實證研究,有以下結論和政策建議:
1)對工業污染物產排指標分布特征的考察表明,所有污染物產排指標都呈現出高度右偏分布,因此將工業污染源區分為重點污染源和非重點污染源的目錄抽樣方法,對重點污染源進行全面調查,對非重點污染源進行抽樣調查(或其他估算方法),仍是適合于環境保護現實的正確調查方法。
2)在具體的分界點的確定上,按照統計科學方法所確定的分界點一般要低于85%,根據幾種方法的平均值,這一分界點可以適當下調。根據3種方法計算結果,可以調整到80%甚至更低。這種變化與中小企業特別是小企業的發展所導致的污染源格局變化有一定關系。在環境統計制度制定之初,少數大型企業的污染物產排量占據了污染物總產排量的絕大部分份額,但隨著中小企業的發展,這個份額會有所下降,因此有必要根據污染格局的變化來修正這個分界點。
[1]董廣霞,董文福,周冋,等.污染源普查動態更新調查技術問題及解決對策分析[J].中國環境監測,2012(1):99-101.
[2]齊珺,魏佳,羅志云.對我國環境統計制度的思考和建議[J].環境與可持續發展,2011(2):66-69.
[3]欒文英.目錄抽樣調查方法研究[J].上海統計,2001(6):17-19.
[4]張倩.如何確定目錄抽樣中全面調查對象與抽樣調查對象[D].天津:南開大學,2000.