999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

象限分析法在第二次全國污染源普查數據審核中的應用

2020-07-22 03:54:18劉孝富張志苗王瑩劉柏音邱文婷羅鐳
環境工程技術學報 2020年4期

劉孝富,張志苗,王瑩,劉柏音,邱文婷,羅鐳

中國環境科學研究院環境信息研究所

第二次全國污染源普查(簡稱二污普)是我國在“十三五”期間開展的一項重大國情調查,普查成果為我國打贏污染防治攻堅戰乃至“十四五”規劃提供強有力的支撐。數據的真實、準確、可靠、符合邏輯是普查質量的靈魂,為此數據審核發揮著至關重要的作用。二污普分為清查、全面入戶調查、產排污核算3個階段,每個階段數據審核側重點有所不同,但異常值的識別始終是數據審核的重要內容[1-2]。二污普數據審核中的異常值識別方法包括直接對比法、專家經驗法、排序法、占比法、平均值法、直方圖法等,每種方法都有各自的優劣勢。如直接對比法是將某些指標與排污許可、環境統計或工業統計等資料中相同指標進行對比;專家經驗法是依據專家的知識直接判斷數據是否異常,既可以判斷單個指標,也可以判斷兩兩指標相互關系的異常情況;排序法是將同行業的普查對象進行升序或降序排列,識別出極大或極小值;占比法是排序法中的一種,將生產活動水平或者產排污量占同一區域或流域較大的普查對象識別出來;平均值法是通過設置一個閾值,將遠離行業平均水平的普查對象識別出來;直方圖法是依據統計學規律設置置信度,將不在置信區間的普查對象識別出來。以上方法存在不同程度的局限性,或是在設定閾值、距離值、置信度等方面存在主觀性,或是需要較多的統計樣本。筆者介紹一種相對客觀、可適用于不同普查階段的數據審核方法——象限分析法,以期通過相關案例研究為各地開展二污普數據審核提供思路,也為下一次污染源普查以及其他普查工作的開展提供借鑒。

1 象限分析法簡介

1.1 基本概念

象限分析法是根據事物的2個重要屬性進行分類分析,從而找出解決問題的方法。象限分析法的第一步是找出影響事物的2個屬性(篩選2個指標),將一個屬性(指標)作為x軸,另一個屬性(指標)作為y軸,在坐標軸上對指標進行劃分,形成不同的象限,常見的有四象限、六象限、九象限(圖1)等,分析每個象限的特征從而找出規律,識別出異常事務或者需要重點關注的事務。當前,象限分析法在人才選拔[3]、防洪減災[4-5]、國土資源評價[6-7]、健康調查[8]等領域應用較廣,比較著名的應用包括時間管理的四象限法[9]以及描述基礎研究和應用研究關系的巴斯德象限[10]。

圖1 象限劃分示意Fig.1 A sketch of quadrant division

1.2 象限分析法識別異常值的技術思路

1.2.1篩選評價指標

象限分析法要求至少篩選2個指標開展評價,且2個指標之間存在一定的相關性。如分析二污普數據中產品產量數據是否填報錯誤,可以通過分析產量與原料使用量是否一致來確定,因此篩選出產量和原料使用量2個指標。

1.2.2繪制多個樣本散點圖

象限分析法不依賴專家的經驗和知識,而是通過多個樣本的指標相關性趨勢來判定異常情況。因此需獲取多個樣本的屬性數據,分別以2個屬性為x軸和y軸繪制散點圖(圖2)。

圖2 象限分析散點圖Fig.2 Scatter diagram of quadrant analysis

1.2.3象限分類及特征分析

根據所獲取的樣本數量決定需要劃分象限的數量,最少4個象限,樣本數量較多時可以設定9~16個象限,以平均每個象限樣本數占樣本總數的10%為宜。分析每個象限的基本特征,如圖2所示,第1象限表示產量低而原料使用量高,第9象限表示產量高而原料使用量少的普查對象。

1.2.4聚類劃分

確定象限數量之后,對x軸和y軸進行分割,也稱之為聚類。聚類的方法有多種,包括K-means聚類[11]、層次聚類[12]、密度聚類[13]等方法。如圖2所示,x軸和y軸分別被劃為D、E、F和A、B、C各3類。K-means聚類算法如下。

(1)從N個樣本中隨機選取K個聚類中心,如果是分成3類就選擇3個樣本作為聚類中心。

(2)對各樣本與聚類中心間的距離進行計算,按照最近距離原則將樣本歸屬最近的聚類中心。

(3)計算聚類中心樣本的平均值,以此作為新的聚類中心。

(4)迭代第(2)~(3)步直至新的聚類中心與上一迭代的聚類中心相等或小于指定閾值,結果呈現收斂特征,則算法結束。

1.2.5異常值識別

落在特征象限的點位表示數據有明顯異常,如圖2所示,分布在第1象限或第9象限的普查對象,存在產量或原料使用量填報錯誤的可能性較大,需重點核實。

2 象限分析法在清查階段的應用示例

在二污普清查階段,各地上報了工業源、農業源、集中式污染治理設施、生活源鍋爐、入河(海)排污口5類源的數量和位置,各類源是否存在漏報是該階段數據審核的重點。通過各地上報污染源數量與相關統計數據是否一致來判定是否存在漏查行為,如工業源的上報數量與固定資產投資、工業增加值、工業產品銷售產值是否匹配;各類畜種規模化養殖場數量與生豬出欄量、豬肉產量、牛奶產量、肉牛出欄量、牛肉產量和禽蛋產量是否匹配;污水處理廠數量與生活污水處理率、垃圾填埋場數量與生活垃圾集中處理率是否匹配;生活源鍋爐數量與人口、住宿餐飲企業、醫院、學校數量是否匹配;入河(海)排口與污水處理廠數量、工業廢水治理設施數量是否匹配等。

以工業源數量與固定資產投資為例,采用象限分析法來說明清查階段數量審核過程。表1顯示某省30個地市上報的工業源數量以及各地市近10年工業固定資產投資情況。

表1 某省各地市工業源數量與固定資產投資統計分析

采用九象限分析法來識別工業源數量上報異常情況。首先根據30個地市的屬性繪制散點圖(圖3),采用K-means聚類法將y軸清查上報工業源數量分割為A、B、C 3類,分割閾值為13 937和41 263,將x軸的近10年工業固定資產投資分割為D、E、F 3類,分割的閾值為1 407億和3 493億元。AF象限表示清查上報數量少,而固定資產投資高的地區;CD象限表示清查上報數量多,而固定資產投資少的地區。在清查階段重點關注漏查行為,因此落在AF象限的點位清查數據存疑最大,即編號為13、15和30的地市。

圖3 工業源清查數據審核象限分析Fig.3 Inventory date audit of industrial source by quadrant analysis

3 象限分析法在普查階段的應用示例

在二污普的全面普查階段,普查表中與產排污量核算密切相關的關鍵指標是數據審核的重點。如工業源中的產品產量、原料使用量、燃料(煤炭、電力、天然氣、汽油等)使用量、取水量、排水量、工業總產值等;農業源中畜禽養殖業的出欄量、存欄量、欄舍面積、糞污資源化利用率等。多數情況下,普查表中的指標之間具有一定的相關性,如產量與能源消耗量,產量與原料使用量,產量與產值、養殖量、欄舍面積等,可以通過指標之間相互關系來識別指標填報的異常情況,象限分析法在其中發揮著重要作用。

表2為某行業33家企業填報的產品產量和燃煤使用量的情況,同樣采用九象限法來識別異常值。根據33家企業的屬性繪制散點圖(圖4),采用K-means聚類法將y軸燃料使用量分為A、B、C 3類,分割閾值為2 110、6 116 t;將x軸產品產量分為D、E、F 3類,分割閾值為2 245、9 380 t。在普查階段重點關注落在AF象限和CD象限的點位,AF象限表示產品產量高但燃料使用量偏低;CD象限表示產品產量低但燃料使用量偏高,落在這2個象限的點位數據異常的可能性最大,需重點核實。從圖4可以看,落在AF象限的點位,CD象限的點位有1個(編號為22的企業)。落在BF、BD、CE、AE象限的點位數據異常的可能性也較大,需進一步核實。

表2 某行業企業產品產量與燃料使用量統計分析

圖4 工業源產品產量與燃煤使用量數審核象限分析Fig.4 Output and coal usage audit of industrial source by quadrant analysis

4 討論

在污染源普查數據審核中,與其他異常值識別方法相比,象限分析法具有普適性、客觀性較強的特點。主要表現在以下幾個方面。

(1)象限分析法可彌補行業專家的缺失。如根據行業專家經驗判斷,生產1 t粗鋼的燃煤消耗量為0.49~0.56 t(以標煤計)[14],當企業填報的粗鋼煤耗與該值偏差較大,則產量數據或燃料使用量數據填報錯誤。污染源普查中行業門類較多,行業的平均數據普遍缺乏,無法完全靠行業專家來審核全國百萬計的污染源,在這種情況下可匯聚同行業的樣本,采用象限分析法來識別數據填報異常情況。

(2)象限分析法避免了趨勢擬合的不確定性。如圖5所示,常規的分析方法是依據橫、縱坐標的屬性進行擬合,與趨勢線距離越大的點位數據異常可能性越大[15-16]。但在選擇擬合方程時,存在較大的不確定和主觀性,可能是線性也可能是非線性。象限分析法避免了趨勢擬合選擇函數的主觀性,通過象限的特征來識別異常情況。

圖 5 象限分析法與擬合法對比Fig.5 Comparison between quadrant analysis and trend fitting

(3)象限分析法避免了閾值選擇的主觀性。如圖5所示,與趨勢線的距離相差多少被定義為存在異常,有一定的主觀性。采用排序來識別異常值時,也存在極大、極小值判定標準制定的問題。象限分析法無閾值制定的環節,橫縱坐標分割采用非監督聚類法,最大程度保證評估結果的客觀性。

(4)象限分析法對統計樣本的數量沒有太多要求,可依據樣本的數量來選擇象限的數量,樣本數量較少時可采用四象限,樣本數量較多時可采用九象限及以上。如采用直方圖法來識別異常值,則需要的樣本數量較多,數量較少時無法統計直方區間。

5 結論

象限分析法因其高效、便捷、簡單、客觀性較強、所需樣本數量少等特點,特別適合污染源普查的數據審核。污染源普查所含的行業門類多、填報數據專業性強,象限分析法可在一定程度上彌補行業專家的缺乏,在數據審核中發揮著重要作用。象限分析法也存在一些不足,當樣本數量和象限數量不匹配時,可能會導致識別出的異常點位偏高或偏低。當存疑最大的象限沒有識別出異常點位時,可能會掩蓋一些異常值。充分發揮各種數據審核方法優勢,因地制宜采用象限分析、趨勢擬合、排序、直方圖、專家經驗等多種方法,可以達到事半功倍的效果。

主站蜘蛛池模板: 国产无码高清视频不卡| 8090成人午夜精品| 在线中文字幕日韩| 91九色最新地址| 小说区 亚洲 自拍 另类| 91九色最新地址| 色国产视频| 精品91视频| 国产精品白浆在线播放| 亚洲最新地址| 全午夜免费一级毛片| 国产成人乱无码视频| 尤物精品视频一区二区三区| 午夜毛片免费看| 免费在线色| 91福利片| 全部免费毛片免费播放| 日本午夜在线视频| 亚洲综合狠狠| 亚洲一级毛片在线观播放| 成人另类稀缺在线观看| 亚洲无码精品在线播放| 欧美在线综合视频| 国产精品欧美激情| 国产在线观看精品| 色哟哟国产成人精品| 91探花在线观看国产最新| 国产午夜无码专区喷水| 57pao国产成视频免费播放| 色精品视频| 乱系列中文字幕在线视频 | 欧美中文字幕第一页线路一| 亚洲乱码视频| 亚洲精品无码高潮喷水A| 少妇精品在线| 久久精品欧美一区二区| 久操线在视频在线观看| 亚洲精品自在线拍| 国产一级毛片高清完整视频版| 在线看片中文字幕| 亚洲综合激情另类专区| 制服丝袜一区二区三区在线| 亚洲最大福利网站| 成人在线观看不卡| 国产浮力第一页永久地址| 国产九九精品视频| 欧美成人精品一区二区| 亚洲 日韩 激情 无码 中出| 国产微拍精品| 97在线免费| 亚洲人成电影在线播放| 国产成人久久综合一区| 九色视频最新网址| 亚洲AⅤ永久无码精品毛片| 欧美不卡二区| 国产成年无码AⅤ片在线 | 91网址在线播放| 日韩欧美亚洲国产成人综合| 91精品国产综合久久香蕉922| 四虎AV麻豆| 国产成人综合网| 亚洲精品日产精品乱码不卡| 国产在线观看一区二区三区| 亚洲日韩国产精品无码专区| 国产精品亚洲一区二区在线观看| 欧美一区二区三区香蕉视| 亚洲无限乱码| 免费观看欧美性一级| 日韩二区三区| 国产成人无码综合亚洲日韩不卡| 亚洲AⅤ波多系列中文字幕| 亚洲天堂视频在线观看| 麻豆精品久久久久久久99蜜桃| 天天综合网站| 国产男女免费视频| 天堂av高清一区二区三区| 免费看美女毛片| 人妻91无码色偷偷色噜噜噜| 亚洲毛片一级带毛片基地| 这里只有精品免费视频| 色哟哟国产成人精品| 亚洲综合第一页|