999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Excel在污染源普查工作中數據查重的應用

2018-11-13 11:55:42付立蘋
資源節約與環保 2018年10期
關鍵詞:企業

姚 磊 付立蘋

(昆明市環境科學研究院 云南昆明 650032)

引言

污染源普查是重大的國情調查,是環境保護的基礎性工作,對掌握各類污染源的數量、行業和地區分布情況,了解主要污染物產排和處理情況,建立健全重點污染源檔案,準確判斷我國當前環境形勢,制定實施有針對性的經濟社會發展和環境保護政策、規劃,加快推進生態文明建設具有重要意義[1]。

污染源普查工作中,數據的采集和對數據的處理貫通整個工作的所有環節,是該項工作的重中之重。其中,在數據處理的過程中,會多次涉及到數據查重的問題。例如,獲得來自于不同職能部門工業企業原始名錄后,需要進行匯總并查重比對,剔除重復的企業形成基礎名錄。查重工作處理得當,能夠為后續的數據處理帶來便利,避免重復調查和重復統計,節約有限的人力資源。

本文根據Excel 2016(Excel 2007或以上版本均可)提供的功能,提出幾種數據查重處理的方法,并對幾種方法的優劣進行探討,以期污普工作者在處理數據查重問題時能夠找到一種適合自己的最佳方法。

現以第二次污染源普查在建立工業企業基礎名錄中的查重比對的技術要求為例,詳細介紹各種方法。根據要求,用來比對的字段包括統一社會信用代碼,組織機構代碼以及企業名稱。不同來源的數據查重比對,只要其中一數據源的某條記錄中以上3個字段中有一項的值和另一數據源的對應字段的某條記錄值是相同的(不含空值),則認為分別來自兩個數據源中的這兩條記錄是重復的,即這兩條記錄都是指向同一工業企業。

1 Excel查重方法

下述所有的方法在應用前均須把兩組不同來源的數據根據字段對應的原則復制到同一工作表中,并新建一列字段標注數據來源以方便比對。本文實例中使用了12條記錄。

1.1 快速刪除重復值法[2]

選中表格區域中的任意一個單元格,如A7單元格。單擊“數據”選項卡中的“刪除重復值”按鈕,打開“刪除重復值”對話框。根據污普查重比對技術要求,只單獨勾選“企業名稱”字段,同時勾選“數據包含標題”復選框,單擊“確定”后根據提示完成操作。再次執行“刪除重復值”的操作,將“刪除重復值”對話框中的字段單獨勾選為“統一社會信用代碼”,操作完畢后,接著對“組織機構代碼”字段進行“刪除重復值”操作。

1.2 高級篩選法[2]

選中表格區域中的任意一個單元格,如A7單元格。單擊“數據”選項卡中的“高級”按鈕,彈出“高級篩選”對話框。點選“在原有區域顯示篩選結果”,將光標定位到“列表區域”框內,將原有內容修改為“$C$1:$C$13”(即企業名稱字段對應的所有數據集),然后勾選“選擇不重復的記錄”復選框,最后單擊“確定”按鈕。將篩選結果復制拷貝到另一新建的工作表中,接著對“統一社會信用代碼”應用高級篩選,完成后再將二次篩選結果復制到另一新建工作表中,然后對“組織機構代碼”也應用高級篩選。

1.3 函數公式法

1.3.1 COUNTIF函數法[3]

分別選中E2、F2、G2單元格,然后分別輸入函數公式:=COUNTIF(A$2:A2,A2&"*")、=COUNTIF(B$2:B2,B2)、=COUNTIF(C$2:C2,C2),在 H2 單元格內輸入=IF((E2>1)+(F2>1)+(G2>1),"重復",""),選定E2:H2,向下拖動至第13行,則H列內顯示“重復”值其所對應的條目屬于重復企業條目。

1.3.2 SUM函數數組求和法

分別選中E8、F8、G8單元格,然后分別輸入函數公式:{=IF(A8="",0,SUM((A8=$A$2:$A$7)*1))}、{=IF(B8="",0,SUM((B8=$B$2:$B$7)*1))}、{=IF(C8="",0,SUM((C8=$C$2:$C$7)*1))},在 H8 單元格內輸入=IF((E8>0)+(F8>0)+(G8>0),"重復",""),選定 E8:H8,向下拖動至第 13 行,則H列內顯示“重復”值其所對應的條目屬于重復企業條目。

1.3.3 IF函數綜合排序法

選中C1單元格,對字段“企業名稱”進行“降序”排序。在E3單元格處輸入:=If(C3=C2,row(),0),向下拖動至第13行,則E列內顯示值大于0的單元格其所對應的條目屬于重復企業條目。該方法的進階:可將不同數據源的重復數據并排顯示,不同重復項對應不同的篩選值,操作如下:完成E列賦值操作后,選擇E3:E13,復制,原有位置選擇性粘貼→數值,再次選擇E3:E13,右擊單元格“F2”→粘貼,將值粘貼于F列內,E、F列兩列數據挫位排列。在G1單元格內輸入字段“篩選值”,G2單元格內輸入公式:=E2+F2,并向下拖動至G13,選擇G2:G13,復制,右擊單元格“G2”,點擊選擇性粘貼→數值,將值粘貼于G列內,然后對G列進行降序排序,則可以將來自不同數據源的重復數據并排顯示,方便數據間的比對。在比對完“企業名稱”刪除重復數據后,可重復以上步驟分別對“統一社會信用代碼”和“組織機構代碼”進行重復值比對剔除。

2 各種查重方法的比較

上述各種查重方法均有其優缺點。快速刪除重復值法操作步驟少,在所有的查重方法中最為快捷,非常適合對Excel不熟練的新手操作,但因為是直接刪除數據,刪除的數據是哪些并不能一目了然的呈現出來,同時還須做好原始數據的備份;高級篩選法操作步驟相對繁瑣,但操作淺顯易懂,也適合新手應用,而且在篩選出不重復值的同時還保留了原始數據,但不能直觀顯示重復值是哪些條記錄;函數公式法的應用需要對Excel函數有一定的了解,清楚函數公式的邏輯所在,并能夠通過公式生成的值來辨別對應的條目是否屬于重復值。但函數公式法能夠把原始記錄中的重復與非重復數據非常清晰的呈現出來。函數公式法中(1)、(2)相對來說步驟較少,可以對“企業名稱”、“統一社會信用代碼”、“組織機構代碼”3個字段同時進行查重,且篩選出的重復值僅屬于其中一個數據源,剔除重復值相對便捷;但要注意COUNTIF函數在計算長字符串時,會將15位后面出現的任何數字都視為0,若兩個字符數相等的長字符串字符數多于15位且前面15位也都相等,COUNTIF會視為等值,由于統一社會信用代碼為18位字符串,故以COUNTIF進行查重時須在公式中添加“&"*"”,使COUNTIF函數識別超過15位的字符串;函數公式法(3)操作步驟相對較多,且排序后應用“IF”函數篩選出的重復值可能來源于兩個數據源中,若要篩選出某個數據源中的重復值,則要通過“進階”操作得出篩選值,再通過自定義排序(“數據來源”字段作為主要關鍵字、“篩選值”字段作為次要關鍵字)顯示出來。但該方法的優點是可以通過“進階”操作將來自兩個數據源的重復值并排顯示,且不同重復項其對應篩選值也不一樣,在后期清查建庫過程中需要精確比對剔除重復數據時,此法反而相對便捷。在應用函數公式法時須注意,公式不能直接用來排序或篩選,必須將公式進行選擇性粘貼生成數值后才能進行排序或篩選。

3 討論

在污染源普查實際工作中,從不同部門獲取的名錄數據是相當繁雜的,一是數據的條目數量通常上千,所列的字段不局限于企業名稱、統代碼及組代碼,還有諸如聯系地址、行業類別等字段,且來自不同部門的數據所列字段也不一樣;二是數據的錄入不規范,例如原始企業名錄庫中存在極少數重復企業,部分企業缺少統代碼和組代碼信息,部分數據錄入時存在首/尾空格錄入問題,在查重比對分析中會引起漏查,另外部分統代碼和組代碼是純數字,在錄入時格式若不設置好會以科學計數法顯示,還有企業名稱錄入時,全稱中帶有XX省、XX市、“有限責任公司”的,“省”、“市”、“責任”等字眼被省略,從而在比對查重時同一企業會被計算機識別為不同企業。因此,當拿到企業名錄數據后進行查重比對前,需要對數據進行前處理。

本文在此建議數據前處理按以下步驟進行:①規范表格樣式,確定表格所需字段及排列順序;②空格替換,將所有單元格內的空格替換為空值,但數據本身就需要空格的不能替換;③將科學計數法顯示的數據變更成數字串顯示;④填充空值,填充值須簡單、識別度高且與所在字段對應的其他數據不重復,如a1、a2…a3…;⑤剔除各原始數據源內的重復值。

按以上步驟執行完數據前處理就可以進行查重比對分析了。針對不同數據源企業名稱錄入不統一的問題,可以在執行完第一次重復值剔除后,復制并拷貝企業名稱字段列,在拷貝列中將“XX 省”、“YY 市”、“XX”、“YY”等替換為空值,將“有限責任公司”、“有限公司”替換為“公司”,并按IF函數綜合排序(進階)法進行查重,查重結果須結合原始企業名錄進行比對,逐一剔除。

結語

Excel軟件可以實現將多種數據查重方法應用于污染源普查工作中,通過選取合適的查重方法讓查重工作效率最大化。

猜你喜歡
企業
企業
當代水產(2022年8期)2022-09-20 06:44:30
企業
當代水產(2022年6期)2022-06-29 01:11:44
企業
當代水產(2022年5期)2022-06-05 07:55:06
企業
當代水產(2022年4期)2022-06-05 07:53:30
企業
當代水產(2022年1期)2022-04-26 14:34:58
企業
當代水產(2022年3期)2022-04-26 14:27:04
企業
當代水產(2022年2期)2022-04-26 14:25:10
企業
當代水產(2021年5期)2021-07-21 07:32:44
企業
當代水產(2021年4期)2021-07-20 08:10:14
敢為人先的企業——超惠投不動產
云南畫報(2020年9期)2020-10-27 02:03:26
主站蜘蛛池模板: 亚洲精品无码成人片在线观看| 国产97公开成人免费视频| 亚洲成A人V欧美综合| 欧美中文字幕无线码视频| 欧美精品成人一区二区视频一| 国产黄网站在线观看| 日韩中文精品亚洲第三区| 亚洲大尺码专区影院| 久久国产黑丝袜视频| 日本免费福利视频| 宅男噜噜噜66国产在线观看| yy6080理论大片一级久久| 国产高清精品在线91| 五月综合色婷婷| 国产成人乱码一区二区三区在线| 成人综合网址| 亚洲最猛黑人xxxx黑人猛交| 五月天综合婷婷| 国产SUV精品一区二区| 老熟妇喷水一区二区三区| 成人精品免费视频| 久久婷婷综合色一区二区| 性激烈欧美三级在线播放| 一本大道无码日韩精品影视| 午夜视频免费一区二区在线看| 人人澡人人爽欧美一区| 国产成人亚洲精品色欲AV| 色色中文字幕| 久久香蕉国产线看精品| 亚洲视频一区| 国产精品视频系列专区| 国产一区二区在线视频观看| 毛片网站观看| 欧美日韩激情在线| 中字无码av在线电影| 97精品久久久大香线焦| 美女被躁出白浆视频播放| 精品午夜国产福利观看| 天天色综网| 老司机午夜精品网站在线观看| 亚洲乱伦视频| 久久国产V一级毛多内射| 成人福利在线观看| 色噜噜在线观看| 福利一区在线| 中文字幕欧美日韩| 国产色爱av资源综合区| 美女无遮挡免费网站| 国产精品片在线观看手机版| 国产精品欧美日本韩免费一区二区三区不卡 | 国产欧美自拍视频| 国产成人一区在线播放| 亚洲男人的天堂久久精品| 91视频首页| 国产亚洲高清在线精品99| 青青草91视频| 国产成人精品男人的天堂下载 | av大片在线无码免费| 欧美午夜久久| 九九热视频在线免费观看| 国产精品一区在线麻豆| 青青草一区二区免费精品| 亚洲人视频在线观看| 欧美成人A视频| 国产精品人人做人人爽人人添| 亚洲成综合人影院在院播放| 54pao国产成人免费视频| 精品自窥自偷在线看| 国产成人亚洲精品色欲AV| 免费高清a毛片| 国产99视频精品免费观看9e| 亚洲国语自产一区第二页| 亚洲天堂网站在线| 国产成人福利在线视老湿机| 日本在线国产| 亚洲区欧美区| 国产精品短篇二区| 亚洲欧美国产视频| 久久国产拍爱| 天天操精品| 成年人福利视频| 国产极品美女在线播放|