清潔生產數據庫的建立與應用
余沁園,彭軻,劉剛
(重慶新顏科技咨詢有限公司, 重慶401147)
摘要:清潔生產是一種預防污染的環境戰略,而開展清潔生產審核、實施清潔生產方案則是提升企業清潔生產水平、提高資源利用效率和從源頭削減污染物的有效手段[1]。該文介紹了一種基于關系型數據庫的數據表模型和導入規則,用于從清潔生產審核報告中提取清潔生產方案,經數據抽取、轉換、裝載和清洗等步驟構建清潔生產數據庫。同時,借助軟件開發工具,實現清潔生產方案的查詢和多樣性呈現,為工業企業和咨詢機構開展清潔生產審核、實現節能降耗提供技術支撐。
關鍵詞:清潔生產;數據庫;污染預防
收稿日期:2015-05-25
作者簡介:余沁園(1973—),男(羌族),四川北川人,工程師,碩士,研究方向為清潔生產、環境信息化,E-mail:yuqinyuan@hotmail.com
中圖分類號:X38
DOI: 10.14068/j.ceia.2015.04.024
在清潔生產審核過程中,工業企業通常會產生和實施不同類型的清潔生產方案。這些方案有的花錢多,有的花錢少或者不花錢,有的側重于工藝技術改造,有的側重于加強管理或提高員工技能,然而都可以幫助企業提高資源利用效率,從源頭削減污染物的產生,有一定的環境效益和經濟效益。清潔生產審核咨詢機構如果注重基礎資料采集的完整性和準確性[2],以及清潔生產方案的有效收集和積累,則可為后續的其他清潔生產審核項目提供幫助,而構建有特色的清潔生產數據庫則是實現知識積累最基礎也最重要的工作。
2009年,重慶新顏科技咨詢有限公司承擔了“重慶清潔生產技術支撐平臺”的建設,至今從審核過的200多個清潔生產項目中收集和積累了5000多項清潔生產方案,經數據清洗、整理后導入數據庫,初步形成了涵蓋汽摩、機械、化工、醫藥、建材等多個行業的清潔生產數據庫。
1數據庫構造
清潔生產數據庫選用全球應用最廣泛使用的開源數據庫MySQL,運行于Linux操作系統之上。清潔生產數據庫配置為關系型數據庫,其E-R模型比較明晰,最基礎的數據表為清潔生產方案表(solutions),字段設置如表1所示。

表 1 數據表字段設置
其中,“項目編號”和“方案編號”構成數據表的主關鍵字。按清潔生產審核的有關規范,“方案類別”共分8類,包括:提高員工素質或完善激勵機制、加強管理、資源能源節約或原輔材料替代、優化過程控制或完善計量、回收利用廢棄物或削減污染物、更新或維護設備、技術工藝改造、改進產品或包裝物?!胺桨笭顟B”共分3類,包括:已實施、正在實施和計劃實施?!胺桨敢幠!惫卜?類,包括:中/高費方案和無/低費方案。
2數據清洗和整理
從形式上看,清潔生產方案的主要數據來源是咨詢機構編制的《清潔生產審核報告》。然而,由于報告本身是非結構化的文本格式(多為MS Word格式),其中與清潔生產方案有關的匯總表的樣式隨編制人員不同而有一定差異,使數據的抽取比較困難。同時,文本格式的表格數據存在段落符號不一致,中、英文符號不統一,半角全角符號混用,以及在Windows系列操作系統下數據編碼格式與數據庫裝載工具要求有差異等問題,因此在進行數據裝載時常常存在關鍵數據的導入異常中斷,以及部分數據冗余、重復、缺失等問題。
數據的不規范,是建立清潔生產數據庫的難點。要解決這個問題、確保數據裝載成功,就需要在獲取清潔生產方案后進行數據的抽取、轉換和裝載(數據ETL,即Extract, Transform & Load),通常如果缺乏專業的數據ETL工具,則利用幾個常見工具也可完成,主要包括以下工作步驟:
(1)新建一個MS Excel工作表。從《清潔生產審核報告》“方案的產生和篩選”一章中拷貝清潔生產方案分類匯總表,并從“方案的實施”一章中拷貝已實施的清潔生產方案成果匯總表和正在實施以及計劃實施的清潔生產方案匯總表至Excel工作表,并按表 1內容進行數據列標題和內容調整;
(2)在Excel工作表中,將半角逗號“,”全部替換為全角逗號“,”,并將半角雙引號“”替換為全角雙引號“”;
(3)將文件另存為.csv文件(逗號分隔符文件);
(4)再用Excel重新打開.csv文件,將所有數字類型的字段格式全部改為“常規”;
(5)在Excel中,將數字中的千分號全部刪除,并確保所有單元格中的軟回車字符全部刪除,然后保存文件;
(6)用Word打開.csv文件,將連續兩個半角逗號“,,”替換為“,NULL,”;
(7)重復上一步驟,確保所有“,,”全部被替換為“,NULL,”;
(8)利用替換功能將“空格+逗號”替換為“逗號”,并利用高級替換功能將段落標記“,^P”替換為“,NULL^P”,保存文件;
(9)將.csv文件用Notepad打開,另存為solutions.csv文件,記住選擇編碼為“utf”。
數據按上述步驟清洗、完善之后,再用數據庫管理工具(比如phpMyAdmin)導入solutions.csv文件,記住選擇“Ignore duplicate rows”,字段分隔符選擇逗號“,”。導入和裝載作業完成后,初步建立了清潔生產方案數據庫。
值得注意的是,如果在清潔生產審核過程中善于使用Excel等軟件工具,則可以從Excel中直接進行數據轉換和清洗,跳過上述步驟(1),簡化工作。
3數據庫應用
MySQL數據庫的一大優勢是有多種數據操縱平臺可供選擇,流行且簡易的平臺選擇為LAMP(Linux操作系統+Apache服務器+MySQL數據庫+PHP編程語言),因此筆者選擇PHP程序語言和Smarty模板引擎開發了“方案查詢”功能。
目前,可以實現以下5種形式的方案查詢:
(1)按投資額查詢
(2)按方案種類查詢
(3)按行業查詢
(4)按企業查詢
(5)按組合查詢
PHP程序方面,首先是連接數據庫,關鍵語句如下:
$connection=mysql_connect($db_host,$db_username,$db_password);
if (!$connection)
die(“Could not connect to the database:
”.mysql_error());
mysql_select_db($db_database, $connection);
然后是構造SQL查詢(以組合查詢為例),關鍵語句如下:
$sql=“select abbreviation, seq_no, name, environment, economic, investment from $db_table where $strCond limit $iStartRecord, $nRecordsPerPage”;
$result=mysql_query($sql,$connection);
if (!$result)
die(“could not get results from the table:$db_table
query condition is: ”.$strCond);
while($result_row=mysql_fetch_array($result))
$arrResult[]=$result_row;
mysql_close($connection);
最后,將查詢結果的表現與邏輯分離。這樣做有兩個好處,一是使用同樣的代碼可為不同的目標生成數據,二是應用程序設計人員可與開發人員獨立工作[3]。筆者選用Smarty模板引擎對查詢結果進行規整和修飾,可實現分頁顯示,代碼不再贅述。
比如,筆者正在協助一家機械企業開展清潔生產審核,想查找一下與之有關的中/高費清潔生產方案,于是以投資額為“50萬元-500萬元”,方案類別為“技術工藝改造”和“更新或維護設備”,以及所屬行業為“摩托、汽車和機械”進行數據庫查詢,如圖1所示。

圖1 數據查詢界面 Fig.1 Data query interface
可以查詢到多條清潔生產方案,查詢結果如圖2所示。

圖2 數據查詢結果 Fig.2 Data query result
由于正在審核的這家工業企業正好擁有一條自泳線,現場觀察發現存在的資源浪費和環境問題較多,于是點擊查詢結果中的第1個項方案“自泳線改陰極電泳線”,則可以查看詳細情況,如圖3所示。

圖3 數據查詢結果詳情 Fig.3 Details of data query results
從中可以查看“長安xx”公司實施該方案的簡介、經濟效益、環境效益等描述,以及具體投資額、節電量等定量數據,對于筆者有重要的啟迪作用。
此外,將清潔生產數據庫作為外部數據源與Excel等電子表格工具結合,可實現Web發布數據透視圖。圖4是按“行業”和“方案類別”發布的清潔生產方案在“節約天然氣”績效方面的數據匯總透視圖。

圖4 數據透視圖 Fig.4 Data perspective chart
4結論
選擇恰當的數據結構和數據清洗、整理方法,可以快速構建清潔生產數據庫,從而將清潔生產審核過程中產生的大量數據,特別是清潔生產方案等予以整理和應用,一方面便于探尋和積累有價值的行業清潔生產方案,另一方面也有助于提高清潔生產審核效率、快速提供有針對性的方案,做到事半功倍。
清潔生產數據庫的應用范圍很廣,可以為技術和管理工作提供更多、更好的支撐。除了進一步優化數據裝載和查詢效率,以及完善基于Web的數據透視表和數據透視圖功能,筆者還在挖掘和嘗試實現數據呈現的豐富性和多樣性的其他方法,這也是今后值得努力的方向之一。
清潔生產數據庫目前僅由筆者所在咨詢機構進行維護和使用,應用普及率還不高,若有關主管部門予以協調和支持,則有望推廣至全社會使用,為廣大工業企業節能減排作出更大的貢獻。
參考文獻(References):
[1]國家環境保護局. 企業清潔生產審計手冊[M]. 北京: 中國環境科學出版社, 1996.
[2]余沁園, 彭軻. 清潔生產審核中基礎資料的采集[J]. 三峽環境與生態, 2009, 2(4): 53-59.
[3]W Jason Gilmore. PHP與MySQL程序設計[M]. 朱濤江, 譯. 北京:人民郵電出版社, 2009.
Establishment and Application of Cleaner Production Database
YU Qin-yuan, PENG Ke, LIU Gang
(Chongqing New Look Technology Consulting Co., Ltd., Chongqing 401147, China)
Abstract:Cleaner production is a pollution-prevention oriented environmental strategy. Cleaner production assessment (CPA) and implementation of corresponding solutions are efficient and effective ways of elevating cleaner production level, optimizing resource utilization, and cutting pollutants from the source. This article introduces a relational-database based table model and import rules, by which cleaner production solutions are extracted from the CPA report, and database is built through data extraction, conversion, loading, and cleaning. At the same time, with proper software development tools, the query and diversity display of cleaner production solutions can be realized. In this way, it can provide technical support for industrial enterprises and consulting organizations to carry out CPA, save energy and reduce consumption.
Key words: cleaner production; database; pollution prevention