諸云強,趙曉宏,馮卓,潘鵬,李時蓓,孫凱,4
(1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101; 2.江蘇省地理信息
資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023; 3.環(huán)境保護部環(huán)境工程評估中心,北京 100012;
4.中國科學院大學,北京 100049)
?
環(huán)境影響評價大數(shù)據分析與創(chuàng)新服務
諸云強1,2,趙曉宏3,馮卓1,潘鵬3,李時蓓3,孫凱1,4
(1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京100101; 2.江蘇省地理信息
資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京210023; 3.環(huán)境保護部環(huán)境工程評估中心,北京100012;
4.中國科學院大學,北京100049)
摘要:環(huán)境影響評價是一項數(shù)據密集型工作,不僅需要跨部門、多類型的大數(shù)據支撐,而且會產生相互關聯(lián)的整體價值非常高的成果數(shù)據。如何共享和利用環(huán)評大數(shù)據,是充分發(fā)揮環(huán)評作用的基礎和前提。通過分析環(huán)評業(yè)務流程,提出了環(huán)評數(shù)據的概念模型和組成內容,重點探討了利用大數(shù)據、云計算、“互聯(lián)網+”等新一代信息技術和思維模式,以期未來能夠實現(xiàn)環(huán)評大數(shù)據的開放共享、關聯(lián)發(fā)現(xiàn)、在線計算和創(chuàng)新應用。
關鍵詞:環(huán)境影響評價;大數(shù)據;云計算;互聯(lián)網+;共享服務
環(huán)境影響評價是一項覆蓋范圍廣、多主體參與的數(shù)據密集型工作,既需要基礎地理、水文、地質、氣象、海洋和環(huán)境監(jiān)測等大量數(shù)據資源的支撐,又會在環(huán)評、技術評估、審批、監(jiān)督后評價、公眾參與等過程中產生大量的數(shù)據資源。在經歷引入確定、規(guī)范建設、強化完善、提高拓展四大階段的發(fā)展后[1],我國的環(huán)境影響評價已經積累了海量的環(huán)境影響報告書、報告表、登記表以及技術評估報告、竣工驗收報告、審批報告等數(shù)據資源。
然而,環(huán)評大數(shù)據的共享和利用并不理想。2008年,全國人大在《環(huán)評法》執(zhí)法檢查中指出,“水文、地質、氣象、海洋和環(huán)境監(jiān)測等相關數(shù)據沒有實現(xiàn)共享,要加快整合現(xiàn)有基礎數(shù)據,逐步建立統(tǒng)一的環(huán)評基礎數(shù)據庫、環(huán)評審批數(shù)據庫和污染源跟蹤數(shù)據庫,形成環(huán)評信息共享機制和交流平臺”。全國1 000多家環(huán)評單位各自以不同的方式和渠道獲取有關數(shù)據,這些數(shù)據質量參差不齊,標準不統(tǒng)一,收集耗時長、成本高[2]。從2010年開始,環(huán)保部環(huán)境工程評估中心主持開展了環(huán)評基礎數(shù)據庫建設工作。到目前為止,已經制定了較為完善的標準規(guī)范體系[3],建設形成了環(huán)評法律法規(guī)庫、專家?guī)臁⒌乩硇畔臁h(huán)境敏感區(qū)等基礎支撐數(shù)據庫,以及建設項目環(huán)評報告書、重點行業(yè)環(huán)評指標庫、環(huán)評資質庫等環(huán)評核心業(yè)務數(shù)據庫。盡管環(huán)評基礎數(shù)據庫取得了豐碩的成果,但還需要繼續(xù)推進數(shù)據共享機制、數(shù)據資源整合以及環(huán)評技術支持系統(tǒng)的建設[4]。
隨著物聯(lián)網、云計算等信息技術和電子商務、社交網絡等互聯(lián)網應用的發(fā)展,大數(shù)據時代已經悄然來臨。大數(shù)據的出現(xiàn),迅速引起政府部門、產業(yè)界、科技界的廣泛關注,已成為國家戰(zhàn)略、產業(yè)投資和科學研究的熱點,滲透到各個領域。大數(shù)據應用的層出不窮和巨大的潛力,讓人們開始重新審視和關注數(shù)據的價值[5]。在此背景下,本文在系統(tǒng)分析環(huán)評數(shù)據資源的基礎上,研究探討符合大數(shù)據思維的環(huán)評數(shù)據創(chuàng)新服務模式。
1環(huán)境影響評價數(shù)據分析
環(huán)評的本質在于預防或減輕規(guī)劃或建設項目的決策對環(huán)境的不良影響[6],其核心業(yè)務流程是環(huán)評單位依據法規(guī)政策和技術標準對實施單位的建設項目(或規(guī)劃)可能對環(huán)境造成的影響進行評價(過程中要對公眾意見進行調查),評估機構(專家參與)對環(huán)評報告(表)進行技術評估后,再由環(huán)境保護主管部門對環(huán)境影響評價進行審批,最終決定是否通過環(huán)評,如圖1所示。

圖1 環(huán)評核心業(yè)務流程Fig.1 The core business workflow of environmentalimpact assessment
環(huán)評一般包括:評價區(qū)域自然和社會環(huán)境調查、建設項目工程分析、環(huán)境質量監(jiān)測、環(huán)境影響分析、環(huán)境保護措施分析與建設等步驟。從環(huán)評全生命周期來看,環(huán)評完成后,還要進行環(huán)境保護的竣工驗收和后評價,以便對其中的環(huán)境保護措施落實情況及環(huán)保效果進行評估。環(huán)評全生命周期流程如圖2所示。

圖2 環(huán)評全生命周期流程Fig.2 The full lifecycle of environmental impactassessment
根據前述環(huán)評業(yè)務流程的分析,可得到環(huán)評數(shù)據概念模型,如圖3所示,即承受客體(環(huán)境)承載或支撐著實施主體(建設項目或規(guī)劃等),而實施主體作用于承受客體可能產生環(huán)境影響;參與主體(環(huán)評機構、評估機構、專家、審批機構、社會公眾等)按照各自職責收集或生產基礎數(shù)據(基礎地理、水文地質、生態(tài)環(huán)境、氣候氣象等),參與環(huán)評不同環(huán)節(jié)的工作中,并最終形成環(huán)境影響評價成果(報告書、報告表或登記表等)。
基于概念模型,環(huán)評數(shù)據涉及的主要數(shù)據實體及其關系如圖4所示,主要包括:實施主體、環(huán)境客體、參與主體、環(huán)評依據和環(huán)評成果5個一級實體。實施主體主要包括:可能對環(huán)境造成影響的建設項目、政府政策、規(guī)劃、計劃等;環(huán)境客體包括:自然地理環(huán)境、人文社會環(huán)境、大氣環(huán)境、水環(huán)境、聲環(huán)境、土壤環(huán)境等,其中自然地理環(huán)境和人文社會環(huán)境中又會包含環(huán)評最為關注的環(huán)境影響敏感點(區(qū)),包括:需特殊保護地區(qū)(飲用水水源保護區(qū)、自然保護區(qū)、生態(tài)功能保護區(qū)、基本農田保護區(qū)、世界遺產地、國家重點文物保護地等),生態(tài)敏感與脆弱區(qū)(沙塵暴源區(qū)、荒漠綠洲、濕地、熱帶雨林、紅樹林等),社會關注區(qū)(人口密集區(qū)、文教區(qū)、醫(yī)院等);參與主體包括:建設單位、環(huán)評單位、評估單位、審批機構、專家和社會公眾等;環(huán)評依據包括:法律法規(guī)、部門規(guī)章、地方政策、區(qū)劃/規(guī)劃、評估導則、環(huán)境標準等;環(huán)評成果包括:環(huán)評報告書(報告表/登記表)及其衍生的重點行業(yè)環(huán)評指標數(shù)據、技術評估報告、審批意見,建設項目竣工環(huán)境保護驗收報告、后評價報告等。

圖3 環(huán)評數(shù)據概念模型Fig.3 The concept model of environmental impactassessment data

注:N表示數(shù)據實體之間是多對多的關系。圖4 環(huán)評核心數(shù)據實體關系模型Fig.4 The E-R model of core data of environmental impact assessment
因此,環(huán)評數(shù)據庫組成主要包括:環(huán)評依據庫、基礎支撐庫、核心成果庫以及成果描述庫,其中成果描述庫主要用于數(shù)據的交換與共享服務,通過元數(shù)據和數(shù)據服務的形式對外提供服務。環(huán)評數(shù)據庫組成如圖5所示。

圖5 環(huán)評數(shù)據庫組成Fig.5 The components of environmental impact assessment database
2環(huán)評大數(shù)據創(chuàng)新服務
大數(shù)據是指無法在可容忍的時間內用傳統(tǒng)信息技術和軟硬件工具對其進行感知、獲取、管理、處理和服務的數(shù)據集合[7]。通常,人們認為大數(shù)據具有“4V”特征(體量大——Volume、類型多——Variety、快速化——Velocity、價值化——Value)。大數(shù)據還體現(xiàn)出個體或部分數(shù)據呈現(xiàn)低價值而數(shù)據整體呈現(xiàn)高價值的特點[8]。大數(shù)據直接帶來三個思維模式的轉變[9]:(1)數(shù)據分析不是依靠少量的隨機樣本,而是全體數(shù)據;(2)允許數(shù)據不精確性和混雜性;(3)關注數(shù)據間的相關關系而不是因果關系。從科研的角度,大數(shù)據的本質在于從模型驅動到數(shù)據驅動范式的轉變以及數(shù)據密集型科學方法的確立[10]。
對比大數(shù)據,環(huán)評數(shù)據資源盡管已經具備資源體量大、類型多、數(shù)據整體呈現(xiàn)高價值等特點,但其開放共享、關聯(lián)分析與挖掘利用還需要進一步提高。
環(huán)評數(shù)據資源必須實現(xiàn)向大數(shù)據的轉變,加強管理與應用服務的創(chuàng)新,才能進一步提高環(huán)評的科學性和效率,更加有效地支撐“科學、智能、陽光”的環(huán)評,進一步提升環(huán)評在參與國家宏觀調控、優(yōu)化產業(yè)結構、轉變經濟增長方式、推進節(jié)能減排、遏制環(huán)境違法行為等方面的作用。環(huán)評大數(shù)據需要解決跨部門開放共享、全生命周期關聯(lián)、智能發(fā)現(xiàn)與推薦以及高效的在線計算分析與便捷的公眾服務等問題。
(1)創(chuàng)新共享機制,促進大數(shù)據開放共享
大數(shù)據的開放共享是發(fā)揮其價值的基礎和前提。2015年9月國務院發(fā)布的《促進大數(shù)據發(fā)展行動綱要》中將政府數(shù)據的開放共享列為首要任務。早在2009年,美國就啟動了政府開放數(shù)據計劃,通過網站Data.gov共享政府數(shù)據,以CSV、HTML、XLS、PDF、WMS、WFS等格式向社會公眾開放,并逐漸向政府關聯(lián)數(shù)據轉換[11]。英國也建立了政府開放數(shù)據網站。2011年,美國、英國、挪威、巴西、南非、墨西哥、印度尼西亞、菲律賓8個國家聯(lián)合簽署了《開放數(shù)據聲明》,成立開放政府聯(lián)盟(OGP);2013年又簽署了《開放數(shù)據憲章》,規(guī)定了政府開放數(shù)據的五大原則[12],其中最重要的一條就是“開放為默認,不開放為特例”。通過該原則可以使政府部門盡最大可能地公開所有數(shù)據。截至2014年底,全球有63個國家加入了開放政府聯(lián)盟。
因此,作為政府投資的環(huán)評基礎支撐數(shù)據,如基礎地理、地質、水文、氣象數(shù)據,以及作為環(huán)境保護基本制度的環(huán)評成果數(shù)據等,應在充分尊重數(shù)據生產者知識產權(數(shù)據使用的知情權、被引用權等)的基礎上,進一步推動數(shù)據開放共享,并且應使用元數(shù)據、數(shù)據目錄等形式,方便數(shù)據的查詢和使用。
(2)實現(xiàn)數(shù)據關聯(lián),促進全生命周期追溯
關聯(lián)數(shù)據(Linked Data)被認為是語義網的一種實現(xiàn),通過明確的語義表達,使不同領域、來源和結構的數(shù)據可以相互鏈接,從而促進數(shù)據的查找、集成與利用,為構建一個富含語義、人機都可理解的、互聯(lián)互通的全球數(shù)據網絡奠定基礎[13- 14]。
如前文所述,環(huán)評數(shù)據橫向上包括同一個區(qū)域內的戰(zhàn)略環(huán)評、規(guī)劃環(huán)評、建設項目環(huán)評等的數(shù)據;縱向上包括環(huán)境影響評價、技術評估、審批、驗收、后評價等數(shù)據。這些數(shù)據資源應參照關聯(lián)數(shù)據技術,實現(xiàn)縱向、橫向以及特定維度的關聯(lián),如建設項目環(huán)評與所在區(qū)域戰(zhàn)略環(huán)評、規(guī)劃環(huán)評的關聯(lián),建設項目環(huán)評報告書、技術評估報告、審批意見以及項目竣工環(huán)保驗收報告、后評價報告的關聯(lián),建設項目環(huán)評與環(huán)評單位、人員資質的關聯(lián),同類同規(guī)模建設項目的關聯(lián)等。通過數(shù)據關聯(lián),構建形成互連互通的環(huán)評數(shù)據語義網絡,可以方便地進行各類信息的智能查找和全生命周期的追溯分析等。
(3)構建一體化平臺,提升預測分析效率
環(huán)評的核心是對實施主體可能對環(huán)境客體造成的影響進行預測分析,包括大氣、地表水、地下水、噪聲等。這些預測分析需要利用不同的環(huán)境預測模型以及相應的輸入參數(shù)數(shù)據。安裝調試環(huán)境預測模型、準備模型輸入數(shù)據往往非常費時費力,而且如果進行大范圍的預測分析,往往還需要高性能計算能力的支持。
因此,應利用云計算技術,發(fā)展“模型-數(shù)據”一體化共享平臺。在高性能或分布式計算環(huán)境下,實現(xiàn)大氣、水、聲等常用的環(huán)境影響預測分析模型的共享與在線計算。同時,基于已經整合集成的環(huán)評大數(shù)據,實現(xiàn)環(huán)境影響預測分析模型輸入數(shù)據的自動匹配與推薦,進而提升環(huán)境影響預測分析的效率與水平。
(4)利用“互聯(lián)網+”,實現(xiàn)大數(shù)據創(chuàng)新應用
“互聯(lián)網+”是把互聯(lián)網和傳統(tǒng)行業(yè)應用結合起來,形成一種新的生產和服務模式,推動傳統(tǒng)產業(yè)換代升級。如傳統(tǒng)銀行+互聯(lián)網產生了支付寶,傳統(tǒng)集市+互聯(lián)網產生了淘寶,傳統(tǒng)百貨賣場+互聯(lián)網產生了京東,傳統(tǒng)打車+移動互聯(lián)網產生了滴滴快的等。2015年7月,國務院印發(fā)了《關于積極推進“互聯(lián)網+”行動的指導意見》,提出“到2018年,互聯(lián)網與經濟社會各領域的融合發(fā)展進一步深化,互聯(lián)網成為提供公共服務的重要手段。到2025年,‘互聯(lián)網+’成為我國經濟社會創(chuàng)新發(fā)展的重要驅動力量”。
因此,環(huán)評大數(shù)據的應用必須利用“互聯(lián)網+”思維,把互聯(lián)網應用到環(huán)評數(shù)據資源的收集(如基于網絡的公眾意見調查、環(huán)評報告書等資料報送,基于移動終端的環(huán)境敏感點調查、流域生物多樣性調查等)、處理(如在線環(huán)境影響預測分析)、開放共享(如網絡環(huán)評數(shù)據交換共享、環(huán)評信息公開與推送)、利用(如建設項目時空分布、產業(yè)結構分析、產業(yè)結構調整與環(huán)境質量關聯(lián)分析)等各個環(huán)節(jié)中。
3結語
環(huán)評作為環(huán)境保護的一項基本制度,在控制污染物排放、提高清潔生產水平、減小生態(tài)破壞、節(jié)約自然資源、調整產業(yè)結構和布局優(yōu)化經濟增長、推動決策的科學化和民主化等方面發(fā)揮了重要作用。但近年來,環(huán)評執(zhí)行率和措施落實率不到位[4]也致使環(huán)評制度飽受爭議。環(huán)評是一項數(shù)據密集型的工作,一方面需要跨部門、多類型的大數(shù)據支撐,另一方面又會產生大量的、相互關聯(lián)的數(shù)據。要讓環(huán)評回歸本質,必須“依靠數(shù)據、拿數(shù)據說話、用數(shù)據決策”。盡管環(huán)評數(shù)據已經具備大數(shù)據資源體量大、類型多、數(shù)據整體呈現(xiàn)高價值等特點,但還需進一步利用大數(shù)據、云計算、“互聯(lián)網+”的思維和技術,加強環(huán)評數(shù)據的開放共享、語義關聯(lián)、在線計算和創(chuàng)新應用。
參考文獻(References):
[1]張云懷, 姚建玉, 董西哲. 我國環(huán)境影響評價的回顧與發(fā)展[J]. 北方環(huán)境, 2011, 23(4): 82- 83.
[2]趙曉宏, 李時蓓, 諸云強. 加強基礎庫建設提高環(huán)評科學性[J]. 環(huán)境保護, 2012(22): 59- 62.
[3]王卷樂, 趙曉宏, 馬勝男, 等. 環(huán)境影響評價基礎數(shù)據庫標準規(guī)范體系研究[J]. 環(huán)境科學與管理, 2011, 36(8): 168- 173.
[4]趙曉宏, 丁峰, 李時蓓, 等. 環(huán)評基礎數(shù)據庫建設與展望[J]. 環(huán)境影響評價, 2014(4): 33- 35.
[5]諸云強, 孫九林, 王卷樂, 等. 論地球數(shù)據科學與共享[J]. 國土資源信息化, 2015(1): 3- 9.
[6]包存寬. 環(huán)境影響評價制度改革應著力回歸環(huán)評本質[J]. 中國環(huán)境管理, 2015, 7(3): 33- 39.
[7]李國杰, 程學旗. 大數(shù)據研究:未來科技及經濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據的研究現(xiàn)狀與科學思考[J]. 中國科學院院刊, 2012, 27(6): 647- 657.
[8]徐宗本. 大數(shù)據研究的若干科學問題[J]. 科技促進發(fā)展, 2014, 10(1): 66- 69.
[9]維克托·邁爾-舍恩伯格, 肯尼思·庫克耶. 大數(shù)據時代[M]. 盛楊燕, 周濤,譯. 杭州: 浙江人民出版社, 2013.
[10]郭華東, 王力哲, 陳方, 等. 科學大數(shù)據與數(shù)字地球[J]. 科學通報, 2014, 59(12): 1047- 1054.
[11]Ding L., Lebo T., Erickson J.S.,etal. TWC LOGD: A portal for linked open government data ecosystems[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2011, 9(3):325- 333.
[12]Castro D. , Korte T.. Open Data in the G8: A Review of Progress on the G8 Open Data Charter[EB/OA]. [2015-10-20]. http://www2.datainnovation.org/2015-open-data-g8.pdf.
[13]Bernhard Haslhofer, Bernhard Schandl. Interweaving OAI-PMH data sourceswith the linked data cloud[J]. International Journal of Metadata, Semantics and Ontologies,2010, 5(1): 17- 31.
[14]Christian Bizer, Tom Heath, Tim Berners-Lee. Linked Data - The Story So Far[J]. International Journal on Semantic Web and Information Systems, 2009, 5(3): 1- 22.
Big Data Analysis and Innovative Service on Environmental Impact Assessment
ZHU Yun-qiang1,2, ZHAO Xiao-hong3, FENG Zhuo1, PAN Peng3, LI Shi-bei3,SUN Kai1,4
(1.State Key Lab of Resources and Environmental Information System, Institute of Geographic Sciences and Natural
Resources Research, Chinese Academy of Sciences, Beijing 100101, China; 2.Jiangsu Center for Collaborative
Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China;
3.Appraisal Center for Environmental & Engineering, Ministry of Environmental Protection,
Beijing 100012, China; 4.University of Chinese Academy of Sciences, Beijing 100049, China)
Abstract:Environmental impact assessment (EIA) is a data-intensive research work that not only requires support of cross-department and multi-type big data, but also produces lots of linked and high value data achievements. How to share and exploit these data is the fundamental and precondition of fully playing the role of EIA. After analyzing the core business workflow of EIA, this paper puts forward the conceptual model and content of EIA data. And then it focuses on discussion about the usage of new generation of information technologies such as big data, cloud computing, “Internet Plus”, etc., and the thinking mode. Thereof it will achieve the open sharing, association discovery, online calculation and innovative applications of big data of environmental impact assessment in the future.
Key words:environmental impact assessment; big data; cloud computing; Internet Plus; sharing service
中圖分類號:X820.3
文獻標識碼:A
文章編號:2095-6444(2016)01-0005-05
DOI:10.14068/j.ceia.2016.01.002