劉國波,戎 愷,唐 力,王偉民,周偉奇,韓寶龍,劉 凱,黃 洪
1 青海大學,西寧 810016 2 深圳市鑫云通科技有限公司, 深圳 518031 3上海愷擎智能科技有限公司, 上海 201199 4 深圳市生態環境監測站, 深圳 518049 5 廣東省深圳生態環境監測中心站, 深圳 518049 6 中國科學院生態環境研究中心, 北京 100085
城市是人類文明的標志[1],城市生態環境是人類賴以生存和發展的基礎,為人類提供了物資供給、氣候調節和精神審美等各種生態系統服務[2]。隨著生態文明建設需求和科技進步和,建設生態環境大數據平臺逐漸成為生態環境規劃、管理、保護和建設的重要手段[3]。當前,已建成的平臺類型主要包括綜合性智慧城市建設平臺、單要素單行業的監測管理平臺和區域性生態環境監測管理平臺。智慧城市是數字城市與物聯網等技術有機融合的產物[4—5],智慧城市建設可有效提升城市治理和管理效率[6],但目前我國智慧城市建設存在“重建設、輕應用”等問題[7],城市生態大數據方面的建設力度偏弱且缺乏與生態模型的耦合而難以支持城市生態治理的科學決策。圍繞濕地[8]、城市生態風險[9]、水質監測[10—11]等單生態要素單行業的信息化平臺建設相對較多,這些平臺能滿足單個部門管理需要,卻難以滿足城市生態大數據管理需要。區域性生態環境監測管理平臺在較大尺度范圍也取得了較好的應用效果[12—15],如金沙江下游流域生態環境管理信息系統[14],然后由于尺度效應和城市生態系統自身特點,大尺度區域的生態環境監測和管理方案難以滿足城市智慧化管理需要。
深圳市地處我國廣東省南部,野生動植物資源豐富[16],經濟社會的快速發展導致資源環境約束趨緊、生態環境保護壓力加大,在生態文明和智慧城市建設背景下,如何借助物聯網、衛星遙感、移動互聯網和大數據挖掘等技術構建集數據采集、信息提取、知識發現、決策生成和快速服務為一體的城市生態大數據智慧化管理與服務平臺?如何把城市生態大數據與生態系統格局、質量、服務和風險評估等模型進行有效耦合,與現有生態環境監測和評估體系對接,進而提高城市生態治理能力和決策水平?等等這一系列問題的解決亟需開展城市生態大數據智慧管理和服務平臺方面的研究。為此,本文基于 “空-地-網-統計-眾源”等方式[17]獲取的深圳市水、土、氣、生、人等多主題生態大數據,利用時空地理大數據整合和共享、大數據挖掘、云端一體化業務協同等技術,并結合生態系統服務評估、分析和決策模型庫,提出了深圳城市生態大數據智慧管理和服務平臺構建方案,期待為城市生態大數據管理研究,深圳市生態環境治理和綠色發展提供科技支撐。
物聯網、移動互聯網、計算機和數據庫等信息化技術的快速發展為生態大數據的智慧管理和服務平臺構建提供了必要的技術途徑,也使生態環境動態監測具備了實用性、有效性與快捷性[18]。平臺總體架構共包括4個層次和兩個支撐體系(圖1),四個層次為感知層、網絡層、數據匯集和處理層、應用層,兩個支撐體系為標準規范體系和安全保障體系。
感知層使用在線設備或衛星等搭載對光照、溫度、濕度、氣體、聲音、影像等信號具有感知、識別、通信能力的傳感器,對城市生態環境要素的物質屬性、環境狀態、行為態勢進行分布式狀態辨識和信息采集。也可基于移動互聯網技術采用“人+智能終端APP”方式實現生態野外數據調查與采集。
網絡層基于無線或有線網絡的通信技術和通訊協議,實現感知層數字信息的編碼、認證、路由和控制。廣泛覆蓋的移動通信2G/3G/4G/5G/WIFI網絡和ZigBee/NB-IoT技術可為生態大數據的實時和連續傳輸提供可靠的網絡保證。
數據匯集和處理層借助WebGIS、數據庫、大數據挖掘、遙感和地理信息技術,實現基礎地理、影像柵格、地面調查、統計分析等各類生態大數據數據的匯交、清洗、整合、處理和分析,為應用層提供數據支撐。
應用層是整個平臺的核心組成部分和信息出口,基于面向生態系統監測和評估的方法庫/模型庫/對策庫,實現了生態大數據展示和統計分析、城市生態評價分析、信息服務和發布、生態安全預測預警四項功能,并在此基礎上構建了面向政府管理部門和科研人員的城市生態監測與評估管理決策分析系統。
標準規范體系為技術平臺提供數據質量、技術規范和組織管理方面的體制保障;安全保障為技術平臺穩定可靠運行提供數據、網絡和系統安全方面的技術保障。

圖1 平臺架構圖Fig.1 Platform architecture diagramNB-IoT: 窄帶物聯網 Narrow band internet of things; WIFI: 無線網絡通信技術 Wireless fidelity; ZIGBEE: 紫蜂協議 ZigBee
數據資源是信息化技術平臺的基石,隨著遙感影像、社交平臺和智能終端來源生態大數據的不斷涌現,構建科學合理的數據分類體系是城市生態大數據有效集成和管理的必要前提[19—21],本文以“分類科學明確、管理方便高效”為原則構建了7種數據庫:(1)基礎地理數據庫,主要存儲行政邊界、道路、興趣點、監測點和采樣點等數據。(2)影像柵格數據庫,主要存儲深圳市1979年至今的原始高分、中分衛星數據及其分類專題圖。(3)地面生態調查數據庫,主要存儲植物、動物、微生物、水生生物名錄、數量、多樣性、空間分布、居留型、區系、生境類型、保護級別等數據,涉及動物調查點位記錄17161個,植物調查樣地885塊,河流水生態樣點33個,微生物調查樣點8個。(4)社會統計數據庫,主要存儲城市歷年各街道人口、經濟、社會、資源利用、污染排放等數據。(5)生態監測數據庫,主要存儲自動站監測數據,涉及自動氣象站的小時和日值數據、空氣質量站數據、氣象塔數據和生態站碳通量數據等。(6)文獻資料數據庫,主要存儲深圳市政府各部門以及其它權威部門歷年發布的生態環境類文獻資料電子版或者掃描件。(7)多媒體數據庫,存儲照片和音視頻數據。
元數據是對數據基本信息的描述和規定,也是數據交匯和共享體系中連接數據提供者、使用者和管理者的紐帶[22]。生態大數據涉及部門眾多,數據類型復雜多樣且時空屬性信息重要,元數據設計在基本標準之上根據數據特色進行了個性化定制和擴展。平臺數據均包含數據編碼、數據名稱、數據類別、數據格式、數據量大小、檢索關鍵詞、數據提供者等基本元數據信息;基礎地理等空間數據除基本元數據信息之外還包含時間跨度、地理范圍、空間分辨率或比例尺、時間分辨率、要素類型等信息,遙感影像數據還需強調傳感器名稱、數據波段、加工處理方法;而多媒體數據還需要額外提供編碼方式、分辨率、拍攝信息、位置等信息。所有入庫數據均在元數據信息完備的基礎上,為數據管理和共享服務提供基礎保障。
數據管理是數據共享的基礎[21],本文使用“地理數據庫+關系數據庫+文件數據庫”相結合的方式對生態大數據進行管理。其中,空間數據轉變為同一空間參考后存儲于PostGIS地理數據庫;調查統計等關系型數據存儲于Microsoft SQL Server 關系型數據庫;微博爬蟲數據和動植物圖片等非關系型數據存儲于MongoDB分布式文件數據庫,方便對文本型和圖片型數據進行索引和查詢。
1.3.1時空地理大數據整合和共享技術
時空地理大數據是城市生態大數據的重要組成部分[23],兼具大數據容量大(Volume)、多樣性(Variety)、價值高(Value)、速度快(Velocity)的“4V”特征,還呈現出多載荷、多分辨率、多時相和多要素的“四多”特點[24],需要借助遙感、地理信息和WebGIS等技術對時空地理大數據進行整合,向下屏蔽時空地理大數據的復雜異構性,向上提供時空地理信息基礎底座賦能開放多元化業務應用[25],從而實現跨部門、跨地域和跨層級間的有效共享。
借助地理信息處理工具對遙感影像進行投影變換、圖像拼接、空間分析和專題制圖等處理;基礎地理等矢量數據經過幾何、屬性和拓撲檢查等操作集成到平臺;生態監測類數據、動物樣線調查、植物樣地調查、植物優勢物種普查和水生態采樣調查數據等均按照自身空間位置進行空間化處理;統計表格數據按照數據庫設計范式進行整理、清洗,根據數據所屬行政區或地理分區邊界進行關聯;采用網絡爬蟲工具采集的微博評論數據在經過隨機抽樣和分詞工具清理之后建立文本數據庫,每條數據包含文本評論內容、發布地點、發布時間以及微博用戶基本信息。最終形成以高分辨率遙感影像和基礎地理數據為基底的生態環境“一張圖”核心數據體系。
信息化時代的時空大數據的快速更新、可視化表達和共享需要滿足互動、動態、快速和自動等要求[26—27]。使用“Geoserver+Openlayers+Cesium”方式搭建二三維一體化時空大數據可視化和共享服務平臺,基于空間數據處理軟件編碼實現時空地理數據的動態提交、自動入庫、屬性關聯、樣式渲染、專題制圖和信息共享;平臺以SOAP、XML、WSDL、UDDI 等技術構建數據資源目錄,使用角色定義配置各類用戶的數據訪問權限,并通過地圖服務、影像服務、要素服務、地理處理服務和定制服務等方式向用戶提供服務。
1.3.2生態大數據挖掘分析技術
大數據由于自身的特性存在難以集成與管理、難以自動化處理與分析的問題,尤其是涉及空間相關的數據挖掘十分困難[5]。生態大數據需要借助機器學習、遙感、GIS空間分析和網絡爬蟲等技術的深度挖掘與分析[28—29]才能發現更多深層次信息和知識。
生態系統格局是生態大數據的重要組成部分,機器學習可用于揭示生態系統類型的格局特征與演變規律。基于高分衛星遙感數據,結合矢量數據輔助,利用基于機器學習的影像自動分類(非監督分類)多等級景觀格局提取分析技術,定量解構了城市多等級的生態精細格局。城市熱環境和地表參數的獲取對于城市人居舒適度評價和生態系統服務評估至關重要,平臺基于遙感數據和地面監測數據使用地表溫度反演模型、凈初級生產力反演模型和植被生物量反演模型等完成上述參數的獲取。
生態大數據的挖掘涉及生態、林草、國土、氣象等多部門和多源空間數據的綜合分析,借助空間插值模型、空間聚類分析模型、空間疊加分析模型、最小費用模型等方法,完成不同類型的生態環境大數據相互連接和協同分析,釋放生態大數據的價值。
城市人居舒適度關乎人們幸福感,影響人們身心健康,是評價一個城市生態環境質量的關鍵[30],也為城市生態環境質量改善提供指導方向。微博大數據是城市人居舒適度情感調查的主要數據源,平臺首先以“天氣或空氣質量”為關鍵詞使用網絡爬蟲工具采集微博評論大數據,經過有效性處理后自動化集成,并使用“SnowNLP”情感分析工具計算每條微博的情感分值;然后以微博情感分值、遙感數據反演、監測站數據和社會經濟統計等數據為基礎,通過分析城市熱環境與空氣質量的空間分布與演變特征、居民對熱與空氣質量的感受等因素實現了人居舒適度指數的動態評價和發布。
1.3.3云端一體化業務協同技術
平臺基于生態環境數據庫構建了“云端互聯、一云多端”的“一張圖”應用體系,即在服務器端依托深圳政務云軟硬件資源以“一張圖”為核心實現平臺數據的匯集、整合、展示、查詢、處理和共享,并與深圳市原有智慧環保平臺無縫集成,通過“統一安全防護、統一資源管理、統一用戶管理、統一授權管理、統一門戶集成、統一接入管理”的“六統一”方式實現“資源共建共用、數據互聯互通、業務協同處理、信息及時共享”,支持多種用戶跨設備終端類型進行訪問,針對政府管理人員、生態環境科研人員、業務部分調查人員和普通公眾提供差異化系統功能和數據訪問服務。
生態野外數據調查采集系統服務于科研人員和業務部門的專業用戶,包括野外生態數據采集APP和后臺管理Web系統。采集APP主要包括用戶登錄與注冊、最新消息顯示、數據采集、樣地調查、歷史數據查看、離線地圖顯示、用戶設置等功能,后臺管理Web系統的主要包括采集員管理、數據模板管理、樣地管理、采集任務管理、采集數據管理、采集員監控和數據統計等功能。目前,調查人員通過APP已上傳5萬多個點位數據和上萬張照片。
城市生態系統監測評估工作涉及生態、水文、氣象、遙感、地理信息等多個學科的知識,所需評估模型復雜多樣,過程十分繁瑣,技術門檻較高,限制了生態系統監測評估模型在政府決策和跨領域應用中的推廣[31]。平臺借助數據和算力優勢運用監測評估生態模型和算法,實現了指標計算、綜合評價、風險預警、報告生成、可視化輔助決策等功能,提高了深圳市生態環境管理和決策的科學化水平。
2.2.1生態系統格局-構成-過程監測
生態系統格局評估模塊提供了生態系統格局分析、景觀格局指數計算、斑-廊-基分析、動態度分析、城市擴張分析等功能;生態系統構成評估模塊全面集成和空間化了深圳市動物、植物和微生物的地面調查數據,聚焦物種多樣性并揭示其空間分布特征;生態過程評估模塊實現了深圳市物質、能量、水和典型元素代謝特征的空間化評估。在此基礎上,針對城市生態系統格局、構成、過程存在的主要問題和變化驅動因素提出了相應的提升對策。具體包括重要廊道保護、關鍵節點保護、綠色網格構建等景觀格局優化對策,群落優化、生境改善、動植物保護等構成優化對策,熱環境緩解、資源可持續利用、城市生態系統效率優化等過程優化對策。如,平臺生態系統格局分析功能基于長時間序列的中分衛星遙感數據,揭示了深圳自建市以來森林、草地、濕地、農田和城鎮等生態系統類型的空間格局與演變特征。結果表明,過去40年深圳市城市化快速發展,城鎮生態系統擴張顯著侵占了大量生態空間,其面積占比已從1979年的1.36%增長至2019年的48.36%,與此同時,森林和濕地生態系統面積顯著減少(圖2)。針對城市發展空間與生態空間矛盾突出問題,提出了劃定基本生態控制線來限制城市的持續蔓延,并結合城市更新通過空間整治、生態修復等措施提升老區生態功能改善人居環境的對策。

圖2 1979—2019年深圳市各類生態系統面積占比Fig.2 Proportion of the area of various ecosystems in Shenzhen from 1979 to 2019
2.2.2生態系統服務評估
生態系統服務評估模塊提供了熱島效應消減、徑流調節、空氣凈化調節、固碳釋氧、土壤保持、生物多樣性維持、海岸帶防護、綠地服務供給有效性評估等多種生態系統服務評估功能。同時,針對生態系統服務評估狀況給出了微氣候調節服務提升、水土保持服務提升和水源涵養服務提升對策。城市綠地是城市生態系統的重要組成部分,具有固碳釋氧、降溫增濕、抗污滯塵、減弱噪音等多種生態功能,對于改善城市生態環境,提高城市居民生活品質有著舉足輕重的作用,是城市生態環境可持續發展的重要基礎,平臺使用網絡分析法研究了239個城市綠地的可達性水平,并以到綠地的距離500 m、1000 m和2000 m為界劃分城市綠地可達性的等級。結果表明,深圳市公園綠地社會服務范圍有限且空間分布不均,為此,深圳市需要在城市綠地社會服務盲區增加綠地建設,同時,調整綠地組成與結構特征提升城市綠地生態功能。
2.2.3生態系統綜合評估
生態系統綜合評估是分析生態系統的生產及服務能力,對其進行健康診斷,做出綜合的生態和經濟分析,評價其當前狀態并預測未來發展趨勢,為生態系統管理提供科學依據[32]。生態系統綜合評估模塊使用生態健康綜合評估模型、人居舒適度分析模型、水生態健康評估模型、基于碳排放指標的生態環境綜合評估模型對深圳市的生態系統進行綜合評估。
生態健康綜合評估模型包括基礎數據、關鍵指標、核心指數、綜合指數4個層次:(1)基礎數據層包括與生態環境相關的城市統計年鑒和統計公報等。(2)面向國家生態環境建設政策銜接的關鍵指標層,其各項指標主要來自“領導干部離任自然資源審計”、“資源環境承載能力監測預警長效機制”、“生態產品價值實現機制”和“深圳率先建設社會主義現代化先行區指標體系”,以及深圳市重點生態問題指標和后續需要健全的重要城市長期生態系統監測指標。(3)面向綜合指數計算核心指數層,其各指標按照代謝效率、服務能力、典型問題3個方面進行細分,核心指數可以動態調整,按照本文給定的方法,調整指標并不會影響當年綜合指數得分,有效減少了指標調整選擇變化帶來的得分波動,提高了長期可比較性。(4)面向政府評估和民眾知曉的綜合指數層,該層包括三類指數和一個綜合指數:生態系統代謝效率指數、生態系統服務能力指數、生態系統典型問題指數,以及進一步壓縮為一維度的綜合指標“城市生態系統健康指數”,平臺對外發布綜合指數層內容。
人居舒適度分析模型以微博評論數據為數據源,限定深圳為評論地點,以“天氣或空氣質量”為關鍵詞,通過網絡抓取工具收集有關天氣或氣候相關的文本評論數據,通過微博數據情感分析結合當時的氣象和空氣質量數據進行人居舒適度分析并自動計算和發布每天的人居舒適度滿意指數。通過平臺對2020全年的微博情感分析數據統計發現,深圳居民對人居環境整體上是滿意的,其中非常滿意率為33.25%,很滿意率為7.24%,滿意為5.81%;不滿意率為35.88%。
水生態健康評價是推進河流生態系統保護的重要手段,平臺構建了河流水文、河流形態、河岸帶、水體理化、水生生物和干擾強度等6 項一級指標及22 項二級指標的河流健康綜合評價體系[33];然后,采用層次分析法確定各指標項的權重,并以100分為滿分按不同的權重賦予各級指標不同的分值,某樣點6 個一級指標的的得分總和便是最終的評價得分;最后,根據生態水文、流域植被、河道生態護岸、生態質量、生態服務、動植物棲息地等生態環境數據和社會經濟數據對流域水生態健康進行評價。研究結果表明,深圳市水生態健康狀況總體得分偏低,有待進一步提升,其中,總氮和底棲動物多樣性等指標得分偏低。
基于工業碳排放的生態評估模型是使用生態環境壓力-狀態-響應(Pressure-State-Response,PSR)模型圍繞工業碳排放修正生態評估指標體系。考慮到工業碳排放總量和強度是由于人類能源消耗及化石原料使用給生態安全帶來的生態脅迫,且與多項生態環境指標關系明顯,因此參考深圳市低碳城市指標體系,結合歷年工業環境污染數據的可獲性,構建了包含工業碳排放總量、工業碳排放強度在內的生態環境綜合評估指標體系。
2.2.4生態系統問題與風險防范
生態系統問題與風險防范是城市生態管理的工作重點。生態系統問題與風險防范模塊基于調查數據使用物種入侵分析方法和面源污染分析方法,對深圳市外來物種入侵、城市內澇、城市熱風險、臭氧風險、BVOCs排放和花粉致敏等問題進行風險評估和可視化展示,并為城市生態問題的風險防范提供防范物種入侵、面源污染和花粉致敏方面的對策支持。例如,平臺根據植物普查、植物花期、花粉致敏植物名錄和花粉致敏等級數據,計算生成了深圳市不同季節的花粉致敏風險分布圖(圖3),以此針對花粉致敏易感人群提出了相應的風險防范措施,即建議在致敏風險較高的區域加強科普和風險提示以保護人體健康。

圖3 花粉致敏風險分布Fig.3 Risk distribution of pollen allergy
2.2.5生態管理戰略與政策
生態管理戰略與政策模塊為全國和深圳建市40年以來實施的生態環境保護政策提供了查詢預覽功能和深圳生態管理政策與城市復合生態系統演進數據的統計分析功能,模塊集成的熵權法和耦合協調度方法模型,為未來深圳市生態系統管理戰略框架與政策體系的制定提供了輔助決策功能。
公眾參與是城市生態大數據智慧管理和服務平臺共建、共治、共享的重要途徑,也是生態環境監測和服務信息科學性與準確性檢驗的有效途徑。在2020年5月22日的國際生物多樣性日主題活動中,平臺對公眾發布了深圳生態大調查APP,APP服務于大自然保護協會和深圳綠色基金會組織的青少年生態大調查挑戰賽等活動,旨在讓更多市民參與生態調查活動,體驗戶外調查樂趣,了解深圳市生態系統現狀,感受深圳城市生態魅力,促進人居生活和城市生態的和諧發展。其它機構也能夠利用該APP的植物識別、標注和打分功能組織戶外探索等活動。公眾通過生態大調查APP提供的調查記錄將被用來與業務部門調查記錄進行相互驗證和補充,為專業調查提供結果復核。
平臺集成的生態系統格局、質量、服務、風險評估和綜合評估模型,為多源生態大數據的挖掘分析工作提供了專業工具,為生態大數據“數據-信息-知識-決策”的價值化過程提供了科學支撐,平臺的主要優勢有以下幾點:(1)彌補了傳統信息化平臺缺乏科學分析的不足,使平臺不再是原始數據和監測數據的簡單展示,而是大數據中隱式、先前未知和潛在有價值信息的充分挖掘和快速服務。(2)平臺能有效降低了用戶數據收集與處理,及專業模型操作的難度,突破了原始數據應用的瓶頸和難點,提高了專業模型在業務部門中的使用率,有效解決了“重建設,輕應用”的問題。(3)借助大數據分析工具和專業模型分析,實現了區域性多要素、多行業數據的綜合分析,避免了單要素、單行業數據的碎片化管理和分析,為城市生態大環保事業的協同分析和智慧化管理提供了必要的技術保障。
平臺所采用的技術方案和專業分析模型,可以在省、市、縣等各級政府部門中推廣使用,更好服務于城市的智慧管理和綠色發展。同時,生態大數據智慧管理和服務平臺建設作為智慧環保建設的一部分,可以進一步加強與智慧交通、智慧水利等服務平臺的互聯互通,為“美麗城市”和“智慧城市”建設提供一個“大而智”的綜合性信息化服務平臺。
城市生態大數據智慧管理和服務平臺依靠“生態大數據+專業模型”的技術方案實現了從生態大數據到管理決策知識的挖掘,克服了傳統生態環境管理過程中遇到的多維數據獲取困難、整合挖掘能力不足、專業分析模型欠缺、數據難以有效支持決策等問題,從而全面提升了城市生態治理決策水平。深圳城市生態監測與評估管理決策分析系統運用監測評估生態模型和算法,實現了指標計算、綜合評價、風險預警、報告生成、可視化輔助決策等功能,為深圳市生態系統問題和風險防范提供了數據支撐,也為深圳市生態環境的管理和決策、科學研究和公眾科普提供了重要的技術平臺。未來需要進一步加強其他信息技術和專業模型在生態大數據管理中的應用,提升用數據支撐決策和服務的能力。