王林森,周素紅,賴鵬程,鄒 丹,宋江宇
(1.中山大學 地理科學與規劃學院,廣州 510006;2.廣東省公共安全與災害工程技術研究中心,廣州 510006)
生態環境是生產、生活活動的重要空間依存。隨著中國社會經濟發展邁向高質量發展的新階段,生態文明建設的地位逐漸突出。保護生態環境質量、充分發揮生態服務價值是生態文明建設的基礎內容(谷樹忠 等,2013;劉靜 等,2020)。已有研究表明,生態環境質量,尤其是區域動植物多樣性,是維系文明穩定的關鍵(Johann, 2004; Losev,2006;沈清基,2013;陳子琦 等,2022)。對于解決生態問題和構建良好生態環境,最核心、最為廣泛應用的工作抓手是生態空間的管控與限制。多數國家和地區實行相應的生態空間管控措施,將天然或近天然的區域劃作保護地,建立生態空間體系,對物種及其生境進行保護(劉冬 等,2015;何雄偉,2021)。
面向生態文明建設的落實需求,中國也開始逐漸進行生態空間管控區域界定的實踐探索。生態保護紅線的提出是中國生態文明建設的重大政策創新(李干杰,2014;Gao, 2019;張琨 等,2022),是中國生態環境保護的重要制度(范玉龍 等,2022)。中國生態空間管控區域界定的實踐最早在地方層面進行,可以追溯到2003年深圳市編制的《深圳市城市近期建設規劃(2003—2005)》文件①2003年出臺《深圳市近期建設規劃(2003—2005年)》.http://www.chinanews.com.cn/estate/2010/11-17/2661161.shtml,其中關于基本生態控制線的生態空間管控的開創性做法,逐漸被國內眾多城市效仿,各地的相關政策與規劃文件隨之陸續發布和實施。2011 年國務院頒布了《關于加強環境保護重點工作的意見》②2011年國務院印發《關于加強環境保護重點工作的意見》。http://www.gov.cn/gongbao/content/2011/content_1977824.htm,在全國政策層面上明確指出生態紅線劃定以及生物多樣性保護考量的必要性和戰略意義(高吉喜,2014;楊邦杰 等,2014)。隨后2014 年2月由環保部發布的技術指南文件明確了技術用語為生態保護紅線③2014年2月,環境保護部印發《國家生態保護紅線——生態功能基線劃定技術指南(試行)》,清晰定義生態保護紅線體系框架并制定了生態保護紅線劃定技術流程。http://www.gov.cn/xinwen/2014-02/04/content_2612994.htm,同年4月頒布的《環境保護法》④2 014 年4 月修訂的《中華人民共和國環境保護法》首次將生態保護紅線寫入法律。http://www.gov.cn/zhengce/2014-04/25/content_2666434.htm將生態保護紅線上升至立法高度。生態保護紅線規劃實踐領域逐漸形成較為完善的政策法規體系和理論指導框架。尤其,在目前國土空間規劃的發展背景下,越來越多的研究和實踐工作致力于將生態保護紅線落地,與其他控制線組成“三區三線”,落在一張底圖上(王穎等,2018;魏旭紅 等,2019;岳文澤 等,2020;馬紅 等,2022)。結合國土空間規劃統籌意見⑤2019 年11 月,國務院印發《關于在國土空間規劃中統籌劃定落實三條控制線的指導意見》,以指導生態保護紅線在規劃落地中的統籌問題。http://www.gov.cn/gongbao/content/2019/content_5453396.htm和技術文件,如“雙評價”⑥2020年1月,自然資源部印發《資源環境承載能力和國土空間開發適宜性評價指南(試行)》,為“三區三線”的落圖工作提供技術依據。http://www.gov.cn/zhengce/zhengceku/2020-01/22/content_5471523.htm,生態保護紅線得到精確的地理位置劃定。生態保護紅線已從理論概念轉化為推進生態文明建設的有力的空間規劃工具和研究目標。
生態環境質量評估和生態敏感性分析是生態保護紅線相關研究、實踐工作的核心內容,主要包括水、土、氣要素評估和動植物多樣性監測。水、土、氣、植被等靜態生態要素以及動物、人類活動等動態生態要素是生態環境的2 個重要組成方面。對其進行精確、靈敏評估分析是生態保護紅線劃定和監測的重要前提。目前,已有研究和實踐工作的生態環境質量評估和生態敏感性分析方法主要有以下3種:基于遙感圖像解譯,通過遙感圖像對區域水土資源、植被覆蓋進行評估分析(王麗霞 等,2017;王燕 等,2017;夏皓軒 等,2020);基于人工調查,通過土地利用調查、野生動物調查以及氣象監測站點等對區域土地利用、生物多樣性、氣候狀況進行評估分析(劉軍會 等,2018;伏鐳,2021;馬星 等,2021);基于野外紅外相機和物聯網技術監測,通過設立“相機陷阱”和無線網絡傳輸技術對區域生境、動物多樣性進行評估分析(李晟 等,2014;王天明 等,2020)。然而,上述方法均存在一些局限,基于遙感圖像解譯方法獲取的是植被覆蓋、水土等靜態生態要素的狀況,忽略了動物活動與人類活動對生態環境的影響,不利于生態敏感性分析;而基于人工調查的方法耗力又耗時,難以大范圍開展,也難以長時序監測,不符合日常監測需求。此外,兩者的技術流程過于冗雜,無法實現實時計算和預警,這也導致生態保護紅線的日常監測管理工作缺乏技術支撐。而新興的基于野外紅外相機和物聯網技術監測方法可在一定程度上獲取動態生態要素,利用無線傳輸技術和人工智能技術也可以實現實時監測,但該方法存在視頻數據量大、監測范圍有限等局限。
一些學者認為生態保護不僅是保護傳統生態景觀(Landscape Ecology),也要關注生態聲景觀(Soundscape Ecology)(Pijanowski et al., 2011a)。早在20 世紀60 年代,Rachel Carson(1962)在其經典著作《寂靜的春天》(Silent Spring)中闡述聲景觀與生態環境質量的密切關系。生態聲景觀作為自然環境的重要特性,可以表征動物活動與人類活動的空間分布差異,有助于更全面地反映地域生態環境質量和分析生態敏感性(Pijanowski et al.,2011b)。如遙感影像無法觀測到交通工具以及工業機器對生態環境的侵擾,但這種侵擾可以被引擎聲音所表征。此外,生態聲景觀能更好地表征景觀生態環境的動態性,更靈敏地反映人類活動的侵擾(Fuller et al., 2015)。已有研究發現,即使是在植被豐富的區域,人為噪音對野生動物有較強的驅離作用(Barber et al., 2011)。聲景觀的空間異質性、強動態性、靈敏性將更有利于生態敏感性分析。雖然以往受限于理論內涵不全面或技術問題,生態聲景觀的研究沒有得到重視(Merchant et al., 2015),但隨著人工智能、物聯網技術以及微型聲音采集器的普及,基于聲景觀的生態保護紅線的日常監測成為可能。并且,環境聲音識別技術的可靠性已在其他領域得到驗證,尤其是基于聲音頻譜圖和卷積神經網絡的聲音類型識別技術已發展較為成熟(史秋瑩,2016;Salamon et al., 2017)。
生態保護紅線的相關研究及規劃實踐,在環境保護、生態治理等生態文明建設活動中發揮重要作用,且與其相關的政策法規體系和理論指導框架仍不斷發展與完善。然而,以往的規劃與研究大部分將工作重心放在生態保護紅線的劃定上,而生態保護紅線的實際生態環境保育效果,已劃定的生態保護紅線的合理性、可靠性、受侵擾程度的監測和評估等往往被忽視。并且,該領域常使用的基于遙感圖像解譯和基于人工調查的方法能對生態環境質量的本底進行大致評估,但對動態的生態要素把握不足,無法實現生態保護紅線的日常監測。而生態聲景觀在生態敏感性分析上有良好的表征,在一定程度上可以彌補傳統評估分析方法對于動態生態要素的忽視。因此,本文從生態聲景觀視角出發,先制定一份面向日常監測的聲景觀要素分類標準,并構建深度學習模型進行訓練,得到基于聲景觀智能識別的分類模型;再利用該模型在共成水庫保護區結合傳統GIS方法對生態保護紅線的日常監測和生態侵擾因素進行探討。以期探索更科學的生態環境質量評估和生態敏感性分析方法。
本研究的技術思路如圖1所示:首先,基于現有文獻(Schafer, 1993; Pijanowski, 2011)和國土空間規劃特性制定一份聲景觀要素分類標準,并利用開源聲音素材對這些類型進行人工標注,以創建聲景觀類型數據庫;其次,搭建一個基于卷積神經網絡和梅爾頻譜圖特征的聲景觀類型識別模型,并利用聲景觀類型數據庫進行模型訓練;第三,在案例地收集生態保護紅線的聲景觀數據,利用上述模型對生態保護紅線沿線監測點的聲景觀要素類型進行智能識別,并計算生態聲景觀要素占比,對生態狀況進行動態評估,為日常監測提供數據;最后,將分析生態易受侵擾的主要影響因素,包括生態本底特征和人類侵擾分布特征2 個方面,通過識別重要侵擾要素,為全域的生態保護紅線的常態化監測點選址提供參考。

圖1 基于聲景觀智能識別的生態保護紅線日常監測技術路線Fig.1 Technical flow chart of daily monitoring of ecological conservation red line based on intelligent recognition of soundscape
聲景觀的要素有2種基礎的分類體系:一種是以Schafer(1993)為代表的學者,認為聲景觀由自然聲(natural)、人聲(human)、社會聲(societal)、機器聲(mechanical)、信號聲(indicators)以及安靜聲(quiet)組成;另一種是以Krause 和Pijanowski(2011)為代表的學者,將聲景觀組成要素分為生物聲(biophony)、地球物理聲(geophony)、人工聲(nthrophony)。目前的聲景觀研究大都以這2種分類為基礎進行細分或調整。本文在現有分類體系的基礎上,參考國土空間規劃的生產空間、生活空間、生態空間的“三生空間”劃分聲景觀要素,制定一份面向生態保護紅線日常監測的分類標準(表1)。為獲取訓練標簽,基于全球最大的音頻眾包平臺⑦Freesound: https://freesound.org/(Freesound)收集3 576條10 s的音頻,覆蓋每個二級分類。

表1 聲景觀要素分類Table 1 Classification of soundscape elements
監測案例地是位于廣東省云浮市新興縣太平鎮的共成水庫保護區。該保護區包括1個省級自然公園以及周邊一定范圍的區域,對應1條核心的生態保護紅線以及若干條一般的生態保護紅線,紅線的類型為水源涵養、生物多樣性維護。省級自然公園的面積為5.678 km2,紅線長度為22.140 km。監測點主要沿自然公園生態保護紅線設置,并向一般生態保護紅線的一定范圍擴展(圖2)。監測點的數量為57個,監測點間距約為350 m。由于本研究主要是監測人為活動對生態保護紅線的侵擾狀況,因此監測點在等距設置的基礎上做了一定調整,向聚落點以及道路靠近。每個監測點都收集至少2個時段1 min音頻(即1個時段對應收集1 min的音頻),水庫上游作為影響整體生態質量的重點區域,對該區域完整收集3個時段的音頻(早、中、晚),以充分把握聲景觀的時空動態。音頻的收集依靠手持Zoom H4n PRO 設備,并在采集時間點規避大風、雷、大雨等氣象因素。收集的每段1 min 音頻被切割為6 段10 s 音頻,聲景觀要素的識別模型統一以10 s 為分類的基本單位,總共得到944 段10 s 的音頻。

圖2 案例地區位以及監測點空間分布Fig.2 Location of case areas and spatial distribution of the sampling sites
為將深度學習模型的識別結果轉化為生態保護紅線監測結果,采用生態聲景觀要素占比指標評估生態保護紅線狀況。即先利用深度學習模型識別生態聲景觀要素數目、生活聲景觀要素數目以及生產或交通聲景觀要素數目,再計算生態聲景觀要素數目在所有聲景觀要素數目的占比(如某點在早、中、晚共收集3段1 min音頻,模型將這3 min音頻分割為18段10 s音頻,然后識別18段音頻的類型,最后統計每種類型的數目及占比)。同理,通過計算生活聲景觀要素數目以及生產或交通聲景觀要素數目在所有聲景觀要素數目的占比,還可以監測侵擾類型及程度。
識別生態易受侵擾區域以設置常態化監測點是日常監測的前提,本文通過回歸模型分析易受侵擾的主要因素。生態保護是要協調人地關系系統,因此回歸模型的自變量將圍繞地與人2 個方面選取,即生態本底特征和人類侵擾分布特征。生態本底通過監測點所在位置的植被歸一化指數(NDVI)、監測點高程表征。NDVI 數據是董金瑋等(2021)基于Landsat5/7/8 遙感數據提取的,高程則來自地理空間數據云的ASTER GDEM 30 m分辨率數字高程數據⑧ASTER GDEM 30 m分辨率數字高程數據:http://www.gscloud.cn/home。
人類侵擾分布特征可被分為活動影響范圍和活動影響程度2個方面,活動影響范圍通過監測點距居民點距離、夜間燈光強度、距道路距離表征。居民點位置參考百度地圖。道路數據來自Open Street Map。夜間燈光數據截取自美國國家海洋大氣管理局下屬國家環境信息中心生成的NPP/VIIRS夜間燈光數據集⑨NPP/VIIRS夜間燈光數據集:https://www.ngdc.noaa.gov/eog/index.html,原有空間分辨率為15″(約450 m)。活動影響程度通過多尺度中心性表征,理論上中心性越強的空間,受影響程度越大。本文選擇空間句法理論中最典型的指標——全局、局部整合度(楊滔,2017)表征多尺度中心性。整合度變量在拓撲圖形學的含義是空間系統中某一元素與其他元素之間的集聚或離散程度,反映該空間在整個系統的中心性。整合度高說明此類空間更有可能吸引全局或局部上的人類到此活動,生態受侵擾的概率更大。具體實現是以道路網、居民點為人類活動范圍的基本框架,將其轉化為軸線圖,并通過DepthmapX軟件計算得到。
高效地提取聲景觀要素特征是模型的關鍵。通過傳統方法提取的聲音信號特征,包括韻律特征(音高、強度和持續時間)、音質特征(共振峰、頻譜能量分布、諧波噪音比)以及頻譜特征(梅爾頻譜系數、線性預測系數、感知線性預測系數)(Zhang et al., 2022),往往是低維的,無法反映“三生空間”中各聲景觀要素的復雜特征。一種融合梅爾頻譜圖和卷積神經網絡的新興方法逐漸在環境聲音分類模型中表現出優勢,通過反向傳播學習聲音能量在時間和頻率上的分布特征,可以捕捉到復雜聲音的差別;此外,通過卷積核計算,能識別較強噪音背景下的環境聲音類型(Salamon et al., 2017)。本文的模型框架在該思路的基礎上設計。首先,將聲音信號轉化為梅爾頻譜圖,為增強模型對時間維度上的學習能力,該模型還計算一、二階差分的梅爾頻譜圖,并將原始、一、二階差分的梅爾頻譜圖作為3個通道輸入模型;其次,為最大程度地避免樣本數量較少以及標簽質量不佳等問題,該模型使用Mixup 的數據增強方法(Zhang et al., 2017);最后,將 數 據 輸 入 VGG、GoogleNet、ResNet 三 個 主流的輕量級深度學習模型中,再使用2 層全連接輸出28類聲景觀要素(圖3)。

圖3 深度學習模型框架Fig.3 Schematic representation of the deep learning model
模型基于python3.6 的tensorflow1.18.3 的深度學習框架搭建。模型輸入分為2種情況,僅輸入原始梅爾頻譜圖和輸入含原始、一、二階梅爾頻譜圖(類似RGB三個通道的圖像),輸入尺寸為224×224;模型主體框架有3種,VGG、GoogleNet、ResNet,通過對比不同輸入情況和不同主體框架的模型精度以選取最佳模型。縱向對比看,3種模型在加入一、二階梅爾頻譜圖作為另外2個通道后,模型精度皆有顯著提升(表2)。其中,VGG 的訓練精度提升約3%,驗證精度約提升5%;GoogleNet的訓練精度約提升3%,驗證精度約提升4%;ResNet 的訓練精度約提升14%,驗證精度約提升5%。橫向對比看,ResNet 的訓練精度和驗證精度最高,分別為89.88%和72.41%,表明該模型框架可以較好地對聲景觀要素的復雜特征進行捕獲和識別,因此,模型選取ResNet作為主體框架。

表2 不同模型訓練精度與驗證精度對比Table 2 Comparison of training accuracy and validation accuracy of different models %
從空間分布看,該案例地東側的生態狀況明顯優于西側,東側的監測點生態聲景觀要素占比大部分都達到90%,侵擾類型以生活類為主(圖4)。通過實地調查發現,東側的各居民點大都完成搬遷,房屋空置率較高,因此這些區域生態環境較少受到人類活動侵擾。相反,西側的監測點生態聲景觀要素占比大部分低于90%,并存在較多監測點低于60%,侵擾類型包括生活類和交通類,易受侵擾的區域包括西南側的上游居民點和西北側的水庫下游大壩區域。這主要是因為縣道沿紅線西側由北向南穿過,車流量相對大導致交通類侵擾嚴重;此外,水庫上、下游地勢相對平坦,加上交通區位的優勢,形成空間集中、規模較大的居民點,導致生活類侵擾也相對更多。

圖4 生態聲景觀要素占比(a)與侵擾類型(b)空間分布Fig.4 Spatial distribution of ecological compliance(a) and type of encroachment(b)
由于西南側的水庫上游作為影響整體生態質量的重點區域,且存在相對多的侵擾現象。為此,采集并分析該區域3個時段的聲景觀。區域在中午時段受侵擾程度相對最高,晚上時段次之,早上時段相對最少,這與人類活動規律基本一致。但在居民點核心范圍內的監測點,3 個時段的侵擾程度都較高(圖5)。

圖5 水庫上游區域受侵擾情況的動態變化Fig.5 Dynamics of encroachment in the upstream area of the reservoir
本文嘗試選取地與人2個方面的空間特征為自變量,構建因變量為生態聲景觀要素占比的回歸模型,分析易受侵擾的主要要素。如表3所示,回歸模型的R2為0.472,并且各變量的方差膨脹系數最大值僅為1.756,可以認為不存在共線性問題,表明各變量可以較好地解釋生態聲景觀要素占比。從空間的生態本底特征看,NDVI 變量的標準化β系數為0.146,但在統計意義上并不顯著,從側面驗證通過傳統遙感數據對植被狀況的監測并不能準確地反映區域的生態狀況,因此,基于聲景觀的監測是必要的。高程變量的標準化β系數為0.163,即地勢越高的地方生態聲景觀要素占比越高,但在統計意義上也不顯著。因此,僅考慮生態本底而忽略動態生物要素存在不足。

表3 生態聲景觀要素占比影響因素分析的回歸模型結果Table 3 Regression model results for the analysis of factors influencing the rate of compliance with the eco-soundscape
從空間的人類侵擾分布特征看,距居民點距離變量的標準化β系數為0.261,且在統計意義上顯著。這表明距居民點愈遠生態聲景觀要素占比愈高,受侵擾的概率愈小。夜間燈光強度變量的標準化β系數為-0.319,并在統計意義上顯著。這表明夜間燈光強度越高的地方,生態聲景觀要素占比越低,受侵擾程度越高。距道路距離變量的標準化β系數為0.185,且顯著性P值為0.088,說明距離道路越遠生態聲景觀要素占比越高,受侵擾概率越小。距居民點距離、夜間燈光強度和距道路距離表征人類活動影響范圍變量的分析結果符合基本常識。值得注意的是,夜間燈光強度的標準化β系數在所有變量中絕對值最大,說明人類夜間活動以及燈光強度對生態聲景觀的影響是顯著的,在選取常態化監測點中需重點考慮。在表征人類活動影響程度的變量方面,全局整合度的標準化β系數為-0.206,且顯著性P值為0.059;局部整合度的標準化β系數為0.138,但在統計意義上不顯著。這驗證了全局整合度越高的空間,其生態聲景觀要素占比越低,生態受侵擾的概率越大;但局部整合度對生態的影響微乎不計。
本文針對現有研究忽略動態生物要素的問題,基于生態聲景觀視角結合深度學習和傳統GIS方法對生態保護紅線進行評估,并分析影響生態聲景觀的主要因素,得出的主要結論包括:
1)參考“三生空間”制定了聲景觀要素分類標準,并構建深度學習模型進行訓練,得到分類模型的訓練精度為89.88%、驗證精度為72.41%。深度學習模型的識別結果與實地調研觀察到的聲景觀要素類型基本一致,證實了通過聲景觀智能化監測的方案在日常監測中是可靠的。
2)利用深度學習模型對案例地聲景觀進行分類預測,并通過計算生態聲景觀要素占比實現生態保護紅線的監測。監測結果顯示,案例地生態狀況整體較好,大部分監測點的生態聲景觀要素占比都在60%以上,侵擾類型以生活類和交通類為主;從空間分布上看,案例地東側的生態狀況明顯優于西側;從時間上看,案例地在中午時段受侵擾程度相對最高,晚上時段次之,早上時段相對最少,這與人類活動規律基本一致。
3)利用回歸模型分析易受侵擾的主要因素,模型的R2為0.472。分析結果顯示,夜間燈光強度對生態聲景觀要素占比的影響最大,隨后依次是距離居民點的距離、空間中心性、距道路距離。因此,在聲景觀常態化監測點的選址中應按照以上重要次序對這些因素進行考慮。此外,NDVI 以及地勢等表征空間本底的因素在模型中并不顯著,這也從側面驗證僅考慮生態本底而忽略動態生物要素存在不足。因此,日常監測應捕捉動態的侵擾因素,做到在發生重大生態破壞行為前早發現。
本文創新地將聲景觀要素納入監測體系,符合生態保護紅線日常監測的基本需求。基于聲景觀智能識別的監測相比較傳統的遙感評估方法各有優勢。在大尺度上對區域生態本底進行評估,遙感圖像解譯具有較大的優勢,通過遙感技術結合人工糾正的方法劃定生態保護紅線也是目前的主流方法。但是,遙感和人工方法對動態生態要素把握仍不足導致日常監測的準確性受限。基于聲景觀智能識別的方法在生態保護紅線日常監測中具有優勢:聲景觀可以反映人類活動、動物活動等動態要素對生態環境的影響,幫助更全面地監測生態保護狀況;基于聲景觀的智能識別方法可以連續監測長時序的生態狀況,并實現自動分析,可滿足日常監測的基本需求;最后,該方法還可以識別出具體的侵擾類型,有助于生態保護紅線的日常整治。
本研究也存在一些不足,在深度學習模型方面,本文創新地制定了一聲景觀要素分類標準,但這份標準的二級分類可能存在要素不全面的問題,并且各分類的梅爾頻譜圖特征區分度可能不夠,進而導致模型無法識別;此外,根據這份標準收集的訓練樣本數有限,且每個類型的素材數量也不完全一致,這些都會導致模型精度降低,進而對生態保護紅線的監測結果產生影響。未來的研究可通過改進分類標準和提高訓練樣本質量以減少模型誤差。進一步地,智能化評估方法的精度若在未來能達到較高精度,還可以作為生態保護紅線相關法律、法規的數據依據,并規避人為篡改監測結果的風險,幫助建設“理論—技術—法規”生態保護紅線日常監測體系。在案例地的監測方面,本文通過手持設備進行音頻數據收集,沒有完整地模擬日常監測的全部時段,因此所計算的生態聲景觀要素占比可能存在偏差。并且,本文沒有對案例地進行長期追蹤監測,在未來的日常監測工作中可以根據地域特性對生態聲景觀要素占比設置不同閾值,占比達到一定閾值后可視為達標。監控達標率的高低可以對監測點進行預警,以及對日常整治工作的效果進行考核。值得注意的是,案例地代表的是華南的大都市區遠郊,其生態聲景觀類型較豐富,但在一些生態本底較差地區,聲景觀變化并不明顯,本文監測方案可能對其作用不明顯。
致謝:感謝審稿人對本研究的修改提出寶貴的建議,此外,廖伊彤和張昕在數據采集過程中提供了幫助,在此一并表示感謝。