莫定源 MO Ding-yuan
(百色學院數理科學與統計學院,百色 533000)
百色市于2020 年3 月30 日被國務院批復同意設立為廣西重點開發開放試驗區,這對區域經濟快速發展提供了契機,而城市發展也給生態環境帶來必然的壓力,生態環境污染、生態系統損害的問題將日益凸顯。本文開展百色市生態環境綜合評價研究,目的在于識別影響百色市生態環境的關鍵驅動因子,探究各類生態環境指標對生態環境的影響程度及指標間強弱的耦合關系,豐富和發展現有的百色市生態環境評價理論。
目前針對生態環境的綜合評價研究包括以下兩類:①對生態環境評價指標體系的構建及指標變化趨勢的定性研究,研究對象涉及省域、市域、山區道路、礦區、草原等;②基于研究區構建生態環境評價指標體系,并利用統計數據或提取的指標數據,運用相關數學模型對生態環境質量評價進行定量研究。譬如蔡文博等[1]基于遙感多源數據和統計數據對全球四大灣區生態環境進行綜合評價,郁文等[2]綜合運用層次分析法以及模糊綜合評價法對礦山地質的生態環境進行評價,劉璐[3]利用遙感指數法研究河套平原綠洲的生態環境狀況,吳倩[4]基于遙感與GIS 技術對華北油田中部地區進行生態環境評價,蓋美等[5]基于熵權TOPSIS 法探究海洋生態環境質量狀況。此外,也有學者將貝葉斯網絡模型應用于生態環境領域,譬如黎斌等[6]提出運用貝葉斯網絡對城市生態紅線進行劃定,楊湘艷等[7]基于貝葉斯網絡對海洋生態環境質量進行評判。雖然眾多學者對生態環境的評價進行了研究,但鮮有學者以市域為研究對象進行生態環境質量的預測研究。另外,在進行生態環境綜合評價時,存在指標體系構建欠妥、數據質量難以保證以及對生態環境系統認知受限等問題,影響了生態環境的綜合評價結果的客觀性和準確性。
本文在前人研究的基礎上,構建百色市生態環境綜合評價指標體系,并建立基于貝葉斯網絡的百色市生態環境綜合評價模型,該模型的優點是可以彌補生態環境綜合評價過程及預測的不確定性,在某種程度上提高評價結果的準確性及預測的可靠性。利用貝葉斯網絡直觀、可視化的特點,可以直觀揭示指標間的依賴關系。此外,利用貝葉斯網絡強大的推理能力,結合生態環境系統的內部作用機理,充分挖掘各要素間蘊藏的潛在關系,并對百色市生態環境質量進行預測研究。
貝葉斯網絡(Bayesian network,簡稱BN)是利用圖模型表示概率知識的模型,己經成為解決不確定性問題進行有效表示、概率推理、結構學習和參數學習的有效工具之一[8]。BN 是一個有向無環圖,由網絡拓撲結構和條件概率表構成。其理論依據是概率統計中的貝葉斯公式:
上式中,將X=x 視為假設,Y=y 視為證據。在輸入證據Y=y 之前,P(X=x)稱為先驗概率,在輸入證據Y=y 之后,P(X=x|Y=y)稱為后驗概率[9]。貝葉斯網絡可以有效融合專家先驗知識和證據信息,新證據輸入模型后能對先驗概率進行修正,各節點能得到更符合客觀事實的概率分布。
假設V={x1,x2,…,xn}表示隨機變量的集合,E 表示節點間的相互依賴關系,P 表示模型中的條件概率表,則貝葉斯網絡模型可表示為B=<G,P>。根據統計學概率論的相關知識,貝葉斯網絡聯合概率分布則可表示為[10]:
根據馬爾可夫理論,若已給定父節點集的情況下,則該節點獨立于其非后繼節點。記β(xi)表示節點xi父節點集,則:
通常,確定節點的有向弧(即網絡的拓撲結構)的過程稱為結構學習,而確定節點間相互依賴程度(即條件概率表CPTs)的過程稱為參數學習,將二者統稱為貝葉斯網絡學習。計算貝葉斯網絡節點后驗概率的過程稱為貝葉斯網絡推理,是實現模型預測、診斷分析、評估系統的理論依據[9]。
本文將貝葉斯網絡模型應用于生態環境綜合評價,融入專家知識和實證數據,建立指標間的貝葉斯網絡拓撲結構,并利用實證數據進行參數學習、敏感性分析,再通過貝葉斯概率推理進行生態環境預測研究。本文構建的基于貝葉斯網絡的生態環境綜合評價模型如下:
上式中,Y 表示子節點生態環境綜合指數(i 表示生態環境綜合指數等級,本文中設置該節點為三個等級,在貝葉斯網絡中也稱為三個狀態,分別為良好、一般、較差)或者準則層指標指數。X 表示父節點準則層指標或指標層指標。xj表示第j 個指標的觀測值。
利用本模型進行生態環境綜合評價與預測,步驟如下:①針對研究區獨特性的地理位置、氣候、經濟狀況等,篩選合適指標構建綜合評價指標體系;收集指標數據及計算相關指標數據,并對數據進行標準化處理、等級劃分等;②利用AHP 方法、熵值法二者組合最終確定指標權重;③根據指標間的因果關系或依賴關系,并咨詢相關領域專家,確定貝葉斯網絡拓撲結構示意圖;④利用Netica 軟件基于實證數據對貝葉斯網絡模型進行參數學習;⑤對參數學習后的模型進行驗證,并對感興趣節點(生態環境綜合指數)進行敏感性分析;⑥利用貝葉斯網絡強大的推理能力,設置因果推理及診斷推理,挖掘指標間潛在的強弱耦合關系,對2013-2020 年百色市生態環境質量進行評價,并對預測結果進行綜合分析。
本文以百色市為研究對象,依據目的性、整體性、主導性、動態性和相關性等原則,結合百色市獨特的地理位置、氣候特點等,篩選合適指標并確定百色市生態環境綜合評價指標體系(表1),本文所用到的數據主要來源于《百色市國民經濟和社會發展統計公報》(2013-2020)、《廣西統計年鑒》(2013-2020)、《百色市統計年鑒》(2013-2020)、廣西百色市生態環境局官網等。所用指標的部分數據,是經計算整理后得到。

表1 百色市生態環境綜合評價指標體系及指標代碼
目前,確定指標權重的方法主要有兩類:一類是客觀法,另一類是主觀法。本文為了避免受主觀因素影響較大,同時也為了消除對數據的過度依賴,采用AHP 法和熵值法二者混合最終確定指標的權重。AHP 方法的具體計算步驟詳見相關參考文獻[11]。
熵值法計算步驟如下:
①假設樣本數據可以用m 行n 列的矩陣表示,即
②數據標準化處理,計算公式如下[12]:
正向指標:
負向指標:
由xij組成標準化矩陣。
③計算上述標準化矩陣第j 項指標下第i 個記錄所占比例:
由yij組成矩陣。
④計算上述矩陣Y 第j 項指標的熵值:
⑤計算差異性指數hj。令hj=1-Ej,則當hj越大時,該指標對評價作用就越大。計算hj占總體的比重,計算方法為:

表2 百色市生態環境綜合評價指標權重及等級劃分
下一步,利用綜合指數法計算準則層和目標層數值,綜合指數法公式如下:
上式中,W 表示某一年的生態環境綜合評價指數或準則層某個指標,Qi表示準則層指標或指標層指標標準化值,Pi表示指標權重,n 表示指標個數。經計算,百色市2013-2020 年各年份的目標層和準則層指標數據如表3所示。依據自然斷點法及相關文獻研究成果對指標進行等級劃分,等級劃分結果詳見表2。

表3 2013-2020 年百色市生態環境準則層、目標層指標標準化數據
為了直觀反映百色市2013-2020 年生態環境質量狀況,以折線圖的形式揭示百色市自然環境指數、生態環境指數、社會環境指數、生態環境綜合指數評價結果及演變過程,詳見圖1。

圖1 百色市生態環境綜合評價結果及演變過程
由圖1 可知,從2013-2020 年,自然環境指數總體呈現上升-下降-上升-下降的趨勢,因為2015 年是降水量最多的年份,因此自然環境指數較高,而2016 是降水量最少的年份,導致自然環境指數呈現較大幅度下降。2013-2020 年,生態環境指數呈現曲折上升的趨勢,這是因為城市道路面積在增加,對生態環境有明顯的負向作用,加劇了生態環境的破壞,而污水處理廠集中處理率、人均公園綠地、生活垃圾處理率都呈現總體上升的趨勢,對生態環境有明顯的正向作用,在這四個因素的耦合作用下,使得生態環境指數呈現曲折上升的趨勢。2013-2020 年,社會環境指數呈現總體上升的趨勢,社會環境變得越來越好。主要原因是第三產業占GDP 比值、人均GDP、教育支出均呈現逐年增加趨勢,從而促進社會環境質量變好;同時,工業廢水排放量、工業二氧化硫產量總體呈現逐年下降的趨勢,對社會環境的改善起到很大的促進作用,雖然該兩項指標在2020 年有所上升,但在這五個因素的耦合作用下,使得社會環境指數呈現不斷上升的趨勢。生態環境綜合指數除了在2016 年有較小幅度下降,其余年份均呈現不斷上升的趨勢,表明百色市生態環境質量在不斷得到提升。
本文以驅動力(壓力)-狀態-響應為主線構建貝葉斯網絡模擬和預測模型,指標層指標作為影響百色市生態環境的直接驅動力,生態環境質量是生態環境受到驅動力影響的狀態,而響應是國家、政府部門及個人采取具體措施阻止、減輕生態環境惡化而作出的行為與決策。目前,構建貝葉斯網絡結構的方法主要有兩種:一是領域專家確定;二是實證數據訓練。若通過實證數據學習得到,則必須要有足夠的樣本數據,而節點間因果關系或依賴關系很明顯時,領域專家確定網絡拓撲結構更具優勢[13]。本文選取的指標依賴關系明顯,因而采用領域專家知識方法確定貝葉斯網絡拓撲結構,詳見圖2。

圖2 貝葉斯網絡拓撲結構示意圖
貝葉斯網參數學習的目的是為了確定BN 各節點條件概率表(CPTs)。本研究運用Netica 軟件EM 算法對貝葉斯網絡模型進行參數學習,參數學習后的模型如圖3 所示。限于篇幅,現以節點C(森林覆蓋率)為例,參數學習后的條件概率表如表4 所示。

表4 節點C 森林覆蓋率參數學習結果
當人類活動過度干預生態環境,干預程度超過生態環境自我修復的閾值時,必將導致生態環境受損。政府部門應當根據不同的生態環境質量等級,采取相應的生態環境政策,以促進生態環境與社會經濟的協調發展。現以圖3構建的貝葉斯網絡模型為例,在貝葉斯網絡模型的基礎上添加響應模塊,圖3 中節點U 即為響應節點,模擬政府部門在不同生態環境質量等級下的管理對策,詳見表5。
貝葉斯網絡模型中敏感性分析是通過改變輸入節點參數的值來量化目標節點的影響程度[14],Netica 軟件通過方差縮減方法對目標節點進行敏感性分析。方差縮減的值越大,表示該節點對目標節點影響越大;反之,則越小[7]。通過敏感性分析,識別影響百色市生態環境的主要驅動因子,從而為生態環境保護提供理論依據。選擇百色市生態環境綜合指數作為目標節點,敏感性分析結果如表6 所示。

表6 模型中各指標敏感性分析
由表6 可知,準則層指標對目標節點影響最大的指標依次是社會環境指數、自然環境指數、生態環境指數;在指標層各指標中,對目標節點影響的前五個驅動因子分別是森林覆蓋率、年平均氣溫、年降水量、工業廢水排放量、教育支出,表明該五項指標對百色市生態環境質量影響較大。
為了驗證模型的穩定性和魯棒性,參照相關學者[15]的方法對模型進行驗證。根據圖3 訓練的模型,以目標節點(百色市生態環境綜合指數)的最大概率所在等級作為最終預測值,并將預測值與綜合指數法計算得到的實際值進行比較。
大部分年份預測結果與真實值相吻合,經計算該模型預測準確率為87.5%。根據相關學者的經驗,BN 模型準確率高于80%即可表明模型的預測效果較好[16],因此本文構建的貝葉斯網絡模型性能較好,從而可利用該模型進行預測研究。
本文在綜合考慮敏感性分析、人類活動影響等因素的基礎上,從因果推理、診斷推理兩個方面設置典型的情景分析。
2.6.1 因果推理
在貝葉斯網絡中通過設置父節點的值(輸入證據)來推導子節點各等級發生的概率,依據最大概率原理來判斷推理的結果。
①單因素對百色市生態環境綜合指數的影響。依據敏感性分析,選擇對百色市生態環境綜合指數影響較大的因素(森林覆蓋率)作為典型例子。現通過輸入森林覆蓋率的證據,對百色市生態環境綜合指數的等級進行預測,結果如表7 所示。

表7 單因素對百色市生態環境綜合指數等級的預測
由表7 可知,輸入證據森林覆蓋率為較差時,預測的百色市生態環境綜合指數等級為一般;輸入證據森林覆蓋率為一般或良好時,預測的百色市生態環境綜合指數等級為良好。由此可見,在其他變量保持不變時,不斷提升森林覆蓋率的等級,對百色市生態環境綜合指數等級有較明顯的提升,從而促進人與自然環境的和諧相處,改善人們的居住環境質量。
②多因素對百色市生態環境綜合指數的影響。通過設置與人類活動相關的教育支出、工業廢水排放量、工業二氧化硫產量指標的混合證據,基于最大概率原則對百色市生態環境綜合指數進行預測研究,結果如表8 所示。

表8 多因素對百色市生態環境綜合指數等級的預測
由表8 可知,在其他變量均不變時,輸入證據教育支出、工業廢水排放量、工業二氧化硫產量指標的混合證據均為較差或一般時,百色市生態環境綜合指數的預測等級為一般;在其他變量均不變時,輸入證據教育支出、工業廢水排放量、工業二氧化硫產量指標的混合證據均為良好時,百色市生態環境綜合指數的預測等級為良好。由此可見,隨著教育支出的增加,工業廢水排放量、工業二氧化硫產量的減少,百色市生態環境綜合指數將由一般變為良好。
2.6.2 診斷推理
在貝葉斯網絡中通過設置子節點的值(輸入證據)來推導父節點各等級發生的概率,依據最大概率原理判斷推理預測結果。現輸入百色市生態環境綜合指數狀態三的證據,探討指標層指標各等級發生的概率,并對比先驗概率與后驗概率的變化量。結果詳見表9。

表9 輸入百色市生態環境綜合指數狀態三證據對指標層指標各等級的概率
由表9 可知,輸入證據百色市生態環境綜合指數狀態三時,變化量排在前十名分別是森林覆蓋率狀態三、年平均氣溫狀態一、年平均氣溫狀態三、工業廢水排放量狀態三、教育支出狀態三、人均GDP 狀態三、年降水量狀態三、森林覆蓋率狀態一、年降水量狀態一、工業二氧化硫產量狀態三。此外,當百色市生態環境綜合指數為狀態三時,各指標狀態三的概率均有不同程度的提升,由此說明欲提升生態環境的質量,必須不斷提升各指標良好狀態所占的比例。其中,森林覆蓋率指標狀態三的概率變化最大,并且預測值由原來的狀態二轉變為狀態三,即為了達到生態環境綜合指數為良好等級,則必須保證森林覆蓋率也必須是良好等級,這可為地方政府實施政策體系提供一種思路。其他推理研究類似上述討論,在此不再贅述。
從圖1 可知,社會環境指數與生態環境綜合指數的變動幾乎趨于一致,表明社會環境指數對生態環境指數影響很大,這與敏感性分析中社會環境指數對生態環境指數影響最大的結論相吻合。同時,在2013-2020 年間生態環境綜合指數在不斷上升,由此可以看出百色市生態環境質量在不斷得到提升,表明政府部門實施的生態環境保護政策已發揮應有的作用。
近年來,百色市為了加大環境保護力度,先后頒布了《百色市環境保護“十二五”規劃(2011-2015 年)》《百色市“十三五”工業綠色發展規劃》《百色市節能環保產業發展“十三五”規劃》等規劃方案,這些規劃方案對百色市生態環境進行嚴格監管,對工業廢水排放、工業二氧化硫排放、生活垃圾處理、大氣污染物排放等方面設立嚴格的標準,使得百色市生態環境質量得到了明顯的提升。在近幾年,工業廢水排放量、工業二氧化硫排放量等顯著下降,生活垃圾處理率顯著上升,表明百色市生態環境保護在政府相關部門的監管下已有一定成效。
通過構建貝葉斯網絡預測模型,可以克服指標體系構建欠妥、數據質量難以保證以及對生態環境系統認知受限等因素的不確定性,貝葉斯網絡預測結果并不是絕對的,而是將最大概率所在的狀態作為預測值,從而提升了預測結果的客觀性、科學性和準確性。通過貝葉斯網絡因果推理和診斷推理,可以預測在不同情境下生態環境的變化趨勢,為預防環境惡化及生態破壞提供理論依據。
敏感性分析結果表明,對百色市生態環境綜合指數影響最大的五個指標分別是森林覆蓋率、年平均氣溫、年降水量、工業廢水排放量、教育支出,從診斷推理可知變化量排在前十名分別是森林覆蓋率狀態三、年平均氣溫狀態一、年平均氣溫狀態三、工業廢水排放量狀態三、教育支出狀態三、人均GDP 狀態三、年降水量狀態三、森林覆蓋率狀態一、年降水量狀態一、工業二氧化硫產量狀態三。從診斷推理結果可知,變化量越大的指標表示受生態環境綜合指數影響也越大,即該指標對生態環境綜合指數越敏感。通過對比敏感性分析結果與診斷推理結果,二者彼此交融、相互驗證:一方面,貝葉斯網絡的診斷推理結果充分驗證了敏感性分析的正確性;另一方面,敏感性分析結果能為貝葉斯網絡推理提供決策支持。
本文基于貝葉斯概率相關理論,結合領域專家知識和客觀實證數據,構建了基于貝葉斯網絡的百色市生態環境綜合評價與預測模型,主要結論如下:
①本研究確定各指標權重充分融合了領域專家知識和客觀實證數據。AHP 方法確定權重主要基于生態、環境相關領域專家知識,而熵值法權重則基于客觀數據,融合兩種方法確定指標權重,使得評價結果更加科學、合理。
②對百色市生態環境綜合指數進行了貝葉斯網絡敏感性分析,從而有效識別影響百色市生態環境的關鍵驅動因子,可以為政府部門制定生態環境保護政策提供參考。
③基于貝葉斯網絡強大的推理能力,通過輸入單因素或多因素組合的證據,模擬情景分析進行預測研究,可以充分挖掘模型中潛在的信息。此外,在貝葉斯網絡模型的基礎上可以添加響應模塊,模擬不同管理對策下的效應。
④對百色市2013-2020 年生態環境質量進行綜合評價及演變過程分析,結果表明百色市近年來在生態環境保護工作方面已取得一定成效。
百色市生態環境綜合評價與預測模型的構建,一方面可以為百色市生態環境保護與社會經濟發展協調的政策制定提供科學指導,促進百色市自然、環境、社會等可持續發展;另一方面,利用貝葉斯網絡強大的推理能力,可以預測在不同情境下生態環境的變化趨勢,為預防環境惡化及生態破壞提供理論依據,發揮動態監測在實踐中的有效應用。本文在某些指標數據獲取時存在一定困難,導致構建的綜合評價指標體系還不夠全面。下一步,我們將構建更加完善、全面的生態環境綜合評價指標體系,同時融入動態貝葉斯網絡模型,進一步提高評價和預測的準確性。