施鳳寧 陽輝 劉湘偉 王雨春 蘇禹銘 胡明明*包宇飛 李姍澤 溫潔
(1.中國水利水電科學研究院流域水循環模擬與調控國家重點實驗室,北京 100038;2.云南省水文水資源局,昆明 650100;3.西藏自治區水文水資源勘測局,拉薩 030619;4.武漢大學,武漢 430072)
滇池又名昆明湖,位于云南省昆明市城區西南部,為云南省面積最大的高原淡水湖泊,屬國家重點環境治理的河湖之一[1]。隨著社會經濟的快速發展,大量的工農業廢水和生活污水排入滇池,致使滇池水質惡化,水體富營養化問題突出[2]。由于地理特性、水生生態系統和污染特性等差異,不同水域會出現不同的富營養化表現癥狀,即出現不同的藻類種群分布情況[3]。相較于應用較廣泛的因變量葉綠素濃度[4—6],基于不同水域下各藻類的藻細胞密度進行的富營養化定量分析更具針對性[7],但國內相關研究目前鮮見報道。
定量了解關鍵環境因素對藻類爆發的影響是合理解決富營養化問題的先決條件[8,9]。最大信息系數(Maximum Information Coefficient,MIC)是一種基于信息論的度量標準[10],它考慮了變量間的線性和非線性關系并歸一化了互信息,克服了定量計算非線性信息的難點,逐漸成為水環境研究中新興的相關性計算方法。如Savvas等[11]使用MIC計算了地中海海灣中不同藻類種群與環境因素間的非線性相關大小,Hu等[12]利用MIC計算了膠州灣溶解有機物與理化性質的潛在關系,Liu等[13]應用MIC計算了洱海中不同藻類藻密度與環境因素間的非線性相關關系。本文基于滇池外海2014—2020年氣象數據、水質監測數據及生態監測數據,對滇池外海藻類的時空分布情況進行了分析,并結合MIC與Pearson相關系數對滇池不同區域中環境因素與藻類間的非線性相關關系進行了計算,為湖泊富營養化的定量分析與治理提供了新的視角和理論依據。
滇池(24°27′—25°27′N,102°29′—103°00′E)是云貴高原湖泊中最大的淡水湖泊,屬長江流域金沙江水系,湖面海拔約1886 m,湖體呈弓形,弓背向東,南北長約32 km,東西寬12.5 km,湖岸線長163.2 km[15]。滇池南北分為草海、外海兩部分,其中草海水體面積約10.67 km2,外海為滇池主體部分,面積約287.1 km2[16],湖區情況如圖 1所示。
數據來源外海是滇池的主體部分,其最北部區域為浮游藻類聚集區,富營養化整體呈現北部最高,由北向南逐漸降低的模式[17,18]。選取位于外海北部(海埂中)、東北部(五水廠)、中部(觀音山中)、西南部(白魚口)、南部(大河尾)的5個監測點(圖1),監測時期為2014年1月至2020年7月,監測頻次為每月1次。水樣采集自水面下0.5 m,水溫(WT)、pH采用多參數水質分析儀(哈希Q40D)現場監測數據,透明度(SD)用塞氏盤測定并記錄??偟?TN)、氨氮(AN)、總磷(TP)、葉綠素a(Chl.a)等指標的水質樣品依照水環境監測規范(SL219-2013)采集保存并依據《水和廢水監測分析方法 第四版》進行監測。藻類定性樣品采用25?浮游生物網在水體表層呈“∞”形來回緩慢拖動十次撈取。藻類定量樣品(1 L)用魯哥試劑固定,并在實驗室虹吸濃縮至30 mL后用計數框行格法分類計數,鑒定標準參考《中國淡水藻類—系統分類及生態》[19]。藻密度計算公式如下:

圖1 滇池湖區及采樣點示意Fig.1 Schematic diagram of Dianchi Lake and distribution of sampling points

式中,Ni為每升水中第i種浮游藻類(藍藻、綠藻、硅藻、黃藻等)的細胞數量(cells/L),A為計數框的面積(400 mm2),Ai為計數面積(mm2),Vm為1 L水樣經沉淀濃縮后的樣品體積(30 mL),V為原樣本水量(1 L),ni為每片計數得到的第i種硅藻的細胞數(cells)。
監測的藻類密度包括藍藻細胞密度(CYNCD)、綠藻細胞密度(CHLCD)、硅藻細胞密度(BCLCD)、黃藻細胞密度(XNTCD)、裸藻細胞密度(EUGCD)、隱藻細胞密度(CRYCD)、甲藻細胞密度(PYRCD)和金藻細胞密度(CHRCD)。氣象指標包括氣溫(AIRT)、日累計輻射(TSI)、降雨量(PRCP)和風速(WS;表 1),數據來源于中國氣象數據網及美國國家航空航天局MERRA-2大氣再分析數據。

表1 研究區監測數據情況Tab.1 The water quality and meteorology in study area
相關性分析方法Pearson相關系數:Pearson相關系數用于度量2個變量間的線性相關性,其計算公式為:

最大信息系數:最大信息系數是一種不對數據分布進行假設的相關算法,不僅可以計算變量間的線性關系和非線性關系還可以檢測出不能使用單個函數表示的非函數依賴關系[20],因此適合對湖泊富營養化普遍存在的非線性關系進行定量分析。其核心原理是對兩變量聯合樣本的散點圖采取特定規模的網格劃分,根據網格中的邊際概率密度函數和聯合概率密度函數計算兩變量的互信息值[21],計算公式如下:

式中,B(n)為設置散點圖中網格大小的參數,文獻[22]指出當B(n)=n0.6時效果最好,本文也設置為該值。表示網格中X和Y的最大互信息maxI(D|G),其中互信息公式為:

MIC相關性的取值為[0,1],其中0表示兩個變量是獨立的,1表示兩個變量完全相關,非線性相關系數的顯著性水平由t檢驗(雙尾)給出。根據Reshef等[21]給出的定義,MIC與r2的差值接近零時變量間為線性關系,而變量呈現非線性關系時MIC值較Pearson相關系數大,據此結合兩相關系數的大小進行環境變量與不同藻細胞密度的非線性相關分析。
根據2014—2020年藻密度監測數據(圖2),外海藻密度隨季節變化明顯,且在空間上呈現出北高南低的分布特征。最大值出現在2017年7月的北部區域(51009.66×104Cells/L),最小值為中部區域2020年3月的974.05×104Cells/L。可以觀察到,除2017年7月的異常,北部區域藻密度(1909.00×104—51009.66×104Cells/L)大小自2014年以來有較為明顯的降低,并于2016年降低到最低點,但近兩年有上升的趨勢。東北部藻密度總體(1219.93×104—44694.67×104Cells/L)在2018年前略高于北部,但自2018年后有明顯的降低現象。中部(974.05×104—19274.88×104Cells/L)及西南部(1924.70×104—13383.67×104Cells/L)藻密度長期處于較低水平,南部區域藻密度(1342.67×104—25130.97×104Cells/L)雖高于湖體中部及西南部,但遠低于北部及東北部。

圖2 總藻密度時空分布情況Fig.2 Spatio-temporal distribution of total algal density
藻密度總體在春季及夏季較高且夏季的藻密度高于春季。春季,湖體東北部藻密度水平高于其他區域。夏季,北部區域的藻密度在2014、2017和2020年達到所有區域中的高水平,東北部藻密度在2014、2016及2018年處于前列,南部區域在2020年的藻密度水平攀升至首位。秋季,東北部及南部區域的藻密度水平較其他區域高,而冬季藻密度水平在各區域中分布平均,無明顯的區域性差異。
根據不同藻種在全湖均值及各區域的占比情況可知(圖3),藍藻及綠藻的占比遠大于其他藻類,其中更以藍藻為主。除占優勢的藍藻及綠藻外,硅藻、黃藻和隱藻在不同區域表現出了不同的占比大小。根據全湖均值來看,外海藍藻總體在春季占比低,夏季占比高,除夏季外,在氣溫較低的11月及12月也能達到極高的占比數;與藍藻相比,綠藻在春季占比高,夏季占比低。從各區域藻類分布情況來看,藍藻與綠藻密度均值比呈現出北高南低的態勢(北部:10.95,東北部:7.61,中部:5.18,西南部:6.73,南部:5.08),表明藍藻與綠藻間的競爭優勢由南向北逐漸降低。

圖3 不同藻種時空分布情況Fig.3 Spatio-temporal distribution of different algal species
基于藻種時空差異性分析結果,對藍藻、綠藻細胞密度和環境因素進行了相關性分析。Pearson相關分析結果見圖 4,最大信息系數分析結果見圖 5。根據MIC與r2的差值,全湖藍藻細胞密度與COD(0.053,P<0.01)、Chl.a(0.067,P<0.01)存在更強的線性相關性,與pH(0.22,P<0.01)、AN(0.22,P<0.01)存在更強的非線性相關性,環境因素中MIC值較大的為WT、pH、Chl.a、AN及AIRT。全湖綠藻細胞密度與環境因素非線性相關性較強,其中非線性強度更強的為TP(0.22,P<0.01)和TN(0.20,P<0.01),MIC值較高的為TP、TN、TSI及AIRT。

圖4 皮爾遜相關系數分析結果Fig.4 The result of Pearson coefficient analysis

圖5 最大信息系數分析結果Fig.5 The maximal information coefficient analysis
北部水域中藍藻細胞密度與COD(0.01,P<0.01)及Chl.a(0.14,P<0.01)存在更強的線性相關性,與AN(0.22,P<0.01)、AIRT(0.22,P<0.01)及pH(0.22,P<0.01)非線性關系更強,WT、AIRT、pH、AN及Chl.a的MIC值較大;綠藻細胞密度與AN(0.13,P<0.01)線性程度更強,而非線性程度更高的有Chl.a(0.34,P<0.01)、TP(0.30,P<0.01)、TN(0.30,P<0.01)和AIRT(0.30,P<0.01),環境參數中Chl.a、TP、TN和AIRT的MIC值較高。東北部藍藻與SD(0.15,P<0.01)、PRCP(0.16,P<0.01)和Chl.a(0.17,P<0.01)線性相關性更強,與TP(0.29,P<0.01)、AN(0.28,P<0.01)和pH(0.27,P<0.01)非線性關系更強,環境參數中Chl.a、COD、AIRT和TP的MIC值較高;綠藻細胞密度與WS (0.12,P<0.01)線性程度更強,與AIRT(0.32,P<0.01)、COD(0.28,P<0.01)和SD(0.27,P<0.01)非線性程度更高,MIC值較高的環境參數包括AIRT、COD、SD、pH和AN。
外海中部水域的藍藻細胞密度與AIRT(0.15,P<0.01)、PRCP(0.15,P<0.01)、WT(0.17,P<0.01)、COD(0.17,P<0.01)及Chl.a(0.19,P<0.01)線性程度更高,與TSI(0.29,P<0.01)、WS(0.25,P<0.01)非線性相關性更強,整體而言WT、TN、Chl.a、pH和COD的MIC值較高;綠藻細胞密度與PRCP(0.13,P<0.01)及SD(0.14,P<0.01)線性相關性更強,TSI(0.30,P<0.01)、AIRT(0.26,P<0.01)和WT(0.25,P<0.01)非線性程度更高,MIC值較高的環境參數包括TSI、AIRT、WT及TP。西南區域中,藍藻細胞密度與Chl.a(0.14,P<0.01)、AIRT(0.14,P<0.01)、WT(0.15,P<0.01)、pH(0.17,P<0.01)及COD(0.18,P<0.01)線性相關性更強,TSI(0.29,P<0.01)非線性程度更高,COD、TSI、WT和Chl.a的MIC值較高;綠藻細胞密度與環境因素非線性程度更強,其中與AN(0.34,P<0.01)、WT(0.33,P<0.01)和TP(0.30,P<0.01)具有很強非線性關系,TP、WT、AN和COD的MIC較高。南部水域藍藻細胞密度與環境因素線性相關性弱,與COD(0.35,P<0.01)和TN(0.34,P<0.01)非線性程度高,TN、COD、pH和Chl.a的MIC值較高;綠藻細胞密度與TP(0.12,P<0.01)和COD(0.14,P<0.01)線性程度更強,與pH(0.30,P<0.01)、TN(0.29,P<0.01)和Chl.a(0.28,P<0.01)非線性相關性更強,環境因素中pH、COD、TN和Chl.a的MIC值較高。
2014—2020年滇池外海藻密度呈現明顯的北高南低的現象,其主要原因在于北部湖區近鄰昆明市區[22],受城市污水影響嚴重,東北部是昆明市蔬菜花卉的主產區,存在化肥施用過量的問題[23]。相較于湖區北部與東北部,中部與西南部距城區相對較遠,水體中氮磷含量相對較低。南部區域靠近昆明市晉寧區,雖然相對于主城區受影響小,但該區域藻密度水平仍受城市污水等影響高于中部及西南部。2017年夏季滇池外海尤其是北部湖區出現藻密度異常上升的現象,其原因在于2017 年6—8月流域降水異常,導致入湖河流污染負荷上升,與此同時,牛欄江補水量較2016年減少,降低了補水對外海的水質改善作用[24]。因此,針對性地對北部湖區城市污水、東北部湖區農業污染進行治理,并提升牛欄江補水的環境效率是管控滇池藻類生長的關鍵。
從全湖均值來看,除2016年春季外,2014—2020年藍藻在所有藻類中占絕對優勢,而綠藻僅次于藍藻。相對于藍藻和綠藻,其他藻類占比數較小,對水華貢獻有限。侯秀麗等[25]在滇池2013—2015年的調查中發現,富營養化較高的水環境中,綠藻比藍藻具有更強的生長優勢。本研究數據表明,在整體上綠藻更傾向于在富營養化程度低的水域獲得更強的生長優勢,如本研究中北部與東北部富營養化程度遠高于中部、西南以及南部,但其藍藻與綠藻密度均值比更高;然而在富營養化程度近似的局部,綠藻在稍高的富營養化水域中生長優勢更強,如東北部水域較北部水域富營養化平均程度略高,但藍藻與綠藻密度均值比值卻更低,南部水域較中部及西南部富營養化平均程度略高,但藍藻與綠藻密度均值比值也更低。馮秋園等[26]發現春季藍藻密度和占藻類總密度比例最低,冬季最高,綠藻在春季藻密度和占藻類總密度比例最高,與本研究結果相似,不同的是雖然藍藻在冬季表現出很高的占藻類總密度比例,但藍藻主要在各年的夏季表現出最高的占比。由于在不同季節下,藍藻和綠藻表現出不同的生長優勢,結合不同區域所處的富營養化程度,藻密度及藻類種類分布表現出明顯的季節及空間差異。
由于富營養化過程復雜[27],目前大多數富營養化驅動分析采用的線性相關性雖然可以捕捉環境變量與富營養化表征變量的線性相關關系但對在富營養化過程中大量存在的非線性甚至非函數依賴關系卻無能為力。MIC包含線性與非線性的相關關系,適合判斷藻密度與環境因子的相關性,但從MIC自身難以區分藻類與環境因子間的線性和非線性關系大小。由于Pearson僅表現變量間的線性相關性大小,且MIC及Pearson均是標準化相關性系數,可以將二者結合以探討環境因素與藻類間的線性及非線性關系。藍藻細胞與Chl.a線性相關性較強,綠藻細胞與Chl.a間線性相關性很弱。在優勢藻更替時[28,29],Chl.a與藻密度間的相關性會發生明顯改變,不同季節下物種組成的不同使得Chl.a無法表征準確描述藻類的動態變化。因此,在外海藻類時空分布分析的基礎上,對不同湖區中的主要藻種(藍藻、綠藻)進行非線性相關分析,以獲取藻類與環境因素間更加準確的相關性分析結果。
從相關性分析結果可以發現,藍藻與綠藻的細胞密度與營養鹽在各湖區幾乎不線性相關但存在較強的非線性相關性。相較于營養鹽,物理環境參數與藻細胞密度的線性與非線性關系兼具但非線性強度更高。TP、TN及AN為藻類必需的營養物質[30],是其生長的主要驅動因素[31]。物理參數中AIRT、WT和TSI是藻類生長的必要外部條件[33,34];PRCP對營養鹽入湖通量影響大[32,33];而WS影響藻類在湖中的分布,同時也對水溫的分層產生影響[36]。因此上述外部物理環境參數也是藻類生長的驅動因素。COD、SD和pH受藻類影響大,當藻類死亡分解腐爛時,水體中的化學需氧量會隨著上升[37];滇池水體的酸堿度與水體中植物的光合作用有密切的關系[38],浮游藻類在光合作用下促進水體中HCO3-轉換為H2CO3和OH-;SD作為表征富營養化程度的指標,湖泊富營養化導致浮游植物生物量增加,使得水體SD下降[39]。雖然上述環境參數會受到其他因素影響,甚至成為影響藻類生長的原因,但在本研究中SD、pH與藻密度相關性程度高,且上述因素在機理上并非主要驅動因素,因此COD、pH的結果程度較原因程度更強,與Chl.a一并歸為在該時空分布下的結果參數。SD與藻密度間相關性較COD及pH弱,除受藻類影響外,牛欄江等引水工程也同時對其造成影響,多個影響源使得其與藍藻類密度間的關系更加復雜,因此無法簡單將其歸為原因變量或結果變量。根據相關性分析結果,結果變量與藍藻密度線性相關程度高于原因變量,不同于藍藻,結果變量與綠藻密度間線性關系均不明顯,因此上述結果變量的變動主要受藍藻而非綠藻的生長過程控制。總體而言,藻類密度與結果變量存在明顯的線性關系,而相較于線性關系,藻密度與原因變量間的非線性關系更為顯著。
根據MIC分析結果及定性的驅動分析結果,全湖范圍下藍藻的水質驅動因素主要為WT和AN,由于AN與TN相關性差(0.16),且TN與藍藻密度相關性較弱(0.15),因此其他形態的氮對藍藻生長的影響有限。綠藻的水質驅動因素主要為TP和TN,相較于AN,綠藻可能受其他的氮形態影響大。從各湖區的結果可知(圖5),藍藻細胞密度與氮的相關性更強,且在富營養化更嚴重的北部及東北部區域,AN為主要的營養鹽影響因素,而在富營養化相對較弱的中部、西南部及南部,其他形態的氮的影響更強(TN的MIC高于AN,且TN與AN相關性弱)。各湖區綠藻受氮磷影響相當,其中東北部及南部綠藻受氮影響更深,而其余湖區磷對綠藻的作用更強。由于藍藻為外海主體藻種,對本研究涉及的時空分布而言,滇池外海的藻類受氮的影響更深。在氣象因素中,WS在局部區域的影響較強(北部藍藻、中部藍藻、西南部綠藻、南部藍藻及綠藻),但總體而言AIRT及TSI是全湖范圍下控制藍藻與綠藻生長的主要氣象因素。
(1)2014—2020年滇池外海藻密度呈現明顯的北高南低的現象,對北部湖區城市污水、東北部湖區農業污染進行治理,并提升牛欄江補水的環境效率是管控滇池藻類生長的關鍵。(2)藍藻在所有藻類中占絕對優勢,且藍藻在主要在夏季表現出最高的藻類密度占比,而綠藻相對于其他季節在春季的藻類占比最高。在整體上綠藻更傾向于在富營養化程度低的水域獲得更強的生長優勢,然而在富營養化程度近似的局部,綠藻在稍高的富營養化水域中生長優勢更強。(3)總體上藻類密度與結果變量存在明顯的線性關系,而相較于線性關系藻密度與原因變量間的非線性關系更為顯著。(4)藍藻的水質驅動因素主要為WT和AN,且相較于其他氮源,AN對藍藻的影響更大;綠藻的水質驅動因素主要為TP和TN,其他形態的氮對綠藻的影響可能較AN更強。在氣象條件中,藍藻和綠藻主要受AIRT及TSI的控制。