黃 煒, 趙來軍
(上海大學 管理學院,上海 200444)
藍藻是一種原始而古老的藻類原核生物,在富營養化湖泊中常于夏季大量繁殖,腐敗死亡后在水面形成一層藍綠色而有腥臭味的浮沫,被稱為“水華”[1].2000年以來,太湖藍藻水華的持續時間有所增加,3~12月都會發生;近年來太湖藍藻水華的發生頻率和空間范圍都大大增加.滇池每年都會發生不同范圍、不同程度的藍藻水華.年年出現的夏末藍藻水華也引起公眾對波羅的海環境狀況的關注.藍藻水華問題已成為國內外一個主要的環境問題,也一直是一個十分困難的研究問題.
孔繁翔和高光[2]認為,風浪和湖流將湖區內的藍藻吹向湖岸,形成水華,大型湖泊中的藍藻不必完全依賴外界輸入的營養鹽.姚恩親等[3]認為藍藻喜歡堿性環境,人們通過大量研究和觀測都發現pH值與藍藻水華暴發存在相關性.徐恒省等[4]基于對太湖藍藻水華現場近500d的觀測結果認為,風速、風向和藍藻在水體中的分布存在內在聯系.武勝利等[5]通過實證研究得到:溫度并非太湖藍藻水華暴發的必要條件;較大風速對藍藻水華起抑制作用;充足的日照并非水華暴發的必要條件;降水可以有效抑制藍藻水華.王銘瑋等[6]認為藍藻數量達到一定程度后,低流速、高氣溫、低風速、少降水、強光照和低氣壓可能導致水華發生.但也有反例:2007—2009年3年中,2009年夏季日照時間較少,但水華出現天數卻最多.Spencer等[7]的研究表明,光照條件與水華形成有著密切關系.Sullivan等[8]報告,在澳大利亞的摩根,魚腥藻水華在渾濁度低于50NTU時發生.Maier等[9]評估了對藍藻水華起作用的8個變量:渾濁度、水體顏色、溫度、水流、總磷、溶解磷、氧化氮和總鐵.一般認為對藍藻種群的生長起重要作用的因子包括溫度、光照、營養鹽和水體穩定性.Mur等[10]發現,藍藻細菌每天增殖0.3~1.4倍,比很多藻類的速率慢得多.溫度在25°C以上時大多數藍藻達到最快生長速率.Paerl等[11]認為,藍藻水華一般由藍藻本身的生理特點以及溫度、光照、營養鹽、其它生物等諸多環境因素引發.Figueiredo等[12]觀測到溶解氧在水華的衰退期被大量消耗.Metro Halifax水土保護協會發現,過度飽和的O2和CO2濃度迅速降低,強烈的太陽輻射,這是對浮游生物最不利的環境,此環境抑制了光合作用和固氮過程[13].此結論對強光照有利于藍藻大量生長的傳統認識提出了挑戰.
上述文獻雖然提出了諸多影響因子,但不同學者關于同一影響因子得出不一致、甚至相反的研究結論,這些需要進一步的研究.很多研究者只考察少數幾個或某類影響因子與葉綠素a濃度、藍藻密度或水華事件之間的相關性,缺乏對不同種類影響因子的廣泛比較.這會導致研究結論的片面性,因為只考察某類因素時并不能保證其它種類因素保持不變這一假設的正確性,例如文獻[5]就存在此問題.因此研究此類問題應盡可能納入更多的影響因子,包括水質、水文和氣象等不同種類的影響因子.一些有關藍藻水華影響因子的研究使用實驗法,這其中數據量偏少以及模擬環境與真實環境的偏差的問題可能導致研究結論的片面性和誤差.有的學者采用一些簡單的統計方法對水華發生頻率或藍藻密度及其空間分布作了一些簡單的統計描述,缺乏相關性分析等深入研究.
基于前人的研究成果,也為了解決其中存在的問題,本文構建以藍藻水華發生與否為因變量、同時以水質、水文和氣象3類指標為自變量的非線性關系模型,基于歷史數據系統地識別出藍藻水華暴發的顯著環境影響因子.
目前,國內外關于藍藻水華影響因子的研究,主要考察葉綠素a濃度、藍藻密度等和一些影響因子(如風速、氣溫)之間的關系.葉綠素a濃度或藍藻密度只能從微觀角度表示藍藻水華的強度,并不能確切表示藍藻水華發生與否;再加上藍藻水華暴發條件的多樣性和復雜性,這些指標和其影響因子之間的關系并不能代表水華暴發與否和這些影響因子之間的關系.例如有研究結論表明:當湖體中的葉綠素a含量超過10μg/L或藍藻密度達到20 000細胞/mL時可被稱為藻類水華[14];然而孔繁翔等人的觀測報告顯示,2007年8月上旬太湖水體中的葉綠素a濃度大于水華形成閾值,但由于臺風過境,幾乎沒有觀測到藍藻水華的形成[15].藍藻水華是由于特定的氣象與水文條件導致藍藻群體在水體中位置的改變而“瞬時”形成的,并不全是藻類的原位生長所致[16].在水華發生季節,沒有人為干擾時,只要環境合適,湖泊中葉綠素一般都保持高濃度狀態,這期間葉綠素并沒有迅速消失或增加[2].另外盡管藍藻水華的定義并不統一,但在此領域內有一個較公認的觀點,即藍藻顆粒覆蓋水面是藍藻水華暴發的重要特征[17].但水體中葉綠素a濃度或藻類密度較高時藍藻顆粒并不一定形成對水面的覆蓋.藍藻顆粒對水面的覆蓋與水體中的葉綠素a濃度或藻類密度之間并無確定的關系,或者說關于葉綠素a濃度或藻類密度并沒有一個科學、準確和確定的閾值可被用來判斷藍藻水華暴發與否.這些都說明,不宜用葉綠素a濃度或藻類密度等作為藍藻水華暴發與否的指標;另外藍藻水華的發生受水質、水文和氣象類因素影響.
本文中藍藻水華反演圖被用來判斷水華發生與否.水華反演圖是基于衛星云圖制作的,而衛星云圖在反映藍藻水華暴發情況方面具有較多優勢.衛星云圖從宏觀角度反映藍藻水華的暴發情況,因而比從微觀角度(即在某一點)測量水體的葉綠素a濃度、藍藻密度或藻類生物量的方法更加科學、準確地反映藍藻水華暴發與否及暴發的強度,因為某一點的藍藻密度等指標的值較大并不能確切地反映該點所在水域形成藍藻覆蓋,也不能確切地反映水華強度.衛星云圖由固定的遙感傳感器(例如EOS衛星的MODIS傳感器)成像,更客觀——尤其與人工觀測相比.衛星云圖是基于覆蓋水面的藍藻水華的光譜特征而形成圖像的,符合藍藻水華通行的概念.目前國內外尚無研究者用藍藻水華反演圖判斷某個水域在某個時間是否暴發水華,進而直接將水華發生與否的指標作為被解釋變量來研究它與環境非生物影響因子間的關系.
在本藍藻水華影響因子識別模型中,因變量是藍藻水華暴發與否,是二元變量,只取“發生”或“未發生”兩個值,而自變量均為(或大多為)連續變量,對于這一特殊的數據模式一般的研究方法或模型均不適用,而離散因變量模型大類中的二元選擇模型較為合適.Probit模型是一種二元選擇模型[18].在Probit模型中,因變量y是關于自變量xt(xt為自變量向量)的、服從正態分布的非線性函數.xj(第j個自變量)的變化對響應概率p(即事件發生的概率)的影響為

式中,φ為標準正態分布函數的密度函數,βt為系數向量.可由式(1)判斷xj每增加一個單位時因變量表示的事件發生的概率變化多少單位.系數βj如為正數,則xj越大,因變量取1的概率越大;如為負數,則xj越大時相應的概率越小.相對于其它二元選擇模型(邏輯模型和極值模型),Probit模型中自變量系數的意義更明確,更適合作為各影響因子影響趨勢的度量手段.
以藍藻水華發生或不發生的狀態作為因變量y,以若干潛在影響因子作為自變量xt構建顯著影響因子識別模型.總體擬合模型為

式中,F為累積分布函數,對于Probit模型,F為Φ(x);βt為均值是0且相互獨立的隨機誤差項.使用Eviews 6.0中的Probit建模工具,擬合模型為

樣本值y=1表示藍藻水華發生,y=0表示不發生.
從式(3)可以看出:當xj變化時,其系數表示了水華發生概率的變化趨勢和變化程度.例如xj增加(其它自變量保持不變)時,如果其系數βj為正數且較大,則積分上限增加且增加較多,又由于被積函數為正的密度函數,從而水華發生概率增加且增加較多.
此模型要驗證的假設:
H0為藍藻水華暴發與否與模型中的各潛在影響因子均不顯著相關,即H1為并非所有的βj(j=1,2,…,k)都為0.

上述模型為一個通用的模型,可以用于湖泊、水庫藍藻水華顯著影響因子的識別研究.
2007年5月底藍藻大規模暴發,藍藻水華面積達全太湖的1/3.統計結果表明,2007年和2008年藍藻水華呈加劇態勢[19].2011年太湖全湖藻類水華暴發頻次較往年有一定幅度的下降,但小范圍水華暴發頻次居高不下.梅梁灣、貢湖灣、西部沿岸一帶藍藻形勢沒有根本好轉.對各監測點的調查結果顯示,太湖流域以藍藻門為主,藍藻門數量最高時約占藻類總量的91.6%[20].
研究中的數據由中科院南京地湖所數據集成與模擬中心提供,為太湖湖體大貢山水域2008年6—12月的日水質、水文、氣象3類(共19項監測指標)監測數據和太湖藍藻水華反演圖.19項監測指標為:風速V、風向D、瞬時降雨IR、氣溫Ta、水溫Tw、太陽輻射I、氣壓P、濁度T、水深HW、電導率C、pH值、溶解氧濃度ρdo、電池電壓VC、濕度H、藍藻密度CD、葉綠素a濃度ρch、氨濃度ρNH3、硝酸鹽濃度ρNI、鹽度S.由于云層覆蓋,被研究階段中有些日期的反演圖無法制作,又由于監測系統的故障,少量日期的監測數據缺漏,有效樣本共59個.
數據處理工作主要有:對自動監測數據時間段的定位——由于每天的監測數據多達兩百多條,但其未提供時間信息,需根據每條記錄中的太陽輻射強度、氣溫、水溫、氣壓等信息確定該記錄的監測時間段,以便與反演圖的記錄時刻匹配;將監測數據與水華反演圖的信息進行組合,以及對監測數據作歸一化處理.
在EViews 6.0建模環境中按上述內容構建因變量和自變量的函數關系結構,并按此關系結構將用Excel軟件預處理(即上述的數據處理)過的數據復制到EViews的數據結構中,選用Probit模型對此數據集作擬合運算.影響因子識別模型的擬合結果的主要情況如表1所示,19個自變量中,V,Ta,H和C分別0.094,0.008,0.063和0.087,在10%的顯著性水平上通過z檢驗,對因變量有顯著影響.前兩個變量的系數符號表明其分別與藍藻水華發生的概率負相關和正相關,與一些文獻(例如文獻[21])中的研究結論一致.關于后兩個變量較少有文獻涉及,目前國內外尚無它們與水華暴發與否之間關系的相關研究結論.本研究的統計結果顯示,濕度、電導率與水華發生的概率負相關,這是本研究的新發現.但濕度、電導率與水華發生之間的關系有待進一步的機理研究,對于電導率與水華發生之間的關系還需作因果關系檢驗.
模型的可決系數為0.647,擬合優度值較好.LR統計量檢驗除了常數項以外所有系數都是0的假設,測試模型整體的顯著性.Prob(LR)=0.000 05<0.01%,此模型在0.01%的顯著性水平上通過整體顯著性檢驗.擬合優度檢驗結果:H-L統計量的值是11.5,此值偏大.

表1 用19個自變量擬合的結果Tab.1 Fitting result with 19independent variables
殘差檢驗結果如圖1所示,圖中A為標準化殘差變動幅度,N為樣本編號.殘差總體較小,在0附近,較理想,但有兩個殘差值較大.

圖1 擬合模型的殘差檢驗圖Fig.1 Residual test for fitted model
根據自變量間的相關性分析結果,采用逐步回歸的方法從模型中去掉氨濃度、水溫、鹽度、溶解氧濃度、氣壓和電池電壓這6個與其它自變量相關性強的自變量.最后的擬合結果的主要情況如表2所示,與表1中的擬合結果比較,多了一個顯著因子——硝酸鹽濃度,它與因變量正相關,顯著性達到1%.此統計結論與文獻[21]中的相關結論一致.

表2 將大貢山水域數據去掉6個指標后的擬合結果Tab.2 Fitting resultafter6indiceareremoved
自變量影響的顯著性提高了,V,Ta,H,ρNI和C分別為0.013,0.013,0.024,0.006和0.023,均在5%的顯著性水平上通過z檢驗.這幾個自變量的z統計量的絕對值大于2,根據Probit模型的理論可知[18],這也表示它們的系數真值至少有95%的概率不等于0,也就是說它們對因變量的影響是顯著的.由自變量系數的絕對值(其含義見對式(1)和式(3)的解釋)可知,氣溫與硝酸鹽濃度對水華發生概率的影響程度較大.由于去掉了6個自變量,可決系數為0.522,較前一次的可決系數有所降低.即Prob(LR)=0.000 06<0.01%,此模型在0.01%的顯著性水平上通過整體顯著性檢驗.擬合優度檢驗結果顯示:每組預測的H-L值較小,即預測誤差較小;H-L統計量的值較小,為3.46,與前一次的相應值相比,此指標大幅度改善,擬合效果較好.
模型的殘差正態性檢驗結果比較理想,見圖2,其中n為樣本個數,r為殘差值.殘差平方的相關圖和偏相關圖也顯示該模型的檢驗結果較理想,不存在自回歸條件異方差性,見圖3.

圖2 殘差正態性檢驗Fig.2 Normality test for residuals

圖3 殘差平方的相關圖和偏相關圖Fig.3 Correlogram and partial correlation diagram of residual sum of squares
將離散因變量模型(二元選擇模型)引入藍藻水華研究領域,根據藍藻水華反演圖判斷水華暴發與否,用水華暴發與否的指標作為模型的因變量,用水質、水文和氣象3類監測指標作為自變量,構建了藍藻水華顯著影響因子識別模型,基于太湖大貢山水域的歷史數據識別出顯著影響因子.研究結果顯示:氣溫和硝酸鹽濃度與太湖大貢山水域的藍藻水華暴發的概率正相關;風速、濕度和電導率則與水華暴發的概率負相關,其中濕度和電導率的影響效果為本文的新發現.它們都是太湖大貢山水域的藍藻水華暴發的顯著影響因子.本文為太湖藍藻水華確定的顯著環境影響因子能為有關部門制定太湖藍藻水華長期防治規劃(例如削減硝酸鹽)和短期應急措施(例如人工降雨、開閘放水、引江濟太、人工打撈等)提供理論依據.本研究方法亦可用于其它水域.
本文中的研究方法和相關模型具有實用性和普適性,因為在太湖、巢湖等國內的諸多湖泊、水庫和河流以及國外的諸多湖泊、水庫和河流都設有自動監測設備或人工監測點,且衛星遙感服務又具有全球覆蓋性,也就是說此類研究工作需要的數據是存在的.只要通過合適的方法獲得這些數據后就能構建此類模型并進行實證研究.
由于數據可得性的問題,筆者只考慮了藍藻生存環境中的物理、化學類影響因子,未考慮生物類影響因子.
[1]陳翔,禹繼華,劉杰,等.洪澤湖藍藻暴發的氣象條件分析[J].安徽農業科學,2010,38(15):8141-8142,8177.
[2]孔繁翔,高光.大型淺水富營養化湖泊中藍藻水華形成機理的思考[J].生態學報,2005,25(3):589-595.
[3]姚恩親,魯斌禮,吳錦芳.湖泊藍藻水華發生的影響因子[J].科技促進發展,2009(12):8.
[4]徐恒省,翁建中,李繼影,等.太湖藍藻水華預警監測與風速風向的關系研究[J].環境監控與預警,2009(2):5-7.
[5]武勝利,劉誠,孫軍,等.衛星遙感太湖藍藻水華分布及其氣象影響要素分析[J].氣象,2009,35(1):18-23.
[6]王銘瑋,徐啟新,車越,等.淀山湖藍藻水華暴發的氣象水文因素探討[J].華東師范大學學報,2011(1):21-31.
[7]Spencer C N,King D L.Regulation of blue-green algal buoyancy and bloom formation by light,inorganic nitrogen,CO2,and trophic level interactions[J].Hydrobiologia,1987,144:183-191.
[8]Sullivan C,Saunders J,Welsh D.Phytoplankton of the River Murray,1980-85[R].Water Quality Report No.2.Canberra:Murray-Darling Basin Commission,1988.
[9]Maier H R,Dandy G C,Burch M D.Use of artificial neural networks for modelling cyanobacteria Anabaenaspp.in the River Murray,South Australia[J].Ecological Modeling,1998,105:257-272.
[10]Mur L R,Skulberg O M,Utkilen H.Cyanobacteria in the environment[DB-OL].[1999-07-01].http//www.who.int/water_sanitation _health/resourcesquality/toxcyanchap2.pdf.
[11]Paerl W,Fulton R S,Moisander P H,et al.Harmful freshwater algal blooms,with an emphasis on cyanobacteria[J].Science World,2001,1:76-113.
[12]Figueiredo D R,Reboleira A S S P,Antunes S C,et al.The effect of environmental parameters and cyanobacterial blooms on phytoplankton dynamics of a Portuguese temperate lake[J].Hydrobiologia,2006,568:145-157.
[13]Soil & Water Conservation Society of Metro Halifax.The Blue-Green Algae (Cyanobacteria)[DB-OL].[2007-09-20].URL:http://lakes.chebucto.org/cyano.html.
[14]王崇,孔海南,王欣澤,等.有害藻華預警預測技術研究進展[J].應用生態學報,2009(11):2813-2819.
[15]孔繁翔,馬榮華,高俊峰,等.太湖藍藻水華的預防、預測和預警的理論與實踐[J].湖泊科學,2009,21(3):314-328.
[16]Reynolds C S.The ecology of the planktonic bluegreen algae in the north shropshire meres[J].Field Studies,1971,3:409-432.
[17]周立國,馮學智,王春紅,等.太湖藍藻水華的 MODIS衛星監測[J].湖泊科學,2005,20(2):203-207.
[18]張大維,劉博,劉琪.EViews數據統計與分析教程[M].北京:清華大學出版社,2010:160-161.
[19]李旭文.Landsat-7SLC-OFF ETM 遙感 數據下載及在太湖藍藻水華監測中的應用[J].環境監測管理與技術,2009,21(3):13-16.
[20]顧蘇莉,陳方,孫將陵.太湖藍藻監測及暴發情況分析[J].水資源保護,2011,27(3):28-32.
[21]Jiang Y,Ji B,Wong R N S,et al.Statistical study on the effects of environmental factors on the growth and microcystins production of bloom-forming cyanobacterium—Microcystis aeruginosa[J].Harmful Algae,2008,7:127-136.