白 鵬,龍秋波
(1.中國科學院地理科學與資源研究所陸地水循環及地表過程重點實驗室,北京 100101;2.湖南省水利水電勘測設計研究總院,湖南 長沙 410007)
用水量預測是水資源規劃及管理的重要基礎和依據,也是保證供水系統安全運行和科學管理的有效手段[1-3]。用水量預測的方法有很多,根據對數據處理方式的差異,用水量預測通常可分為時間序列法、結構分析法和系統分析法3類[4-6]。時間序列法主要是根據用水量周期性或規律性的變化特征進行統計分析,進而構建預測模型[7-9];結構分析法是通過分析城市用水量與各種相關因素(如人口、產值、糧食產量和氣候等)之間的聯系,構建用水量和關聯因素之間的統計模型,進行用水量預測[10];系統分析法不追究個別因素的作用效果,削弱隨機因素的影響,力求體現各因素對用水量規律的綜合作用[11-12]。上述3種方法各有優勢和不足,目前還無法建立一個確定性模型對區域用水系統的復雜性進行描述。相比于其他兩種方法,時間序列法對用水系統外部復雜的影響因素進行簡化,不需要對影響用水量的因素進行預測,只考慮歷史用水量數據隨時間內在變化規律,進而對整個系統的未來狀態做出預測[7-9]。該類方法比較符合用水量序列的特點,因而在用水量預測工作中應用較為廣泛。常見的時間序列預測法包括年增長率法、移動平均法、人工神經網絡法和自回歸模型法等[13-14]。多種用水量預測方法的比較研究有助于識別最優的方法,減少預測結果的不確定性。本文擬選擇京津冀地區為對象,對3種常用的年用水量時間序列預測方法進行比較,分析3種方法在京津冀地區年用水量預測中的適用性,為促進京津冀地區水資源的高效管理和規劃提供科學支持。
年增長率法是通過分析歷史的城市年用水量增長情況,計算出區域年用水增長率,從而根據現狀水平年的用水量預測出規劃年的用水量。該方法計算簡單,但需要收集長系列的歷史用水量數據,在一些地區可能存在數據缺失、資料不全等問題[6]。年增長率法假定歷史年用水量數據序列符合特定的函數分布(如冪函數),常用的計算公式為
Wt+1=W0(1+R)n
(1)
式中:Wt+1為第t+1年的用水量;W0為現狀基準年用水量;R為城市用水量年平均增長率,本文中R的取值通過歷史用水量數據進行參數擬合求得;n為間隔年數。
當一個變量按時間順序排列的值之間具有依賴關系或自相關性時,就可以建立該變量的自回歸模型,并由此對其發展變化趨勢進行預測[15]。需要指出的是自相關性是建立自回歸模型的基礎,只有具有顯著自相關性的時間序列才可以建立自回歸模型。城市年用水量變化一般都比較緩慢,輕易不會發生突變,符合自回歸模型的構建基礎,該方法的優點是所需資料少,可用自身變數數列進行預測。自回歸模型的方法有很多,本文選取門限自回歸模型進行研究。該模型能有效描述復雜的非線性動態系統,由于門限的控制作用,該模型具有很強的穩健性和適用性,常常被應用于在經濟、環境、海洋、氣象等領域[16]。門限自回歸模型的基本思路是在觀測時間序列{Xt}的取值范圍內引入n個門限值Tj(j=1,2,…,n),根據延遲步長d將{Xt}按{Xt-d}值的大小分配到不同的門限區域內,再用自回歸模型對不同區間內的{Xt}序列進行擬合,從而對時間序列進行非線性動態描述,模型的一般形式[17-18]為
(2)
式中:Tj為門限值;Ztj為第j個相互獨立的正態白噪聲序列;a0j為第j個門限自回歸區間的自回歸系數;mj為第j個門限區間自回歸模型的階數。
區域年用水量變化影響因素眾多,系統內部的變化機理復雜且各類影響因素之間相互作用。人工神經網絡方法具有自適應性、容錯性以及強大的映射能力,能夠大規模處理高度非線性復雜問題,能夠從大量的歷史數據中進行訓練,進而找出時間序列內在的變化規律,因此被廣泛應用于區域的年用水量預測[19-20]。但是,人工神經網絡方法內部參數較多,易陷入局部最優解,灰色預測方法可以很好地解決這些問題。灰色理論是一種研究既包含已知信息又包含未知信息的系統理論與方法,該理論以“小樣本”、“離散”、“無規律”的數據為主要研究對象,將雜亂無章的原始數據序列通過一定的處理方法,使之變為比較有規律的時間序列[21-22],能夠較好地弱化數據序列的波動性并處理隨機擾動因素。但是,灰色預測方法缺乏自學習和自組織能力,尤其是在對復雜的非線性系統進行預測時,因非線性系統的數據隨機性變化顯著,會產生很大的誤差。灰色人工神經網絡充分利用了二者之間的差異性和互補性,充分發揮各自的優勢[23]。二者結合的方式是利用神經網絡對灰色模型GM(1,1)預測結果進行誤差修正,從而構建神經網絡模型和灰色模型GM(1,1)的串聯式組合模型。本研究用到的神經網絡模型為BP模型,隱含層個數為10。具體的計算步驟如下:①對時間序列進行歸一化處理,建立GM(1,1)模型;②基于GM(1,1)模型進行時間序列的預測;③計算觀測數據和預測數據的誤差;④將模型預測誤差序列作為神經網絡模型的輸入項,對網絡進行訓練,確定網絡的權重和閾值,得到能夠反映預測值和誤差關系的網絡結構;⑤分別基于GM(1,1) 模型和神經網絡模型預測下一時刻(t+1)的預測值及其偏差,二者之和即為t+1時刻的預測值;⑥重復步驟④,得到t+2,t+3,…,t+m時刻的預測值(m是預測年數)。
京津冀一體化是黨中央、國務院做出的一項重大國家戰略部署,是實現京津冀三地優勢互補、促進環渤海經濟圈發展、帶動北方腹地發展的需要。京津冀地區可持續發展面臨的重大問題之一是經濟社會發展水平和水資源量不匹配[24]。該地區是中國北方經濟規模最大、最具活力的地區,同時,也是我國缺水最嚴重的地區之一,人均水資源占有量約為全國平均值的1/9[25]。因此,京津冀地區的協調發展需要打破行政區域限制,以京津冀地區為統一體整體進行水資源規劃和管理,甄別適用于該地區的年用水量預測方法顯得尤為必要。本文的年用水量數據來源于京津冀三地的水資源公報,時間跨度均為1997—2018年(圖1)。由圖1可知,京津冀三地1997—2018年的用水量變化呈現出明顯不同的趨勢。北京市和天津市年用水量呈現先減少,而后緩慢增加的趨勢,而河北省年用水量呈波動下降趨勢。本文設置了不同的模型訓練期T(表1),如模型訓練年數為10,表示前10年數據用于模型訓練,其余年份的數據用于模型的驗證。預測結果評估指標為相對偏差,其正值表示模型高估年用水量,負值表示低估年用水量。不同訓練期的條件下基于最小二乘法擬合的京津冀年用水量年平均增長率見表1。

圖1 京津冀地區1997—2018年用水量變化

表1 不同訓練期下京津冀年用水量平均增長率

表2 不同訓練期下各模型年用水量模擬的相對誤差

表3 不同訓練期條件下各模型驗證期年用水量模擬的相對誤差
模型訓練期和驗證期,京津冀三地年用水量模擬的相對誤差見表2、表3。由表2可知,模型的誤差隨訓練期的增加而減少。以北京市為例,訓練期由10 a增加到18 a時,年增長率法的相對誤差由 -1.2%變為0.6%,自回歸模型法的相對誤差由3.4%減少到0.9%,灰色神經網絡法的相對誤差變化最大,由-6.4%變為1.7%。在模型訓練期,年增長率方法在北京市明顯優于其他兩種方法,但在模型驗證期,年增長率方法表現最差,可見訓練期的模型模擬結果并不能反映模型真實的預測能力。因此,本文基于驗證期的結果來評判3種模型的年用水量預測能力。由表3可見,3種模型的預測能力表現出明顯的區域分異性。在北京市和天津市,灰色神經網絡法表現最好,自回歸模型法次之,而年增長率法表現最差。以18 a訓練期模型的預測結果為例,北京市3種模型(灰色神經網絡法、自回歸模型法、年增長率法)預測結果的相對誤差分別為 -2.2%、-4.7%和-14.9%;在天津市,3種模型預測結果的相對誤差分別是-3.1%,-11.6%和-20.4%;在河北省,3種方法的預測誤差要明顯小于北京市和天津市。比較而言,灰色神經網絡法略優于年增長率法,二者均優于自回歸模型法。
圖2為訓練期為18 a(1997—2014年)條件下,京津冀三地年用水量驗證結果。由圖2可見,年增長率法模擬和預測的年用水量近乎一條直線,這與真實的年用水量數據變化不一致,實際的年用水量序列通常呈明顯的年際波動。究其原因,可能是因為年增長率法采用單一的函數分布,很難有效地模擬年用水量的波動變化。自回歸模型法的預測誤差較大,而且與實際年用水量的變化趨勢不一致。灰色神經網絡法不僅預測誤差較小且能夠很好模擬年用水量的年際波動,在年用水量呈非線性變化的地區優勢明顯。灰色神經網絡方法優于其他兩種方法的原因可能在于其強大的非線性映射能力,使模型能夠快速捕獲時間序列中隱藏的趨勢信息,并建立穩健的模型結構來進行趨勢的預測。因此,灰色神經網絡法在京津冀三地年用水量預測中表現最好,建議將其作為該地區年用水量預測的優選方法。

(a) 北京市
利用灰色神經網絡法,對京津冀三地2019—2025年用水量進行預測。模型訓練數據均為1997—2018年的實際年用水量數據。模型預測結果見圖3,可見2019年后北京市年用水量總量趨于平穩,將維持2018年的用水規模,年際波動很小,平均變化速率為0.06億m3/a,2025年的用水量預測值為39.7億m3。天津市的用水量仍維持增加趨勢,但增速明顯放緩,平均速率為0.17億m3/a,2025年的用水量預測值為29.6億m3。河北省的用水量則仍維持下降態勢,平均的下降速率為-0.80億m3/a,2025年的用水量預測值為176.8億m3。

圖3 京津冀2019—2025年年用水量預測結果
時間序列預測模型的預測結果往往具有一定的不確定性,這是由時間序列預測模型的計算原理決定的。時間序列預測法的基本原理是承認事物發展的延續性,通過對過去的時間序列進行統計分析,推求出事物發展的趨勢,并采用數學方法消除時間序列中的隨機干擾,從而進行預測。基于時間序列的預測模型依賴于事件發生的先后順序,同樣大小的值改變順序后輸入模型產生的結果是不同的。如果未來有不可預測的突發事件(如大尺度、持續性的干旱),預測結果也會出現很大誤差,即如果各地實施有別于以往的產業結構調整、農業和生活節水措施,年用水量預測的結果可能有較大誤差。即便如此,它仍然是一種簡便且有效的年用水量預測方法。
a. 京津冀三地1997—2018年的年用水量呈現出不同的變化趨勢,北京和天津地區的年用水量呈先減后增的非線性變化,而河北省年用水量呈波動遞減的趨勢。
b. 年增長率法、自回歸模型法和灰色神經網絡法3種年用水量預測模型的比較結果表明,灰色神經網絡方法在京津冀三地表現性最好,可推薦為該地區年用水量預測的首選方法。
c. 基于灰色神經網絡方法的京津冀三地年用水量預測結果表明:2019—2025年,北京市年用水量將保持平穩,年際變化不大;天津市的年用水量將緩慢增長;河北省的年用水量將繼續下降。