(新疆塔里木河流域希尼爾水庫管理局,新疆 庫爾勒 841000)
城市需水量預測是進行區(qū)域水資源調(diào)配的重要基礎(chǔ),其受人口、固定資產(chǎn)投資、經(jīng)濟增長等多種因素的影響,且具有非線性、大時滯和不穩(wěn)定等特點。因此對城市需水量預測方法進行研究,及時準確掌握未來城市需水量的變化規(guī)律,對于提高城市供水保證率、降低城市缺水風險、維護水安全具有重要意義。
目前,國內(nèi)外學者針對城市需水量預測方法已經(jīng)進行了大量的研究,取得了一定的成果。如:采用灰色關(guān)聯(lián)模型、主成分回歸模型、多元線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型等[1-5],但這些方法在處理數(shù)據(jù)上缺少魯棒性,導致模型普遍缺乏長效性和擴展能力,不能完全反映數(shù)據(jù)的本質(zhì)特征。
鑒于此,本文在前人研究的基礎(chǔ)上,以新疆阿克蘇市歷年城市需水量及相關(guān)數(shù)據(jù)為例,耦合主成分分析(Principal Component Analysis, PCA)和長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short-term Memory,LSTM)的各自優(yōu)點,構(gòu)建了基于PCA-LSTM模型的城市需水量預測方法,并取得了一些有價值的研究成果。
PCA方法的主要計算步驟如下:?原始數(shù)據(jù)標準化處理;?計算標準化矩陣的相關(guān)系數(shù);?根據(jù)相關(guān)系數(shù)矩陣計算特征值和特征向量;?計算特征值及貢獻率;?計算主成分載荷矩陣及得分。具體計算過程參見文獻[4]。
LSTM模型具體算法過程參見文獻[6]。
本文耦合PCA模型與LSTM模型的各自優(yōu)點,構(gòu)建了PCA-LSTM模型。其計算步驟如下:?對歷年城市需水量和相關(guān)數(shù)據(jù)進行標準化處理; ?利用PCA降低模型輸入?yún)?shù)維度,篩選出需水量的關(guān)鍵因子; ?構(gòu)建PCA-LSTM預測模型,并對樣本參數(shù)不斷進行優(yōu)化; ?評價模型性能。
選用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squard Error,RMSE)和平均絕對百分誤差(Mean Absolute Percent Error,MAPE)3項指標作為模型優(yōu)劣評價指標。
以新疆阿克蘇市2000—2016年城市需水量數(shù)據(jù)為研究對象,采用已經(jīng)預處理過的試驗數(shù)據(jù),主要包括全市歷年GDP、第一產(chǎn)業(yè)增加值、固定資產(chǎn)投資、城鎮(zhèn)消費品零售額、總?cè)丝凇⒊擎?zhèn)居民人均可支配收入、城市綠化面積和城市需水量數(shù)據(jù)。以2000—2012年數(shù)據(jù)為訓練集,2013—2016年數(shù)據(jù)為驗證集。
為了進一步提高模型計算結(jié)果的可信度,將所構(gòu)建模型(PCA-LSTM模型)與LSTM模型、粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)與最小二乘支持向量機模型計算結(jié)果進行對比研究。
2.2.1 仿真分析
利用SPSS軟件計算影響城市需水量的主次因素,主成分計算結(jié)果見表1。由表1可以看出,前3個因子的特征值均大于1,且累計貢獻率達到83.47%,因此選擇前3個因子代替原變量。通過正交旋轉(zhuǎn)法得到各因素對3個主成分的載荷,見表2。對第1因子貢獻最大的為全市GDP、第一產(chǎn)業(yè)增加值;對第2因子貢獻較大的是固定資產(chǎn)投資;城市總?cè)丝趯Φ?因子貢獻較大。

表1 特征值及主成分貢獻率

表2 主成分矩陣
因此,本研究選用的主要影響因子有全市GDP、第一產(chǎn)業(yè)增加值、固定資產(chǎn)投資與城市總?cè)丝冢⒁源藰?gòu)建未來城市需水量預測模型的輸入樣本,輸出參數(shù)為1年后的城市需水量。模型具體參數(shù)詳見表3。

表3 PCA-LSTM算法參數(shù)
由表4可以看出,構(gòu)建模型的評價指標MAE、MAPE和RMSE分別達到了12.75萬m3、0.06%和15.11萬m3,證明該模型預測精度較為理想。

表4 PCA-LSTM預測模型精度分析
2.2.2 模型對比
LSTM模型、PCA-BP模型、PCA-LSSVM等模型計算結(jié)果詳見表5。

表5 不同模型預測結(jié)果精度分析
由表5可知,PCA-LSTM模型的MAE、MAPE和RMSE分別為12.75萬m3、0.06%和15.11萬m3,較LSTM模型分別提高了7.43萬m3、0.04%和9.67萬m3的精度,而且評價指標優(yōu)于PCA-PSO-BP與PCA-LSSVM模型。這表明PCA-LSTM模型可為干旱區(qū)城市水資源調(diào)度調(diào)控提供決策依據(jù)。
a.利用PCA方法篩選影響城市需水量的主要因子,實現(xiàn)了模型有效降維,提升了LSTM模型的預測精度和穩(wěn)定性。
b.構(gòu)建的PCA-LSTM模型與BP神經(jīng)網(wǎng)絡(luò)等其他模型相比,模型評價指標MAE、MAPE和RMSE的誤差分別為12.75萬m3、0.06%和15.11萬m3,均優(yōu)于傳統(tǒng)模型,為干旱區(qū)城市水資源調(diào)度調(diào)控開辟了新方法。