基于LSTM-NeuralProphet 模型的城市需水預(yù)測方法研究

2023-09-22 01:07:08范怡靜

中國農(nóng)村水利水電 2023年9期

關(guān)鍵詞：影響模型

范怡靜，劉真，苑佳，劉心

（河北工程大學(xué)信息與電氣工程學(xué)院，河北邯鄲 056038）

0 引言

全球超過一半的城市面臨水資源供需失衡的問題，水資源的不均衡分布、水質(zhì)污染和城市擴(kuò)張等因素而導(dǎo)致的城市水資源利用率低的問題越來越嚴(yán)峻。城市水資源預(yù)測是保障水資源供需平衡，提高水資源利用率的關(guān)鍵技術(shù)之一。但城市需水量受人口、地域、天氣、經(jīng)濟(jì)發(fā)展等諸多因素影響，具有較強(qiáng)的非線性和不確定性，城市需水的精準(zhǔn)預(yù)測具有一定難度，受到學(xué)術(shù)界和實(shí)際應(yīng)用領(lǐng)域的廣泛關(guān)注［1］。從預(yù)測尺度出發(fā)，需水預(yù)測可分為三大類：短期預(yù)測（每小時(shí)至每月預(yù)測）、中期預(yù)測（1～10 年以內(nèi)的年度預(yù)測）和長期預(yù)測（超過10 年），中期和長期預(yù)測有助于制定有關(guān)投資規(guī)劃和產(chǎn)能擴(kuò)張的戰(zhàn)術(shù)決策，短期預(yù)測影響水務(wù)公司的運(yùn)營決策［2］。與長期預(yù)測在制定戰(zhàn)略規(guī)劃方面具有重要意義相比，短期預(yù)測對(duì)于水務(wù)公司來說同樣至關(guān)重要，短期需水預(yù)測能夠影響運(yùn)營決策，對(duì)于城市供水保障、水資源利用和可持續(xù)發(fā)展具有重要意義。因此，提高短期城市需水預(yù)測的準(zhǔn)確性至關(guān)重要。

目前存在多種不同的方法用于短期城市需水預(yù)測，常用的方法有遺傳神經(jīng)網(wǎng)絡(luò)模型［3］、BP（Back Propagation）神經(jīng)網(wǎng)絡(luò)［4］、支持向量機(jī)模型［5］、灰色模型［6］和ARIMA 模型（Autoregressive Integrated Moving Average model）［7］等，基于城市用水?dāng)?shù)據(jù)的時(shí)間序列特性預(yù)測未來的需水?dāng)?shù)據(jù)。Chang H 等［7］使用逐步多元回歸和ARIMA 模型分析了季節(jié)性趨勢(shì)下降的城市需水量與氣候變量之間的關(guān)系對(duì)需水量進(jìn)行預(yù)測。劉鑫［8］提出K-Means聚類算法（K-Means clustering algorithm）和季節(jié)性滑動(dòng)平均自回歸模型耦合方法預(yù)測2020 年1-8 月水廠及行政區(qū)的逐月供水?dāng)?shù)據(jù)。以上兩種方法均采用時(shí)序模型，這類模型對(duì)數(shù)據(jù)的節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn)的適應(yīng)性較差，而被用于數(shù)據(jù)預(yù)測的Neural-Prophet 模型［9］在時(shí)間序列數(shù)據(jù)預(yù)測具有很強(qiáng)的優(yōu)勢(shì)，能夠出色地適應(yīng)數(shù)據(jù)的節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn)。但長期歷史數(shù)據(jù)中的隱藏特征不止這些，LSTM（Long Short Term Memory networks）在學(xué)習(xí)和挖掘長期歷史數(shù)據(jù)中的隱藏非線性和非周期性等特征有獨(dú)特的優(yōu)勢(shì)［10］，郭冠呈［11］建立了雙向長短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)模型預(yù)測常州市某DMA 入口15 min 的水量。董云城［12］開展了基于ARIMA-LSTM 的城市供水量組合預(yù)測模型研究。

目前已實(shí)現(xiàn)的短期城市需水預(yù)測技術(shù)大多集中在固定時(shí)隙預(yù)測上，無法適應(yīng)時(shí)隙的變化，而城市需水量受不同季節(jié)影響，需水量的峰值、波動(dòng)不同。因此，本文對(duì)四季24 h 時(shí)間分辨率和夏季15 min 時(shí)間分辨率兩種不同時(shí)隙的城市需水量進(jìn)行預(yù)測，提出了一種將NeuralProphet（NP）與長短期記憶（LSTM）網(wǎng)絡(luò)相結(jié)合的LSTM-NeuralProphet模型，該模型將NeuralProphet和LSTM的優(yōu)點(diǎn)結(jié)合起來，NeuralProphet模型考慮數(shù)據(jù)的周期性、節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn)，LSTM 模型學(xué)習(xí)長期歷史數(shù)據(jù)的特征。本研究使用Anomaly Transformer 模型對(duì)異常值檢測，并分段擬合校正數(shù)據(jù)，采用主成分分析法對(duì)需水影響因子進(jìn)行分析，校正后的數(shù)據(jù)輸入NeuralProphet 模型和LSTM 模型中產(chǎn)生對(duì)應(yīng)的輸出特征，將這些輸出特征和需水影響因子輸入到AutoML，在AutoML 的標(biāo)準(zhǔn)模型分析中選取3 個(gè)效果最好的模型作為Stacking模型的基學(xué)習(xí)器，得到最終的預(yù)測結(jié)果。

1 城市短期需水預(yù)測模型

為了提高不同時(shí)隙粒度的城市需水量預(yù)測精度，本文提出了一種將NeuralProphet（NP）與長短期記憶神經(jīng)網(wǎng)絡(luò)（LSTM）相結(jié)合的LSTM-NeuralProphet 模型。需水預(yù)測模型主要分為以下3 個(gè)模塊：數(shù)據(jù)預(yù)處理部分基于Anomaly-Transformer 模型進(jìn)行異常值檢測，采用分段曲線擬合對(duì)異常值校正，通過主成分分析法分析影響因子；預(yù)測模型部分使用了LSTM 和Optune 優(yōu)化后的NeuralProphet 預(yù)測模型；模型耦合部分通過安全網(wǎng)機(jī)制過濾輸入特征，采用AutoML 選取Stacking 模型的基學(xué)習(xí)器，設(shè)計(jì)的需水預(yù)測模型總體架構(gòu)如圖1所示。

圖1 需水預(yù)測模型總體架構(gòu)圖Fig.1 Overall structure diagram of water demand prediction model

1.1 基于Anomaly Transformer 和PCA 的數(shù) 據(jù)預(yù)處理

1.1.1 異常值檢測——Anomaly Transformer模型

Anomaly Transformer 模型［13］是一種基于自監(jiān)督學(xué)習(xí)的時(shí)序異常檢測模型，如圖2 所示，利用全新的關(guān)聯(lián)視角，建立時(shí)間序列中的每個(gè)數(shù)據(jù)點(diǎn)與整個(gè)序列之間的聯(lián)系。這種關(guān)聯(lián)蘊(yùn)含著豐富的時(shí)序模式，具有信息含量。該模型采用Anomaly-Attention 和前饋層的交替堆疊的結(jié)構(gòu)，增強(qiáng)了模型從多層次特征中學(xué)習(xí)潛在時(shí)序關(guān)聯(lián)的能力。Anomaly-Attention 由prior-association 和series-association 兩個(gè)分支組成，其中prior-association 使用可學(xué)習(xí)的高斯核來計(jì)算相對(duì)時(shí)間距離，而series-association分支則從原始序列中學(xué)習(xí)關(guān)聯(lián)。在每一層的Anomaly-Attention中，模型通過query、key、value和可學(xué)習(xí)的scale參數(shù)矩陣來計(jì)算注意力權(quán)重，進(jìn)而得到每個(gè)數(shù)據(jù)點(diǎn)的潛在聯(lián)系。通過這種方式，Anomaly Transformer 模型可以更加準(zhǔn)確地檢測到城市需水時(shí)序中的異常點(diǎn)。由于設(shè)備出錯(cuò)等原因，城市24 h需水量和15 min 需水量檢測常出現(xiàn)異常值，因此，采用Anomaly Transformer模型進(jìn)行異常值檢測。

圖2 Anomaly Transformer框架圖Fig.2 Anomaly Transformer frame diagram

1.1.2 影響因子篩選——主成分分析

PCA（Principal Component Analysis）是通過線性變換將原始數(shù)據(jù)映射到新的坐標(biāo)系中，使得新坐標(biāo)系下的方差較大，從而找到原始數(shù)據(jù)的主要方向，將原始數(shù)據(jù)進(jìn)行中心化處理，計(jì)算出協(xié)方差矩陣，并對(duì)其進(jìn)行特征值分解，分解后得到原始數(shù)據(jù)在新坐標(biāo)系下的投影矩陣（主成分），每個(gè)主成分代表原始數(shù)據(jù)的一個(gè)方向，同時(shí)對(duì)應(yīng)著一個(gè)特征值，特征值越大表示對(duì)應(yīng)的主成分包含的信息越多。與傳統(tǒng)的相關(guān)性分析相比，在處理屬于高維數(shù)據(jù)的氣象影響因子，解決避免模型過擬合問題中，PCA可有效簡化分析過程，提高城市需水預(yù)測準(zhǔn)確性，消除自變量之間的多重共線性。

1.2 基于LSTM-NeuralProphet 的城市需水預(yù)測模型

1.2.1 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)

LSTM（Long Short-Term Memory）一種常用的循環(huán)神經(jīng)網(wǎng)絡(luò)，針對(duì)傳統(tǒng)RNN模型在訓(xùn)練過程中容易出現(xiàn)的梯度消失和梯度爆炸問題［14］，LSTM 采用門控結(jié)構(gòu)，提高模型預(yù)測精度。LSTM 模型的核心是LSTM 單元（LSTM cell），LSTM 單元的輸入由當(dāng)前時(shí)刻的輸入、上一個(gè)時(shí)刻的輸出和上一個(gè)時(shí)刻的單元狀態(tài)共同決定，根據(jù)門控機(jī)制來決定輸入、遺忘和輸出的權(quán)重，更新單元狀態(tài)和輸出。

式中：xt是LSTM 模型在時(shí)刻t的輸入；ht-1是LSTM 模型在時(shí)刻t-1的輸出；ct-1是LSTM模型在時(shí)刻t-1的細(xì)胞狀態(tài)；it、ft和ot分別是當(dāng)前時(shí)刻的輸入門、遺忘門和輸出門的輸出；σ( )是sigmoid函數(shù)；⊙表示按元素相乘；W和b是模型的參數(shù)。

最后，LSTM 模型在時(shí)刻t的輸出為ht，同時(shí)ct也會(huì)作為下一個(gè)時(shí)刻的單元狀態(tài)輸入到模型中。由于城市需水?dāng)?shù)據(jù)存在明顯的時(shí)間序列特征，利用 LSTM 神經(jīng)網(wǎng)絡(luò)挖掘數(shù)據(jù)中時(shí)間序列的變化規(guī)律。

1.2.2 NeuralProphet預(yù)測模型原理

NeuralProphet 模型［9］是FbProphet 的改進(jìn)模型，將深度學(xué)習(xí)項(xiàng)集成到滯后數(shù)據(jù)擬合的方程中，模型的超參數(shù)可以自動(dòng)調(diào)整，具備更好的預(yù)測性能。但是，模型里regulation 調(diào)整會(huì)直接影響整體分布，為了避免過擬合問題并且提高模型的泛化能力，需要進(jìn)行自動(dòng)化參數(shù)調(diào)優(yōu)。相比于Grid Search 等其他超參數(shù)調(diào)優(yōu)框架，Optuna 尋優(yōu)速度更快，更加適合城市需水?dāng)?shù)據(jù)集。

圖3 NeuralProphet原理圖Fig.3 NeuralProphet schematic

NeuralProphet模型的預(yù)測過程如下：

式中：T(t)代表趨勢(shì)部分，表示時(shí)間序列數(shù)據(jù)中的長期（上升或下降）趨勢(shì)，使用線性或非線性函數(shù)來建模；S(t)代表季節(jié)性部分，表示時(shí)間序列數(shù)據(jù)中的短期（每周、每月或每季度）的周期性變化；E(t)代表特殊事件，表示時(shí)間序列數(shù)據(jù)中的異常值；F(t)代表未來回歸項(xiàng)，表示時(shí)間序列數(shù)據(jù)中由于特定的節(jié)假日而引起的變化；A(t)代表自回歸部分，表示時(shí)間序列數(shù)據(jù)中的歷史數(shù)據(jù)對(duì)當(dāng)前時(shí)間的影響；L(t)代表滯后回歸項(xiàng)，是t時(shí)刻外生變量滯后觀測的回歸效應(yīng)。綜合這些部分，NeuralProphet 模型可以很好地捕捉城市需水?dāng)?shù)據(jù)中的各種影響因素，從而實(shí)現(xiàn)更加準(zhǔn)確的預(yù)測。

1.2.3 LSTM-NeuralProphet模型

LSTM-NeuralProphet模型是一種基于神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測模型，如圖4所示。該模型考慮到兩個(gè)不同時(shí)隙：較短的時(shí)間尺度（15 min）和較長的時(shí)間尺度（24 h），將校正后的兩個(gè)不同時(shí)隙的數(shù)據(jù)集分別輸入到NeuralProphet 模型和LSTM 模型中產(chǎn)生對(duì)應(yīng)的輸出特征f1N、f1L和f2N、f2L。采用Pycaret 庫實(shí)現(xiàn)AutoML，將f1N、f1L和f2N、f2L輸入到AutoML，在AutoML 的標(biāo)準(zhǔn)模型分析中選取3 個(gè)效果最好的模型作為Stacking 模型的基學(xué)習(xí)器，得到最終的預(yù)測結(jié)果，同時(shí)，為了提高LSTM-NeuralProphet模型的準(zhǔn)確性，AutoML 中還使用主成分分析選取額外的回歸因子。

圖4 LSTM-NeuralProphet模型框架圖Fig.4 LSTM-NeuralProphet model frame diagram

為了確保該方法的準(zhǔn)確性引入安全網(wǎng)機(jī)制，在LSTMNeuralProphet 模型中加入了一個(gè)安全網(wǎng)機(jī)制，選取兩種方法平均誤差的2%為安全網(wǎng)機(jī)制的閾值。在需水預(yù)測過程中，判斷兩種方法所預(yù)測結(jié)果之間的平均誤差是否大于安全機(jī)制的閾值，若其中一種方法在準(zhǔn)確性方面的表現(xiàn)明顯低于另一種方法，那么表現(xiàn)較差的模型將被排除在LSTM-NeuralProphet 模型之外。

1.3 超參數(shù)調(diào)優(yōu)

利用城市需水?dāng)?shù)據(jù)集訓(xùn)練不同的模型，將所提出的LSTMNeuralProphet 模型與NeuralProphet 模型、LSTM 模型、BP 模型進(jìn)行比較。其中NeuralProphet 模型的超參數(shù)可以自動(dòng)調(diào)整，以獲得最佳性能。同時(shí)也存在一個(gè)缺點(diǎn)，模型里regulation 調(diào)整會(huì)直接影響整體分布，為了避免過擬合并且提高模型的泛化能力，自動(dòng)化參數(shù)調(diào)優(yōu)至關(guān)重要。相比于Grid Search 等其他超參數(shù)調(diào)優(yōu)框架，Optuna尋優(yōu)速度更快，更加適合城市需水?dāng)?shù)據(jù)集。

Optuna 的原理基于貝葉斯優(yōu)化算法，主要包含了3 個(gè)核心組件：Trial，Study 和Sampler。Trial 對(duì)超參數(shù)組合進(jìn)行評(píng)估；Study 管理和控制Trials 的流程；TPE 算法不斷根據(jù)超參數(shù)的選擇有可能達(dá)到最優(yōu)的超參數(shù)組合；Sampler選取下一個(gè)超參數(shù)組合的實(shí)際過程。這個(gè)過程中，Optuna 采用貝葉斯優(yōu)化算法提高了超參數(shù)搜索效率，從而更加高效地構(gòu)建高性能的機(jī)器學(xué)習(xí)模型。通過Optune 超參數(shù)優(yōu)化NeuralProphet，選擇隱藏層數(shù)為2，搜索空間設(shè)置如表1 所示。對(duì)于LSTM 模型，如果增加隱藏單元的個(gè)數(shù)，性能會(huì)有所提高，但訓(xùn)練模型的時(shí)間也會(huì)增加。綜合預(yù)測性能和成本，設(shè)置隱藏單元的個(gè)數(shù)為200，對(duì)LSTM 模型進(jìn)行訓(xùn)練，以得到兩種場景下最優(yōu)結(jié)果。

表1 Optune的搜索區(qū)間Tab.1 Optune′s search interval

2 需水?dāng)?shù)據(jù)來源及分析

2.1 數(shù)據(jù)來源

北京市和邢臺(tái)市都處于暖溫帶半濕潤大陸性氣候區(qū)，冬季寒冷干燥，夏季炎熱潮濕，春秋兩季氣候溫和，四季分明，如何合理充分利用水資源，對(duì)社會(huì)經(jīng)濟(jì)及城市的發(fā)展具有重要的影響［15］。因此，選取以24 h為單位的北京市水務(wù)局（2016年1月1日至2022年9月30日）的原始用水?dāng)?shù)據(jù)和以15 min為單位邢臺(tái)市某水廠（2022 年夏季）原始用水?dāng)?shù)據(jù)。其中80%的數(shù)據(jù)作為訓(xùn)練集，其余20%的數(shù)據(jù)作為測試集。北京市的氣象數(shù)據(jù)來源于國家氣象信息中心，共包含13 個(gè)氣象要素：最高溫度f0，最低溫度f1，平均溫度f2，天氣狀況f3，風(fēng)向f4，風(fēng)速f5，空氣質(zhì)量f6，空氣質(zhì)量分?jǐn)?shù)f7，最大露點(diǎn)f8，最小露點(diǎn)f9，平均露點(diǎn)f10，平均降水量f11，最大降水量f12，如表2所示。

表2 關(guān)于城市需水量的影響因子Tab.2 On the influencing factors of urban water demand

2.2 異常值檢測及校正結(jié)果分析

城市用水量常常由于設(shè)備出錯(cuò)等原因出現(xiàn)異常值，本文利用Anomaly-Transformer 模型分別對(duì)以24 h 為單位的北京市水務(wù)局（2016 年1 月1 日至2022 年9 月30 日）的原始用水?dāng)?shù)據(jù)和以15 min 為單位邢臺(tái)市某水廠（2022 年夏季）原始用水?dāng)?shù)據(jù)進(jìn)行異常值檢測。根據(jù)數(shù)據(jù)特點(diǎn)分別以年為單位和以天為單位進(jìn)行數(shù)據(jù)劃分，再利用分段曲線擬合，擬合后按順序把不同時(shí)間段校正結(jié)果拼接起來。選出原始水文時(shí)序數(shù)據(jù){ai}中的非空值進(jìn)行分段曲線擬合，用該結(jié)果替代相應(yīng)位置的缺失值。經(jīng)過校正后獲得的時(shí)間序列數(shù)據(jù)記為{gi}，對(duì){gi}用Anomaly-Transformer 的方法進(jìn)行異常值檢測，該模型包含3 層，我們將隱藏狀態(tài)的通道數(shù)dmodel 設(shè)置為512，win_size 設(shè)置為14。為了權(quán)衡損失函數(shù)的兩個(gè)部分，所有數(shù)據(jù)集的超參數(shù)λ 設(shè)置為3。我們使用初始學(xué)習(xí)率為10-4的ADAM優(yōu)化器，設(shè)置早停策略，訓(xùn)練過程將在30 個(gè)周期內(nèi)提前停止，批量大小為16。將檢測出的異常值二次分段曲線擬合填補(bǔ)，結(jié)果如圖5所示。

圖5 分段曲線擬合Fig.5 Piecewise curve fitting method

采用相同步驟，用全局曲線擬合對(duì)缺失值填補(bǔ)和異常值校正，并與分段曲線擬合對(duì)比。圖5 與圖6 對(duì)比可以看出，針對(duì)凹凸性發(fā)生改變的時(shí)間序列數(shù)據(jù)，分段擬合曲線能更好地體現(xiàn)時(shí)序變化趨勢(shì)。

圖6 全局曲線擬合Fig.6 Global curve fitting method

2.3 需水量影響因子的率定

對(duì)于城市用水量與時(shí)間、溫度、降水量、空氣質(zhì)量等影響因素密切相關(guān)，具有復(fù)雜性、非線性、時(shí)變性的特點(diǎn)。為了提高模型的泛化能力和魯棒性，本文利用皮爾遜相關(guān)性分析和主成分分析方法分別對(duì)北京市城市日用水量及用水影響因素?cái)?shù)據(jù)進(jìn)行分析，得到各影響因素與城市日用水量的關(guān)聯(lián)程度。定義北京市日用水量為y，影響因子為f0～f12，并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。使用SPSS 軟件對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行相關(guān)性分析，得到相關(guān)系數(shù)表。

在表3中篩選出城市用水量的主要影響因子。關(guān)聯(lián)度的下限值取0.6，即選擇的主要影響因子為相關(guān)性大于0.6 的影響因子：f0、f1、f2、f8，可以作為城市需水預(yù)測模型的輸入。同時(shí)，發(fā)現(xiàn)很多自變量之間的相關(guān)度達(dá)到0.6 以上，各個(gè)自變量之間的相關(guān)性很高，反映出模型自變量之間具有很強(qiáng)的多重共線性。為了解決自變量較多并且有多重共線性的問題，我們選擇用SPSS進(jìn)行主成分分析，得到表4。

表3 影響因子的相關(guān)性Tab.3 The correlation of influence factors

表4 影響因子解釋的總方差Tab.4 The total variance of the influence factor interpretation

為了使主成分分析法解釋更高效并且最小化城市需水預(yù)測模型的數(shù)據(jù)冗余，保留數(shù)值大于1 的特征值數(shù)據(jù)。表4 在只提取了4 個(gè)主成分的情況下，累計(jì)方差貢獻(xiàn)率就達(dá)到了91.745%。第5 個(gè)主成分的特征值只有0.513，因此提取前4 個(gè)主成分比較合適，可以用這4 個(gè)主成分來代替原來的11 個(gè)變量，因此，可以用4 個(gè)主成分來代替所有自變量，命名為：FAC1_1、FAC2_1、FAC3_1、FAC4_1。

3 實(shí)驗(yàn)結(jié)果分析與討論

3.1 模型評(píng)價(jià)指標(biāo)

用6 個(gè)性能指標(biāo)評(píng)估測試結(jié)果，分別為：平均百分比誤差MAPE、均方根誤差RMSE、平均絕對(duì)誤差MAE、均方誤差MSE、均方根對(duì)數(shù)誤差RMSLE和決定系數(shù)R2。采用如下公式計(jì)算預(yù)測結(jié)果的性能參數(shù)，其中n為數(shù)據(jù)點(diǎn)個(gè)數(shù)，yi為實(shí)際值，為預(yù)測值，真實(shí)觀測值的平均值。

3.2 案例分析

3.2.1 數(shù)據(jù)預(yù)處理一：異常值校正對(duì)比

為了檢驗(yàn)分段擬合校正和全局?jǐn)M合校正對(duì)城市需水預(yù)測的影響，根據(jù)章節(jié)2.2 異常值檢測及校正結(jié)果分析，使用分段擬合和全局?jǐn)M合對(duì)用水量進(jìn)行缺失值填補(bǔ)和異常值校正，將這兩種擬合結(jié)果分別輸入到LSTM-NeuralProphet 模型中，其中所有的訓(xùn)練和測試都是使用相同運(yùn)行環(huán)境進(jìn)行。AutoML 標(biāo)準(zhǔn)模型選取效果最好的模型：Extra Trees Regressor 作為Stacking 模型的基學(xué)習(xí)器。由表5 預(yù)測結(jié)果可知，主成分回歸的回歸系數(shù)更接近1，以天為單位全年用水量分段擬合的數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測結(jié)果相比MAE、MSE、RMSE、RMSLE、MAPE分別降低了5.824 4、204.806 1、5.762 4、0.012 6、1.64%，以15 min 為單位夏季用水量分段擬合的數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測結(jié)果相比MAE、MSE、RMSE、RMSLE、MAPE分別降低了442.982 562、304 685.355 67、250.873 26、0.0380 02、1.66%。因此，本文使用分段擬合優(yōu)于全局?jǐn)M合。

表5 不同異常值校正方法的結(jié)果對(duì)比Tab.5 Comparison of results of different correction methods for outliers

3.2.2 數(shù)據(jù)預(yù)處理二：需水影響因子對(duì)比

為了進(jìn)一步顯示原始幾個(gè)原始自變量與提取的主成分因子對(duì)城市需水預(yù)測的影響在模型中引入篩選的兩組影響因子作為額外的輸入信號(hào)。根據(jù)章節(jié)2.3 需水量影響因子的率定，皮爾遜相關(guān)性分析選取的影響因子為f0、f1、f2、f8；主成分分析提取出4 個(gè)影響因子為FAC1_1、FAC2_1、FAC3_1、FAC4_1。將這兩種分析法所選取的影響因子加入LSTM-NeuralProphet 模型中，其中所有的訓(xùn)練和測試都是使用相同運(yùn)行環(huán)境進(jìn)行。AutoML標(biāo)準(zhǔn)模型選取效果最好的模型Gradient Boosting Regressor 作為Stacking 模型的基學(xué)習(xí)器。由表6 預(yù)測結(jié)果可知，主成分回歸的回歸系數(shù)更接近1，MAE、MSE、RMSE、RMSLE、MAPE分別降低了0.288 7、6.033 8、0.240 8、0.008、0.1%。因此，本文使用主成分分析法在提取影響因子時(shí)優(yōu)于用皮爾遜相關(guān)性分析。

表6 不同影響因子的結(jié)果對(duì)比Tab.6 Comparison of the results of different influencing factors

3.2.3 案例一：24 h需水預(yù)測

對(duì)模型進(jìn)行訓(xùn)練后，對(duì)2016 年1 月1 日至2022 年9 月30 日的北京市水務(wù)局的用水?dāng)?shù)據(jù)進(jìn)行了劃分80%作為訓(xùn)練集，其余20%作為測試集。所有的訓(xùn)練和測試都是使用相同運(yùn)行環(huán)境下進(jìn)行。AutoML 標(biāo)準(zhǔn)模型分析比較結(jié)果如表8 所示，選取前3個(gè)效果最好的模型：線性回歸、最小角回歸、貝葉斯嶺回歸作為Stacking模型的基學(xué)習(xí)器。

表7 不同預(yù)測模型的結(jié)果對(duì)比（24 h）Tab.7 Comparison of results from different prediction models（24 h）

表8 AutoML標(biāo)準(zhǔn)模型分析比較結(jié)果（24 h）Tab.8 AutoML standard model analysis and comparison results（24 h）

在2016 年1 月1 日至2022 年9 月30 日逐日進(jìn)行預(yù)測時(shí)，將預(yù)測步長設(shè)置為單步預(yù)測。圖7 的殘差圖可以直觀看出LSTM模型的性能惡化，不能保證預(yù)測的準(zhǔn)確性。圖8、圖10 顯示NeuralProphet模型的性能與LSTM-NeuralProphet 模型的性能最接近。表7 中詳細(xì)比較了具有6 個(gè)性能指標(biāo)的24 h 需水預(yù)測。對(duì)比LSTM 模型、NeuralProphet 模型、BP 模型和LSTM-Neural-Prophet 模型，所提出的LSTM-NeuralProphet 模型在6 個(gè)性能指標(biāo)的結(jié)果都優(yōu)于其他3種模型，提高了預(yù)測精度。

圖7 基于24 h數(shù)據(jù)集的LSTM 模型預(yù)測結(jié)果Fig.7 Prediction results of LSTM model based on 24 h data set

圖8 基于24 h數(shù)據(jù)集的NeuralProphet模型預(yù)測結(jié)果Fig.8 Prediction results of NeuralProphet model based on 24 h data set

圖9 基于24 h數(shù)據(jù)集的BP模型預(yù)測結(jié)果Fig.9 Prediction results of BP model based on 24 h data set

圖10 基于24 h數(shù)據(jù)集的LSTM-NeuralProphet模型預(yù)測結(jié)果Fig.10 Prediction results of LSTM-NeuralProphet model based on 24 h data set

表9 不同預(yù)測模型的結(jié)果對(duì)比（15 min）Tab.9 Comparison of results of different prediction models （15 min）

3.2.4 案例二：15 min需水預(yù)測

對(duì)模型進(jìn)行訓(xùn)練后，對(duì)2022年夏季的邢臺(tái)市某水廠數(shù)據(jù)進(jìn)行了劃分80%作為訓(xùn)練集，其余20%作為測試集。所有的訓(xùn)練和測試都是使用相同運(yùn)行環(huán)境下進(jìn)行。AutoML 標(biāo)準(zhǔn)模型分析比較結(jié)果如表10 所示，選取前3 個(gè)效果最好的模型：線性回歸、貝葉斯嶺回歸、正交匹配追蹤算法作為Stacking 模型的基學(xué)習(xí)器。

表10 AutoML標(biāo)準(zhǔn)模型分析比較結(jié)果（15 min）Tab.10 AutoML Standard Model analysis and comparison results （15 min）

在2022年夏季每15 min預(yù)測進(jìn)行預(yù)測時(shí)，將預(yù)測步長設(shè)置為單步預(yù)測。圖12、圖13的殘差圖可以直觀看出NeuralProphet和BP模型的性能惡化，不能保證預(yù)測的準(zhǔn)確性。圖11、圖14顯示LSTM 模型的性能與LSTM-NeuralProphet 模型的性能最接近。表9 中詳細(xì)比較了具有6 個(gè)性能指標(biāo)的15 min 需水預(yù)測，對(duì)比LSTM 模型、NeuralProphet 模型、BP 模型和LSTM-Neural-Prophet 模型，所提出的LSTM-NeuralProphet 模型在6 個(gè)性能指標(biāo)的結(jié)果都優(yōu)于其他3種模型，提高了預(yù)測精度。

圖11 基于15 min數(shù)據(jù)集的LSTM 模型預(yù)測結(jié)果Fig.11 Prediction results of LSTM model based on 15 min data set

圖12 基于15 min數(shù)據(jù)集的NeuralProphet模型預(yù)測結(jié)果Fig.12 Prediction results of NeuralProphet model based on 15 min data set

圖13 基于15 min數(shù)據(jù)集的BP模型預(yù)測結(jié)果Fig.13 Prediction results of BP model based on 15 min data set

4 結(jié) 論

研究提出了一種基于LSTM-NeuralProphet 模型的雙時(shí)間尺度城市需水預(yù)測模型，使用北京市和邢臺(tái)市兩個(gè)城市的需水時(shí)間序列進(jìn)行預(yù)測，得到如下結(jié)論。

（1）數(shù)據(jù)的質(zhì)量直接決定了模型的預(yù)測和泛化能力的好壞，但早期的模型通常忽略了離群點(diǎn)的處理，為了提高短期需水量預(yù)測模型的精確度，本文提出了一種基于Anomaly-Transformer的水文時(shí)間序列異常值檢測和分段擬合校正模型。實(shí)驗(yàn)結(jié)果表明，該模型可以得到較高準(zhǔn)確率的預(yù)測結(jié)果。

（2）對(duì)比了皮爾遜相關(guān)性分析和主成分分析提取的影響因子，結(jié)果表明，對(duì)于數(shù)量較多且相互關(guān)聯(lián)的影響因子，主成分分析優(yōu)于皮爾遜相關(guān)性分析。PCA 只取前后方差較大的幾個(gè)主成分來代表原變量，同時(shí)可以消除自變量之間的多重共線性，在減少了計(jì)算工作量同時(shí)大大提高需水預(yù)測模型的精度。

（3）將LSTM-NeuralProphet 模型應(yīng)用于預(yù)測夏季15 min 超短周期時(shí)間分辨率和24 h 中周期時(shí)間分辨率這兩種不同時(shí)隙的用水量，均得到了較為理想的預(yù)測結(jié)果。實(shí)驗(yàn)結(jié)果在一定程度上體現(xiàn)了該模型的泛化能力和健壯性，為城市需水預(yù)測提供了新思路，對(duì)于城市供水等領(lǐng)域具有一定的借鑒意義。