潘世英, 丁 鑫, 崔 玥, 呂昊正, 王 童, 馬樂志
(1.濟南熱力集團有限公司, 山東 濟南 250014; 2.山東睿冠電能熱力有限公司,山東 濟南 250101; 3.山東魯恒節能服務有限公司, 山東 濟南 250001)
影響建筑物室內溫度的因素有地理位置、供熱面積、墻體絕熱性能、用戶用熱習慣、窗墻比、室外溫度及太陽輻射量等,這使得求解變得復雜[1]。本文將濟南市供熱用戶作為研究對象,將供熱介質流量、供水溫度、回水溫度、室外溫度作為輸入參數,利用SPSS MODELER軟件建立基于MLP神經網絡的室內溫度預測模型。室內溫度預測模型可實現在一定室外溫度和熱網運行參數下,預測用戶室內溫度,為滿足用戶用熱需求、調整熱源負荷提供一個有效的分析工具。
① MLP神經網絡
MLP多層感知器是一種在單層感知器基礎上增加隱藏層而形成的一種多層前饋網絡,一般由輸入層、隱藏層和輸出層構成,每一層全連接到下一層,除了輸入層,每個層都是一個帶有非線性激活函數的神經元,多層感知器是一種通用的可擬合復雜函數的近似方法[2]。
選定供熱介質流量x1、供水溫度x2、回水溫度x3、室外溫度x4作為MLP神經網絡的輸入參數,室內溫度y作為輸出參數。MLP神經網絡的結構見圖1,為提高預測精度,本文將隱含層設定為兩層。

圖1 MLP神經網絡的結構
② SPSS Modeler軟件
SPSS Modeler是一款以可視化數據為用戶界面的數據挖掘軟件,擁有豐富的數據挖掘算法,可提供數據挖掘相關的數據源、數據預處理(包括數據審核、數據抽取、數據轉換)、建模、模型評估、模型部署等功能,將需要操作的各個環節表示成若干個節點,數據通過圖形化的方式在各個節點流動形成數據流,可以和其他數據庫軟件比較好地兼容、連接[3]。
① 數據預處理
濟南熱力集團有限公司已經采集逾3×108組數據,每一組數據均包含供熱介質流量、供水溫度、回水溫度、室外溫度。除室外溫度來源于中國天氣網外,其他數據均來自遠程抄表系統、室內溫度采集系統。本文選取含有室內溫度的40 000組數據(室內溫度由室內溫度采集系統獲得),按照1∶1比例隨機分配,分別作為建模數據集和驗證分析數據集,進行預測模型建模和室內溫度預測效果后評價。
從數據源讀取建模數據(隨機選取20 000組數據),將供熱介質流量、供水溫度、回水溫度、室外溫度設置為輸入參數,將室內溫度設置為輸出參數。然后對數據進行預處理,主要進行缺失值、離群值和極值處理,數據預處理中的參數設置見圖2。由預處理結果可知,符合要求的數據為19 358 組。

圖2 數據預處理中的參數設置
② 預測模型參數選擇
建模數據集分區界面見圖3。將建模數據集隨機按5∶3∶2分為訓練集、測試集、驗證集。訓練集用于訓練預測模型,測試集用于測試已訓練好的預測模型的泛化能力,驗證集用于驗證由不同數量組件組成的預測模型精度。
筆者采用便于提高預測結果準確性的增強方式(boosting)構建預測模型,預測模型構建的目標選項見圖4。預測模型可由多個組件構成,筆者選取了由1~10個組件構成的預測模型,對訓練完成的10個預測模型分別進行精度驗證。

圖3 建模數據集分區界面

圖4 預測模型構建的目標選項
在預測模型構建的基本選項中(見圖5),將神經網絡模型設為MLP,兩個隱藏層,每個隱藏層的神經元數均為66。在預測模型構建的終止規則中,將每個組件的最大訓練時間設定為25 min。
③ 模型預測結果驗證
經過訓練,并通過模型泛化能力測試后,我們對分別由1~10個組件組成的預測模型進行精度驗證。在進行精度驗證時,我們采用平均絕對誤差作為考核指標。平均絕對誤差越小說明預測模型的精度越高,反之精度越低。由精度驗證結果可知,當預測模型由10個組件構成時,預測模型的精度最高。因此,我們采用由10個組件構成的預測模型對室內溫度進行預測。

圖5 預測模型構建的基本選項
筆者從驗證分析數據集的20 000組數據中隨機抽取了19組,進行預測效果驗證。預測效果驗證結果顯示,預測室內溫度與實測室內溫度的平均相對誤差為-2.27%,基本符合要求。
將濟南市供熱用戶作為研究對象,將供熱介質流量、供水溫度、回水溫度、室外溫度作為輸入參數,利用SPSS MODELER軟件建立基于MLP神經網絡的室內溫度預測模型,對預測模型的構建及預測效果后評價結果進行分析。預測效果驗證結果顯示,預測室內溫度與實測室內溫度的平均相對誤差為-2.27%,基本符合要求。