趙 超,戴坤成,王貴評
(福州大學 節能技術研究中心,福州 350108)
基于KPCA-WLSSVM的建筑能耗預測模型
趙 超,戴坤成,王貴評
(福州大學 節能技術研究中心,福州 350108)
為降低建筑能耗影響因素間復雜相關性對模型性能的影響,建立了一種基于KPCA-WLSSVM的建筑能耗預測模型。利用核主元分析(KPCA)對輸入變量進行數據壓縮,消除變量之間的相關性,簡化模型結構;進一步采用加權最小二乘支持向量機(WLSSVM)方法建立建筑能耗預測模型,同時結合一種新型混沌粒子群-模擬退火混合優化(CPSO-SA)算法對模型參數進行優化,以提高模型的預測性能及泛化能力。通過將KPCA-WLSSVM模型方法應用于某辦公建筑能耗的預測中,并與WLSSVM、LSSVM及RBFNN模型相比,實驗結果表明,KPCA-WLSSVM模型方法能有效提高建筑能耗預測精度。
建筑能耗;預測;核主元分析;支持向量機
隨著建筑能耗在能源消耗中所占比重的快速增長,建筑節能受到越來越多的關注,準確有效地預測建筑能耗是開展節能評估工作的重要基礎,也是進行建筑節能優化設計的主要依據。由于建筑能耗系統涉及到機理復雜的熱濕傳遞過程,是一個典型的多變量、非線性、強耦合和多擾動的復雜系統,采用機理方法建立建筑能耗預測模型十分困難。人工神經網絡由于對非線性函數具有很強的擬合和逼近能力,作為一種有效的非線性建模方法,目前已有許多學者將其成功應用于建筑能耗預測領域[1-4]。但由于神經網絡訓練基于經驗風險最小化原則,易產生過學習導致泛化能力下降,另外還存在諸如網絡結構難以確定和過分依賴大樣本學習等缺陷,因而在建筑能耗預測領域還難以大范圍推廣。
支持向量機(Support Vector Machines,SVM)是Vapnik等[5-6]基于統計學習理論提出的一種新的有監督機器學習方法。支持向量機利用結構最小化原理來提高其泛化能力,較好地解決了小樣本、非線性、高維數、局部極小等實際問題,目前已成為建筑能耗預測領域的研究熱點[7-8]。最小二乘支持向量機(Least Squares Support Vector Machines,LS-SVM) 是標準SVM的擴展,LS-SVM模型在優化目標函數中選取了誤差(松弛變量)二范數的形式,將SVM中需要求解的二次規劃問題轉化為線性方程組求解問題,從而降低了計算復雜度,有效提高了學習速度,較好地解決了大樣本數據情況下SVM計算復雜的問題[9]。文獻[10-12]基于LSSVM回歸方法建立了建筑能耗預測模型,并獲得了較好的預測結果。針對LSSVM算法魯棒性能欠佳的問題,Suykens等[13]提出了加權最小二乘支持向量機算法(Weighted Least Squares Support Vector Machines,WLSSVM)。WLSSVM在建模過程中依據訓練樣本的重要性分別賦予其不同權重,從而克服了奇異點對LSSVM魯棒性能的影響。文獻[14]基于該算法建立了建筑能耗預測模型。盡管支持向量機回歸方法能夠有效處理高維數、非線性數據建模問題,但是建筑能耗受到氣候條件、建筑特征參數、圍護結構熱工性能、室內熱擾、新風負荷、室內環境參數、空調運行模式等眾多因素的影響,且各影響因素之間嚴重相關,不可避免存在一定的噪聲和冗余信息,在建模過程中會降低精度,增加計算復雜度[15-16]。因此,有必要對能耗建模樣本數據進行數據壓縮和特征提取,通過降維處理來去除樣本數據集合中的冗余信息以及消除噪聲,以提高模型的預測精度和泛化能力。核主元分析法(KPCA)作為一種數據壓縮和特征提取的非線性技術,已在數據處理中的到了廣泛應用[17-18]。KPCA采用核函數的方法,把過程數據或變量組成的原始數據空間映射到高維特征空間,在高維特征空間使用線性PCA方法來尋找主成分。特征空間中的主元變量則保留原始變量的特征信息而消去冗余信息,它是解決數據相關問題,提高模型運算速度的重要工具。
為了提高建筑能耗預測模型的精度和可靠性,筆者提出了一種基于KPCA和WLSSVM的建筑能耗預測方法。首先采用KPCA方法對輸入變量進行特征提取,有效消除變量之間的相關性,降低輸入變量的維數;將通過特征提取后的數據集作為輸入變量建立WLSSVM建筑能耗模型;考慮到LSSVM的正則化參數和核寬參數對模型擬合精度和泛化能力都有較大影響,利用混沌粒子群-模擬退火混合優化(CPSO-SA)算法對LSSVM的參數進行優化選擇,從而建立起具有較高預測精度和泛化能力的建筑能耗預測模型。基于DEST仿真平臺的模擬數據,對南方地區某辦公建筑的能耗進行預測,并與WLSSVM、LSSVM和RBF神經網絡預測模型的性能進行比較,結果表明,KPCA-WLSSVM預測模型的性能優于另外3種預測模型。
1.1 核主元分析
KPCA方法利用非線性核函數將原空間的樣本數據映射到線性高維特征空間,即通過非線性映射,將原空間xi(i=1,2,…,N)映射到某個高維特征空間,并在這個特征空間實現PCA,高維特征空間的協方差矩陣R為
(1)
求協方差矩陣R的特征值λi和特征向量ui有
Rui=λiui
(2)
特征向量ui可以表示為φ(x)的線性組合
(3)
式(1)兩邊左乘φ(xk),整理得
(4)
式中:k=1,2,…,N。定義一個N×N維的核函數矩陣K
Kij=K(xi,xj)=φ(xi)T·φ(xj)
(5)
式(4)進一步化簡為
Nλia=Ka
(6)
式中:a=(a1,a2,…,aN)T;提取樣本數據x映射后的第t非線性主元pt
(7)
1.2 加權最小二乘支持向量機
由于標準SVM模型需要求解二次規劃問題,在大樣本數據的情況下,其運算量大,所需支持向量的個數較多,因此模型比較復雜,從而導致模型的推廣能力較差。Suykens等在標準SVM基礎上提出了最小二乘支持向量機模型。相對于支持向量機模型,LS-SVM模型中的約束是等式約束,在優化目標函數中選取了誤差平方和的形式,將原來SVM中需要求解的二次規劃問題通過最優性條件轉化為線性方程組求解問題,從而降低了計算復雜度,在非線性系統建模方面更具有優勢。其優化問題為[19]
(8)
s.t.yi=ωT·φ(xi)+b+ξi
(9)
式中:ω為權系數向量;φ(·)為輸入空間到高維空間的映射;C為正則化參數;b為閾值。

(10)
s.t.yi=ωT·φ(xi)+b+ξi
(11)
引入Lagrange函數
(12)

K(xi,xj)=φ(xi)T·φ(xj)
(13)
則式(10)的優化問題變為式(14)線性方程組的求解問題
(14)

(15)
1.3 混沌粒子群-模擬退火混合優化算法
標準PSO算法以其簡單易行及快速收斂的特性在工程優化領域得到了快速發展,但也存在容易陷入局部最優的問題,且搜索速度有待進一步提高。筆者提出一種混沌粒子群-模擬退火(CPSO-SA)混合算法用于搜索最佳模型參數,該算法結合了CPSO算法的群體多樣性和SA算法的漸進收斂性的優點,并保持全局搜索和局部搜索的平衡,可以有效提高算法的搜索效率,從而加快算法的收斂速度。
基于CPSO-SA的參數優化算法流程為:
1)輸入訓練樣本集{(xi,yi),i=1,2,…,N};設置CPSO-SA算法的控制參數:種群規模m、最大迭代次數tmax、初始溫度T=T0;隨機產生m個粒子{p1,p2,…,pm},初始化粒子的位置值和速度值,當前迭代次數設置為t=0;
2)計算每個粒子適應度值f(pi);

p(n+1)=λp(n)(1-p(n))
(16)
式中:λ為控制參數;n為迭代次數;

(17)
式中:pBEST為全局最優個體。若Δf<0,則更新pBEST;否則令s=exp(-Δf/T),若s>rand(0,1),則更新pBEST,否則pBEST不變;
5)對粒子的速度和位置進行進化,得到下一代粒子個體,t=t+1,根據溫度下降函數T=T(t),更新溫度T;
6)若粒子適應度變化量小于設定閾值,或t>tmax,則算法終止;否則返回2),進行下一步。
2.1 建筑能耗影響因素分析
建筑能耗系統是一個復雜的非線性系統,影響建筑能耗的因素眾多,主要分為4大類[12、15-16]:外部氣候條件、圍護結構、設備因素以及建筑運行管理模式。外部氣候條件是影響建筑能耗的“自然”因素,包括溫度、濕度、日照及風速等參數,它們能夠直接影響熱量通過圍護結構的傳遞,進而對建筑能耗產生影響;圍護結構可以看作是影響建筑能耗的“人為”因素,包括了反映建筑熱工性能的圍護結構傳熱系數、遮陽率等參數和反映建筑體形特征的體形系數、建筑面積、朝向、窗墻比等參數,這類因素可以通過改善建筑本身的熱工性能及相關參數對建筑能耗起到積極作用;設備因素包括照度標準、燈具類型、設備功率等參數,這些參數取決于建筑的使用功能;建筑運行管理模式也是影響建筑能耗的重要因素之一,它包括了通風次數、人員密度、設備運行時間、新風指標等參數。
2.2 建模步驟
由于建筑能耗與眾多能耗影響因素之間存在復雜的非線性關系,在建模過程中會增加計算復雜度,降低建模精度。因此,有必要通過降維處理去除樣本數據集合中的冗余信息以及消除噪聲,以提高模型的預測精度和泛化能力。筆者提出的KPCA-WLSSVM的建筑能耗預測模型首先利用KPCA提取能耗因子的非線性特征,消除數據冗余并降低模型輸入維數,然后采用WLSSVM方法建立能耗預測模型。模型的結構如圖1所示。

圖1 KPCA-WLSSVM建模流程圖Fig 1 Sketch of KPCA-WLSSVM
考慮到LSSVM算法的正則化參數和核寬參數對模型擬合精度和泛化能力的有較大影響[20],筆者采用CPSO-SA算法在正則化參數C及核寬參數σ的定義域內進行搜索,尋找C和σ的組合最優值。參數優化問題定義為
(18)
s.t.Cmin≤C≤Cmax
σmin≤σ≤σmax

綜上所述,基于CPSO-SA優化的KPCA- WLSSVM建筑能耗預測模型算法關鍵步驟總結如下:
1)樣本數據歸一化處理。為了避免計算出現飽和現象,按式(19)對建筑能耗訓練樣本進行歸一化處理。

(19)
式中:X是原樣本數據;Xmax,Xmin分別代表樣本數據中最大值和最小值;T是目標數據;Tmax是目標數據的最大值,取Tmax=0.9;Tmin是目標數據的最小值,取Tmin=0.1。
2)KPCA特征提取。按式(7)提取主成分,降低樣本維數,消除變量之間的相關性。

4)基于最優參數C*和σ*由式(14)求解b、α*,建立WLSSVM建筑能耗預測模型。
6)反歸一化。按式(20)對模型輸出進行反歸一化處理,

(20)
7)模型預測性能評價。采用相對誤差絕對值最大值Emax、相對誤差絕對值平均值Eave和均方根誤差RMSE三個性能指標對模型進行評價。
(21)
(22)

(23)
式中:N為樣本數。
2.3 實例分析
2.3.1 建筑物簡介 用于驗證文中所建立的KPCA-WLSSVM建筑能耗預測模型的建筑物是南方地區一幢16層的辦公建筑,其外形如圖2所示。

圖2 建筑外形示意圖Fig 2 Shape of office building
該建筑總高度為57.4m,主樓地上16層,地下1層,附樓(裙房)3層。總建筑面積為19 700.5m2。地上建筑面積17 315.62m2,地下建筑2 384.88m2,標準層層高3.5m,外窗尺寸為2.5m×2.0m,窗臺離地高度0.8m。空調運行時間為8:00—17:00,總計每天運行9h,空調季為6月1日到8月30日。
2.3.2 構造樣本集 根據能耗影響因素分析,并結合《公共建筑節能設計標準》相關規定,在對辦公建筑能耗建模過程中,主要考察以下能耗因子:室外溫度(x1)、室外濕度(x2)、太陽輻射(x3)、空調系統運行模式(x4)、最低照度(x5)、燈光熱擾(x6)、室內溫度(x7)、室內濕度(x8)、設備熱擾(x9)、電熱轉換率(x10)、人均新風指標(x11)、家具系數(x12)、外墻傳熱系數(x13)、內墻傳熱系數(x14)、玻璃遮陽系數(x15)、玻璃傳熱系數(x16)、通風次數(x17)[21]。
同時,為減少試驗次數,并保證試驗的全面性,采用正交試驗方法獲取數據樣本集。DEST中影響因素的取值,采用事先設定好的水平值,每個因素選取4個水平值,選用L64(421)正交表進行試驗計算,建筑物能耗的基準值采用動態負荷計算軟件DEST-C的計算值。為獲得較為理想的訓練數據,選用4組正交試驗,并且每組正交試驗中每個因素選取不同的水平值,經過DEST-C動態計算,獲得建筑物全年能耗結果。經DEST-C計算獲256組實驗數據,隨機取其中的3/4作為訓練樣本,余下的1/4作為測試樣本驗證模型的預測性能。
2.3.3 模型訓練 通過KPCA計算,取主元個數為8個,此時累計貢獻率已經超過90%。碎石圖如圖3所示。另外,核參數和正則化參數是WLSSVM性能的重要影響因素,不同的參數組合將得到不同的學習性能和泛化性能。為避免主觀經驗選取的盲目性,采用CPSO-SA算法對模型的兩個參數進行尋優,優化后的參數分別為C=326.7、σ=0.86,滿足預測模型對精度的要求,建筑能耗模型訓練結果如圖4所示,擬合值和期望值基本吻合。

圖3 核主成分碎石圖Fig 3 The scree plot of kernel principal component

圖4 KPCA-WLSSVM模型訓練結果Fig 4 The training results of KPCA-WLSSVM
2.3.4 結果與分析 為比較分析組合模型的預測效果,同時建立了LSSVM、WLSSVM和RBFNN神經網絡模型對建筑能耗進行預測。通過MATLAB平臺實現上述4種預測模型對建筑能耗進行預測,預測值和實際值的對比如圖5所示。從圖中可以知道,4種模型的預測結果大都能夠反映能耗的變化,但有個別樣本點偏差較大,組合模型的預測值和期望值基本重合,相比于單一的LSSVM、WLSSVM和RBFNN神經網絡模型,組合預測模型的預測效果較好。
為了從整體上評價4種預測模型的預測精度和穩定性,按式(21)、(22)及(23)對上述4種模型進行評價,計算結果如表1所示。
表1 種模型評價指標計算結果
Table 1 The predictive results of the four models

模 型訓練集測試集相對誤差絕對值最大值Emax/%相對誤差絕對值平均值Eave/%均方根誤差RMSE相對誤差絕對值最大值Emax/%相對誤差絕對值平均值Eave/%均方根誤差RMSERBFNN0.0390.0210.02614.723.119.86LSSVM0.330.260.0346.882.964.01WLSSVM0.490.310.0397.811.132.89KPCA-WLSSVM0.480.290.0262.810.890.84

圖5 4種模型的預測結果Fig 5 Prediction of the four models
從表1的計算結果可以看出,采用RBF神經網絡和LSSVM方法預測雖然具有很高的訓練精度,但是當其用于預測時,誤差較大,泛化性能差,預測效果不理想;采用WLSSVM進行預測,由于該方法對每個樣本進行了加權處理,有效消除了顯著誤差的影響,具有較好的預測精度,其平均預測誤差和均方根誤差比LSSVM有所降低,但預測效果仍有待提高;KPCA-WLSSVM方法首先采用KPCA對能耗樣本數據進行數據壓縮和特征提取,去除樣本數據中的冗余信息以及消除噪聲,使得WLSSVM模型的預測效果得到了很大的改善,最大相對誤差絕對值從7.81%降到2.81%,相對誤差絕對值平均值從1.13%降低到0.89%,這表明組合模型具有更高的預測精度和預測穩定性,泛化能力得到顯著提高。通過對比分析模型的性能指標,結果表明KPCA-WLSSVM模型具有更好的預測效果,是一種有效、可行的建筑能耗預測方法。
通過4個模型的預測結果及性能評價指標的比較可以看出,基于KPCA-WLSSVM能耗預測模型的預測效果要優于其他3種模型,表明了KPCA- WLSSVM模型在建筑能耗預測中的有效性和優越性。主要結論為:
1)核主元分析能夠消除建筑能耗影響因素間的冗余性和共線性,正確提取輸入樣本的特征信息,簡化模型的輸入樣本。
2)WLSSVM充分考慮了各樣本對建模的影響,有效地賦予各樣本合適的權值,優化了LSSVM模型,使得模型具有良好的非線性處理能力。
3)采用CPSO-SA優化算法對模型的參數進行優化選擇,避免了經驗選擇的缺陷,在此基礎上建立的建筑能耗預測模型具有更好的學習精度和推廣應用能力。
[1] Wong S L,Wan K K W,Lam T N T. Artificial neural networks for energy analysis of office buildings with daylighting [J]. Applied Energy,2010,87(2): 551-557.
[2] Azadeh A,Ghaderi S F,Tarverdian S,et al. Integration of artificial neural networks and genetic algorithm to predict electrical energy consumption [J]. Applied Mathematics and Computation,2007,186(2): 1731-1741.
[3] 喻偉,李百戰,楊明宇,等. 基于人工神經網絡的建筑多目標預測模型[J]. 中南大學學報:自然科學版,2012,43(12): 4950-4955. Yu W,Li B Z,Yang M Y,et al. Building multi-objective predicting model based on artificial network [J]. Journal of Central South University: Science and Technology,2012,43(12): 4950-4955. (in Chinese)
[4] Mathieu J L,Price P N,Kiliccote S,et al. Quantifying changes in building electricity use,with application to demand response[J]. IEEE Transactions on Smart Grid,2011,2(3): 507-518.
[5] Vapnik V. The nature of statistical learning theory [M]. Springer,2000.
[6] Cortes C,Vapnik V. Support vector networks [J]. Machine Learning,1995,20(3): 273-297.
[7] Dong B,Cao C,Lee S E. Applying support vector machines to predict building energy consumption in tropical region [J]. Energy and Buildings,2005,37(5): 545-553.
[8] Li Q,Meng Q L,Cai J J,et al. Applying support vector machine to predict hourly cooling load in the building [J]. Applied Energy,2009,86(10): 2249-2256.
[9] Suykens J A K,Van G T,De B J,et al. Least squares support vector machines [M]. Singapore: World Scientific,2002.
[10] Li X M,Shao M,Ding L X,et al. Particle swarm optimization-based LS-SVM for building cooling load prediction [J]. Journal of Computers,2010,5(4): 614-621.
[11] Jung H C,Kim J S,Heo H. Prediction of building energy consumption using an improved real coded genetic algorithm based least squares support vector machine approach [J]. Energy and Buildings,2015,90: 76-84.
[12] Zhao H X,Magoules F. Parallel support vector machines applied to the prediction of multiple building energy consumption [J]. Energy,2009,4(2): 231-249.
[13] Suykens J A K,de Brabanter J,Lukas L,et al. Weighted least squares support vector machines: robustness and sparse approximation [J]. Neurocomputing,2002,48: 85-105.
[14] Guo Y,Nazarian E,Ko J,et al. Hourly cooling load forecasting using time-indexed arx models with two-stage weighted least squares regression [J]. Energy Conversion and Management,2014,80:46-53.
[15] Li Q,Meng Q L,Cai J J,et al. Predicting hourly cooling load in the building: a comparison of support vector machine and different artificial neural networks [J]. Energy Conversion and Management,2009,50(1): 90-96.
[16] Crawley D B,Hand J W,Kummert M,et al. Contrasting the capabilities of building energy performance simulation programs [J]. Building and Environment,2008,43(4): 661-673.
[17] Fan Z Z,Wang J H,Xu B G,et al. An efficient KPCA algorithm based on feature correlation evaluation [J]. Neural Computing and Applications,2014,24(7/8):1795-1806.
[18] Jia P F,Tian F C,He Q H,et al. Feature extraction of wound infection data for electronic nose based on a novel weighted KPCA [J]. Sensors and Actuators,B: Chemical,2014,201:555-566.
[19] Suykens J A K. Least squares support vector machines [J]. Neural Processing Letters,1999,9(3):293-300.
[20] 樊曉雪. 最小二乘支持向量機的參數選擇[D]. 河北 保定: 河北大學,2012. Fan X X. Least squares support vector machine parameter selection [D]. Baoding: Hebei University,2012. (in Chinese)
[21] 康一亭,于丹,蘇華,等. 辦公建筑能耗基準中影響因子對建筑能耗的影響度[J]. 中南大學學報: 自然科學版,2012,43(Sup1): 146-150. Kang Y T,Yu D,Su H,et al. Impact factors of energy consumption benchmarking in office buildings [J]. Journal of Central South University: Science and Technology,2012,43(Sup1): 146-150. (in Chinese)
(編輯 胡英奎)
A prediction model for energy consumption of building based on KPCA-WLSSVM
ZhaoChao,DaiKuncheng,WangGuiping
(Research Center of Energy Saving Technology,Fuzhou University,Fuzhou 350108,P. R. China)
The correlations among the building energy consumption factors can corrupt the prediction model’s performance,and get undesirable results. A prediction model based on KPCA-WLSSVM is proposed to forecast building energy consumption. The kernel principal component analysis (KPCA) method could not only solve the linear correlation of the input and compress data but also simplify the model structure. A novel hybrid chaos particle swarm optimization simulated annealing (CPSO-SA) algorithm is applied to optimize WLSSVM parameters to improve learning performance and generalization ability of the model. Furthermore,the KPCA-WLSSVM model is applied to the energy consumption prediction for an office building,and the results show that the KPCA-WLSSVM has better accuracy compared with WLSSVM model,LSSVM model and RBF neural network model. and the KPCA-WLSSVM is effective for building energy consumption prediction.
energy consumption of building; forecasting; kernel principal component analysis; support vector machines
10.11835/j.issn.1674-4764.2015.05.016
2015-06-16 基金項目:國家自然科學基金(6080402、61374133);高校博士點專項科研基金(20133314120004)
趙超(1976-),男,副教授,主要從事最優控制研究,(E-mail) seasky76@163.com。
Foundation item:National Natural Science Foundation of China (No. 6080402,61374133); Research Fund for the Doctoral Program of Higher Education of China (No. 20133314120004)
TU831
A
1674-4764(2015)05-0109-07
Received:2015-06-16
Author brief:Zhao Chao (1976-),associate professor,main research interest:optimal control,(E-mail) seasky76@163.com.