蔣衛濤,李 民2,姚 雄2,朱永燦,馬一迪
(1.西安工程大學電子信息學院,陜西 西安 710048; 2.陜西省水利電力勘測設計研究院,陜西 西安 710001)
隨著社會經濟的飛速發展和科技的不斷進步,能源問題和環境問題已成為全世界面臨的突出問題。大力推廣清潔、可再生能源,采用高效的節能技術正是解決這一問題的重要方法之一。太陽能作為一種新能源,因為其具有取之不盡、用之不竭、無環境污染等諸多優點而受到各行各業的關注。太陽能的開發利用中,太陽能集熱是最成熟、實際應用最多且在經濟上能與常規能源競爭的一種可再生能源利用技術[1-3]。
由于太陽能集熱的效率會受到太陽輻射量、日照時長、氣溫等因素的影響,而不同地區太陽輻射量、日照時長、氣溫等因素也各不相同,因此利用太陽輻射量、日照時長、氣溫等因素對太陽能集熱效率進行預測,對選擇太陽能集熱站選址將有著重大的意義。
由于太陽能集熱效率受輻太陽輻射量、日照時長、氣溫等多因素影響,具有很強的隨機性,所以預測的難度非常大。目前對非線性預測的方法有多種,如灰色預測(Grey Model,簡稱GM)、線性回歸(Linear Regression)、時間序列、人工神經網絡(Artificial Neural Network,簡稱ANN)、馬爾可夫(Markov Chain, 簡稱MC)等等[4-8]。但是,這些方法都在理論或者應用當中存在不足,例如:時間序列方法中的高階模型參數估計難度大,而低階模型預測精度低;灰色預測只適合于指數增長的預測;ANN存在過擬合、樣本需要量大以及局部極小等問題等問題。支持向量機(Support Vector Machine,簡稱SVM)作為一種智能的預測方法,在小樣本、非線性、高維模式識別等問題的解決上表現出許多特有優勢,已經在光伏發電、核反應堆功率預測、變壓器溫度預測以及電力負荷預測等多領域有著廣泛的應用[9-12]。最小二乘支持向量機(Least Square Support Vector Machine, 簡稱LSSVM)是SVM的改進算法,在繼承SVM的優勢的同時,可以降低SVM的計算復雜度,提高運算效率。
因此,本文采用LSSVM對太陽能集熱效率進行預測,首先對得到的數據進行歸一化處理,利用遺傳算法(Genetic Algorithm,簡稱GA)對LSSVM參數進行優化,訓練得到基于LSSVM的太陽能集熱效率預測模型。
SVM是由Vapnik等人在20世紀90年代后期提出的[13],是一種基于統計學理論的機器學習方法。SVM是基于結構風險最小化原則,尋找最優回歸超平面,設訓練的樣本為{xi,yi},i=1,2,…,n,xi∈Rd,則該樣本超平面的表達式為
ωTφ(x)+b=0
(1)
式中:ω為權值矢量;b為閾值。
SVM將尋找最優超平面問題可以歸結為求解如下優化問題:
(2)
(3)
式中:C為懲罰參數,ξi為非負松弛因子。對式(3)引入拉格朗日乘子并依據卡羅需-庫恩-塔克條件可求解如下線性問題:
(4)
式中:Y=[y1,y2,…yn]T,α=[α1,α2…αn]T,IV=[1,1,…1]T,Ωij=yiyjK(xi,xj),i,j=1,2,…,n為核矩陣,K(xi,xj)為核函數,IN為單位矩陣。利用最小二乘求出α和b后,可得LSSVM的預測函數為
(5)
式中:αi為拉格朗日乘子;b為分類閾值。
LSSVM通過核函數定義的非線性變換將輸入空間變換到高維空間, 并在這個高維空間中尋找輸入變量和輸出變量的線性關系, 因此核函數的選擇嚴重影響著LSSVM的預測精度,常用的核函數有:線性核函數、多項式核函數、高斯徑向基核函數(RBF)、Sigmoid核函數。本文選擇高斯徑向基核函數(RBF)為核函數,如式(6)所示:
(6)
式中:σ是高斯核寬度。在LSSVM的預測模型中,懲罰參數C和核參數σ2是影響LSSVM性能最大的兩個參數。因此,本文采用遺傳算法對LSSVM參數進行優化,尋得最優參數。
GA是優良的智能優化算法,在1975年,最初由美國Michigan的Holland提出[15],是一種通過模擬自然進化過程搜索最優解的方法。由于GA的整體搜索策略和優化搜索方法在計算時不依賴梯度信息或其他輔助信息,只需要影響搜索方向的目標函數和相應的適應度函數,所以遺傳算法可以對LSSVM參數進行尋優。其基本原理如下:
遺傳操作包括三個基本算子:選擇、交叉和變異[16]。
綜上所述,對于BPH合并原發性高血壓的患者,在常規治療基礎上加用非那雄胺治療,在改善癥狀、縮小PV及降低PSA水平的同時,明顯減少機體IL-6、MMP-1、CRP炎癥因子的水平。由于本研究樣本量小,患者服藥種類,高血壓年限不等等因素可能干擾研究結果,需加大樣本量、細化分組及增加觀察年限來進一步明確非那雄胺的療效及BPH同原發性高血壓的關系。
(1)選擇:從群體中選擇優勝的個體,淘汰劣質個體的操作叫選擇。目前,最常見且最簡單的選擇方法是輪盤賭選擇法,在該方法中,各個個體的選擇概率和其適應度值成比例。設群體大小為n,其中個體i的適應度為fi,則i被選擇的概率為
(7)
個體適應度越大,其被選擇的概率就越高,反之亦然。個體被選擇后,可隨機組成配對,以供后面的的交叉操作。
(2)交叉:遺傳算法中起核心作用的是遺傳操作的交叉算子,交叉操作就是把兩個父代個體的部分結構加以替換重組而生成新個體。交叉算子根據交叉率將種群中的兩個個體隨機地交換某些基因,能夠產生新的基因組合,期望將有益組合在一起。最常用的交叉算子為單點交叉,具體操作是:在個體串中隨機設定一個交叉點,實行交叉時該點前或后的兩個個體的部分結構進行互換,并生成新個體。
(3)變異:變異算子的基本內容是對群體的個體串的某些基因座上的基因值進行變動。一般來說,變異算子首先對群中所有個體以事先設定的變異概率判斷是否進行變異,其次對進行變異的個體隨機選擇變異位進行變異。
本文選擇格爾木地區某1年的月平均數據作為訓練數據,下一年的月平均數據作為測試數據,通過訓練數據訓練太陽能集熱效率預測模型,通過測試數據檢驗預測模型的性能。由于數據之間相差較大,會影響訓練的效果,因此在訓練前必須對訓練數據進行預處理。本文首先對訓練數據進行歸一化預處理,將輸入量都歸一化到[0,1]區間內,其具體的歸一化公式如式(8)所示:
(8)
式中:Xmax、Xmin分別為采集到月平均氣溫、月平均日照時數、月平均太陽總輻射量和月平均日照百分率的最大值和最小值,Xi表示月平均氣溫、月平均日照時數、月平均太陽總輻射量和月平均日照百分率。
表1所示為太陽能集熱效率預測模型的輸入和輸出參數。從表1可以看出,月平均氣溫、月平均日照時數、月平均太陽總輻射量、月平均日照百分率作為輸入參數,太陽能集熱功率作為輸出參數。圖1表示某一年的輸入變量曲線。通過圖1的測試數據輸入變量曲線,利用訓練得到的預測模型對下一年的月平均太陽能集熱功率進行預測。

表1 預測模型輸入輸出

圖1 測試數據輸入變量曲線
針對LSSVM參數難以確定的問題,本文采用遺傳算法對LSSVM參數懲罰因子C和核參數進行優化,其優化的步驟如下:
(1)初始化種群,對個體進行編碼,基因序列為懲罰因子C和核參數,生成隨機種群。其中種群最大規模為20, 參數C和的尋優范圍都設定為[0,100]。
(2)設置最大進化代數為200,并確定適應度函數,利用樣本數據進行訓練測試,根據規則計算個體適應度。本文將實際光熱效率與預測出來的光熱效率的均方誤差作為遺傳算法的適應度函數,其具體表達式如式(9)所示:
(9)

(3)當種群最優個體達到滿足條件或達到終止迭代次數時退出尋優過程,得到優化解。跳轉至第5步,否則進入下一步。
(4)對當代存活的種群執行選擇、交叉、變異得到下一代種群,返回第3步判斷。其中,交叉概率為0.5,變異概率取0.9。
(5)得到最優懲罰因子C與核參數。并代入到LSSVM中通過訓練樣本訓練得到預測模型。
本文通過GA優化LSSVM參數,得到基于LSSVM的太陽能集熱效率預測模型。首先將獲取到的原始數據分為訓練數據和測試數據,為避免訓練數據的差異性,對訓練數據進行歸一化處理,通過歸一化后的訓練數據訓練太陽能集熱效率預測模型,在訓練的同時利用遺傳算法對LSSVM參數進行優化,最后確定預測模型。圖2所示為基于LSSVM的太陽能集熱效率預測模型流程圖。

圖2 基于GA優化LSSVM的太陽能集熱效率預測模型流程圖
本文以月平均氣溫、月平均日照時數、月平均太陽總輻射量、月平均日照百分率作為基于GA優化LSSVM的太陽能集熱效率預測模型的輸入參數,預測太陽能集熱功率。通過遺傳算法對LSSVM進行參數尋優,經過200次迭代后,可以得到如圖3所示的適應度曲線,從圖3可以看出,經過多次調整后,適應度MSE最終穩定于0.051 9。此時得到的最優參數,Cbest=2.203 6,best=0.000 953 68。將得到的最優參數代入預測模型中,就得到了基于LSSVM太陽能集熱效率最優預測模型。

圖3 適應度曲線
利用相同的數據集,分別對ANN和時間序列進行訓練和測試,將其得到的預測結果與LSSVM進行比較,比較的結果如圖4所示。通過圖4結果曲線的對比可知,基于LSSVM的太陽能光熱效率預測模型的預測精度明顯高于ANN預測模型和時間序列預測模型。

圖4 不同方法對比圖
為了能夠更全面地評價LSSVM的太陽能光熱效率預測模型的預測性能,本文采用兩種不同的評價標準對結果進行評價比較,它們分別是平均絕對百分誤差(Mean Absolute Percentage Error, 簡稱MAPE)和均方根誤差(Root Mean Squares Error,簡稱RMSE)。當誤差越小時,MAPE和RMSE越小,模型性能越好。MAPE和RMSE的表達式如式(10)和式(11)所示:
(10)
(11)

表2 預測誤差對比 %
結合MAPE和RMSE兩種不同的評價標準,進一步比較LSSVM、ANN、時間序列這三種模型在太陽能光熱效率預測方向的性能,其對應的預測結果評價標準如表2所示,從表2可以看出,在訓練和測試階段LSSVM預測模型的RMSE和MAPE值均小于ANN和時間序列的值,這意味著LSSVM預測模型的預測結果更接近真實值。因此,綜合圖4和表2可以看出,LSSVM預測模型比ANN預測模型和時間序列預測模型具有更小的預測誤差,其預測結果也更接近真實值。
本文提出了一種基于LSSVM的太陽能集熱效率預測模型,利用訓練數據對LSSVM預測模型進行訓練,遺傳算法進行LSSVM參數尋優,以月平均氣溫、月平均日照時數、月平均太陽總輻射量、月平均日照百分率作為預測模型輸入對太陽能集熱效率進行預測,并將結果與ANN預測模型和時間序列預測模型進行對比,比較結果表明,LSSVM預測模型具有更小的預測誤差,RMSE和MAPE值分別為0.68和1.25。綜上表明,LSSVM預測模型可以很好地應用于太陽能集熱效率的預測。