董林+葛悅琴+錢圳冰
[摘要]文章是一個研究多重變量之間的關(guān)聯(lián)程度的問題,通過利用多項(xiàng)式回歸方程擬合的思想,偏最小二乘回歸法、線性回歸和曲線擬合的方法建立了電力系統(tǒng)短期負(fù)荷預(yù)測的模型。模型考慮了數(shù)據(jù)相對于時(shí)間的變化情況、數(shù)據(jù)之間存在的相互影響關(guān)系,對未來的電力系統(tǒng)短期負(fù)荷情況進(jìn)行了合理的預(yù)測。
[關(guān)鍵詞]偏最小二乘回歸;時(shí)間序列分析;拉格朗日乘子法;自回歸滑動平均
[DOI]1013939/jcnkizgsc201716194
1問題分析
電力系統(tǒng)負(fù)荷的變化有其自身的規(guī)律,一方面,呈現(xiàn)期性,隨著春、夏、秋、冬四季更迭,負(fù)荷在每個季節(jié)有著其自身內(nèi)部的發(fā)展規(guī)律;從周一到周五的5個工作日,負(fù)荷也有著較大的相似性,但是周末的負(fù)荷值往往低于工作日,整體呈現(xiàn)周期性。另一方面,電力系統(tǒng)負(fù)荷的變化也受許多不確定因素的影響,比如天氣、人們活動等因素。
通過綜合考慮各個氣象因子之間的相互作用,詳細(xì)地描述了綜合氣象因子和負(fù)荷指標(biāo)間的回歸方程。定性分析了綜合氣象因子與負(fù)荷值之間的關(guān)系,并且通過回歸理論繪制出擬合曲線,建立回歸模型,進(jìn)一步定量分析綜合氣象因素與負(fù)荷之間的相關(guān)性。
在對短期負(fù)荷的預(yù)測時(shí),結(jié)合往年的數(shù)據(jù)以及近階段的天氣情況,我們通過加拉格朗日乘子法來修正所建立的回歸模型,使得模型預(yù)測的結(jié)果更加準(zhǔn)確。
2名詞解釋
21多元線性回歸分析
指通過對兩個或兩個以上的自變量與一個因變量的相關(guān)分析,建立預(yù)測模型進(jìn)行預(yù)測的方法,是一種普遍應(yīng)用的統(tǒng)計(jì)分析與預(yù)測技術(shù)。多元線性回歸中,一般采用最小二乘方法估計(jì)回歸系數(shù),以使殘差平方和達(dá)到最小。
22拉格朗日乘子法
將約束優(yōu)化問題,根據(jù)效用函數(shù)方法,將其轉(zhuǎn)變成無約束問題,同時(shí)對無約束的效用函數(shù)利用擬牛頓算法求解其最優(yōu)解,更新乘子。其主要思想是引入一個新的參數(shù)(即拉格朗日乘子),將約束條件函數(shù)與原函數(shù)聯(lián)系到一起,使能配成與變量數(shù)量相等的等式方程,從而求出得到原函數(shù)極值的各個變量的解。
3基本假設(shè)
(1)假設(shè)2015年1月11日至17日氣象因素與往年差別不大。
(2)假設(shè)不會因數(shù)據(jù)采集系統(tǒng)或管理系統(tǒng)自身出現(xiàn)故障導(dǎo)致部分負(fù)荷數(shù)據(jù)的丟失。
(3)假設(shè)數(shù)據(jù)的采集過程是正確并且真實(shí)的,沒有因意外或其他特殊原因引起的數(shù)據(jù)非規(guī)則性變化。
(4)假設(shè)統(tǒng)計(jì)數(shù)據(jù)不會因電網(wǎng)負(fù)荷統(tǒng)計(jì)的標(biāo)準(zhǔn)不同而產(chǎn)生誤差。
(5)假設(shè)不會因?yàn)槠渌藶橐蛩囟鴮?dǎo)致數(shù)據(jù)出現(xiàn)異常情況。
4問題一的模型建立與求解
41數(shù)據(jù)綜合處理
題目所給的數(shù)據(jù)存在一些問題,需預(yù)先處理:地區(qū)一、二的天氣因素中有幾項(xiàng)缺失,需要參考數(shù)據(jù)進(jìn)行修正補(bǔ)加,同時(shí)減少由于節(jié)假日因素影響到的數(shù)據(jù)。
42模型建立過程
(1)將因變量組和自變量組進(jìn)行n次標(biāo)準(zhǔn)化,得到n標(biāo)準(zhǔn)化觀測數(shù)據(jù)陣分別記為:F0和E0。
問題二中自變量為5個氣象因素,因變量為日最高負(fù)荷值、日最低負(fù)荷值、日平均負(fù)荷值,即m=5,p=3。
43模型的結(jié)論
如果要用氣象因素來提高負(fù)荷預(yù)測精度,在諸氣象因素中,筆者會優(yōu)先推薦最高溫度、最低溫度、平均溫度。偏最小二乘回歸方法的模型對研究兩組多重變量之間的依賴關(guān)系的構(gòu)造是合理,并且有效的,可以很好地解決所求問題。
5問題二的模型建立與求解
51問題二的分析
問題二要求我們以已知數(shù)據(jù)作為參考,預(yù)測兩地區(qū)2015 年1月11日至17日共7天的電力負(fù)荷。我們采用了時(shí)間序列預(yù)測法中的ARMA 模型(自回歸滑動平均模型),利用已掌握的比較完備的歷史統(tǒng)計(jì)數(shù)據(jù),采取一定的數(shù)學(xué)方法進(jìn)行科學(xué)的加工整理。在這個模型中,因?yàn)橹挥星皫啄晖粫r(shí)間段各地區(qū)負(fù)荷量的每日數(shù)據(jù),所以選擇平穩(wěn)時(shí)間序列預(yù)測法較為準(zhǔn)確地預(yù)測兩個地區(qū)2015 年1月11日至17日共7天的電力負(fù)荷。
52模型的構(gòu)建說明
ARMA 模型(自回歸滑動平均模型)是時(shí)序方法中最基本的模型。該模型具有隨機(jī)差分方程的形式,即
假定當(dāng)k>0時(shí),at+kat與xt不相關(guān),也就是期望E(at+kat)=0(k>0)
利用Excel數(shù)據(jù)挖掘的方法中的Trend函數(shù),得到了2015年的預(yù)測值。而我們在問題三中只有前六年的數(shù)據(jù),信息資料的質(zhì)量和數(shù)量都不是很高,所以預(yù)測得到的結(jié)果誤差應(yīng)該較大。
6問題三的模型建立與求解
61模型原理
問題3涉及了氣象因素的負(fù)荷值預(yù)測,該預(yù)測值主要由兩部分構(gòu)成:一為問題三中預(yù)測的負(fù)荷值;二為約束條件:2015年氣象因子綜合對負(fù)荷值的一個影響值。在問題二中,已經(jīng)得到過去幾年氣象因子對負(fù)荷指標(biāo)的回歸方程。基于原函數(shù)和約束條件的相關(guān)分析之上,問題四所采用的優(yōu)化算法為“拉格朗日乘子法”。
62模型建立
記y=f(x)為我們希望得到的線性回歸方程,其中f(x1)為問題三中預(yù)測到的第i(i=1,2,…,7)天的日負(fù)荷值的高階函數(shù)擬合方程,λf(x2)為已知數(shù)據(jù)2015年的氣象因子綜合對日平均負(fù)荷值的一個影響值。模型如下:
y=f(x)=f(x1)+λf(x2)
63模型的求解
(1)運(yùn)用MATLAB對問題三中2015年1月11日至1月17日預(yù)測值進(jìn)行處理,得到日負(fù)荷值的曲線,我們選用十三階多項(xiàng)式進(jìn)行擬合,效果很好,得到擬合方程系數(shù)陣。
(2)在第2問的基礎(chǔ)上,代入2015年1月11日至1月17日的相關(guān)指標(biāo),重復(fù)問題二,得到氣象因子綜合對日平均負(fù)荷值的回歸方程。
(3)將2015年1月11日至1月17日的氣象因子代入步驟二所得方程預(yù)測日平均負(fù)荷值,我們所求的,最后得到高階回歸方程組。
下圖是經(jīng)過修正擬合后的和未記及氣象因素的一個比較圖:淺色為修正后的曲線,深色為未記及氣象因素的擬合圖,7幅圖分別代表了7天,縱坐標(biāo)為電力負(fù)荷值。從圖上我們可以清晰地看出修正后的圖平滑度更好,說明修正是合理有用的。
7模型的推廣
由于我國領(lǐng)土面積大,南北距離大,各個地方氣候因素不近相同,我們的模型可以進(jìn)一步預(yù)測南部地區(qū)高溫對電力負(fù)荷的影響,也可以預(yù)測在東北地區(qū)嚴(yán)寒條件下對負(fù)荷值產(chǎn)生的影響。
我國某些城市第二產(chǎn)業(yè)和第三產(chǎn)業(yè)發(fā)達(dá),特別是服務(wù)業(yè),因此我們的模型可以預(yù)測這個地方電力負(fù)荷值的主要特征以及預(yù)測該地區(qū)當(dāng)?shù)氐南嚓P(guān)服務(wù)業(yè)的發(fā)展趨勢。
參考文獻(xiàn):
[1]余勝威MATLAB優(yōu)化算法案例分析與應(yīng)用[M].北京:清華大學(xué)出版社,2014
[2]姚澤清,鄭旭東,趙穎全國大學(xué)生數(shù)學(xué)建模競賽賽題與優(yōu)秀論文評析2005—2011年B題[M].北京:國防工業(yè)出版社,2012
[3]張志涌,楊祖櫻MATLAB教程[M].北京:北京航空航天大學(xué)出版社,2015
[4]姚澤清,鄭旭東,趙穎全國大學(xué)生數(shù)學(xué)建模競賽賽題與優(yōu)秀論文評析2005—2011年A題[M].北京:國防工業(yè)出版社,2005
[5]章文波,陳紅艷實(shí)用數(shù)據(jù)統(tǒng)計(jì)分析及SPSS 120應(yīng)用[M].北京:人民郵電出版社,2006