潘榮威

摘要:隨著電力行業競爭日趨加劇,成本控制成為了電力企業廣泛關注的課題,其直接關系著電力企業經濟效益的提高。與此同時,在電力物資采購時,多種物資采購的數量可能存在著一定的相關性,基于此,本文提出一種有關電力物資配套采購數量的領回歸線性回歸預測方法。
關鍵詞:線性回歸;電力物資;數量預測
在進行電力物資采購時,直接或間接相關聯的不同物資的采購數量可能存在著一定的關聯,在小樣本的情況下課用線性回歸法進行預測。同時,一般簡單的線性回歸還有其他的改進方式,嶺回歸是通過添加正則項的方式來改進損失函數。可以較為準確地估計配套物資,從而減少倉儲成本和采購成本。
一、電力物資配套采購數量預測的線性回歸方法分析
線性回歸主要用于對多變量,多維度輸入擬合單輸出的情況。簡單的線性回歸的公式見公式(1)。
其中y^表示估計的輸出的變量、x表示輸入的變量向量,w為權重向量,b為標量表示偏置。為了衡量估計值與真實值之間的差距,需要用損失函數來對其進行衡量。假設輸入的x向量有n個維度,一共有樣本m個數據,則損失函數如公式(2)所示。
其中yi表示第i個樣本的真實值,yi^表示第i個樣本根據輸入、權重和偏置的值所得的估計值。公式中的中的分母中的m用來補償樣本數量帶來的影響,2用來補償求導后的系數2。若將偏置b與x合并,則公式(1)變形為公式(3)的形式:
其中x′=(1,x1,x2,x3…,xn)。由于公式(3)方便描述,后續的x都表示x′。假設輸入的m個樣本分別為xm,ym。那么損失函數可以表示為:
其中大寫的X和Y為m行樣本的矩陣形式。損失函數衡量了真實值與估值之間的差距,因此當損失函數值越小,二者差距越小,目標是求損失函數的最小值。為了求二者之間的最小值,考慮到損失函數是關于w的二次函數,因此對損失函數進行求導,令導數等于0,即可求得最小值。
公式(5)中,若X為滿秩的情況時,即m=n時,存在w使得損失函數為0,而當m>n時,一般而言,很難使得損失函數為0,除非樣本中存著重復樣本的情況。簡單的最小二乘法的另一個缺點是,當出現多重共線性的情況時,公式(5)不穩定,甚至無法求解逆矩陣。多重共線性是指樣本中,輸入變量中某些參數存在著線性關系。為了解決這一問題,可以對公式(5)進行更新,從中添加對角矩陣:
公式(6)中,由于有對角矩陣的加入,求矩陣的逆變為了穩定情況,對應的損失函數為:
公式(7)表示的損失函數所對應的線性回歸叫做嶺回歸,新添加的項叫做正則項,其含義為:在原有的損失函數的基礎上,還需考慮各個權重的大小乘以系數λ的情況,這個系數是人為指定的,稱之為超參數。一般而言,超參數的值需要人為設定,根據實驗結果進行不斷改進。
二、電力物資配套采購數量預測線性回歸方法的試驗對比
為了衡量簡單線性回歸預測和嶺回歸預測之間的差距,本文又隨機選取了樣本中的6條樣本作為對結果的評價。本文使用某省某電力公司的數據,對所有輸入的樣本進行回歸分析,并將得到的結果做可視化。其樣本數據見表1。表2中的數據是兩種模型對于測試樣本的偏差比較結果,其中的數據根據表1以及兩種方法的回歸結果進行計算得出。從比較結果中可以明顯看出,嶺回歸的偏差要比簡單線性回歸模型要好,第3條數據二者都無法正確評估可能是因為第3條數據是離群點,即異常值,因此兩種模型的估計值與實際值之間的差距較大。
三、小結
總之,電力物資采購的成本和數量控制的重要性不言喻,是電力企業經濟效益提高的直接體現。本文重點介紹了電力物資采購時存在著數量上的關系,并提出了簡單線性回歸作為采購數量和目標數量的分析方法,并且針對其不足之處,介紹了能一定程度上解決不足的嶺回歸。
參考文獻:
[1]張萍.電力物資采購成本的控制探討[J].科技與企業,2016,(16).
[2]程志賢等.經評審的最低投標價法理論與實務[M].北京:中國建筑工業出版社,2004.
(作者單位:廣東電網有限責任公司惠州供電局物流服務中心)