楊 進
(國家電網公司冀北電力有限公司 財務資產部,北京 100053)
?
電網企業大數據在財務決策中的應用研究
楊進
(國家電網公司冀北電力有限公司 財務資產部,北京 100053)
摘要:大數據是一個世界范圍內、各行各業都日益重視的話題,然而,大數據代表什么、電力企業如何應用大數據,這些問題的理解者或許并沒有那么多,本文的目的有兩個:一是通過閱讀本文,讀者能夠對大數據有個全面的正確的認識和理解;二是以某電網企業為例,運用各種數據分析工具(包括時間序列分析、回歸分析、聚類分析),將大數據理念與實際的電網企業財務決策掛鉤,通過分析兩個財務決策情景來展示大數據的財務應用,讓對大數據仍有模糊認識的讀者更加清晰、形象地看到大數據是如何應用的,以此來加快我國大數據的應用發展。通過案例應用可以看到大數據的確可以為電網企業發揮重要作用。
關鍵詞:大數據;智能電網;財務;時間序列分析;聚類分析
近年來,隨著全球能源問題日益嚴峻,世界各國都開展了智能電網的研究工作,2011年麥肯錫研究報告《大數據:創新、競爭和生產力的下一個前沿領域》 使得大數據在企業界迅速火熱。大數據被視為下一個創新和生產力提升的前沿,2009年,谷歌公司通過大數據業務對美國經濟的貢獻就為540 億USD,而這只是大數據所蘊含的巨大經濟效益的冰山一角,隨著大數據研究的地位以及將會給社會帶來的價值,大數據已成為學術界和產業界共同關注的研究主題。
在智能電網系統中,大數據產生于整個系統的各個環節。隨著大量智能電表及智能終端的安裝部署,電力企業可以每隔一段時間獲取用戶的用電信息,從而收集了比以往粒度更細的海量電力消費數據,構成智能電網中用戶側大數據。
為了響應財務大數據的號召,電網企業財務部推行全面預算管理,全面預算管理是讓企業大數據、海量數據“活起來”的最好方式,通過對數據進行分析可以更合理地設計電力需求響應系統和短期負荷預測系統、更好的理解電力客戶的用電行為等。但是,由于云計算平臺的廣泛應用,積累了海量、多源異構數據,這急需人們研究這種大數據的分析技術和理論。
一、大數據與電力系統的內涵
(一)大數據內涵
2010年Apache Hadoop 組織給出的大數據定義為,“普通的計算機軟件無法在可接受的時間范圍內捕捉、管理、處理的規模龐大的數據集”。定義中提到了三個關鍵詞:數據量、處理時間和處理工具。說明,在對大數據的理解方面,巨大的數據量、盡快的處理時間和多樣化的處理工具是必不可少的部分,然而巨大的數據量和實時的處理時間卻又是矛盾的,因此對處理工具的多樣性和實用性提出很高的要求。學界普遍認同的三個大數據特性是體量大(Volume)、類型多(Variety)和速度快(Velocity)。除此之外,IBM 公司認為大數據還應具有可信性和可用性(Veracity),而國際數據公司(IDC)則認為數據應當具有價值性(Value)。
(二)電力企業如何理解大數據
可以說智能電網就是“大數據”在電力行業中的一種應用,電力大數據的特征可以概括為5“V”3“E”。除了以上介紹的5V以外,3“E”特征是電力大數據所獨有的,包括能量(Energy)、交互(Exchange)、共情(Empathy)。能量可以理解為數據的價值。數據交互性特指在智能電網中,用戶與供電公司在電流、信息流方面的交互。共情為用戶與供電公司、國家、社會達成統一目標,協調多方面利益,最終實現經濟轉型和可持續發展。
二、電網數據類型
(一)按業務分類
電網中的數據大致可以分為4 類:財務數據,即有關于各種資產成本、運維成本、投資決策、用電收入等的數據;生產數據,即電網運行狀態及相關監測信息,如網絡運行拓撲、設備狀態信息;運營數據,即影響分布式電源出力的配電網相關區域天氣信息,如光照、氣溫、風速等信息;企業管理數據,即網內用戶的狀態及營銷信息,如用戶的用電量信息等,美國太平洋天然氣電力公司每個月從900 萬個智能電表中收集超過3 TB 的數據[5]。最后,新業務數據主要包括分布式電源、電動汽車等數據。
(二)按數據結構分類
依照數據結構的劃分形式,這些數據可以分為結構化數據和非結構化數據,結構化數據存儲在數據庫里,可以用二維表結構來邏輯表達實現的數據。相對于結構化數據,無法用二維邏輯表表達的數據即稱為非結構化數據。非結構化數據主要包括線路、監測圖片和視頻、設備檢修管理等的日志信息等,這部分數據增長非常迅速,互聯網數據中心(Internet data center,IDC)的一項調查報告指出:企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%。
(三)按數據實時性分類
從數據實時性上來分,主動配電網中的數據又可以分為準實時數據、非實時數據、實時數據。設備運行日志、監測視頻、用戶營銷信息等信息因其應用實時性要求低,列為非實時數據;以保證配電網的正常運行,設備的狀態監測信息、氣象信息等并非實時調用的信息目的是供后期對設備狀態分析及預測使用,歸為準實時信息;配電網調度、控制、保護等需要的數據一般時效性很高,為真實完整記錄生產運行的每個細節,完整反映生產運行過程,要求達到“實時變化采樣”,因此大部分為實時數據。這些數據中蘊藏著豐富的信息,對于分析生產運行狀態、提供控制和優化策略、故障診斷以及知識發現和數據挖掘具有重要意義。
三、電力行業財務部門如何應用大數據
(一)大數據的內部應用
1.提高財務管控能力,幫助企業戰略落地
相比較企業內外部的其他類型的數據,財務數據更復雜、更龐大,因此包含著更多的寶貴信息。例如,可以建立數據分析模型,對會計數據進行分析和信息挖掘,也可以對成本、費用、收入、利潤等進行行業比較分析、區域市場分析、增長情況分析等,從而發現經濟的近期和遠期規律,從而在挖掘市場潛力的同時,更好的控制行業風險、提升行業競爭力。在進行模型預測的基礎上,利用全面預算管理解決方案,得到不同時期、不同產品類別的明細數據情況,便于企業的實際和預算數據進行比較,分析差距,找到解決問題的方法。通過與網絡報銷、費用控制等分析工具的配合,可以大大提高財務管控能力,幫助企業實現戰略落地。
2.通過成本效益分析,支持基建決策
發電企業通過大數據提供的有效數據預先進行成本效益預測,進而更科學的做出發電站的選址、輸電線路的設計的決策。另外,如果條件允許的話,還可以根據衛星系統數據將月相與潮汐數據進行綜合,更好的服務與電網公司基建建設。不確定的宏觀環境對電網企業投資決策科學化提出更高的要求,因此,電網公司需要充分利用大數據的分析優勢,借此提高財務的決策支撐、資源配置、風險防范作用,進而提高電網公司的盈利能力、投資能力。
3.升級客戶分析,提高財務收益
電網公司的財務管理倡導投資管理精益化,以此來提高投資效率,在具體的數據分析方面,應該以分析型數據為基礎,科學配置各種服務資源,構建營銷數據分析模型。另外,為了對各級數據需求者提供多為、直觀的分析展示,應建立各種針對營銷的系統性算法模型庫,并且注重開發多樣性的數據可視化工具,進而主動把握市場動態,為企業獲得更好的效益、為顧客提供更好的基礎做好鋪墊。
4.提高財務管控能力,加強財務同其他部門的協同管理
電網各信息系統大多是基于本業務或本部門的需求,存在不同的平臺、應用系統和數據格式,導致信息與資源分散,異構性嚴重,橫向不能共享,上下級間縱向貫通困難。通過實施大數據管理,可以整合電力行業生產、運營、銷售、管理的數據,設計各部門全環節數據共享平臺,將優化內部信息溝通,使財務、人事等工作的開展更順暢,進而提高財務部門的管控水平。
(二)大數據的外部應用
利用電力行業數據可給用戶提供更加豐富的增值服務內容。通過與用戶進行互動式對話,可以發掘更多節能降耗的關鍵點,比如,隨著電動汽車的發展,用戶可以在用電低谷給電動汽車充電,然后在用電高峰期將存儲的電貢獻出來,電網公司可以提供其相當于高峰電價的補助,這樣既緩解了電網公司的波動性,又給用戶帶來了部分收入。
除了與用戶進行數據互換外,還可以與外界進行數據的交換,例如挖掘用戶用電與天氣、交通等因素所隱藏的關聯關系,完善用戶用電需求預測模型,進而為各級決策者提供多維、直觀、全面、深入的預測數據,主動把握市場動態。
作為重要經濟先行數據,用電數據和會計數據同樣重要。如果說用電數據是一個地區經濟運行的“風向標”,那么會計數據是準確反映一個國家經濟運行情況的“晴雨表”,可作為投資決策者的參考依據。
四、大數據應用案例——電網企業大數據分析支持財務管理決策
(一)變電站運檢成本變動規律分析
一個資產從投入到運維、檢修最后到資產退役,整個過程中成本的發生不是固定的,剛投入的設備運行狀態良好,需要檢修、運維的成本花費較低,隨著后期使用年限的增加,各種問題隨之出現:零件壞損、外殼腐蝕、地標更換、事故及異常事件發生頻率增加等等,最后的結果是檢修消缺工作越來越繁重,危險點分析越發復雜,運維壓力逐漸增大,因此,全面透徹的對一個變電站在投運后不同階段發生的成本進行分析,有利于及時的核算所需資源、人力,使得財務工作的實施更具準確性、可操作性、可預見性,提高整個財務工作在變電運維方面的管控能力。
變電站的選擇:變電站根據電壓等級可分為:500KV、220KV、110KV、35KV、10KV,不同的等級的變電站運維檢修成本必然不同,因此首要工作就是選擇一個適當的電壓等級的變電站作為分析目標。本文選取變電站電壓等級有兩個原則,一:該等級變電站數量較多,保證多個變電站的平均數據具有客觀性;二:該等級變電站數據可得、且操作上可行。因為電網公司500KV變電站數量一般較少,約3個左右,因此不適合第一條原則。而110KV以下的變電站數量又太多,數據搜集及處理比較繁瑣,因此根據數量和數據可得性、可處理性選擇220KV變電站。
數據單位的選擇:即便都是220KV變電站,各自的容量也是不同的,為了更具科學性,本文選取的成本單位為元/MVA。
最后需說明的一點是:本文的重點是提供一個運用大數據提高財務分析、預測能力的使用方案,對于數據的準確性是其次,出于保密考慮該數據有所偏頗,但依舊可以從該分析方法上窺探大數據對電網公司的巨大作用。
以220KV變電站為例,根據各220KV變電站多年運維數據累計,得出一個標準的220KV變電站自投入運行后每年的成本,該成本由三部分組成:變電檢修成本、變電站通信設備檢修成本、變電運行成本。假設自2000年投運,一個標準220KV變電站自投運后每年成本如下:

20009453720011053852002113464200312865920042038712005224585200624309620073205072008346736200936453920104253922011474396
圖1220KV變電站每年成本(元/MVA)
運用EVIEWS軟件畫出這12年數據的時序圖如下:

圖2 220KV變電站成本時序圖
從上圖可以看出該序列具有兩個特點:1.明顯的上升趨勢,因此并非平穩序列;2.有較明顯的周期波動性,第一次波動時隔4年,后兩次均為3年。
因此可以選擇以下模型進行該序列的分析:
costt=Tt+St+It
其中,Tt代表長期趨勢,即圖中的增長趨勢;St代表周期波動;It代表隨機波動
長期趨勢擬合:
分別用線性擬合和曲線擬合進行嘗試
線性擬合:選用costt=a+bt+It;E(It)=0,Var(It)=σ2進行擬合
擬合結果如下:

VariableCoefficientStd.Errort-StatisticProb.C20244.8013894.301.4570580.1758T35926.021887.86319.029990.0000
由擬合結果可知,T的系數顯著非零,且判決系數為97%,說明擬合結果良好且時間因素能解釋大部分數據變動,唯一不足之處是常數的系數不顯著。
通過長期趨勢擬合,可以得到趨勢擬合圖,下面對比原序列與擬合序列的圖譜之間的吻合度,見圖3。

圖3 趨勢擬合效果圖
從圖3可以看出,線性擬合雖然擬合出了大部分效果,可是仍然存在一些波動情況,擬合效果仍有可提升的空間。

圖3 東、中、西部全社會用電量及增速
下面嘗試曲線擬合,擬合模型如下:
costt=a+b*t+c*t2
擬合結果如下表:

VariableCoefficientStd.Errort-StatisticProb.C61011.7017854.223.4172150.0077T18454.496314.6342.9224950.0170T*T1343.964472.85932.8422080.0193
可以看出,無論從各系數顯著性和判決系數來看,曲線擬合都比線性擬合要效果優良很多,下面通過擬合效果圖來直觀的查看擬合效果。

圖4 趨勢擬合效果圖
上圖可以看出趨勢效果已經基本擬合完成,只剩下部分的周期波動效果有待提升,因此在趨勢擬合方面最終采用曲線擬合,擬合方程為:
costt=61011+18454*t+1344*t2
從擬合方程可以看出一下幾點:
1.隨著時間T的增加,變電站維護成本呈遞增趨勢。
2.成本增加不是線性的,增長幅度隨T的增加而增大,為18454+144T。由此可見,隨著投運時間的增加,檢修運維各項成本的增加并不是線性的,而是以越來越快的速度增加。
周期波動因素分析:
除了趨勢效果外,還可能存在周期波動,又稱為季節波動,季節波動最好理解的就是氣溫、商品零售額、某景點旅游人數等現象,這些現象都會呈現明顯的季節變動規律。相應的,由變電站成本序列圖可以看出,該序列也存在季節效應,即每隔一段時間,成本會大幅上升一次,下面進行季節效應分析。
下圖為各年的季節因子數及因子圖

圖5 各年的季節因子數及因子圖
由上圖可以看出以下幾點:
1.波動因子以1為分界線,等于1的年份為該年成本與長期趨勢一致,大于1的年份為成本除了長期趨勢外還有向上波動的趨勢,小于1的年份為該年除了長期趨勢外,有向下波動的趨勢。由此可以看出第8年以后,每年的成本除了長期趨勢的增加外,還有季節性向上波動的趨勢,總體來說成本會漲的更快;而第2-4,6-7年均有向下的波動,總體來說成本漲的會比長期趨勢慢一些。
2.自投運后的第5年、第9年、第11年均為成本波動劇增期,在這些運營期到來之前,應提高自己的財務管控能力,擴大資金來源,節約成本,搞好資本運作,為財務工作提供堅實的基礎。
3.在第4、8、10年為花費波動較小的年份,在這些期間最重要的是節約成本,提高運維效率,為波動最劇烈時期的到來做好準備。
以上現象從常理來推斷亦可理解,因為在前期投入運營后,設備新、狀態好,因此運維檢修成本波動不大,而運維一段時間后,由于部分設備出現故障,因此需要一定的大修甚至技改,因此運維檢修成本會有一個突然增加的年份,技改大修過后,設備狀態又煥然一新,運維檢修成本又恢復平穩,以此類推,每隔幾年便會有突然增加的年份,通過大數據,可以預測出這些成本突增的年份是在投運后的第幾年,由此提前做好人員上的安排以及資金上的供給,防止計劃提前造成捉襟見肘,可大大提高財務計劃的前瞻性、可預測性和科學性,為增強財務管控能力提供堅實的分析基礎。

圖6 最終擬合效果圖
經過上述的趨勢擬合及季節因子分析,可以得出全新的擬合效果圖,通過該圖可以發現不僅長期的曲線增長趨勢被擬合了,同時每年不同的波動情況也擬合的良好,說明用該方法與大數據理念來分析變電站運維檢修成本科學且有效。
(二)變電站運維成本預測
在上述分析的基礎上,我們可以大致預測出一個變電站每年的運維檢修成本變化趨勢,如果一個變電站的年限為20年,那么可以把之前相似變電站的成本進行擬合,再考慮貨幣時間價值因素,完全的擬合出一個該種變電站的運維成本圖,以此作為新建變電站的成本參考,提前預測到該站全生命周期內成本的總和及分布。然而,上述方式還存在不足之處,因為考慮到技術的進步速度、國家政策的變更、環境壓力的增加、用電人口的增多等等因素,新建的變電站可能在技術、容量、運維方式等方面發生巨大的變化,因而之前老舊變電站的成本參考性大大降低,這時再用之前老站的成本來對新站進行估計的話,無疑會錯誤的誘導財務計劃編制人員,影響其對資金需求的判斷,從而導致財務甚至整個企業資金鏈斷裂,其重大影響促使我們考慮其他更科學的預測方法。
下面的這種預測方法原理與之前有很大不同,該方法不是單純的通過眾多相似變電站來尋找運維年份與成本之間的關系,而是根據同一變電站的歷史年份的成本發生額來預測未來幾年的成本發生,簡單來說,上面的方法是橫向分析多個變電站從大數據中取得關系,而該方法是縱向分析單個變電站,用該站歷史數據預測未來。
條件假定:假設新型變電站已經運維12年,且其運維成本與上述數據一致,下面進行未來年份數據的預測。
由上述分析可知,此階段曲線擬合效果最好,因此首先進行數列的2階差分,差分后自相關、偏自相關圖如下:

通過白噪聲檢驗發現仍存在部分相關性,經過試驗發現AR(3)模型能很好的擬合,擬合后參數如圖:

VariableCoefficientStd.Errort-StatisticProb.C-22831.0049899.87-0.4575360.6665AR(3)0.7626170.2398373.1797360.0245
因此擬合模型為:
因此最終展開后的擬合模型為:
costt=2*costt-1+costt-2+0.76costt-3-1.52costt-5+0.76costt-6
從第7期開始預測,預測值及效果如下
可見預測效果很好,現擬合未來兩年的成本,擬合圖如下:

圖7 預測效果圖

圖8 擬合效果圖
由此,對待沒有運維經驗的新站,可以用此方法,根據某站前幾年的運行數據來預測未來幾年的成本情況,這樣無疑更提高了財務預測與編制的準確性、科學性。
(三)對需求側進行分析
用電用戶按用途可以分為四類:大工業用電、一般商業用電、居民用電、農業用電,不同類型的用戶用電需求不同、電價不同,因而針對各類用戶,可以采用不同的電能管理政策。例如,大工業和一般商業用電一般需求難以調節,相對的居民用電和農業用電可調節性高,通過電價制定,可以促使其在用電高峰與低谷之間進行合理轉移,由此提高用電的靈活性和平穩性。本文要做的就是將某電網供電的幾個地區按某些指標進行分類,分類后每個類別內的地區在總用電量、用電構成上具有相似性,進而在用電收入核算和電價制定上具有可效仿性。另外,如果該電網擴大供電區域,也可以將新區域納入分類系統,預測新區域的收入與政策效果。
影響電量收入的因素有很多,綜合考慮影響總用電量和四種用電比例的影響因子,最終選定居民GDP、第一產業產值、第二產業產值、人口數4個指標。選取城市數值如下:

編號地區名GDP(億)fistv(億)secondv(億)population(萬)1天津14,442.01186.967,275.451,003.972石家莊4,863.66488.712,359.501,003.153太原2,412.8738.611,052.08367.454沈陽7,158.57321.613,698.91727.115呼和浩特2,710.39134.72866.74233.966大連7,650.79477.593,891.95591.457長春5,003.18332.052,658.65752.678哈爾濱5,017.05587.121,743.93995.219上海21818.15124.897907.811432.34
選用SPSS進行聚類分析,分析過程中的數據處理為:1.原始變量標準化;2.聚類方法為組內聯結法,計算距離選擇平方歐式距離;最后輸出樹狀聚類圖如圖9。

圖9 樹狀聚類圖
在圖9中,縱坐標代表各個地區,橫坐標代表距離數,以不同的距離數為界,可以有不同精細程度的分類。如果以5為界可以得到4組分類:第一組(1,4,7,6)、第二組(2,3)、第三組(9)、第四組(5,8)圖中的1-9分別代表從上至下9個地區,因此最后的聚類結果是,天津、沈陽、長春、大連為一類;石家莊、太原為一類,上海單獨一類,呼和浩特和哈爾濱勉強為一類。如果以距離10為界,可以得到三組分類,以此類推。通過上述分類,與現實對照可以發現,以上分類基本是合理和科學的,而且很方便,因此可以應用到實際電網公司供電區域的聚類上,聚類完成后,可以分別考慮各自組別的用電量、電價等用電策略,以此提高財務的管理能力和收益能力。
五、總結
本文通過各種統計方法,將大數據理念與財務數據結合,展示了財務部門如何應用大數據來提高財務決策工作,希望有一個拋磚引玉的作用,促使各位學者積極投身于大數據的具體應用中去,提高我國企業在財務決策中利用大數據的實際應用能力。另外,面對海量的智能電網數據,如何在有限的屏幕空間下,以一種直觀、容易理解的方式展現給用戶,是一項非常有挑戰性的工作,也是未來要探索的方向。
參考文獻:
[1]Divyakant Agrawal,Philip Bernstein,Elisa Bertino,et al.Challengesand opportunities with big data[J].Proceedings of the VLDB Endowment,2012(12).
[2]周暉,鈕文潔,王毅.從繳費行為分析電力客戶的信用度[J].電力需求側管理,2006(6).
[3]Conejo A J,Morales J M,Baringo L.Real-time demand responsemodel[J].IEEE Transactions on Smart Grid,2010(3).
[4]牛東曉,谷志紅,邢棉,等.基于數據挖掘的SVM 短期負荷預測方法研究[J].中國電機工程學報,2006(18).
[5]謝華成,陳向東.面向云存儲的非結構化數據存取[J].計算機應用,2012(7).
[6]江蘇瑞中數據股份有限公司.海迅實時數據庫助力智能電網建設[EB/OL].http://wenku.baidu.com/view/f3ee4ed 1614e852458fb5744.html.
[7]Wong P C,Shen H W,Chen C,et al.Top ten interaction challenges in extreme-scale visual analytics[J].Computer Graphics and Applications,2012(4).
(責任編輯:王荻)
Research on Application of Big Data on Financial Decision-making of Power Grid Enterprises
YANG Jin
(Financial Assets Pivision,State Grid North Hebei Electric Power Co.,Ltd.,Beijing 100053,China)
Abstract:Big data is an increasingly important topic in the world,however,what big data meaning and how to apply is still unclear.There are two aims in this article :firstly,it give the readers a comprehensive understanding about big data; secondly,takes one grid enterprise for example to show how to use big data through all kinds of analytic tools (including time series analysis、cluster analysis、regression analysis),two scenarios about financial decision-making are demonstrated in order to display the application of big data.The results show that big data will and can make a difference in grid enterprise.
Key words:big data; smart power grids; finance; time series analysis; cluster analysis
收稿日期:2015-12-23
作者簡介:楊進,男,國家電網公司冀北電力有限公司財務資產部稽核處處長,高級經濟師。
中圖分類號:F407.61
文獻標識碼:A
文章編號:1008-2603(2016)02-0033-07