李 昂,李 佩,葉 欣,張佳軒
(陜西理工大學(xué) 電氣工程學(xué)院,陜西 漢中 723000)
長(zhǎng)久以來,客戶竊電問題一直困擾著電力企業(yè)[1],嚴(yán)重影響電網(wǎng)的安全經(jīng)濟(jì)運(yùn)行,并破壞了電力市場(chǎng)的經(jīng)濟(jì)秩序和公平性[2]。反竊電保護(hù)作為供電企業(yè)經(jīng)營(yíng)的核心問題,對(duì)電網(wǎng)經(jīng)營(yíng)效益影響巨大,關(guān)系到企業(yè)的經(jīng)營(yíng)成本[3]。傳統(tǒng)的預(yù)防竊電行方法主要包括定期巡檢、定期校驗(yàn)電表以及人為舉報(bào)等。這些方法對(duì)人的依耐性強(qiáng),抓竊查漏的目標(biāo)不明確[4],且日常開展的用戶檢查工作存在查證難、取證難以及定量難的問題。工作人員在查證上往往無從入手,常以人工整理數(shù)據(jù)的方式開展工作。然而,原始數(shù)據(jù)存放在一張表中,表結(jié)構(gòu)過于冗長(zhǎng),無法建立表間關(guān)系[5],不利于相關(guān)人員挖掘數(shù)據(jù)的價(jià)值。
可視分析起源于互聯(lián)網(wǎng)大數(shù)據(jù)研究領(lǐng)域,基本方式是將自動(dòng)的數(shù)據(jù)分析方法(包括數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等各種基于數(shù)據(jù)的分析方法)與可視化相結(jié)合,通過構(gòu)建人機(jī)互動(dòng)的分析環(huán)境,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的快速分析。事實(shí)上,人的數(shù)據(jù)處理能力有限,但對(duì)圖形模式的識(shí)別能力極強(qiáng)。可視分析的核心思想是利用人的感知能力和計(jì)算機(jī)的計(jì)算優(yōu)勢(shì),讓兩者協(xié)同工作,互相促進(jìn)[6]。近年來,隨著國(guó)家電網(wǎng)公司信息化建設(shè)的快速發(fā)展,海量的營(yíng)銷數(shù)據(jù)中包含有較為完備的用戶基礎(chǔ)信息、用戶用電信息、電費(fèi)信息、繳費(fèi)信息以及其他相關(guān)信息[7]。大電網(wǎng)海量數(shù)據(jù)缺乏有效的可視化策略,難以幫助分析人員快速掌握電網(wǎng)運(yùn)行信息。因此,本文將基于軟件Tableau對(duì)大客戶用電量歷史數(shù)據(jù)進(jìn)行可視化建模與分析,挖掘潛在價(jià)值,提出以數(shù)據(jù)可視化判別竊電客戶的方法,以較為準(zhǔn)確地識(shí)別竊電嫌疑,精確定位客戶,提高電力企業(yè)實(shí)施重點(diǎn)監(jiān)控的效率,從而及時(shí)防范并應(yīng)對(duì)異常客戶的拖欠行為。
Tableau是目前全球最易上手的報(bào)表分析工具,擁有強(qiáng)大的統(tǒng)計(jì)分析擴(kuò)展功能,是一款定位數(shù)據(jù)可視化敏捷開發(fā)和實(shí)現(xiàn)的智能展現(xiàn)工具,具有操作簡(jiǎn)單快速、實(shí)現(xiàn)靈活高效的即時(shí)分析能力。它能夠根據(jù)業(yè)務(wù)需求對(duì)報(bào)表進(jìn)行遷移和開發(fā),實(shí)現(xiàn)業(yè)務(wù)分析人員的獨(dú)立自助,以界面拖拽式操作方式對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行聯(lián)機(jī)分析處理,已被廣泛應(yīng)用于各行各業(yè),用來實(shí)現(xiàn)可交互的、可視化的分析。它無需使用向?qū)Щ蚴蔷帉懗绦颍軌蚋S思維軌跡快速進(jìn)行視圖切換和生成,依靠核心的數(shù)據(jù)處理引擎,能夠處理各種規(guī)模的數(shù)據(jù),并同時(shí)保證近乎實(shí)時(shí)的快速數(shù)據(jù)提取分析,提供可視化交互,并把結(jié)果展示出來,方便用戶理解結(jié)果,從而為企事業(yè)相關(guān)工作人員完善和改進(jìn)業(yè)務(wù)提供依據(jù)[8-9]。
模型基于R語(yǔ)言腳本運(yùn)行的Tableau軟件,鏈接客戶歷史用電量數(shù)據(jù),制作包括客戶用電量環(huán)同比增減圖和客戶信用體系表,并且將其相互耦合,將復(fù)雜冗長(zhǎng)的文本數(shù)據(jù)轉(zhuǎn)化為直觀、清晰、高效、易理解和使用的可視化圖形信息[10]。流程如圖1所示。

圖1 可視化建模過程流程圖
采取相應(yīng)算法抽取存儲(chǔ)在不同源數(shù)據(jù)庫(kù)中的所需數(shù)據(jù),最后整合到數(shù)據(jù)倉(cāng)庫(kù)中。從歷史數(shù)據(jù)庫(kù)中提取2016年和2017年某市10 kV、35 kV、110 kV以及330 kV電壓等級(jí)的大電量客戶的歷史用電量數(shù)據(jù)和非法用電記錄的客戶信用歷史數(shù)據(jù)。大量實(shí)踐調(diào)查研究發(fā)現(xiàn),在電力生產(chǎn)過程中,檔案資料更新不及時(shí)會(huì)導(dǎo)致電網(wǎng)業(yè)務(wù)在數(shù)據(jù)存儲(chǔ)分析時(shí)準(zhǔn)確性不高。如果將這些數(shù)據(jù)作為系統(tǒng)的運(yùn)行指標(biāo),將直接影響評(píng)價(jià)的準(zhǔn)確性。因此,應(yīng)該提取可用數(shù)據(jù)分析判斷其特征。原始電網(wǎng)業(yè)務(wù)在數(shù)據(jù)庫(kù)中采集數(shù)據(jù)時(shí),存在數(shù)據(jù)不完整性、數(shù)據(jù)不一致性等嚴(yán)重的質(zhì)量問題。因此,在保證不減少數(shù)據(jù)所包含信息的前提下[11],應(yīng)對(duì)數(shù)據(jù)進(jìn)行歷史樣本抽取,然后開展分析、排查、清洗等操作,改善數(shù)據(jù)的質(zhì)量,如圖2所示。樣本數(shù)據(jù)處理具體情況如下:若存在缺失值現(xiàn)象,為保證建模數(shù)據(jù)的有效性,將這類數(shù)據(jù)剔除;數(shù)據(jù)指標(biāo),電量的輸入輸出差值波動(dòng)大概能反映竊漏電特征,因此考慮引用線損率衡量線損信息[12]。進(jìn)行excel數(shù)據(jù)排版成Tableau可識(shí)別的格式,然后將數(shù)據(jù)源連接到Tableau軟件,調(diào)整相應(yīng)數(shù)據(jù)類型并根據(jù)數(shù)據(jù)類型將數(shù)據(jù)源的字段分成“維度”和“度量”兩類,調(diào)整字段屬性。

圖2 數(shù)據(jù)處理流程圖
創(chuàng)建4個(gè)計(jì)算字段分別統(tǒng)計(jì)各個(gè)電壓等級(jí)的客戶數(shù),以“交流10 kV”為例,打開創(chuàng)建計(jì)算字段編輯窗口,編寫程序命令“IF[電壓等級(jí)]=交流10kVTHEN[客戶]END”,并將標(biāo)題命名為“交流10 kV”。類似地,可以創(chuàng)建35 kV、110 kV、330 kV電壓等級(jí)的計(jì)算字段,如圖3所示。

圖3 某市各個(gè)電壓等級(jí)客戶數(shù)
制作電量柱狀圖,顯示客戶各月用電量情況。圖4為某市所有客戶用電量大小,寬條形代表2017年用電量,窄條形代表2016年用電量;顏色區(qū)分客戶類型,鼠標(biāo)放到條形圖,可以智能化顯示每個(gè)客戶的編號(hào)、電壓等級(jí)以及用電量等數(shù)據(jù);條形圖的高低則可以清楚展示用電量最大的客戶為客戶2403000083。添加客戶篩選器和電壓等級(jí)篩選器,通過篩選器選擇不同的電壓等級(jí),可以智能化顯示某市各個(gè)電壓等級(jí)下的客戶用電量情況。通過篩選器選擇不同的客戶,可以查看每個(gè)客戶的具體用電量大小。
制作客戶用電量環(huán)比增減度條形圖,顯示各個(gè)客戶用電量環(huán)比增減度。如圖5所示,以時(shí)間10個(gè)月為橫軸,2017年的電量信息為縱軸,構(gòu)建用電量條形圖,并將標(biāo)題命名為“環(huán)比(形狀)”,以區(qū)分電量環(huán)比增減度。其中,向上的箭頭顯示電量環(huán)比增加,向下的箭頭表示電量環(huán)比減少。箭頭在坐標(biāo)系中的位置表示增減度的大小。

圖4 某市2016年和2017年客戶用電量柱狀圖
制作客戶用電量同比增減度折線圖,顯示各個(gè)客戶用電量同比增減度。如圖6所示,以時(shí)間10個(gè)月為橫軸,2016年和2017年的電量信息為縱軸,繪制電量折線圖。其中實(shí)折線和虛折線分別代表2016年和2017年用電量,并將標(biāo)題命名為“電量同比增減度”。構(gòu)建到視圖中,調(diào)整為百分比顯示,將創(chuàng)建的計(jì)算字段“環(huán)比(形狀)”顯示到形狀中,向上的箭頭顯示電量同比增加,向下的箭頭表示電量同比減少。箭頭在坐標(biāo)系中的位置表示增減度的大小。

圖5 客戶用電量環(huán)比增減度

圖6 客戶用電量同比增減度
創(chuàng)建一張儀表板,將前述制作好的工作表排版到儀表板上,調(diào)整大小,添加文字和圖像,合理布局,相互耦合,添加適當(dāng)?shù)暮Y選器并應(yīng)用到所有工作表完成大客戶用電量可視化模型的搭建。
為了測(cè)試該模型的可行性和準(zhǔn)確性,應(yīng)用該模型,通過滑動(dòng)篩選器,結(jié)果如圖7所示。直觀清楚地發(fā)現(xiàn),2017年7月和9月,客戶2401000023的用電量為負(fù)值,分別為-360 kW·h和-436 kW·h,而11月環(huán)比增長(zhǎng)度為134.9%。該企業(yè)2016年11月用電量24 109 kW·h,2017年11月用電量152 kW·h,同比減少99.37%。再?gòu)臍v史信用數(shù)據(jù)來看,該企業(yè)存在竊電記錄,該數(shù)據(jù)嚴(yán)重反常,足夠說明客戶用電異常。通過走訪調(diào)查發(fā)現(xiàn),該客戶報(bào)裝電能計(jì)量裝置電能表電壓進(jìn)線斷開,使用電不計(jì)量,零電壓、零電。經(jīng)現(xiàn)場(chǎng)檢查人員和計(jì)量中心人員勘察后,該戶屬于違約用電,確實(shí)存在竊電行為。
另外,如圖8所示,模型可視化清晰顯示2017年12月客戶2401000082用電量環(huán)比下降23.26%,同比下降94.90%,但該客戶的歷史用電信用數(shù)據(jù)卻較高。通過對(duì)該客戶的走訪調(diào)查,發(fā)現(xiàn)該企業(yè)電量確實(shí)下降,但不存在竊電行為,主要是企業(yè)經(jīng)營(yíng)狀況不佳,受到了市場(chǎng)和政策的嚴(yán)重影響。鑒于此,電力企業(yè)幫其通過政府增加直購(gòu)電指標(biāo)幫扶該客戶。可見,該模型可以有力排查縮小竊電用戶的范圍,大大減少了防竊電工作量,有助于工作人員快速發(fā)現(xiàn)問題并解決問題。

圖7 客戶2401000023的用電量異常分析模型圖

圖8 客戶2401000082的用電量異常分析模型圖
針對(duì)長(zhǎng)期以來供電企業(yè)面臨的預(yù)防竊電及查處難等問題,結(jié)合用電信息采集系統(tǒng)反竊電功能發(fā)展現(xiàn)狀,本文利用Tableau軟件對(duì)某市客戶歷史用電量數(shù)據(jù)進(jìn)行模型搭建、數(shù)據(jù)處理、模型分析以及驗(yàn)證,通過兩個(gè)算例分析驗(yàn)證了算法的有效性。實(shí)踐表明,本方案縮小了竊電嫌疑用戶范圍,減少了防竊電的工作量,為供電企業(yè)進(jìn)行竊電偵查提供了依據(jù),有助于工作人員快速發(fā)現(xiàn)問題并解決問題,節(jié)約了相關(guān)的人力、物力和財(cái)力,降低了供電企業(yè)的損失,保障了電網(wǎng)安全,提升了公司效益,可為反偷查漏工作提供借鑒。