趙江河,楊莉
(1. 云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,云南 昆明 650214; 2. 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院,云南 昆明 650504)
在電力系統(tǒng)中,存在許多的異常數(shù)據(jù)。最初需要人工在大量的正常數(shù)據(jù)中尋找極其個(gè)別的異常數(shù)據(jù)。人工長(zhǎng)時(shí)間地處理同一件事常常會(huì)由于判斷疲勞而忽略了個(gè)別的異常數(shù)據(jù),而電力系統(tǒng)往往會(huì)因?yàn)檫@些疏忽而出現(xiàn)嚴(yán)重的故障甚至重大災(zāi)難。此外這些數(shù)據(jù)往往是不斷增加的,采用人工的方式不僅會(huì)消耗大量的人力物力,而且結(jié)果也不理想。
自動(dòng)化技術(shù)是代替人工處理數(shù)據(jù)的一項(xiàng)偉大的技術(shù),它依靠計(jì)算機(jī)解決了人工疲勞的問題,節(jié)省了大量的人力物力。減少員工從事重復(fù)無(wú)聊工作的時(shí)間,讓員工有更多的時(shí)間投入到創(chuàng)造性的工作中,從而提升員工的工作幸福感。此外在減少員工工作時(shí)間的同時(shí),還能夠解決人為誤檢的問題,從而提高系統(tǒng)的準(zhǔn)確性。
RPA(Robotic Process Automation)是一種新型自動(dòng)化技術(shù),即機(jī)器人流程自動(dòng)化。RPA主要是解決一些重復(fù)的、有規(guī)則的、不變的工作,是借用計(jì)算機(jī)實(shí)現(xiàn)的一套自動(dòng)化處理的任務(wù)。它用于解決一些頻率高、帶有重復(fù)性的作業(yè)任務(wù)。RPA是通過(guò)監(jiān)視用戶在圖形用戶界面(GUI)的操作,并且直接在GUI上自動(dòng)重復(fù)這些操作。
自動(dòng)化技術(shù)主要的流程為:數(shù)據(jù)抓取→數(shù)據(jù)分析→數(shù)據(jù)處理。自動(dòng)化技術(shù)重點(diǎn)需要解決的問題就是數(shù)據(jù)抓取。新型自動(dòng)化技術(shù)采用的是基于桌面級(jí)的數(shù)據(jù)抓取技術(shù),可以對(duì)網(wǎng)頁(yè)上的表格進(jìn)行抓取,并且不會(huì)受限于表格的行列數(shù)量。區(qū)別于早期的API型數(shù)據(jù)抓取,不需要與API的提供方核實(shí)返回的數(shù)據(jù)格式以及字段所代表的含義。
如圖1所示,是底層自動(dòng)化與RPA在數(shù)據(jù)獲取方面的區(qū)別。其中(a)是底層自動(dòng)化的數(shù)據(jù)獲取,它需要自己匹配不同的數(shù)據(jù)結(jié)構(gòu)來(lái)進(jìn)行數(shù)據(jù)的統(tǒng)一。(b)是RPA的數(shù)據(jù)獲取,由于web頁(yè)面本身就對(duì)不同的數(shù)據(jù)結(jié)構(gòu)進(jìn)行了解析,因此RPA只需要獲取web頁(yè)面的信息即可獲取所有不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。

圖1 自動(dòng)化獲取數(shù)據(jù)的兩種方式
目前國(guó)內(nèi)外的RPA應(yīng)用現(xiàn)狀主要集中在銀行審計(jì)領(lǐng)域,運(yùn)用RPA技術(shù)優(yōu)化賬表核對(duì)業(yè)務(wù)流程[1]和企業(yè)財(cái)務(wù)報(bào)銷審計(jì)方式[2]等,從而解決銀行存款函證現(xiàn)有流程耗時(shí)長(zhǎng)、易錯(cuò)問題[3],解決財(cái)務(wù)共享的資金管理問題[4]等。
從RPA的研究現(xiàn)狀分析,國(guó)內(nèi)主要在技術(shù)結(jié)構(gòu)[5]以及功能優(yōu)化上開展分析研究,系統(tǒng)分析了如何構(gòu)建穩(wěn)定性高、彈性強(qiáng)的RPA機(jī)器人[6],并從RPA技術(shù)應(yīng)用的必要性和挑戰(zhàn)進(jìn)行思考,提出解決思路和建議[7]。國(guó)外主要集中于如何選擇更合適的RPA模型以及對(duì)RPA的未來(lái)構(gòu)想,提出了三步法和一個(gè)可量化的模型來(lái)高效的選取和確定合適的RPA流程[8],針對(duì)應(yīng)用場(chǎng)景分析選擇適當(dāng)模型的影響[9],并進(jìn)一步提出了對(duì)未來(lái)RPA技術(shù)的設(shè)想[10]。
根據(jù)國(guó)內(nèi)外的應(yīng)用研究現(xiàn)狀可知,RPA在電網(wǎng)或者異常數(shù)據(jù)告警方面的研究和應(yīng)用領(lǐng)域相對(duì)較窄,其應(yīng)用領(lǐng)域大部分局限于財(cái)務(wù)報(bào)表分析領(lǐng)域。本文嘗試將RPA技術(shù)與電網(wǎng)的異常數(shù)據(jù)告警相結(jié)合,實(shí)現(xiàn)RPA在電網(wǎng)領(lǐng)域的應(yīng)用,來(lái)提升系統(tǒng)的準(zhǔn)確性并且減少人力物力。
RPA技術(shù)是對(duì)現(xiàn)有的電力系統(tǒng)的擴(kuò)展,不需要對(duì)現(xiàn)有的系統(tǒng)進(jìn)行修改。采用RPA技術(shù)可實(shí)現(xiàn)對(duì)異常數(shù)據(jù)進(jìn)行分析并且實(shí)時(shí)的對(duì)相關(guān)的負(fù)責(zé)人員進(jìn)行信息告警,并且不用修改現(xiàn)有大數(shù)據(jù)檢測(cè)平臺(tái)的系統(tǒng),只需要定時(shí)去電力系統(tǒng)信息管理平臺(tái)進(jìn)行數(shù)據(jù)抓取并進(jìn)行數(shù)據(jù)分析即可,操作簡(jiǎn)單,擴(kuò)展性強(qiáng)。
不同的工具在操作方面可能略微有些出入,但本質(zhì)都是基于擴(kuò)展性以及重復(fù)性來(lái)實(shí)現(xiàn)的。UIBot以及UIPath的區(qū)別如表1所示。

表1 UIBot和UIPath的區(qū)別
當(dāng)使用的瀏覽器是多標(biāo)簽的頁(yè)面時(shí),UIPath即使不在當(dāng)前標(biāo)簽頁(yè)面上也可以讀取到該標(biāo)簽頁(yè)的表格數(shù)據(jù),而UIBot則需要切換到當(dāng)前的標(biāo)簽頁(yè)面上才可以讀取到,否則就會(huì)出現(xiàn)讀取到空數(shù)據(jù)的情況。但兩者都要求被抓取的頁(yè)面處于打開狀態(tài)。當(dāng)網(wǎng)頁(yè)沒有打開的時(shí)候,則會(huì)獲取空數(shù)據(jù)。
UIBot可以進(jìn)行相應(yīng)的代碼編寫,對(duì)于有編程經(jīng)驗(yàn)的人來(lái)說(shuō),操作起來(lái)更方便,邏輯更加清晰,適合有代碼基礎(chǔ)的編程人員使用。另外官方文檔也有相應(yīng)的代碼以及函數(shù)調(diào)用樣例。UIPath則不能編輯代碼,給用戶的感覺是非常輕便的,并且用戶不需要了解代碼方面的知識(shí),更加的便捷,適合更廣的人群使用。
UIBot的主流程頁(yè)采用流程圖設(shè)計(jì),其對(duì)流程化的步驟可觀性更強(qiáng)。而UIPath的主流程頁(yè)采用的是嵌套式的設(shè)計(jì),其對(duì)一個(gè)流程內(nèi)部的嵌套結(jié)構(gòu)展現(xiàn)的更好。但對(duì)于小任務(wù)來(lái)講,嵌套格式的流程使用的并不是很多。
通過(guò)對(duì)比分析,結(jié)合電力系統(tǒng)對(duì)定制化的要求較高,本文選擇UIBot進(jìn)行應(yīng)用實(shí)現(xiàn)。
根據(jù)對(duì)應(yīng)用的分析,本實(shí)現(xiàn)將RPA與登錄、讀取網(wǎng)頁(yè)數(shù)據(jù)、異常分析、異常數(shù)據(jù)保存、異常告警進(jìn)行結(jié)合。實(shí)現(xiàn)全自動(dòng)的流程,僅需要人工提供登錄密碼以及異常判斷規(guī)則即可。大致流程為:自動(dòng)登錄→爬取頁(yè)面數(shù)據(jù)→異常分析→數(shù)據(jù)保存→告警。其流程圖如圖2所示。

圖2 RPA抓取電網(wǎng)數(shù)據(jù)并進(jìn)行操作
該應(yīng)用主要由自動(dòng)登錄機(jī)器人、網(wǎng)頁(yè)抓取機(jī)器人、Excel機(jī)器人、異常分析機(jī)器人以及E-mail機(jī)器人5個(gè)機(jī)器人。這5個(gè)機(jī)器人相互協(xié)作,共同組成了抓取電網(wǎng)數(shù)據(jù)進(jìn)行分析并告警的自動(dòng)化應(yīng)用。首先自動(dòng)登錄機(jī)器人通過(guò)web自動(dòng)化工具輸入賬號(hào)密碼登錄電網(wǎng)web頁(yè)面。隨后調(diào)動(dòng)網(wǎng)頁(yè)抓取機(jī)器人來(lái)抓取網(wǎng)頁(yè)上指定區(qū)域的信息。隨后調(diào)用異常分析機(jī)器人對(duì)抓取的信息進(jìn)行異常分析,異常的信息將會(huì)被Excel機(jī)器人保存到Excel中。最后調(diào)用E-mail機(jī)器人相關(guān)負(fù)責(zé)人進(jìn)行郵件告警操作,數(shù)據(jù)流圖如圖3所示。具體的關(guān)鍵點(diǎn)表述如表2所示。

圖3 抓取電網(wǎng)數(shù)據(jù)分析并告警的數(shù)據(jù)流圖

表2 抓取電網(wǎng)數(shù)據(jù)分析并告警的自動(dòng)化應(yīng)用關(guān)鍵點(diǎn)描述
對(duì)以上分析的功能機(jī)器人,在UIBot上開發(fā)5個(gè)流程快,分別是:自動(dòng)登錄、數(shù)據(jù)抓取、異常數(shù)據(jù)保存、異常分析、郵件告警。UIBot上實(shí)現(xiàn)的系統(tǒng)主頁(yè)面如圖4所示。

圖4 UIBot上實(shí)現(xiàn)的系統(tǒng)主流程
其中自動(dòng)登錄則是在登錄頁(yè)面直接輸入提前錄入的管理員用戶名和密碼,在目標(biāo)元素文本框中自動(dòng)輸入并且點(diǎn)擊登錄按鈕。相應(yīng)的命令如圖5所示。

圖5 自動(dòng)登錄實(shí)現(xiàn)
數(shù)據(jù)抓取則是在登錄之后跳轉(zhuǎn)到相應(yīng)的頁(yè)面進(jìn)行數(shù)據(jù)的抓取,抓取的數(shù)據(jù)會(huì)放入流程圖變量input中,以便異常分析流程來(lái)調(diào)用。相應(yīng)的命令如圖6所示。

圖6 數(shù)據(jù)抓取命令圖
異常分析則是使用提前建立起的規(guī)則文檔進(jìn)行篩選,并且將有異常的數(shù)據(jù)進(jìn)行保存,放入流程圖變量input中,方便后續(xù)的操作。異常分析命令如圖7所示。

圖7 異常分析命令圖
異常數(shù)據(jù)保存則是將流程圖變量input進(jìn)行Excel的保存,方便后續(xù)對(duì)異常數(shù)據(jù)進(jìn)行追溯等操作。異常數(shù)據(jù)保存命令如圖8所示。

圖8 異常數(shù)據(jù)保存命令
最后將這些異常的數(shù)據(jù)進(jìn)行匯總,發(fā)送到負(fù)責(zé)人的郵箱進(jìn)行郵箱告警。異常告警命令如圖9所示。運(yùn)行結(jié)果如圖10所示。

圖9 異常告警命令

圖10 運(yùn)行結(jié)果
將該應(yīng)用部署到人工數(shù)據(jù)審核員的個(gè)人電腦上,讓其進(jìn)行24 h不間斷地爬取電力系統(tǒng)信息管理平臺(tái)的數(shù)據(jù)并且進(jìn)行分析。對(duì)該應(yīng)用進(jìn)行為期一個(gè)月的測(cè)試總結(jié)。該應(yīng)用共收集16個(gè)頁(yè)面的數(shù)據(jù),分別對(duì)覆冰、電力設(shè)備溫度等共上百億條數(shù)據(jù)進(jìn)行了132次告警,誤檢率低至0%。解決了人工處理出現(xiàn)的誤檢和漏檢,同時(shí)將人工平均12 h的工作時(shí)長(zhǎng)降低到了3 h。
從最后的實(shí)現(xiàn)效果來(lái)看,引入RPA技術(shù)可以高效、不間斷地爬取以及分析異常的數(shù)據(jù),并且對(duì)負(fù)責(zé)人進(jìn)行自動(dòng)化的異常告警。同時(shí)可以解決因人工檢查帶來(lái)的漏檢和誤檢問題。在減少人力物力的同時(shí),可以有效地提升系統(tǒng)的準(zhǔn)確性。
RPA技術(shù)有很廣泛的應(yīng)用空間,對(duì)于電力系統(tǒng)來(lái)說(shuō),在不改變系統(tǒng)原有功能的前提下可以對(duì)數(shù)據(jù)進(jìn)行抓取以及分析,抓取需要的數(shù)據(jù)并且對(duì)異常的數(shù)據(jù)進(jìn)行分析。RPA以其擴(kuò)展性強(qiáng)的優(yōu)勢(shì),可以很容易地?cái)U(kuò)展到電力系統(tǒng)的各個(gè)領(lǐng)域內(nèi)并且輔助工人進(jìn)行一些重復(fù)性的操作。
將RPA技術(shù)與電力系統(tǒng)異常數(shù)據(jù)告警相結(jié)合,實(shí)現(xiàn)一系列自動(dòng)化流程。在減少人力物力的同時(shí),可以有效地提高系統(tǒng)的準(zhǔn)確性。此外RPA技術(shù)不會(huì)因?yàn)閿?shù)據(jù)結(jié)構(gòu)的不同而進(jìn)行二次開發(fā),也有效地減少了開發(fā)人員的投入。