國網(wǎng)江蘇省電力有限公司南通供電分公司 仲 偉 邵建新
隨著自動化技術(shù)和智能化技術(shù)的快速發(fā)展和廣泛應用,變電站的數(shù)量以及規(guī)模日益增多,同時變電站機器人巡檢的任務測點量更是數(shù)以萬計。傳統(tǒng)的變電站在導入機器人操作票任務時,需工作人員在上千個測點任務中逐個選擇,這樣不僅要求工作人員擁有很高的操作熟練度且耗時嚴重,很易出現(xiàn)錯導入和誤導入情況,因此研究操作票復核系統(tǒng)很有必要。
在電網(wǎng)系統(tǒng)操作票自動生成方面,大多研究集中在利用電網(wǎng)調(diào)控中心提供的電網(wǎng)公共信息模型(CIM),分析CIM 中的設(shè)備模型和拓撲連接關(guān)系,按照一定的布局、布線算法自動生成一次設(shè)備接線圖。文獻[1]研究了基于CIM 數(shù)據(jù)和可伸縮矢量圖形格式的配電單線圖自動構(gòu)圖;文獻[2]介紹了節(jié)點布局問題的數(shù)學模型并應用罰函數(shù)法進行求解;文獻[3]采用蟻群算法,實現(xiàn)了電網(wǎng)自動布局。目前大多數(shù)研究的重點偏向于電網(wǎng)操作票的自動生成,此類研究的前提是調(diào)控中心提供的CIM 包含了應用所需的元件模型和連接關(guān)系,針對操作票的多樣性和易變性略顯不足。
目前在變電站操作票識別和任務導入領(lǐng)域的研究少之又少,另外變電站機器人巡檢對操作票的正確性要求尤為嚴格,本文設(shè)計了一種新型的變電站操作票復核系統(tǒng),服務器平臺采用圖像識別技術(shù)對高拍儀采集的操作票實時視頻進行文字識別、內(nèi)容分析和關(guān)鍵字提取,并將提取后的文字進行生成巡檢任務列表,并導入機器人巡檢任務中。整個過程工作人員只需將操作票放置高拍儀下,在服務器平臺側(cè)點擊圖像識別、生成列表、任務執(zhí)行即可,避免了操作票誤導入和錯導入的情況,為變電站機器人測點巡檢節(jié)約了大量時間。
近年來人工智能識別技術(shù)已取得較大進展,尤其是在圖像識別和分析技術(shù)上更是明顯。巡檢變電站操作票復核系統(tǒng)由應用層、服務器、物理層組成,其中所有算法流程都是在服務器平臺操作。物理層采集模塊由高拍儀和網(wǎng)線組成,負責實時拍攝操作票視頻,并通過網(wǎng)線將實時視頻上傳到服務器。服務器模塊包括圖像識別與分析、關(guān)鍵字提取、生成任務列表、執(zhí)行任務,主要負責對上傳視頻進行分析和處理,處理后的數(shù)據(jù)會導入到機器人巡檢任務中,工作人員只需在服務器平臺側(cè)點擊執(zhí)行任務即可控制機器人進行巡檢任務。物理層主要是采集模塊。

圖1 巡檢變電站操作票復核系統(tǒng)框圖
圖像特征包括顏色特征、紋理特征、形狀特征以及局部特征點等。圖像特征提取是圖像分析與圖像識別的前提,是將高維的圖像數(shù)據(jù)進行簡化表達最有效的方式。2004年Lowe 提出高效的尺度不變特征變換算法(SIFT),利用原始圖像與高斯核的卷積來建立尺度空間,并在高斯差分空間金字塔上提取出尺度不變性的特征點[4]。該算法具有一定的仿射不變性、視角不變性、旋轉(zhuǎn)不變性和光照不變性,所以在圖像特征提高方面得到了最廣泛的應用。服務器可根據(jù)SIFT 和操作票顏色特征,將操作票實時視頻中的文字全部提取出來,并生成操作票文本。
圖像識別與分析算法為關(guān)鍵字提取提供操作票文本,其步驟依次為:初始化網(wǎng)絡(luò),為網(wǎng)線傳輸操作票實時視頻提供可用接口;打開實時視頻錄像;判斷視頻縮放尺寸是否等于原始操作票縮放尺寸,若相等則輸出操作票固有特征尺寸;判斷操作票字體顏色特征是否為黑色,若為黑色則輸出操作票模板;操作票模板識別并輸出操作票上的文字;生成操作票文本;判斷文本的字體并更新文本。
無論是對于長文本還是短文本,往往可通過幾個關(guān)鍵詞窺探整個文本的主題思想。關(guān)鍵詞提取的準確程度直接關(guān)系到推薦系統(tǒng)或者搜索系統(tǒng)的最終效果。基于統(tǒng)計特征的關(guān)鍵詞抽取算法[5]的思想是利用文檔中詞語的統(tǒng)計信息抽取文檔的關(guān)鍵詞。通常將文本經(jīng)過預處理得到候選詞語的集合,然后采用特征值量化算法的方式從候選集合中得到關(guān)鍵詞。詞權(quán)重的特征量化主要包括詞性、詞頻、逆向文檔頻率、相對詞頻、詞長等。關(guān)鍵字提取流程為:操作票文本(預處理)-候選詞(算法)-候選詞權(quán)重計算(抽?。?關(guān)鍵字。
特征值量化算法為生成列表提供關(guān)鍵字,其提取關(guān)鍵字的具體實現(xiàn)為:識別文本;根據(jù)詞性、位置、頻率、詞長對文本預處理,并生成候選詞;根據(jù)詞權(quán)重的特征量化的特點從候選詞集合抽取所需關(guān)鍵字;生成關(guān)鍵字列表。
LDA 主題模型采用了詞袋模型的方法簡化了問題的復雜性。在LDA 主題模型中,每一篇文檔是一些主題的構(gòu)成的概率分布,而每一個主題又是很多單詞構(gòu)成的一個概率分布。同時,無論是主題構(gòu)成的概率分布還是單詞構(gòu)成的概率分布也不是一定的,這些分布也服從狄利克雷先驗分布(Dirichlet)。操作票復核系統(tǒng)的關(guān)鍵在于巡檢任務列表的生成,任務列表中的關(guān)鍵字也服從狄利克雷先驗分布。巡檢任務列表為機器人執(zhí)行任務提供指令依據(jù),其生成的具體實現(xiàn)為:初始化任務列表;設(shè)定狄利克雷分布規(guī)則,對關(guān)鍵字進行分類和排序等操作;生成新的巡檢任務列表;導入列表指令到機器人巡檢任務中。
根據(jù)上述算法生成的巡檢任務指令會導入到機器人巡檢任務中,工作人員只需將要操作票放置于高拍儀下,在服務器平臺側(cè)點擊圖像識別與分析、提取關(guān)鍵字、生成列表和執(zhí)行任務即可,巡檢機器人便會按照任務列表上的內(nèi)容進行巡檢作業(yè)。
基于尺度不變特征變換算法、統(tǒng)計特征的關(guān)鍵詞抽取算法和LDA 主題模型思想,采用Eclipse、Oracle9i 和Python 數(shù)據(jù)開發(fā)和處理實現(xiàn)了變電站操作票復核系統(tǒng)。下面通過實驗來驗證此系統(tǒng)。
為評估操作票復核系統(tǒng)的性能,采用8臺服務器,安裝QUnit 軟件模擬真實運行環(huán)境,同時使用了均方根誤差(RMSE)作為評估指標,其定義如下:

其中fi為算法實際運行次數(shù),為實際成功次數(shù),根據(jù)公式可知,計算的RMSE 值越小性能越優(yōu)。1~8服務器性能評估測試的實測次數(shù)、成功次數(shù)、均方根誤差為:1000/996/0.065%、2000/1996/0.063%、3000/2994/0.061%、5000/4992/0.059%、8000/7988/0.057%、10000/9988/0.053%、15000/14956/0.052%、20000/19920/0.051%。隨著實測次數(shù)的遞增成功次數(shù)遞增,同時成功次數(shù)所占比也遞增,其均方根誤差也趨向于穩(wěn)定,性能越優(yōu)。
一個大型的變電站具有上千個任務測點,在人工導入操作票時經(jīng)常會遇到難以尋找對應測點、錯導入和誤導入的問題,而操作票復核系統(tǒng)可通過服務器的多種算法對應巡檢測點,在時間和準確性上具有明顯優(yōu)勢。該系統(tǒng)在某變電站實際運用中的操作票任務數(shù)量(個)、人工耗時(秒)、系統(tǒng)耗時(秒)分別為:5/100/32、10/300/36、15/600/39、20/900/41、25/1100/42、30/1500/42、35/1900/45、40/2400/45。隨著操作票任務數(shù)量的增加,人工耗時的明顯增加,系統(tǒng)耗時較為穩(wěn)定。人工耗時與系統(tǒng)耗時的差距更是明顯。
綜上,隨著人工智能與現(xiàn)代生活的關(guān)聯(lián)愈加密切,人工智能在生活中的應用將會愈加廣泛。導入操作票損耗的時間對變電站來說十分寶貴,損耗的時間越多,變電站巡檢的時間便越少,許多電廠出現(xiàn)意外都是缺乏足夠的巡檢時間而導致的,本文提出了一種變電站操作票復核系統(tǒng),服務器平臺采用圖像識別技術(shù)對高拍儀采集的操作票實時視頻進行文字識別、內(nèi)容分析和關(guān)鍵字提取,服務器將提取后的文字進行生成巡檢任務列表,并導入機器人巡檢任務中。整個過程工作人員只需將操作票放置于高拍儀下,在服務器平臺側(cè)點擊圖像識別與任務執(zhí)行即可,為變電站巡檢機器人測點任務導入節(jié)約了大量時間。