999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽技術和熵權法的缺陷推薦研究①

2018-08-17 12:06:42齊敬先閆訓超
計算機系統應用 2018年8期

齊敬先,劉 翌,蔣 宇,閆訓超,楊 劍

1(南瑞集團(國網電力科學研究院)有限公司,南京 211000)

2(國網江蘇省電力有限公司,南京 211000)

隨著智能電網及能源互聯網的逐步發展,大運行體系與大檢修體系數據共享及業務協同的實用化水平的逐步提高,設備(資產)運維管理系統(PMS2.0)與調度管理系統(OMS2.0)的互聯互通也逐漸得到推動,進一步推進了設備巡視記錄和電網運行數據在OMS和PMS系統之間的互傳,提高數據共享水平.另一方面,大數據技術的深入應用為各行業的快速發展提供了技術保障,如何將其充分應用于電力行業,并提升電力行業數據存儲、處理、分析及展示能力是當前研究的重點.文獻[1]闡述了智能電網應用相關的電力大數據技術,該技術的應用對電力行業的可持續發展和堅強智能電網的建立意義重大.文獻[2]對未來互聯特大電網的運行控制進行了需求分析,提出了“物理分布、邏輯統一”的全網集散式調度與控制技術支持系統架構.文獻[3]描述了大能源與大數據的融合,闡述電力大數據的特征及應用特點.文獻[4]對配電網故障發生情況進行了多源數據分析,從而避免了數據孤島并提升了數據應用的完備性.文獻[5–8]對變壓器運行狀態構建評估模型,梳理評價指標及指標權重.文獻[9,10]對電力系統的脆弱性評估方法進行總結,并提出了一種基于契合度和零注入失敗量的狀態估計可信度評價方法.文獻[11,12]闡述兩種數據匹配及解析方法.文獻[13]描述了數據標簽在各領域的使用情況.

在此背景下,基于OMS與PMS設備缺陷管理流程互聯接口技術規范逐步應用于系統之間設備缺陷數據的交互.文獻[14–19]對電力缺陷進行了闡述,主要從管理角度對缺陷的閉環管理及如何減少缺陷進行規范.由于運檢人員與調控人員關注的電網設備及電網缺陷類別不同,導致在進行流程互聯互通時,需要通過雙方人員主觀判斷及手動選擇其發現的缺陷,然后啟動PMS和OMS系統的集中缺陷管理流程進行數據交互,導致缺陷發起人員需要進行大量的人工篩選工作及與現場人員的溝通工作,同時提升了數據交互的不合理程度和不完備程度.

本文提出了一種基于標簽技術和熵權法的缺陷推薦方法,該方法首先采用基于正向最大匹配算法、編輯距離算法及規則庫的標簽技術對源缺陷數據進行分類處理,然后采用熵權法對缺陷類別標簽進行綜合客觀評估,進而向對端系統(如OMS)進行缺陷推薦,達到智能化篩選并進行智能推薦的目的.

1 缺陷對象描述

設備缺陷是指運行或備用的設備、設施出現影響電網安全運行或設備健康水平的一切異常現象[14–19].設備缺陷管理是保障電網安全運行的重要措施.缺陷根據其嚴重程度分為危急缺陷、嚴重缺陷、一般缺陷.危急缺陷是指設備或設施發生直接威脅安全運行并需立即處理的缺陷,否則,隨時可能造成設備損壞、人身傷亡、大面積停電、火災等事故.嚴重缺陷是指對人身、電網或設備有重要威脅,暫時尚能堅持運行但需盡快處理的缺陷.一般缺陷是指危急、嚴重缺陷以外的缺陷,指性質一般,程度較輕,對安全運行影響不大的缺陷.

設備種類繁多且缺陷類別多樣,導致運檢人員在發現缺陷時,需要手動確認該缺陷是否屬于調控關注的缺陷類別,然后確認是否需要啟動缺陷交互流程;同樣,調控人員也要手動確認運檢人員關注的缺陷,隨后才能進行缺陷交互.本文為了實現缺陷的智能推薦,在進行缺陷流程發起時,對于設備缺陷的描述要詳細、準確,故而對其缺陷定義如下:

(TYPE,START_TIME,END_TIME,ST_NAME,ST_ID,FOUND_CORP,FOUND_PERSON,VOL_LEVEL,DEV_TYPE,DEV_NAME,DEFECT_LEVEL,DEFECT_DESP,PROCESS_LIMITED),分別表示類別、開始時間、結束時間、消缺時間、變電站名稱、變電站ID、發現單位、發現人、電壓等級、設備類型、設備名稱、缺陷等級、缺陷描述、處理時限.

通過對PMS發現缺陷和OMS發現缺陷進行如上對象化描述,不僅能夠對缺陷進行結構化管理,同時便于進行缺陷分析.

2 缺陷對象標簽化

標簽本質上是資源的元數據,是用來描述、解釋、定位信息源,并使其易于獲取、使用、管理的結構化信息[10].通過對數據進行標簽化處理,可以獲取到對數據的多維度精煉化的特征標識,進而便于對數據進行分析.在進行標簽設計時,應適應具體應用功能,選取一個或多個最能表達數據對象特性的關鍵詞組,從而能夠以更簡潔、更精煉的方式表達數據特性,以提高數據應用和挖掘過程中的效率.為了采用標簽技術對缺陷數據進行標識,首先對原始缺陷記錄進行預處理.

2.1 基于正向最大匹配算法的標簽提取

鑒于缺陷描述信息的非結構化特征及缺陷類別的相對穩定性,本文首先采用正向最大匹配分詞算法對缺陷記錄進行標簽化[11].正向最大匹配算法是以詞典為依據,從左向右將待分詞文本中的多個連續字符與詞典匹配,如果匹配上,則切分為一個詞.其算法思路如下:

1)待分割字符串S,即缺陷描述信息,其長度為maxLength,取其首字母;

2)以首字母對缺陷字典庫進行排序,其長度由長到短,選擇的詞表長度不大于maxLength;

3)將選擇的詞表由長到短分別與字符串S分別進行匹配;

4)若出現了與字符串S完全匹配的缺陷詞,則截取這個缺陷詞,進行保存;

5)將字符串S中已經匹配的子串剪去,剩下的字符串繼續返回步驟2);

6)直到字符串S沒有字符可以匹配或者剩下的字符無法從缺陷字典庫中找到對應的缺陷詞,則停止對字符串S的檢索.

通過分詞處理,將缺陷數據以電力設備缺陷字典庫為基礎進行標簽化標識.

2.2 基于相似度計算的標簽匹配

本文以電力缺陷字典庫為基礎,構建缺陷分類標簽;然而,由于缺陷人為編寫的實際情況,導致很多缺陷描述信息不能夠完全匹配缺陷字典庫,故而本文首先采用相似度計算確認未獲得與缺陷字典庫一致的缺陷記錄,判定其相似度是否超過設置的閾值,若超過閾值,則可以將該缺陷記錄進行標簽化;否則,采用規則庫來進行標簽確認.

2.2.1 基于編輯距離的相似度計算

編輯距離定義:設s[1..i],t[1..j]兩個字符串,編輯距離即為把s轉換成t需要的最少刪除、插入和替換的次數.兩個字符串相互轉換需要經過的步驟越多,差異越大.其操作步驟如下:

1)設源字符串s的長度為n,目標字符串t的長度為m;如果n=0,則返回m;如果m=0,則返回n;

2)構造一個矩陣d[m+1,n+1],初始化矩陣的第一行值為0..n;初始化矩陣的第一列值為0..m;

3)檢查s和t中的每個字符;

4)如果s[i]=t[j],則編輯代價cost為0;如果s[i]!=t[j],則編輯代價cost為1;

5)設置矩陣單元格d[i,j]的值為下面的最小值:

① 正上方單元格的值加1:d[i–1,j]+1;

② 左邊單元格的值加1:d[i,j–1]+1;

③ 對角線單元格的值加上編輯代價cost的值:d[i–1,j–1]+cost;

6)在完成迭代步驟4)至步驟6)之后,d[m,n]即是編輯距離的值.

2.2.2 編輯距離算法優化

傳統的編輯距離算法在進行字符串匹配時,未考慮字符串長度對相似度計算結果的影響,同時,以單個字符進行的匹配導致算法準確率和效率較低,故而對該算法進行優化:

(1)首先以電力詞庫為基礎,采用正向最大匹配分詞算法對缺陷描述信息進行分詞處理;

(2)對步驟3)的字符串s和字符串t檢查其每個分詞;

(3)對步驟4),編輯代價cost以字符串s和字符串t的分詞語義分析結果為依據,若s[i]同義于t[j],則cost=1;否則,cost=0.

假設源字符串s與目標字符串t長度的最大值為Lmax,編輯距離為LD,則相似度S其計算公式如下:

本文采用優化后的編輯距離算法進行缺陷標簽化操作.

2.3 基于規則庫的標簽確認

為了彌補缺陷提取方式及缺陷匹配方式的不足,本文構建了用于標簽化的規則庫,該庫基于專業運行人員和管理人員的理論基礎及直接和間接的經驗積累,基于語義分析進而確認缺陷信息與缺陷字典庫的映射關系,提高缺陷描述信息標簽化的可靠性和準確度.

隨著標簽提取和標簽匹配過程的逐步深入,以及規則庫的逐步完善,將達到智能化標簽生成的目的.

3 熵權法

信息論是一門將信息作為研究對象,以揭示信息的本質特性及規律為基礎,應用數學方法來研究信息存儲、傳輸、處理、控制和利用等一般規律的科學[5].信息熵可以用來度量一個系統的無序和雜亂程度.熵值越大,系統中的數據越無序.熵權法是一種客觀賦權法,其根據各指標的變異程度,利用信息熵進行指標熵權的計算,進而賦予各指標較為客觀的權重.該算法的流程如下:

第一步,構建初始化分析矩陣R=(rij)m×n:

其中,m表示待引入的調控員數量;n為調控員關注的標簽種類;rij表示第j個標簽類別下第i個調控員的關注量.

第二步,對初始化矩陣進行無量綱化處理:

若j為正指標,

若j為逆指標,

其中,Min(rij)表示第j列數值的最小值;Max(rij)表示第j列數值的最大值.本文采用正指標方式進行處理,形成新的矩陣,

第三步,計算第j個標簽類別下第i個調控員關注度的概率pij:

即第j類標簽在第i個調控員關注缺陷數量的占比;

第四步,計算第j個標簽類的信息熵ej:

第五步,計算第j個標簽類的熵權wj:

為了進一步驗證實驗結果的正確性,確認其覆蓋率評價指標如下:

其中,wi為標簽i的熵權計算結果,ci為標簽i的出現頻次,N為標簽類別個數,L為缺陷總數,該指標越大則說明算法準確率越高.

4 缺陷推薦流程

基于以上步驟,對缺陷信息進行對象化描述,通過標簽定義分別對運檢人員及調控員關注的缺陷信息進行標簽化標識.然后,基于熵權法對各標簽的熵權進行計算,對熵權大于所設定閾值的標簽進行標簽推薦,實現智能化的篩選運檢人員及調控員強關注的標簽.其整體流程如圖1.

圖1 缺陷推薦流程圖

5 算例分析

以某地區調控員記錄的缺陷為例,該地區總共有監控人員15人,以該地區2015年記錄的缺陷為例,缺陷記錄共452條,通過標簽技術及熵權法來對該地區監控人員強關注的缺陷信息進行確認,進而實現以該缺陷集合為依據進行缺陷推薦.

(1)對缺陷信息基于正向最大匹配算法、編輯距離算法和規則庫進行標簽化處理.

如“**線**開關SF6氣壓低閉鎖”通過正向匹配可直接與缺陷字典庫“SF6氣壓低閉鎖”匹配,進而被標識為“SF6氣壓低閉鎖”缺陷;“2號主變第一套保護裝置通訊中斷動作”通過編輯距離算法被標識為“保護裝置通信中斷”等.基于原編輯距離算法與改進的編輯距離算法其對比結果如圖2.

圖2 編輯距離算法及優化對比結果

由圖2可得,采用改進的編輯距離算法對缺陷信息進行標簽化,其覆蓋率由28.6%提升到68.4%,進而采用規則庫對缺陷數據進行標簽化完善.

其中,m表示調控員個數,此處為15;n為標簽種類,通過對缺陷歷史數據的分析得出該地區監控人員關注的缺陷總計26類;rij表示某調控員記錄的缺陷中某類標簽的個數,數量越多,則說明關注度越高;該矩陣即為對調控員關注缺陷的數據標簽矩陣.

(3)本文采用正指標方式對初始化矩陣進行無量綱化處理形成新的矩陣.

(4)計算標簽出現的概率pij.

即第j個標簽在第i個調控員關注信息中的占比;

(5)計算標簽的信息熵ej.

(6)計算標簽的熵權wj.

(7)基于各標簽熵權計算結果及覆蓋率閾值,進行強關注標簽篩選及推薦.

由以上結果可知,根據覆蓋率90%的閾值設置及熵權倒序排列,PMS系統可向OMS系統推薦控制回路斷線、主變油位異常、保護裝置故障、火災報警、氣室SF6氣壓低告警、事故總告警、直流系統故障、線路無壓等缺陷.

對于權重閾值設置主要以缺陷類別覆蓋率為基準.若閾值設置過低,則推薦的缺陷類別偏多;若閾值設置過高,則推薦的缺陷類別偏多,僅能對個別缺陷實現推薦,均不能實現推薦信息的合理化.

為了進一步驗證該算法的可行性,搜集另外5個地區的缺陷記錄進行算法驗證,其規模描述如下:

表1 各地區基礎信息

表2 各地區計算結果

實驗結果表明,該算法對于實現系統之間的缺陷推薦效果較好,同時,通過對覆蓋率的分析可發現B地區發生某類缺陷較多,可進行重點監視及家族性缺陷分析.

6 結束語

本文提出了一種基于標簽技術和熵權法的缺陷推薦方法,用于OMS和PMS缺陷互聯互通時的智能化推薦.標簽技術是大數據時代的產物,便于對被分析對象進行多維度精煉化的描述,本文通過正向最大匹配算法、編輯距離算法和規則庫技術的應用來輔助實現缺陷記錄的標簽化標識;熵權法利用其客觀性,即從數據源自身來確認缺陷類別的被關注程度.標簽技術與熵權法的結合將用戶的主觀選擇與客觀評價結合,并通過對編輯距離算法的優化提升標簽標識的準確度,實驗結果表明,該方法的應用可為相關人員提供可靠的理論參考依據,減少了調控人員及運檢人員的工作量,進而提升數據交互的智能化水平.

主站蜘蛛池模板: 亚洲欧州色色免费AV| 国产成人麻豆精品| 伊人激情综合网| 国产精品成人观看视频国产| 丝袜无码一区二区三区| 日韩精品一区二区深田咏美| 久久精品视频亚洲| 免费看av在线网站网址| 91九色国产在线| 老司机久久99久久精品播放| 毛片视频网址| 国产成人一区免费观看| YW尤物AV无码国产在线观看| 国产又色又爽又黄| 国产成人h在线观看网站站| 国产欧美中文字幕| 91www在线观看| 久久国产乱子伦视频无卡顿| 青青青视频免费一区二区| 成年人午夜免费视频| 国产在线麻豆波多野结衣| 国产欧美日韩专区发布| 久久成人国产精品免费软件| 全部免费毛片免费播放| 国产噜噜噜| 国产成人AV综合久久| 久久a毛片| 亚洲六月丁香六月婷婷蜜芽| 亚洲综合片| 久久综合亚洲鲁鲁九月天| 久久精品国产在热久久2019| 亚洲 欧美 偷自乱 图片| 伊人福利视频| 五月激情综合网| 久草视频一区| 波多野结衣中文字幕一区二区| 欧美成人综合视频| 欧类av怡春院| 欧美在线一二区| 国产成人福利在线视老湿机| 大陆国产精品视频| 97se亚洲| 亚洲第一页在线观看| 日本人妻丰满熟妇区| 综合色亚洲| 亚洲天堂网在线播放| 国产97公开成人免费视频| 欧美激情伊人| 久久黄色一级视频| 91福利在线观看视频| 国产福利在线免费观看| 亚洲国产av无码综合原创国产| 日韩乱码免费一区二区三区| 国产成人精品2021欧美日韩| 国产欧美日韩18| 欧美a级完整在线观看| 国内精品自在自线视频香蕉| 亚洲国产精品人久久电影| 亚洲欧美在线综合图区| 色婷婷久久| 九九九精品视频| 伊伊人成亚洲综合人网7777| 人妻21p大胆| 五月天丁香婷婷综合久久| 国产成人精品亚洲77美色| 久久精品电影| 任我操在线视频| 日韩成人在线视频| 成人免费网站久久久| 亚洲欧美成人在线视频| 99r在线精品视频在线播放| 国产亚洲视频免费播放| 日本高清免费一本在线观看| 香蕉视频在线精品| 亚洲色中色| 凹凸国产分类在线观看| 国产成人免费观看在线视频| 麻豆国产在线观看一区二区| 国产拍在线| 亚洲免费黄色网| 成人精品视频一区二区在线 | 人妻少妇乱子伦精品无码专区毛片|