王新剛,祝恩國,朱彬若,曹祎
(1. 國網上海市電力公司電力科學研究院,上海 200437; 2.中國電力科學研究院,北京 100092)
多表合一”系統是以“助力智慧城市建設”為出發點,基于遠程信息采集構建的城市智能計量系統,為電、水、氣、熱行業實現能源計量數據遠程采集、實時監測、綜合應用等提供智能化手段,降低損耗和運營成本,服務國家能源階梯價格及節能減排政策執行。智能表作為該系統中與用戶聯系最緊密的組成單元[1],是供能企業和用戶進行貿易結算的計量器具,其運行可靠性對雙方都存在重要意義。運行統計情況表明,智能表在現場可靠運行的風險主要來源于自身元器件失效導致的智能表故障和運行環境異常導致的異常運行狀態[2]。傳統的質量管控只能通過智能表安裝前的試驗和安裝后的運行抽檢、周期檢驗、到期輪換來保證智能表的可靠運行,其缺點是對運行智能表質量管控實時性差,且用于管控分析的數據維度較少,難以及時、全面的掌握智能表運行狀態。
近年來,高級量測體系(Advanced Metering Infrastructure, AMI)一直被用于提升電力企業的運營管理水平[3-6]。美、法、日等國通過AMI實現電能表遠程抄表、實時監控和故障診斷等功能,用于提升計量管理和故障消缺水平。我國在電能計量領域也開展了計量裝置在線監測[7-8]的研究,但較多的是針對高壓大用戶智能表誤差的監測和營銷大數據分析。一方面,電、水、氣、熱智能表在用戶側具有顯著的關聯關系,而現有的系統沒有把此類智能表計納入分析范圍;另一方面,采集系統在長期的運行過程中積累了海量的歷史數據和監測數據,但由于缺乏信息的綜合分析和關聯關系而很難滿足高層次分析決策的要求,無法從時間和空間意義上深層次理解并有效利用這些數據。
為提升“多表合一”的運行穩定性,充分發揮成熟系統的優勢,帶動電、水、氣、熱行業協同發展,不僅需要構建一個適用于多種計量表計數據采集的系統,還要具備異常監測、故障診斷、消缺管理等應用功能。本文結合智能表已有的運行數據監測條件和消缺工作流程,提出了一種基于關聯挖掘的智能表異常診斷和處理方法,通過對智能表數據的采集與處理,利用數據比對、統計分析和數據挖掘[9-12]等技術手段診斷智能表異常工況,從關聯規則提取、監測結果匹配、現場分析及反饋、數據庫更新等方面闡述了該技術是合理、有效的。
“多表合一”系統是在用電信息采集系統的基礎上升級改造而成,其系統結構主要分為主站層、采集傳輸層和數據測量層,如圖1所示。
主站層是系統的運行管理中心,負責整個系統的數據采集、數據存儲、分析應用和系統接口等,是實現智能表異常診斷的關鍵邏輯層,通過系統接口將診斷結果傳輸至閉環消缺系統,以實現故障的智能診斷和閉環處理。
采集傳輸層負責智能表數據的采集和傳輸,由采集設備和上下行通信信道組成。電表的數據采集采用已有的設備和信道,水、氣、熱表數據的采集通過轉換器進行信道和協議的轉換后在傳輸至集中器。
數據測量層是實現智能診斷的基礎數據層,由智能電、水、氣、熱表計組成,負責產生運行和診斷所需的各類數據。
圖1 系統結構框圖
關聯規則反映了大量數據中項目集之間的相關聯系,可定義如下。設I={I1,I2,…,Im}是項的集合,其中:元素稱為項,項的集合稱為項集。事務數據庫D={T1,T2,…,Tn}是數據庫事務T的集合,每個事務T是一個非空項集,且T?I。設X、Y都是T中的項或項集,關聯規則是形如X?Y的蘊涵式,其中:X?I、Y?I,且X∩Y=φ,規則X?Y在事務集D中成立,具有支持度S和置信度C,可表示為:
X?Y(S%,C%)
(1)
式中S%為包含X∪Y的事務T在事務集D中所占的比例,C%為事務集D中包含X的事務中又包含Y的比例,即:
S%=S(X?Y)=P(X∪Y)
(2)
C%=C(X?Y)=P(Y|X)
(3)
同時滿足最小支持度(minimum support)和最小置信度(minimum confidence)的規則稱為強規則,最小支持度和置信度的閾值由運行經驗給出,并可在后續進行調整。關聯規則挖掘方法中最有影響的算法是Apriori算法,由Agrawal和R.Srikant于1994年提出,是一種基于布爾關聯規則挖掘頻繁項集的算法,后續很多關聯規則算法都是在此基礎上的改進和優化。Apriori算法將關聯規則的發現分為兩步:第1步是識別所有的頻繁項集(frequent itemset),即其支持不低于用戶最小支持度的項目集,第2步是從頻繁集中構造其信任不低于用戶最小置信度的規則。
通過對智能表的事件元信息進行統計后發現,診斷結果與事件元信息之間存在一定的導向關系,即某個診斷結果僅與若干個事件元信息存在關聯關系,而與其他事件元信息之間不存在關聯關系。因此,可以通過制定元規則對挖掘過程進行約束,提高挖掘性能,本文對元規則定義如下:
設集合P={P1,P2,…,Pm},Q={Q1,Q2,…,Qn}分別表示事件元和診斷結果的集合,?Qi∈Q,(i=1,2,…,n),?Pj,Pk,…,Pl∈P,(j,k,l∈[1,m]),滿足PjΛPkΛ…ΛPl?Qi,則稱PjΛPkΛ…ΛPl?Qi為智能診斷的一個元規則。
元規則可以根據分析者的經驗、期望或對數據的直覺、根據數據庫模式自動產生,挖掘系統可以尋找與規定元規則相匹配的規則。文章通過對歷史數據的總結和分析,將事件元和診斷結果進行關聯配對,對每個診斷結果挖掘的事件元進行約束,只取具有關聯關系的事件元進行挖掘。
異常診斷流程可分為關聯規則提取、事件元生成和結果診斷三個部分組成,如圖2所示。
圖2 智能表異常診斷流程
關聯規則提取采用離線方式,即異常診斷系統按設定的時間間隔(默認為1日)從知識數據庫中提取滿足要求的關聯規則,作為下一時間段智能診斷的診斷規則。初始的規則由歷史數據、專家經驗等信息挖掘生成,隨著系統運行的逐步完善,異常診斷系統積累的診斷知識越來越多,通過知識數據庫挖掘的規則準確性越來越高。
異常診斷的主流程從事件元生成開始,采集系統對采集的數據和事件進行分析處理,經過相應的數據清洗后形成事件元,并通過關聯信息實現事件元和設備信息及計量點信息的關聯,為結果診斷提供診斷信息。
結果診斷將一定時間窗口內的事件元與關聯規則進行匹配,并提供每個診斷結果的支持度和置信度。
診斷結果處理作為異常診斷的閉環處理環節,其目的主要有兩個:一是確認診斷結果;二是完成故障消缺。在實際運行過程中,由于受到采集數據不完整或異常、知識數據庫不完善、突發異常等因素影響,異常診斷系統不能保證診斷結果完全正確。因此,對于系統的診斷信息,需要人工進行排查和確認。雖然智能診斷結果的有效性仍待確認,但其為運維人員提供了一個排查的方向,縮小了排查的范圍,有利于指導確認工作的開展。
診斷結果處理流程主要分為三大部分:診斷信息收發管理、異常排查管理和消缺管理,具體流程如圖3所示。
圖3 異常診斷閉環管理流程圖
(1)系統從中間庫接收診斷信息,包括診斷結果、支持度和置信度指標、事件元信息等,并將獲取的信息按要求進行排序和展示;
(2)派工人員根據管理要求對診斷信息發起排查流程,安排消缺人員進行排查,消缺人員參考分析指南進行故障排查。排查分為遠程和現場兩種方式,可并行開展,遠程排查可快速獲取計量裝置故障的更多信息,現場排查可獲取采集系統無法獲取的信息。如果通過多次排查仍無法確認故障結果時,可發起協作排查的申請,邀請相關領域的專家共同分析處理。當排查結果確認后,系統需錄入排查結果,并將結果通過中間庫方式反饋故障診斷系統,同時檢查排查工作是否超出分析指南的范圍,如果涉及分析指南中為明確的方法和要求,則更新分析指南;
(3)根據排查結果判斷計量裝置是否需要消缺而選擇發起相應的消缺流程,并對整個消缺流程進行管控,直至完成全部的消缺工作和信息歸檔。
從系統流程中可以看出,閉環消缺管理包括信息流和工作流兩個方面:信息流管理是指對診斷信息的閉環管理,包括信息的獲取、驗證和反饋,分析指南更新,信息的準確性等;工作流管理是指對排查工作和消缺工作的閉環管理,包括工單管理、工作進度和完成質量等。通過信息流和工作流的閉環管理,既保證了診斷結果的準確性和可靠性,也保證了工作的質量,使智能表異常能夠及時準確的得以處理。
3.2.1 診斷信息收發管理
診斷信息收發管理主要負責智能表異常診斷結果的接收、展示,以及將確認的診斷結果發送回去,通過中間庫的形式進行數據交互。系統定時從中間庫獲取診斷信息,并根據操作人員制定的規則進行結果展示,當診斷結果經排查確認后,系統再將結果返回中間庫。
系統按照預先定義的庫、表結構定義和權限配置,實現各種數據的雙向交換,交互的數據格式如表1所示。
表1 系統數據交互列表
唯一性標識用作診斷信息的身份標識,保證數據交互對象的一致性,當系統返回數據時,需連同唯一性標識一起返回。
計量點編號是計量點的唯一性編號,通過該編號消缺管理系統可以從營銷系統獲取相應的計量點基本信息和設備基本信息,便于消缺工作的開展。
監測信息為得出該計量點診斷結果的全部信息,包括診斷結果對應的事件元和故障生成日期,但考慮到可以通過采集系統獲取事件元的詳細信息,為提高接口效率,監測信息不包含事件元的詳細信息。
診斷結果根據信息來源不同分為兩個方面:一個是智能診斷系統分析得出的診斷結果,另一個是人工排查后得出的確認結果。智能診斷系統將其診斷結果和對應的支持度、置信度指標傳給消缺管理系統,消缺管理系統經排查確認后將最終結果返回智能診斷系統,返回最終結果時不含支持度和置信度指標。返回的結果由智能診斷系統判斷原診斷結果是否正確,并根據不同的情況更新知識數據庫。
3.2.2 異常排查管理
異常排查管理主要負責管理智能表異常診斷結果的人工排查過程,包括排查的流程、數據和結果的處理、工作質量的管理等,同時還能以固定的流程指導排查工作的開展。當消缺管理系統獲取診斷信息并生成排查工單后,運維人員根據已有的信息并參照分析指南,開展遠程抄表分析和現場人工排查,通過綜合分析形成最終的排查結果。
由于診斷結果最終由排查分析后得出,排查結果的準確性關系到后續診斷結果的準確性,因此,排查的質量管控尤為重要,本文提出以下三個管控指標:
(1)排查結果支撐數據的有效性。排查時會產生大量的過程數據,如果這些數據能夠有效支撐排查結果,則認為這些數據有效。在進行排查時,首先應確認智能診斷系統提供的信息;其次,通過遠程的方式采集故障點其他支撐數據;如果仍不足以判斷結果,則再經人工現場排查,收集遠程無法采集的數據進行綜合分析;
(2)排查工作的時效性。為保證智能診斷系統高效運行,進行排查工單派發時,會對每個排查任務制定工作時效,通過對時間節點的考核和管控確保運維人員按時完成排查任務;
(3)排查結果的驗證。通過消缺工作的開展和系統對同一計量點相同故障的重復診斷來驗證和考核排查結果的準確性。
3.2.3 異常消缺管理
系統根據排查結果判斷是否啟動消缺流程,對于由電網異常、現場維護導致的異常診斷,經排查階段確認后可直接結束流程,無需進行消缺;而對于設備故障、疑似竊電、回路異常、錯接線、違約用電這類診斷結果,需開展消缺工作并對應發起換表、故障消缺等流程,涉及電量退補、反竊電等情況時還應發起電量退補和反竊電流程。按照閉環管理流程,故障消缺系統的主要功能可分為消缺管理、消缺派工、現場消缺和消缺歸檔。
異常診斷系統將歷史故障或異常信息和對應的消缺結果以統一的數據結構保存下來,形成診斷知識庫,作為后續異常診斷的挖掘知識,診斷知識庫是關聯挖掘的基礎,通過反饋的排查結果形成新的知識,并用于下一次挖掘。在關聯規則的挖掘中,診斷知識庫也叫事務數據庫,是挖掘頻繁項集的基礎,隨著現場異常、故障的不斷確認和處理,診斷知識庫也不斷的擴大,種類也不斷豐富,一些知識如經常發生的異常及對應的診斷結果得到不斷強化,使得其在挖掘過程中的支持度和置信度不斷提高,成為更容易被挖掘到的規則。
故障特征可以通過挖掘故障樣本獲得,也可以根據已有的運行經驗生成。在挖掘系統的運行初期,可以歸納一些故障特征,并在運行過程中不斷檢驗和調整,以適應計量在線監測的實際。本文依據對歷年智能表故障分類及特征的統計分析,結合智能表運維消缺的經驗,生成初始的診斷知識庫。
在系統運行初期,診斷知識庫中的知識基本靠手動方式進行維護,根據特征數據的統計情況、現場運行工況及專家經驗等數據,建立一個初始的知識數據庫。隨著系統的不斷運行,知識數據庫通過學習機制不斷進化、完善,總體而言,診斷知識庫的維護可分為知識積累、學習限制及知識淘汰三個步驟。
4.3.1 知識積累
診斷知識庫的知識積累實際上是一個學習的過程,將智能表運行過程中普遍發生、重復出現的問題記錄下來作為后續診斷的依據。除了初始的知識外,異常診斷系統接收經現場確認的結果,與診斷信息一起以統一的形式存儲在知識數據庫中,形成診斷知識,共同參與下一次關聯規則的挖掘。
4.3.2 學習限制
當具有相近診斷信息的同一類型故障在一段時間內大量發生,則很有可能是一種批量性問題的集中爆發,將極大提高此類故障診斷的支持度和置信度,同時其他診斷結果的支持度和置信度下降。這種情況下,一方面應正確引導診斷系統的結果導向,精確定位診斷結果;另一方面又不能明顯犧牲關聯規則的多樣性,影響其他故障的診斷。因此,必須對此類學習過程進行限制。如果發現一段時間內積累了大量相似的診斷信息,則只記錄N條(N默認取10)診斷信息支持度最高的診斷知識,同時對后續挖掘到的相應關聯規則進行支持度和置信度增強,即挖掘完成后,增強支持度S′%=k·S%,增強置信度C′%=k·C%,k≥1。
(1)相近診斷信息是指具有相同智能表屬性的事件元信息,涉及判斷的智能表屬性主要有制造單位和批次號,且制造單位包含批次號,則相近診斷信息可以理解為具有相同制造單位或批次號存在一個或多個重疊事件元的多條診斷信息。
(2)一段時間是指統計相似診斷信息的時間區間,考慮到故障確認及消缺周期,文中以D天(D默認取30)為窗口長度進行滾動統計,如果在這段時間內相近診斷知識超過M條(M默認取10),則定義為大量。
4.3.3 知識淘汰
隨著診斷知識庫的不斷擴大,一些歷史上特定的、不常發生或不具備普遍適用性的知識應逐步被淘汰,使診斷結果更加能反映當前的運行情況,這個過程稱為知識淘汰。知識淘汰主要有自動和手動兩種方式,自動淘汰由診斷系統自動完成,通過對診斷結果設置診斷知識的生存周期,根據診斷知識的時標屬性進行判斷,如果生存周期內知識庫未獲取相同的診斷知識,則淘汰該知識,否則重置該知識的生存周期;手動淘汰由診斷系統運維人員根據實際需求進行知識的手動刪除。
文中提出的基于關聯挖掘的智能表異常診斷及處理方法遵循實際的故障分析和處理流程,適應智能表異常診斷和消缺工作的開展,是一種提高智能表質量管理水平和消缺效率的有效手段,具有以下特點:
(1)有利于及時、全面的掌握智能表的運行狀態,結合海量數據分析異常運行智能表的故障原因;
(2)有利于指導消缺工作的開展,為現場消缺提供技術支撐;
(3)隨著異常處理的開展,診斷知識庫越來越完善,能夠進一步提高異常診斷的準確率。