陳 廣,宋志偉,陳少兵,賀紹鵬,毛燁華,李澤坤
(1.國家電網(wǎng)有限公司物資部,北京 100032;2.國網(wǎng)物資有限公司,北京 100120;3.華北電力大學電氣與電子工程學院,北京 102206)
隨著現(xiàn)代信息技術的快速發(fā)展和應用,電力物資供應鏈與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)深度融合已成趨勢,數(shù)字化、智慧化成為現(xiàn)代供應鏈的顯著特征[1]。現(xiàn)階段,通過智能采購、數(shù)字物流、全景質(zhì)控三大業(yè)務鏈,現(xiàn)代供應鏈逐漸部署數(shù)字化轉(zhuǎn)型的新型實踐,但數(shù)字化轉(zhuǎn)型過程中的弊端也逐漸暴露,如供應鏈數(shù)據(jù)欠完整、欠規(guī)范、非結(jié)構化等。為了實現(xiàn)數(shù)據(jù)的統(tǒng)一管理和價值挖掘,國家電網(wǎng)有限公司(以下簡稱“國網(wǎng)公司”)投入了大量人力物力聚焦于數(shù)據(jù)治理、分析、應用等各環(huán)節(jié)的工作。然而,數(shù)字化引起的數(shù)據(jù)量激增將造成更多的人力資源投入,在此背景下如何實現(xiàn)供應鏈數(shù)據(jù)運營管理的自動化、智慧化是迫切問題。
數(shù)據(jù)感知以數(shù)據(jù)自動清洗、數(shù)據(jù)質(zhì)量治理和數(shù)據(jù)價值挖掘為技術手段。Hu 等[2]和Korzun 等[3]分別研究了數(shù)據(jù)感知技術在信息處理和生物特性感知等領域的應用;Padulano 等[4]提出了一種適用于大型數(shù)據(jù)庫,在不知道數(shù)據(jù)潛在概率分布的先驗信息情況下還可以與其他非參數(shù)的、基于模式的方法相結(jié)合的數(shù)據(jù)清洗技術;Phan 等[5]提出了一種平穩(wěn)型線性回歸方法用于縱向數(shù)據(jù)的對比分析,并引出了數(shù)據(jù)感知技術在數(shù)據(jù)清洗中的進一步應用;Vuji?等[6]針對傳統(tǒng)電力大數(shù)據(jù)異常值檢測算法存在檢測精度低、檢測效率差等問題,提出基于云計算的電力運行大數(shù)據(jù)異常值快速檢測算法;Duan[7]在Vuji? 等[6]的基礎上提出利用模糊C-均值聚類算法分類識別處理電力運行大數(shù)據(jù),快速檢測其中的異常值。以上數(shù)據(jù)清洗和數(shù)據(jù)異常識別研究為數(shù)據(jù)感知技術積累了大量先期經(jīng)驗,為數(shù)據(jù)感知技術在電力供應鏈數(shù)據(jù)運營管理應用中提供了技術參考。數(shù)據(jù)清洗和質(zhì)量治理旨在為數(shù)據(jù)分析挖掘提供完整有效數(shù)據(jù)集,使數(shù)據(jù)價值得以體現(xiàn),因此數(shù)據(jù)感知技術亦包含數(shù)據(jù)的價值挖掘研究。目前,基于各企業(yè)對供應商評價的需求,用戶特征畫像已有部分研究,例如Li 等[8]和Li 等[9]主要研究了用戶畫像的不同技術框架;Li 等[10]對用戶畫像分類模型展開了進一步研究;Janostik 等[11]充分考慮企業(yè)數(shù)據(jù)的特殊性,提出針對非結(jié)構文本數(shù)據(jù)處理可建立企業(yè)敏感詞庫,針對短文本數(shù)據(jù)處理可結(jié)合字符、拼音以及詞性等特征,以深度學習結(jié)合多層輸入、權值共享技術實現(xiàn)企業(yè)供貨特征提取與分析;Bonner 等[12]引入最大相關最小冗余準則進行用戶特征選取,采用遍歷法從原始特征集找到滿足與目標類別相關性最大、相互間冗余性最小的優(yōu)質(zhì)特征集,基于此實現(xiàn)用戶的畫像特征分析;Molinillo 等[13]提出了一種基于層次樹的回歸方法(CHAID),通過對用戶基本屬性進行分類,從而構建用戶畫像。
隨著現(xiàn)代智慧供應鏈體系建設發(fā)展,“五E 一中心”1)平臺部署趨于成熟,電力物資供應鏈數(shù)據(jù)管理需求急切,上述研究為供應鏈數(shù)據(jù)質(zhì)量管理提供了前期技術參考,但鑒于電力物資供應鏈具有數(shù)據(jù)種類繁多、異構性嚴重、數(shù)據(jù)分布分散、質(zhì)量層次不齊等特點,前述研究在供應鏈數(shù)據(jù)中的應用仍有待因地制宜。進一步講,目前電力物資供應鏈數(shù)據(jù)質(zhì)量管理依托人工手段較多,在數(shù)據(jù)多源匯集、大數(shù)據(jù)沉積愈來愈嚴重的情況下,如何基于數(shù)據(jù)感知技術實現(xiàn)數(shù)據(jù)自動清洗、質(zhì)量自動感知與治理和數(shù)據(jù)價值深度挖掘(供應商畫像分析)等環(huán)節(jié)提質(zhì)增效,是促使電力物資供應鏈由傳統(tǒng)到現(xiàn)代智能化、電子化方向發(fā)展的重要挑戰(zhàn)。基于此,本研究重點討論了數(shù)據(jù)感知技術在電力物資供應鏈數(shù)據(jù)質(zhì)量管理中的研究與應用,主要包括:(1)結(jié)合當前“五E 一中心”下電力物資供應鏈數(shù)據(jù)特點提出“數(shù)據(jù)感知技術”概念及核心組件,分析電力物資供應鏈數(shù)據(jù)質(zhì)量管理技術需求;(2)基于電力物資供應鏈數(shù)據(jù)質(zhì)量管理的現(xiàn)實和技術需求,提出面向現(xiàn)代供應鏈的數(shù)據(jù)質(zhì)量管理體系架構,并結(jié)合“五E 一中心”的兩級部署模式設計現(xiàn)代供應鏈數(shù)據(jù)感知實現(xiàn)框架;(3)基于電力物資供應鏈數(shù)據(jù)特點和實現(xiàn)框架提出數(shù)據(jù)感知的三大關鍵技術——基于時空相關性的多源感知數(shù)據(jù)清洗技術、基于隱藏規(guī)則挖掘的異構異常數(shù)據(jù)修復技術和基于供應商信息系統(tǒng)標識的全息畫像認知技術,實現(xiàn)以供應鏈數(shù)據(jù)特點為基礎,以完整有效數(shù)據(jù)集構建為手段,以供應鏈數(shù)據(jù)創(chuàng)新應用為目的的數(shù)據(jù)“清洗—校正—應用”全環(huán)節(jié)技術體系構建;(4)針對電力物資供應鏈生態(tài)圈全壽命周期管理的必然發(fā)展趨勢,提出數(shù)據(jù)感知技術在“五E 一中心”全面建設的中后期需進一步延伸的技術內(nèi)容和方向。
隨著數(shù)據(jù)挖掘、人工智能和云計算等新興技術的發(fā)展,大數(shù)據(jù)隱藏價值得到重視,數(shù)據(jù)感知技術應運而生。Rahman[14]、Weatherall 等[15]、Soleimani-Chamkhorami 等[16]提出數(shù)據(jù)感知技術范疇包含技術前期對數(shù)據(jù)的完整性、有效性、可用性等方面的研究。Turinsky 等[17]提出數(shù)據(jù)感知技術亦包含現(xiàn)階段大數(shù)據(jù)背景下通過對數(shù)據(jù)的一些特征信息來描述數(shù)據(jù)本身的方法。根據(jù)電力物資供應鏈數(shù)據(jù)特征特點,本研究將數(shù)據(jù)感知技術細化為時空數(shù)據(jù)質(zhì)量感知、異常數(shù)據(jù)感知和供應商信息系統(tǒng)標識感知。時空數(shù)據(jù)質(zhì)量感知技術充分考慮數(shù)據(jù)的時間和空間特性,根據(jù)供應鏈數(shù)據(jù)出處、類目、記錄等屬性進行符合數(shù)據(jù)產(chǎn)出地特征的數(shù)據(jù)完整性修復,主要用于數(shù)據(jù)清洗環(huán)節(jié)。異常數(shù)據(jù)感知技術對供應鏈數(shù)據(jù)的異常情況進行識別,主要面向結(jié)構化數(shù)據(jù)的奇異值、突變點檢測,面向非結(jié)構化數(shù)據(jù),基于數(shù)據(jù)關聯(lián)性、一致性等特征判別數(shù)據(jù)類目的對錯。供應商信息系統(tǒng)標識感知技術對供應商信息進行歸納、統(tǒng)計、挖掘分析,構建供應商全息畫像,實現(xiàn)數(shù)據(jù)價值應用。基于數(shù)據(jù)感知技術的現(xiàn)代供應鏈數(shù)據(jù)運營管理核心組件如圖1 所示,主要包括:(1)采集物資及供應商主數(shù)據(jù)、采購批次及招投標數(shù)據(jù)、合同履約及倉儲數(shù)據(jù)等數(shù)據(jù)資源;(2)基于數(shù)據(jù)感知技術對供應鏈數(shù)據(jù)處理與分析,形成有價值的數(shù)據(jù)集和應用結(jié)果;(3)基于價值數(shù)據(jù)集和數(shù)據(jù)分析結(jié)果,評估數(shù)據(jù)質(zhì)量運營管理成效。

圖1 現(xiàn)代供應鏈數(shù)據(jù)運營管理核心組件構成
為實現(xiàn)電力物資智能采購電子化、數(shù)字物流網(wǎng)絡化、全景質(zhì)控可視化以及內(nèi)外協(xié)同便捷化,以“五E 一中心”供應鏈平臺為支撐的現(xiàn)代供應鏈體系正在逐步建設,包括企業(yè)資源管理系統(tǒng)(ERP)、電子商務平臺(ECP)、電工裝備智慧物聯(lián)平臺(EIP)、電力物流服務平臺(ELP)、e 物資和供應鏈運營中心(ESC)2)。“五E 一中心”平臺建設要求企業(yè)人財物設備信息、供貨計劃信息、電工裝備物聯(lián)信息、物流運輸監(jiān)控信息等多方數(shù)據(jù)匯入,但由于各平臺部署部門作業(yè)標準、人員素質(zhì)、工作制度差異,平臺匯入數(shù)據(jù)存在冗余項、空值、奇異值、數(shù)據(jù)類目錯位等問題,如何將這類欠完整數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量、高價值的有效數(shù)據(jù)是國網(wǎng)公司需要面對的現(xiàn)實需求。對此,國網(wǎng)公司目前主要采用多級人工校核的方式,即:國網(wǎng)公司上級部門對下級部門提供的數(shù)據(jù)進行復審,下級部門配合上級部門核查數(shù)據(jù)并澄清有關問題,將問題數(shù)據(jù)溯源至產(chǎn)出部門。而受電網(wǎng)公司總部、省份、地市、縣公司多級部署,多級人工校核的方式將極大地消耗人力物力,如何借助先進的數(shù)據(jù)治理、處理技術實現(xiàn)問題數(shù)據(jù)的自動糾錯、提升數(shù)據(jù)質(zhì)量是國網(wǎng)公司亟待突破的技術需求(見圖2)。因此,通過數(shù)據(jù)感知技術,對供應鏈中大量冗余類標簽、重復記錄、無關標識、缺失項等問題數(shù)據(jù)進行清洗,對奇異值、錯位項、矛盾項、不一致項等問題數(shù)據(jù)進行數(shù)據(jù)校正,對數(shù)據(jù)正負相關、離散性等特征進行數(shù)據(jù)分析,實現(xiàn)面向供應商的全息畫像和供應網(wǎng)鏈全景可視,是解決電力物資供應鏈數(shù)據(jù)運營管理的有效辦法。

圖2 電力物資供應鏈數(shù)據(jù)質(zhì)量管理的技術需求
以Peikert 等[18]、Akca 等[19]、Parra 等[20]提出的典型數(shù)據(jù)質(zhì)量管理體系為參考,電力物資供應鏈數(shù)據(jù)質(zhì)量管理體系可為五大層級,包括數(shù)據(jù)資源層、數(shù)據(jù)清洗層、數(shù)據(jù)校正層、數(shù)據(jù)分析層和可視化交互層,其架構如圖3 所示。其中,數(shù)據(jù)資源包括物資及供應商主數(shù)據(jù)、采購批次及招投標等業(yè)務數(shù)據(jù)、合同履約及倉儲數(shù)據(jù)等數(shù)億條數(shù)據(jù),以此為基礎展開數(shù)據(jù)清洗、異常數(shù)據(jù)校正、分析應用等環(huán)節(jié)。包括:

圖3 電力物資供應鏈全面數(shù)據(jù)質(zhì)量管理體系
(1)數(shù)據(jù)清洗。數(shù)據(jù)清洗針對原始電力物資供應鏈問題數(shù)據(jù),例如Jiang 等[21]重點研究的重復數(shù)據(jù)、Lian 等[22]重點研究的無關數(shù)據(jù)、鄒同華等[23]和Nugent 等[24]重點研究的缺失記錄等冗余或不完整數(shù)據(jù),采用時空數(shù)據(jù)治理感知技術查重補缺,使電力物資供應鏈數(shù)據(jù)集在數(shù)據(jù)清洗完成后能對現(xiàn)實中真實結(jié)果有更加清晰準確的描繪。
(2)數(shù)據(jù)校正。數(shù)據(jù)校正針對原始電力物資供應鏈中與現(xiàn)實相悖的離群數(shù)據(jù),例如Abraham 等[25]重點研究錯位項、姚鵬川等[26]重點研究奇異值等錯誤數(shù)據(jù),本研究采用張永華等[27]和Wang 等[28]提出的異常數(shù)據(jù)感知技術構建面向離群值的狀態(tài)估計模型,對離群值進行檢測和剔除,實現(xiàn)錯誤數(shù)據(jù)的修復與校正,使電力物資供應鏈數(shù)據(jù)集在數(shù)據(jù)校正后能充分挖掘出正確知識和信息價值。
(3)數(shù)據(jù)分析。數(shù)據(jù)分析針對各供應鏈平臺匯入的數(shù)據(jù),從應用上將分為3 個階段:時珊珊等[29]重點研究的數(shù)據(jù)集成階段、浦雨婷等[30]重點研究的數(shù)據(jù)分析階段、Cao 等[31]和Ma 等[32]重點研究的數(shù)據(jù)服務與應用階段。數(shù)據(jù)集成將ECP、EIP、ERP、ELP 等平臺數(shù)據(jù)進行有機集中,對通過聯(lián)邦計算、數(shù)據(jù)倉庫等技術手段實現(xiàn)數(shù)據(jù)融合及全面共享;數(shù)據(jù)分析主要面向供應鏈平臺內(nèi)開展項內(nèi)數(shù)據(jù)趨勢預測、項間數(shù)據(jù)關聯(lián)分析,面向供應鏈平臺間開展橫向指標對比、質(zhì)量結(jié)果統(tǒng)計等分析;數(shù)據(jù)服務與應用面向供應鏈全鏈主體,基于數(shù)據(jù)分析結(jié)果開展數(shù)據(jù)質(zhì)量監(jiān)察、供應產(chǎn)品的數(shù)字化服務等實踐,形成對供應商信息系統(tǒng)標識的感知,實現(xiàn)供應商全息畫像認知。
現(xiàn)代智慧供應鏈兩級數(shù)據(jù)運營體系基于全業(yè)務需求,通過“大云物移智邊鏈”等技術,著力構建“五E 一中心”供應鏈平臺,從物資合同一鍵生成、在線簽署,到結(jié)算單據(jù)電子化、結(jié)算支付申請自動作業(yè),以實現(xiàn)供應鏈全程電子化、網(wǎng)絡化、便捷化,逐步打造“一級管控、兩級運營”的數(shù)據(jù)管理方案。該方案以兩級部署為核心,其中:電力物流服務平臺、企業(yè)資源管理系統(tǒng)以及“e 物資”分別將本智慧作業(yè)系統(tǒng)的業(yè)務數(shù)據(jù)匯集到總部和省級數(shù)據(jù)中臺,構建兩級部署;電工裝備智慧物聯(lián)平臺和電子商務平臺分別將本智慧作業(yè)系統(tǒng)的業(yè)務數(shù)據(jù)匯集到總部數(shù)據(jù)中臺,構建一級部署。其次,由總部供應鏈運營中心(ESC)和省級供應鏈運營中心從相應的數(shù)據(jù)中臺獲取常態(tài)化業(yè)務數(shù)據(jù)。最終實現(xiàn)兩級數(shù)據(jù)貫通、內(nèi)外協(xié)同、智能采購、全景智控的現(xiàn)代化智慧供應鏈兩級數(shù)據(jù)運營體系。如圖4 所示,描述了兩級部署的現(xiàn)代智慧供應鏈數(shù)據(jù)感知實現(xiàn)架構,關鍵技術主要包括以下3 個方面:時空數(shù)據(jù)質(zhì)量感知、異常數(shù)據(jù)感知、供應商信息系統(tǒng)標識感知。其中,時空數(shù)據(jù)質(zhì)量感知和異常數(shù)據(jù)感知分別服務于省級部署下的供應鏈數(shù)據(jù)清洗和數(shù)據(jù)校正;供應商信息系統(tǒng)標識感知主要服務于總部和省級部署下的供應鏈數(shù)據(jù)分析與應用,具體包含數(shù)據(jù)集成、數(shù)據(jù)分析、數(shù)據(jù)質(zhì)量督察、數(shù)據(jù)服務應用等。

圖4 兩級部署的電力物資智慧供應鏈數(shù)據(jù)感知實現(xiàn)框架
電力物資供應鏈數(shù)據(jù)存在來源分散、同一件產(chǎn)品或設備數(shù)據(jù)存在全網(wǎng)鏈多供應商提供、抑或產(chǎn)品配件數(shù)據(jù)源自多廠商的特點,由于多廠商的人員素質(zhì)、工作規(guī)范、產(chǎn)品質(zhì)量因素等方面存在差異,對全生命周期供應鏈數(shù)據(jù)、物資配送過程管理或同一產(chǎn)出地的設備/配件檢測、試運行等數(shù)據(jù)集進行數(shù)據(jù)清洗環(huán)節(jié)時,需要充分考慮數(shù)據(jù)產(chǎn)出地的時空特性。McKechnie 等[33]、Zhang[34]等、Ramos-Go?i[35]等認為時空數(shù)據(jù)質(zhì)量感知技術主要面向供應鏈數(shù)據(jù)的時間相關性和空間相關性,通過明確數(shù)據(jù)產(chǎn)出場景,設定一個有限度的時空粒度,獲得不同數(shù)據(jù)產(chǎn)地(或傳感器)采集的數(shù)據(jù)相關性,以及相同產(chǎn)地的數(shù)據(jù)相似性特征,基于此構建數(shù)據(jù)時空相關性模型,實現(xiàn)對“臟”數(shù)據(jù)的清洗,構建完整數(shù)據(jù)集。
就楊飛躍等[36]分析的供應鏈多源數(shù)據(jù)特點而言,數(shù)據(jù)清洗過程不僅僅依賴線性插值、平滑預測等在時序數(shù)據(jù)上取得較好效果的傳統(tǒng)方法,還需結(jié)合數(shù)據(jù)的時空相關性對數(shù)據(jù)進行分組,實現(xiàn)相似特征組數(shù)據(jù)單獨清洗,例如裝備生產(chǎn)、運檢、全生命周期管理等時序數(shù)據(jù),按照供應商生產(chǎn)標準、作業(yè)規(guī)范、場景判別閾值等差異構建時空相似特征組,并以產(chǎn)出地歷史數(shù)據(jù)特征進行數(shù)據(jù)集填補、修復。電力物資供應鏈時空數(shù)據(jù)清洗框架如圖5 所示,主要包括以下環(huán)節(jié):(1)逐條遍歷數(shù)據(jù)集,判斷本條數(shù)據(jù)是否冗余,若冗余則刪除該標簽數(shù)據(jù)跳轉(zhuǎn)下一標簽數(shù)據(jù),否則匯總到正確標簽集,完成冗余標簽篩選;(2)判斷是否有重復記錄,若重復則刪除數(shù)據(jù),否則匯總到正確數(shù)據(jù)集;(3)構建數(shù)據(jù)處理算法提取數(shù)據(jù)時空特征,應用李兢等[37]提出的分組方法進行特征分組,構建時空相關性模型,生成數(shù)據(jù)預測值對缺失數(shù)據(jù)填補,并應用張藝鐠等[38]提出的評估方法來評估填補精度;(4)判斷特征組內(nèi)數(shù)據(jù)是否完整,若完整則對相似特征組數(shù)據(jù)進行組合,否則重新遍歷清洗環(huán)節(jié),最終構建完整數(shù)據(jù)集。

圖5 電力物資供應鏈數(shù)據(jù)清洗流程
針對完整數(shù)據(jù)集中異常數(shù)據(jù),如數(shù)據(jù)量級偏差、數(shù)據(jù)標簽不符、數(shù)據(jù)突變、供應商信息矛盾等,需要進行異常數(shù)據(jù)檢測和修復,以便構建有效數(shù)據(jù)集。電力物資供應鏈數(shù)據(jù)種類較多(包括設備出廠試驗數(shù)據(jù)、采購訂單數(shù)據(jù)、采購合同數(shù)據(jù)、基礎運營數(shù)據(jù)等),匯集方式不同,記錄和取樣方式也有差異,存在多源異構的典型特點,因此,需要對結(jié)構化數(shù)據(jù)和非結(jié)構化數(shù)據(jù)單獨治理。具體包括:
(1)就結(jié)構化數(shù)據(jù)而言,其異常數(shù)據(jù)修復可基于數(shù)據(jù)間的關聯(lián)關系,采用殘差分析、神經(jīng)網(wǎng)絡、聚類分析等方法對數(shù)據(jù)本身進行狀態(tài)估計,提取數(shù)據(jù)的歷史演變趨勢和特征曲線,并根據(jù)算法閾值規(guī)則進行異常數(shù)據(jù)的檢測與修復。
(2)就非結(jié)構化數(shù)據(jù)而言,非結(jié)構化數(shù)據(jù)的單一特征較難提取,需要構建面向待檢測數(shù)據(jù)的關聯(lián)數(shù)據(jù)集。首先,通過Jones 等[39]、袁宇等[40]提出的Apriori,以及馮宏偉等[41]、Sering 等[42]提出的FP-Growth 等關聯(lián)規(guī)則算法獲得相應的關聯(lián)規(guī)則集;其次,結(jié)合供應鏈數(shù)據(jù)庫歷史記錄對關聯(lián)規(guī)則集進行優(yōu)化,將待測數(shù)據(jù)進行類屬性識別后的結(jié)果輸入優(yōu)化后的關聯(lián)數(shù)據(jù)集,進行特征比對;最后,基于特征可行域和分類對異常數(shù)據(jù)進行識別。
上述結(jié)構化與非結(jié)構化異常數(shù)據(jù)識別方法在較多數(shù)據(jù)異常識別研究中應用,技術相對成熟,在“五E 一中心”建設前期,應充分應用該類方法以獲得高質(zhì)量、有效、完整的數(shù)據(jù)集;但隨著數(shù)據(jù)匯入的體量激增,數(shù)據(jù)標簽維度龐大,上述方法需進一步拓展,與大數(shù)據(jù)技術深度融合,從海量多維數(shù)據(jù)中發(fā)掘隱藏規(guī)律與特征提取,實現(xiàn)異常數(shù)據(jù)辨識與修復。技術路線如圖6 所示,主要技術拓展內(nèi)容包括:(1)數(shù)據(jù)驅(qū)動的自動規(guī)則感知,即通過自動深度學習、貝葉斯深度學習等的深度數(shù)據(jù)挖掘方法,為每組數(shù)據(jù)匹配最適合的規(guī)則,簡化基于規(guī)則庫的人工成本,提高效率;(2)多維海量異構數(shù)據(jù)隱性信息挖掘,通過對大數(shù)據(jù)的數(shù)據(jù)屬性和數(shù)據(jù)關聯(lián)分析進行深度分析,發(fā)掘前期規(guī)則庫中忽略的類似類型數(shù)據(jù),進行數(shù)據(jù)關聯(lián)性的再次關聯(lián),彌補關聯(lián)認知欠缺;(3)知識與數(shù)據(jù)協(xié)同驅(qū)動的異常數(shù)據(jù)檢測,通過前期規(guī)則庫的知識積累,與大數(shù)據(jù)驅(qū)動的隱性特征融合分析,實現(xiàn)異常數(shù)據(jù)檢測并修復。

圖6 基于數(shù)據(jù)感知技術的電力物資供應鏈非結(jié)構化數(shù)據(jù)剔除及修復方法
供應商全息畫像應用主要依靠于數(shù)據(jù)感知技術,以供應商的內(nèi)部數(shù)據(jù)(如供應商的誠信度)和外部數(shù)據(jù)(如供應商是否涉及安全事件)為基礎,核心是對供應商進行標簽化處理,通過機器學習等技術對大量數(shù)據(jù)進行分析處理,抽象出一個虛擬供應商的特征全貌,從而基于對歷史數(shù)據(jù)的推演作出歸納性的推理判斷,并預測出未來一段時間供應商的某項指標的變化趨勢,從而幫助國網(wǎng)公司全方位、多視角地了解供應商行為特征,實現(xiàn)面向供應商的產(chǎn)品個性化精準設計、定制、營銷和精細化服務。針對供應商信息系統(tǒng)標識數(shù)據(jù)感知技術在數(shù)據(jù)分析環(huán)節(jié)的應用,Khanchi 等[43]、張永等[44]、陳真勇等[45]、Kock[46]認為關鍵在于構建供應商特征標簽庫,以實現(xiàn)對供應商全息畫像的有效認知。具體可按照企業(yè)規(guī)模、信用口碑、供貨連續(xù)性等進行標簽分類,如圖7 所示,其過程需要建立相關業(yè)務規(guī)則:一是標簽庫的建立;二是對應指標的選擇;三是創(chuàng)建統(tǒng)一標簽觸發(fā)規(guī)則;四是標簽數(shù)據(jù)匹配的問題。通過供應商信息系統(tǒng)標識數(shù)據(jù)感知技術,能夠全方位地反映企業(yè)特征,從而構建供應商全息畫像。

圖7 基于數(shù)據(jù)感知技術的電力物資供應商全息畫像認知實現(xiàn)流程
供應商全息畫像主要可分為3 類:供應商群體畫像、供應商個體畫像與供應商指標畫像。其中,供應商群體畫像是指基于物資品類的畫像,展現(xiàn)同類物資群體供應商數(shù)據(jù)表現(xiàn)情況和各供應商排名情況;供應商個體畫像是指基于供應商的畫像,展現(xiàn)供應商標簽、物資品類和績效情況;供應商個體畫像是指基于供應商的畫像,展現(xiàn)供應商標簽、物資品類和績效情況;供應商指標畫像是指基于指標的畫像,根據(jù)指標值對物資品類進行排名,展現(xiàn)單指標數(shù)據(jù)分布和物資排名情況。通過構建供應商特征標簽庫與供應商全息畫像,能夠?qū)ξ镔Y供應商進行良好的度量與區(qū)分。
基于現(xiàn)代供應鏈管理與發(fā)展的基本理論,以“五E 一中心”供應鏈平臺為支撐,實現(xiàn)電力物資供應鏈生態(tài)圈全壽命周期管理成為未來電力物資優(yōu)化配置發(fā)展的重要趨勢,而以數(shù)據(jù)感知技術為核心的全面數(shù)據(jù)質(zhì)量管理體系也勢必會促進物資、業(yè)務、數(shù)據(jù)的融合共享,激活全供應鏈數(shù)據(jù)流價值,高效靈活配置各類資源,推動物資鏈上下游的發(fā)展,例如,馬春光等[47]提出的邊緣側(cè)數(shù)據(jù)感知技術、Tran 等[48]和Lyu 等[49]提出的基于區(qū)塊鏈的共享信息感知技術等核心技術的全面應用等,這些應用與發(fā)展潮流催生了數(shù)據(jù)感知技術向跨行業(yè)數(shù)據(jù)和服務的互聯(lián)互通、互補協(xié)同聯(lián)動等方向的進一步延伸。在如圖8 所示的總體技術架構中,數(shù)據(jù)感知技術在供應鏈數(shù)據(jù)質(zhì)量管理中的發(fā)展方向主要體現(xiàn)為以下方面:

圖8 數(shù)據(jù)感知技術在電力物資供應鏈數(shù)據(jù)質(zhì)量管理體系中的發(fā)展方向
(1)從上下游對接、全鏈業(yè)務融合貫通及畫像需求出發(fā),結(jié)合數(shù)據(jù)感知技術構建電力物質(zhì)供應鏈生態(tài)圈。針對上下游對接需求,依靠目前單一數(shù)據(jù)庫無法滿足海量數(shù)據(jù)存儲與共享需要,下一步將通過如曹瑜等[50]提出的分布式清洗技術、Qiu 等[51]和Pal 等[52]提出的質(zhì)量管控全息可視技術等實現(xiàn)多方高效協(xié)同;針對全鏈業(yè)務融合貫通需求,將通過多源信息處理技術實現(xiàn)供需雙側(cè)平衡以及全鏈業(yè)務融合貫通;針對畫像需求,應通過供應商信用數(shù)據(jù)庫,借助多源信息處理技術對供應商進行分類分級管理和精準化畫像。
(2)基于數(shù)據(jù)感知技術的多源感知能力,實現(xiàn)電力物資供應鏈生態(tài)圈的信息全面互聯(lián)共享。數(shù)字化是萬物互聯(lián)共享的基礎,未來將通過建立電力物資供應鏈生態(tài)圈的數(shù)據(jù)中心以及信息共享云,將供應商、第三方服務商的信息與資源分別納入供應鏈生態(tài)圈,實現(xiàn)信息、數(shù)據(jù)資產(chǎn)、技術資源、知識資源、信用資產(chǎn)等各類信息與資源的全面共享。下一步研究將以物聯(lián)數(shù)據(jù)和業(yè)務數(shù)據(jù)為核心,集聚電力產(chǎn)業(yè)鏈上下游的生產(chǎn)要素資源,分別通過基于區(qū)塊鏈的共享信息感知技術、邊緣側(cè)數(shù)據(jù)感知技術以及面向?qū)ο蟮臄?shù)據(jù)感知技術來實現(xiàn)數(shù)據(jù)共享、數(shù)據(jù)分析服務、平臺融合等需求,并充分挖掘電力供應鏈數(shù)據(jù)資產(chǎn)的價值,提升價值創(chuàng)造能力。
(3)智能制造是以精益生產(chǎn)、標準化和模塊化理念為基礎,通過融合數(shù)據(jù)感知技術,實現(xiàn)整個智能制造業(yè)價值鏈的智能應用與創(chuàng)新服務。其業(yè)務主要包含自動化數(shù)據(jù)管理、業(yè)務流程優(yōu)化和創(chuàng)新第三方服務模式三大應用需求。就自動化數(shù)據(jù)管理而言,其不再局限于人工采集數(shù)據(jù)信息,而是通過基于區(qū)塊鏈的共享信息感知技術實現(xiàn)智能化、電子化、自動化數(shù)據(jù)管理;針對業(yè)務流程優(yōu)化,將進一步挖掘面向業(yè)務流數(shù)據(jù)的感知技術,實現(xiàn)全業(yè)務過程挖掘,促進業(yè)務升級;針對創(chuàng)新第三方服務模式,將進一步應用面向?qū)ο蟮臄?shù)據(jù)感知技術實現(xiàn)組織模式、運作模式的創(chuàng)新發(fā)展。
電力物資供應鏈數(shù)據(jù)質(zhì)量管理是“五E 一中心”平臺建設的重要工作,是構成數(shù)據(jù)中臺物資域的重要環(huán)節(jié),本研究針對電力物資現(xiàn)代供應鏈數(shù)據(jù)特點和現(xiàn)實需求,對數(shù)據(jù)感知技術在供應鏈數(shù)據(jù)質(zhì)量管理中的研究與應用展開探討,得到主要結(jié)論包括:
(1)通過基于時空相關性的多源感知數(shù)據(jù)清洗技術、基于隱藏規(guī)則挖掘的異構異常數(shù)據(jù)修復技術以及基于供應商信息系統(tǒng)標識的全息畫像認知技術等三大關鍵技術,對供應鏈中大量冗余類標簽、重復記錄、無關標識、缺失項等問題數(shù)據(jù)進行清洗,對奇異值、錯位項、矛盾項、不一致項等問題數(shù)據(jù)進行數(shù)據(jù)校正,對數(shù)據(jù)正負相關、離散性等特征進行數(shù)據(jù)分析,可實現(xiàn)面向供應商的全息畫像和供應網(wǎng)鏈全景可視,是解決電力物資供應鏈數(shù)據(jù)運營管理的有效辦法。
(2)以數(shù)據(jù)感知技術為核心的全面數(shù)據(jù)質(zhì)量管理體系能夠有效促進物資、業(yè)務、數(shù)據(jù)的融合共享,激活全供應鏈數(shù)據(jù)流價值,高效靈活配置各類資源,推動物資鏈上下游的發(fā)展。更深層次上講,通過數(shù)據(jù)感知技術實現(xiàn)電力物資供應鏈生態(tài)圈全壽命周期管理,是未來電力物資優(yōu)化配置發(fā)展的重要趨勢。
注釋:
1)“五E 一中心”是國家電網(wǎng)有限公司現(xiàn)代智慧供應鏈體系的平臺架構,應用“大云物移智邊鏈”技術,全面支撐智能采購、數(shù)字物流、全景智控三大業(yè)務鏈,促進國網(wǎng)公司內(nèi)部跨專業(yè)深度合作、外部供應鏈高效協(xié)同,實現(xiàn)物資業(yè)務智慧決策。
2)限于篇幅,各平臺匯集數(shù)據(jù)狀況不在文中具體匯報,備索。