任增朋
(中國核能電力股份有限公司,北京 100097)
黨中央、國務院高度重視大數據產業發展,推動實施國家大數據戰略。習近平總書記在黨的十九大報告上提出,要推動互聯網、大數據、人工智能和實體經濟的深度融合。《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》圍繞“打造數字經濟新優勢”,做出了培育壯大大數據等新興數字產業的明確部署。工業和信息化部制定出臺了《“十四五”大數據產業發展規劃》,作為未來五年大數據產業發展工作的行動綱領。
隨著核電企業對于數據處理需求的不斷發展,常規的數據架構已經難以滿足需求。核電企業的關注重點已轉移到以數據管理平臺為基礎,將不同的業務種類劃分成多個數據區域來存放企業所有類型數據。這些數據將包括企業通過原始積累、外部合作等,以及從自己內部、外部所有渠道獲取到的結構化數據、半結構化數據和非結構化數據。大數據給企業帶來價值的同時也給企業帶來了前所未有的挑戰,作為系統工程,需要戰略、管理、業務、技術幾方面形成合力,才能發揮大數據最大效用。
參照大數據應用發展演進趨勢,核電大數據應用以應用需求為驅動,以數據準備為基礎,并依賴于技術平臺而實現,核電站大數據應用發展劃分為如圖1所示的四個階段。

圖1 核電大數據應用演進階段模型
核電數據管理工作自2013年啟動,以主數據管理為抓手,參照核電站生命周期特征打通主數據全生命周期管理,實現了數據產生源頭、采集過程與使用過程的質量控制。建立了包括標準、運維、質量、安全、系統平臺、程序體系等多維度主數據在內的管理體系,形成了基于數字化建設的全生命周期主數據管理。主數據管理全生命周期管理理念模型如圖2所示。

圖2 核電主數據全生命周期管理概念模型
3.1.1 主數據
主數據(Master Data)是指用來描述企業核心業務實體的數據,是跨越各個業務部門和系統的高價值的基礎數據。主數據具有在業務活動中相對穩定、在業務系統中交互共享、是業務數據的派生源頭(母體數據)等特征。主數據管理的數據包括功能位置、設備、物資等。
3.1.2 業務數據
業務數據是用于記錄業務事件的數據,用來描述某一時間點在業務系統上發生的行為數據。如設備檢修報告、采購訂單、工作申請、物資出入庫等業務活動的行為記錄。
3.1.3 實時數據
實時數據是指機組運行過程中產生的用于真實反映系統及設備瞬時運行狀態的數據。
3.1.4 主數據結構關系
主數據結構是參照電站實體SSCs結構而構建的數據SSCs結構關系。核電主數據SSCs結構關系如圖3所示。

圖3 主數據SSCs結構關系圖
核電信息化建設較為完備,具備了較好的大數據應用數據基礎,但全范圍的數據管理仍處于起步階段,仍面臨巨大的困難與挑戰,具體表現在:
(1)核電領域沒有體系化的數據管理與價值挖掘利用案例,缺少參考經驗。核電行業缺少可參考的成功經驗,需要結合核電特點參其他域數據管理與應用經驗,探索實踐核電數據管理之路,每前進一步都存在巨大的困難與挑戰。
(2)公司范圍內數據資源關聯與共享程度低,數據質量不高,數據資源流通不暢。主數據間仍未進行有效的關聯,難以支持業務貫通,業務數據的管理仍處于起步階段,數據生成與存儲缺少有效的管理與規范,存在數據信息孤島,數據共享與信息資源不暢通,數據價值難以被有效挖掘利用。
(3)數據管理與應用價值不易顯性展示,業務管理投入和需求少。數據本身是應用系統的基礎資源,不易顯現直接價值,從而重應用輕數據;數據價值的挖掘與再利用,需要一定的技術條件與數據知識儲備,認知需要一個過程,造成業務領域無法明確提出應用需求,大數據應用難以深入。
(4)專業數據管理人員短缺,數據管理人才培養困難。當前數據管理與大數據應用學說百家爭鳴、百花齊放,學說理論層出不窮,但經過實踐檢驗的用于電力生產的卻少之又少,缺乏有關數據管理與應用的服務、培訓、人才。
通過核電內部業務部門訪談,數據應用需求及要求主要包括:
(1)主數據質量應能充分滿足應用系統基本業務功能的實現。
(2)主數據間能夠相互關聯調用,能夠有效支持業務功能互聯貫通。
(3)在應用系統上完成的業務活動能夠得到規范的數據選擇應用,既減少人工錄入量,也減少歧義產生,規避風險,提高工作效率。
(4)在應用系統上做業務活動分析總結時,有規范的風險防控及問題解決措施數據,既可輔助決策,也減少人工錄入量,提高效率。
(5)通過大數據應用技術手段發現問題、預測趨勢,實現利用數據對事件進行狀態監測、趨勢分析、診斷與預測。
(6)簡單便捷的獲取業務工作中需要且直觀可視化的數據統計與報表,能夠在三維模型中實現數據可視化。
總體思路:基于數字化與智能化核電建設目標,立足于公司業務管控能力的提升,按照基礎數據治理與管理和頂層智能應用兼顧協同發展的原則,實現數據分析與利用,并可視化展示數據價值。
實施路線為:數據資源的獲取與積累—數據資源的治理與管理—數據價值分析與利用—數據價值可視化,從而實現公司信息化建設按照電子化—數字化—智能化等階段路線穩步推進。
大數據應用平臺的建設是基礎技術條件,通過構建集采集、存儲、管控、監控能力為一體的大數據應用平臺,實現數據標準管理、質量管理、安全管理、架構管理等方面全方位管控,提高數據綜合利用效率,打通數據壁壘,實現與提升大數據的分析與預測能力。平臺也將對在各個業務系統中的數據整合、清洗,有助于企業整體數據質量的改善,提高的數據的實用性。
數據資源是大數據應用的基礎要素與前提條件,要進一步推進信息系統對業務覆蓋度,多渠道全流程采集、獲取與積累全要素數據資源,為進一步的應用積累數據資源。
主要包括主數據質量持續改進、主數據關聯關系搭建與數字資源整合、業務數據標準化。
(1)持續改進主數據質量,支持業務活動開展與系統運行。
(2)搭建主數據結構關系,整合數據資源,支持業務貫通。
(3)標準化業務數據,為數據建模積累規范數據。
數據模型是大數據應用的基礎,是實現預測與分析的必要條件。依據業務大數據應用需求與方向,分領域按功能在標準化數據基礎上逐步建立與豐富數據模型,并持續維護、優化與完善,實現與提高計算、診斷、分析與預測能力,主動提供決策支持,數據驅動管理創新。
實現數據可視化能夠有效提高用戶對數據感知體驗,也是實現數據價值的重要體現與途徑。通過便捷而直觀展現數據分析結果,顯性展示數據價值,支持大數據應用個性化信息展示,能夠為用戶提供更有效的數據洞察手段,更直觀地的表達數據的意義與價值。
大數據應用的實現依賴于技術平臺,實現公司高速接入和采集終端生成的各類數據、海量結構化數據和非結構化數據存儲與管理、高效處理與分析各類數據、構建數據共享中心等需求。打通數據采集、集成、共享、發現、驗證與應用等各個環節,為大數據應用奠定技術基礎。
根據規劃推動了一批大數據應用,通過統計、計算與分析,以數據為驅動改善原有管理模式,通過增值數據價值提升管理水平。
應用場景介紹:在核電企業,信函是指在項目建設和運營中與其他單位來往用于商洽、詢問、答復、請求和報送等活動中形成的文件。具有數量大、內容雜、時效強等特點。傳統人工分發方式,對分發負責人知識和技能要求較高,分發工作量大、效率低、易出錯。
解決方案:為了解決核電信函分發存在的上述問題,設計開發智能分發功能,第一匹配來源采用固定性分發規則,輔助建議采用機器學習。系統采用自然語言處理技術進行語義分析,將函件的標題和內容進行分詞。在特征匹配階段,由系統根據分詞結果,與分發矩陣進行匹配,將信函自動分發出去。如果不能找到規則匹配,采用機器學習依據歷史分發記錄計算給出分發建議,人工確認。無論何種分發結果最終都會記錄到信函庫中,成為機器學習的訓練集。
應用成效:系統應用后,近80%的核電信函可以智能化批分,其中50%可以實現分發規則唯一確定匹配,即全自動批分,機器學習推薦的正確率達到75%。每年預計節超過2 000個工時,人員節省40%,效率、準確性、規范性大幅提高。
應用場景介紹:設備是核電企業的重要核心資產,對設備進行管理從而提升設備的運作效率對于核電企業安全高效發展有重要意義。目前,核電設備管理相關的信息系統在不同時期建設,缺乏一個統一、高效、上下游貫通的管理平臺,不能完整、實時進行信息展示。
解決方案:業務上對設備采用簡化的RCM(SRCM)進行分析,利用設備FEMA和FTA分析數據,并利用數學模型進行輔助分析,減少分析工作量,提升維修決策效率。技術上,平臺數據ETL使用KETTLE工具,從多種不同數據源抽取原始數據,同時在數據流動過程中利用KETTLE的各種工具二次加工處理數據,最后將分析數據存儲到大數據存儲平臺。前端基于Echarts的展示開發提升展示效果和用戶友好度。不同組件之間通過控制器實現動態的多重條件查詢,也可設置動態數據聯動功能,支持基于分析維度的下鉆。
應用成效:系統上線后,CC1管理簡報有效提升設備管理人員的工作效率,無須再登錄多個業務系統,由系統自動推送相關信息,同時解決歷史跟蹤缺陷需要從郵件與歷史文檔中搜索多處查找的問題,如圖4所示。CC1設備績效指標功能,可以直觀展示商運機組績效指標,及時發現設備管理短板,助力CC1設備管理提升。實現關鍵敏感設備缺陷故障的動態跟蹤管理,統一存儲設備的全生命周期數據;建立設備數據績效管理指標體系,從多個評估維度對指標體系進行打分評價,形成一站式的設備績效數據看板。

圖4 CC1管理簡報
大數據應用是一個長期的循序漸進的過程,既要堅持總體規劃,又要促進IT和業務不斷融合聯合創新,既要充滿信心持續推進,又要清醒地認識到大數據應用不能跨越信息化的建設階段,堅定不移的推進信息化建設數字化轉型。