韋宗慧 陸冰芳
[摘 要]本文基于交互式學習技術的多元化業務建模框架設計經驗,以多元化業務建模框架建設技術為視角,就交互式學習技術及其在多元化業務建模框架設計中的應用進行了簡要分析。明確機器學習技術、人工智能算法、數據治理技術等應用目的與價值,從而為基于交互式學習技術的多元化業務建模框架構建實踐提供有益指導,更好地助力電網企業信息化建設,推動電網企業可持續競爭發展。
[關鍵詞]多元化業務;交互式學習技術;建模架構
doi:10.3969/j.issn.1673 - 0194.2020.02.037
[中圖分類號]TP311.1[文獻標識碼]A[文章編號]1673-0194(2020)02-00-02
0? ? ?引 言
以數字化建設為手段,提升企業信息共享能力,推進企業現代化進程,已經成為電網企業轉型升級的必然趨勢。在新時期新形勢發展要求下,如何利用先進科學技術構建多元化業務建模框架,提升業務數據共享水平,成為學術界與實務界關注的重點問題。以下是筆者就交互式學習技術及其在多元化業務建模框架設計中應用的幾點認知。
1? ? ?多元化業務建模框架設計目的與需求
電網企業面對新時代的新任務、新要求、新形勢,“數字化轉型”成為行業轉型升級的重要目標與關鍵手段。在此背景下,提升電網公司數據資產業務集約化管控水平,實現各業務系統數據的有效共享與融合,成為業務改革與創新發展的客觀需求。加之,就當前電網公司業務數據管理現狀來看,普遍存在各業務系統應用獨立、業務數據共享程度不高、信息孤島問題顯著、數據模擬訓練環境計算能力低下、數據資源利用率不高等問題。因此,需要加強多元化業務建模框架研究,通過交互式多元化業務建模框架的科學設計與開發,為電網公司電能質量監測、電能量數據、配網設備數據分析等業務組織開展提供全鏈路數據管理及智能電網數據分析模型訓練技術支撐,實現電網多元化業務數據深度融合和有效共享。對此,基于先進科學技術應用下的多元化業務建模框架,需具備如下基本功能:①為電網公司各業務部門提供多元化業務模型訓練技術支撐,消除跨業務域、跨系統間的業務建模壁壘,改善信息孤島問題,促進各業務系統數據的融合與共享;②具備數據去重,可視化數據清洗整合、血緣分析等數據治理能力,實現數據倉庫標準化建設;③電網公司各業務信息進行數據化處理,實現業務數據全過程標準化、自動化管控;④具備價值數據挖掘能力,可為業務管理提供決策依據等。
2? ? ?多元化業務建模框架設計中交互式學習技術的應用實踐
基于多元化業務建模框架設計需求,結合相關研究經驗,可知機器學習技術、數據治理技術是多元化業務建模框架設計所應用到核心技術。
2.1? ?交互式學習技術應用之“機器學習技術”
機器學習技術是人工智能研究領域廣泛應用的技術,是基于計算機技術、信息技術、應用數學等結合應用下形成用以研究“利用計算機從大數據中分析學習規律,并利用學習規律進行未知數據預測”的技術。由此可見,機器學習技術具有較強的數據計算、分析、處理、挖掘能力,在大數據時代背景下,提升企業機械學習能力,有利于提升企業數據資產利用率,掌握信息化建設與發展的主動權。目前,在機器學習技術應用中,監督學習(分類預測、回歸分析等)、無監督學習(聚類分析、關聯規則分析等)和強化學習(支持向量機的誤差分析等)是較為常用的機械學習算法,將其科學引入業務系統,可有效提升系統數據分析與處理能力,滿足海量數據環境下有價值數據挖掘需求,提升數據資源利用率、有效性。在本次研究的多元化業務建模框架中,根據業務數據用戶實際需求,進行專業機械學習算法平臺開發,實現內置分析算法、回歸算法、深度學習、聚類分析算法、關聯規則算法等在機械學習框架中的集成應用,并為電網公司業務數據應用用戶提供基于交互式學習的建模框架,從而彌補傳統機器學習技術應用入門門檻高、集成管理缺乏、技術應用受限、開源軟件優化困難等不足,實現模型訓練的自動化、智能化發展。與此同時,讓機械學習算法應用更具簡便性、輕松性,促進機器學習技術在電網企業中的推廣與應用,提升電網企業多元化業務建模框架機器學習能力。
2.2? ?交互式學習技術應用之“數據治理技術”
數據治理技術是對數據采集、數據存儲、數據管理、數據處理、數據質量提升和數據利用等技術的總稱。應用目的在于提升數據質量、數據利用價值、數據配置科學水平、數據管理能力,是電網公司業務發展過程中,進行數據資產管理質量與效率提升的技術保障。通常情況下,數據治理技術應用流程如下:一是利用數據采集工具,有效采集各類型元數據,為后續數據處理與利用提供充足數據資源;二是將所采集到的數據依據一定規則與要求,存儲到數據存儲器或數據存儲系統中。基于電網公司業務數據的大規模、大數量、多類型發展,需在不改變數據存儲架構的基礎上,實現數據存儲能力強化,進行數據存儲空間有效拓展;三是對已存儲數據進行針對性管理與利用,滿足用戶對業務數據使用需求。無論是數據采集環節、數據存儲環節,還是數據管理與利用環節,皆離不開數據工具的支撐。對此,要想提升數據治理技術應用有效性,須對大數據治理工具具有一定了解。目前,較為常見的大數據治理工具主要有兩種,一種是如元數據、主數據的單獨工具;另一種是如數據資產管理系統、數據治理系統、數據自助服務平臺的集成工具,以滿足不同數據治理階段、數據治理場景下的數據治理用戶需求。
由于傳統的數據資產管理所應用的規范主要是“CWM(Clockwork Mod Recovery)標準”,雖然為元數據管理提供了相對穩定、規范、標準的存儲環境,實現元數據之間的互聯互通,但在大數據時代背景下,基于元數據數量與類型的不斷增多以及管理范圍的日漸擴大,“CWM標準”已經無法滿足電網公司數據資產管理需求,因此,基于電網公司業務的創新發展,結合電網公司業務數據變化情況,須進行業務數據資產管理標準體系構建。通過統一標準與規范,促進數據資產管理規范化、系統化發展,有效解決業務系統數據管理通用性、擴展性問題。在本次研究的多元化業務建模框架中,根據數據治理需求,利用數據治理技術進行多元化業務建模框架的數據元信息管理功能設計與研發,提升電網企業數據資產管理質量與效率,數據治理技術具體應用如下。①可視化數據字典技術。即通過利用可視化Web式元信息管理工具,實現數據元信息檢索、通信的標準化、規范化發展,提高數據元信息管理質量與效率,滿足大數據環境下元信息檢索、挖掘需求。②自助提數技術。即從數據權限管理創新入手,使數據資產管理平臺具備自助提數功能,一方面,減少提數溝通環節,提升提數高效性,為電網公司業務決策提供信息依據;另一方面,提高數據資產管理自動化水平,使數據資產管理在沒有SQL基礎的業務專家情況下,也能夠進行自助提數,在保證工作質量與效率的同時,節約人力成本。③血緣分析、直系分析以及重要性分析技術。即在數據分析工具、大數據挖掘技術、歷史數據追溯技術等科學運用下,對數據來源、數據與數據之間存在的關系、數據與任務之前存在的關系、數據走向、數據流向、數據被利用情況等具有全面、清晰了解,從而實現有價值數據挖掘,讓數學利用更具科學性、實用性、準確性。就數據血緣分析技術應用而言,能夠通過系統操作,準確找到某表所依賴的表,挖掘表生成路徑;找到依賴于某表的所有表,并進行生產路徑的有效探尋。為保證血緣分析、直系分析以及重要性分析技術應用功能有效實現,應加大數據字段、程序、數據庫、公共構件等軟件實體的數據字段計算、傳遞關系的研究力度,實現數據字段級別數據血緣分析工具的科學研發與利用。
3? ? ?多元化業務建模框架設計中交互式學習技術的應用效益
通過效益分析可知,基于交互式學習技術的多元化業務建模框架,能夠實現智能電網各類數據的融合和共享,進行多業務系統集成化管控;大幅度提升數據模型訓練能力,數據模型訓練響應時間達到500 ms以內,模型訓練并發任務數達到30個以上;海量數據清洗、轉換以及標準化處理能力提高,為大數據技術應用推廣奠定良好基礎,基于大數據技術應用,節約了30%以上的人力成本。
4? ? ?結 語
本文就電網企業多元化業務建模框架設計中交互式學習技術及其應用進行了簡要分析。分析表明:①交互式學習技術的有效應用,有利于多業務系統功能完善,實現電網企業數據模型訓練能力提升;②機器學習技術能夠推進數倉標準化建設進程,進行數據去重操作,讓數據更具應用價值;③數據治理技術應用進一步增強平臺數據治理能力,提升數據利用有效性、時效性;④基于交互式學習技術的多元化業務建模框架設計與實現,推進電網企業信息化建設進程,為企業數據資產相關業務工作順利開展提供幫助,帶動電網其他業務創新發展。總而言之,將交互式學習技術應用于多元化業務建模框架設計,現實意義顯著,且需要在持續研究中,不斷改進與完善。
主要參考文獻
[1]唐翠蘭,劉素娟,范福蘭.基于智能終端的交互式學習設計對深度學習的影響研究[J].教育探索,2019(4).
[2]冉冉,喬林,徐立波,等.基于全業務數據中心延伸源端數據治理研究[J].信息與電腦:理論版,2019(16).
[3]張豹,陳淵.大數據環境下數據治理框架的特點及應用[J].電子技術與軟件工程,2019(16).