伍潤澤 王莉
(國網四川省電力公司德陽供電公司,四川 德陽 618000)
移動互聯網、物聯網、云計算等新一代信息技術的快速發展和5G技術的應用推廣,標志著人類社會正式進入大數據時代,數據成為重要的戰略資源。通過深入探索電力數據與社會數據、互聯網數據的融合創新,促進大數據的流通集成和深度挖掘,創造大數據在智慧城市、人工智能發展應用中的良性生態環境。
電力是國家能源,電力行業的發展是國民生計大事。隨著大數據的時代的到來,智能電網和信息化建設,電力行業積累了海量數據,這些數據在數據量、多樣性、速度和價值方面具有大數據的特征。
研究城市的未來發展、城市的合理布局和綜合安排城市各項工程建設的綜合部署,是一定時期內城市發展的藍圖,是城市建設和管理的依據。城市規劃是以發展眼光、科學論證、專家決策為前提,對城市經濟結構、空間結構、社會結構發展進行規劃。通過優化城市規劃,發揮指導和規范城市建設的重要作用,進行城市造影構建根據城市發展與運行狀況不斷修訂城市規劃,持續改進和完善進行連續決策。
以電力數據為核心,構建多維城市發展歷史狀態比對模型,并在此基礎之上形成電力數據城市造影信息分析,通過海量電力數據為基礎,利用降維分析、系統聚類分析、主成分分析等方法,構建城市發展狀態的多維模型,另一方面結合外部城市經濟環境數據與電力數據指標,通過動態時間規整、支持向量機等算法對目標城市與全國范圍內所有城市進行比對,實現全視角、多空間、多城市的發展狀態比對。

動態時間規整DTW對各樣本的綜合得分時間序列數據進行相似性測度,得到各樣本的初始距離陣。采用計算樣本綜合得分時間序列(面板數據轉時間序列),對時間序列編碼符號化,引入趨勢距離得出兩條時間序列的原始數據距離及其發展趨勢的相似程度,再用根據樣本距離矩陣用ward聚類。
電力數據造影模型本質是以應用為中心的開源SaaS服務平臺,其整體架構由多源數據管理、計算資源管理、應用場景管理三個資源層與應用層構成,以滿足多用戶,多場景定制分析應用的需求:

電力造影模型Saas服務使用SOA技術架構進行開發,SOA提供邏輯與物理層面的松散耦合,因此可以根據造影平臺需要對不同數據服務場景使用不同的API暴露方案,具有可重用的服務和可重組服務以及標準化的服務接口。并且具有服務獨立性和平臺中性,可以滿足擴展性不受到平臺、語言以及應用框架的約束,最大限度滿足造影平臺分析場景及應用環境的多樣性。基于SOA框架,具體使用Docker、Kubernetes等容器技術開展研發,可作為公有云環境下的應用交付平臺、DevOps平臺、自動化運維平臺和行業云平臺,或作為企業級的混合云多云管理工具、kubernetes容器管理工具或Service Mesh微服務架構治理工具。
時間序列數據存在多種相似或距離函數,其中最突出的是動態時間規整[1](Dynamic Time Warping)。動態時間規整未知量伸長或縮短(壓擴),直到與參考模板的長度一致,在這一過程中,未知單詞的時間軸會產生扭曲或彎折,以便其特征量與標準模式對應。給定兩個時間序列Q和C,Q=[q1,q2,…qn],C=[c1,c2,…cm],若n=m,可直接計算兩個序列的距離;若n≠m,則需要線性縮放到一樣的長度再進行比較。為對齊這兩個序列,構造一個n x m的矩陣網格,矩陣(i,j)處的元素為為qi和和cj兩兩個點的距離d(qi,cj)(即序列Q的每一個點和C的每一個點之間的相似度,距離越小相似度越高)。尋找一條通過該矩陣網格若干格點的路徑,路徑通過的格點即為兩個序列進行計算的對齊的點。該路徑定義為warping path規整路徑,用W表示。W=w1,w2……wk其中=中wk=(i,j)k。W需滿足邊界條件、單調性和連續性。滿足這些約束條件的路徑可以有指數個,然后需要使得下面的規整代價最小的路徑,該路徑可通過動態規劃算法得到。
ARIMA屬于時間序列分析法[2],其在電力數據預測中的應用也比較多,其具體的處理步驟為:首先通過ARIMA模型對原始數據進行檢驗,檢驗其是否為非平穩時間序列, 如果不是非平穩時間序列,則需要對其進行處理;多次處理后檢驗為平穩的時間序列,再根據識別階數,建立ARIMA(p,q)模型。
時間序列數據變化的影響因素歸結為四類: 長期趨勢(Trend)、季節變動因素(Seasonal variation)、循環變動因素(Cyclic variation)以及非規律性變化因素 (Irregular variation)。其中,長期趨勢與季節變動因素屬于基本決定因素,循環變動因素屬于規律性因素,而非規律性因素則是偶然不規則因素。然而,在特定時間段內,三類因素并不是同時顯著影響時間序列的變化,每一類因素對數據影響是否顯著、顯著程度需要通過計算分解獲得。 因此通常在傳統 ARIMA 模型基礎上,加入季節調整算法,及考慮季節變動、非規律因素對數據的影響,并通過趨勢分解,分別預測不同的因素對時間序列的影響。
電力城市造影分析主要包含電力數據、政務數據、企業數據、公開數據四部分:
電力數據:電力數據是城市造影分析的數據基礎,因為電力數據具有精確性、實時性、廣泛性等獨特優勢,可以在不同程度上,從多角度衡量社會發展的各個方面。
政務數據:政務數據是模型服務政府治理的關鍵,通過政務數據與電力數據的鉤稽融合,可以更好地服務政府基礎治理,協助政府建立實時監測場景。
企業數據:企業數據是模型服務企業客戶的核心,主要包含企業用戶在使用本平臺接入的共享數據、可能包含授權脫敏的企業基礎數據、生產經營數據、供應商數據等。
公開數據:外部多源公開數據是模型進行服務優化的重要補充,主要包含外部天氣、地理、文化、輿情、行業、經濟等數據,構建的分析場景狀態中,需要大量外部數據用于繪圖輔助、分析參照等功能。
綜合運用LASSO法、PCA分析法等統計方法,將高維的繁多的電力數據、經濟數據輸入,基于城市各指標的發展狀態時間序列,運用X-12Arima調整、DTW規劃等方法進行特征工程,結合聚類、xgboost、svm等機器學習算法,構建多維城市歷史狀態比對分析。實現面板數據中、時空視角下城市的各維度發展趨勢的相似性程度分析,以分類算法解決與目標城市特定年份最相似城市的匹配實現。開發城市發展造影模型。結合logit、BP神經網絡等預測算法,利用電力數據關聯產業結構,透視城市產業群結構狀態,預測電力區域流向,達成產業協同最優方案。
通過開展城市造影分析,構建電力數據為核心的城市整體運行狀態數據監測指標體系,形成全視角、多空間的城市畫像,為城市治理、規劃、投資、城市群協調發展提供實證數據支撐。深度挖掘電力數據的社會、經濟與商業價值,為政府、行業、用戶提供更好的服務。為政府對了解自身城市發展定位提供參考,實現電力服務政府治理與價值拓展。為規劃城市發展提供參考路徑,提高投資效率和規劃效率,優化社會資源配置,提升群眾生活水平。