楊樺



【摘 要】針對新能源汽車充電樁數據的特點,文章提出了一種新能源汽車充電樁數據分析挖掘框架,并詳細介紹了該框架涉及的關鍵技術。通過分析和挖掘新能源汽車充電樁數據,為運營商提供決策支持,為充電用戶提供智能服務。
【關鍵詞】新能源汽車;充電樁;海量數據;數據分析
【中圖分類號】F426.61 【文獻標識碼】A 【文章編號】1674-0688(2020)01-0040-04
0 引言
隨著新能源汽車使用人數的增長,電動汽車充電需求迅速提升,截至2019年4月,全國充電基礎設施累計數量已達到95.3萬臺。然而,由于布局不合理、維護不到位、缺乏平臺管理等問題,可充電設施的利用率卻長期偏低。2015年10月9日,國家發展改革委、國家能源局、工業和信息化部、住房城鄉建設部共同印發了《電動汽車充電基礎設施發展指南(2015—2020年)》,提出:“充電智能服務平臺建設要與充電基礎設施建設同步考慮,融合互聯網、物聯網、智能交通、大數據等技術,通過‘互聯網+充電基礎設施,積極推進電動汽車與智能電網間的能量和信息互動,提升充電服務的智能化水平。鼓勵圍繞用戶需求,為用戶提供充電導航、狀態查詢、充電預約、費用結算等服務,拓展增值業務,提升用戶體驗和運營效率。”[1]實現上述目標的重點就是對充電樁數據進行分析挖掘。
1 新能源汽車充電樁數據描述
我們需要收集的新能源汽車充電樁數據主要有兩類:第一類是運營管理系統與充電設備之間的通信數據,這類數據可以在上級監控管理系統中獲取。由于信息通信對新能源汽車充電運營的重要性,因此國家能源局、國家電網公司、中國南方電網有限責任公司發布了系統與離散充電樁通信規約,在這些規約的要求下,現行建設的充電樁大多具備與上級監控管理系統進行通信的功能,運營管理系統與充電設備之間通信的接口支持TCP/IP協議,數據可通過有線網絡或無線網絡進行傳輸。第二類是用戶評價和建議數據,這類數據主要來源于社交網絡,是充電用戶對新能源汽車充電服務的各種評論及建議,需要到網頁中抓取。
1.1 數據內容及類型介紹
(1)運營管理系統與充電設備之間的通信數據。這類數據主要用于判斷充電樁的運行情況及分析其利用率。根據中國南方電網有限責任公司發布的《電動汽車充換電服務網絡運營監控系統通信規約第2部分:系統與充電設施》(試行),運營管理系統與充電設備之間的通信數據主要包括充電過程實時監測數據、鑒權數據、遠程控制數據、交易數據等。規約中對這些數據的參數名稱、字段類型、字段長度都做了定義,不同廠家的充電樁遵從不同的通信規約,內容會有所差異(見表1)。
(2)用戶評價和建議數據。這類數據是一種補充數據,用于分析用戶的滿意度,主要包括各網頁中用戶對新能源汽車充電服務的評價和建議,例如對現有充電樁安裝地點、數量密度是否滿意,充電時長能否接受等。
1.2 數據特點分析
(1)數據海量增長。以北京為例,根據中商產業研究院的數據,截至2019年3月北京市公共類充電樁數量已達50 694個,這些電樁采集的實時數據,日增長量早已超過TB級。
(2)結構化數據占比大。在我們收集的新能源汽車充電樁數據中,運營管理系統與充電設備之間的通信數據多為結構化數據,用戶評價和建議數據多為半結構化數據及非結構化數據。但從數據收集量來看,主要是以第一類數據為主,它是分析挖掘的最有價值的數據,并且隨著標準體系的逐步完善,這類數據的結構會越來越規范。
(3)價值密度低。新能源汽車充電樁數據雖然海量,但是多半都是記錄數據,價值密度并不高。例如,充電過程實時監測數據一般是正常的,異常數據非常少,但是后者才是狀態檢修的最重要依據。
(4)處理速度快。對新能源汽車充電樁數據的分析挖掘需要在極短的時間內對大量數據進行分析,用于決策制定。在線狀態數據的處理性能要求遠高于離線數據,若未得到及時到位的處理,數據信息價值就會遞減。因此,在線的流數據分析挖掘相比傳統數據挖掘技術有本質的不同。
2 新能源汽車充電樁數據分析挖掘方案
2.1 需求分析
新能源汽車充電樁數據分析主要對海量數據進行智能采集、分析、管理和高效利用,需要支持PB級的數據存儲和處理。通過統計和挖掘分析充電樁運行數據,進行故障預警及判斷,提高設備的運檢水平和運作效率;通過分析用戶充電時間、分布狀況等數據,合理規劃安裝充電樁,提前進行電力資源配置;通過持續跟蹤觀察電動汽車用戶充電特征狀況,探索電動汽車用戶充電行為習慣,研究電動汽車用戶充電消費模式,為用戶的充電行為提供智能推薦,提高服務的效率和質量。
2.2 新能源汽車充電樁數據分析挖掘框架
針對新能源汽車充電樁數據的特點,最大限度地為新能源汽車充電樁運營商及充電用戶提供更有用的知識、更精確的信息及更及時的響應,本文提出了一種能源汽車充電樁數據分析挖掘框架,該框架包括5層(如圖1所示)。
(1)數據源。數據來源主要有運營監控系統和互聯網兩個。從運營監控系統中獲取充電樁傳回的通信數據,包括充電過程實時監測數據、鑒權數據、遠程控制數據、交易數據等。在互聯網中抓取帶有用戶評價和建議的網頁。
(2)數據采集及預處理層。兩種不同的數據源分別采用不同的數據采集方法。運營監控系統數據庫中數據是結構化的,采集方法可以使用數據庫導入工具或特定系統接口。互聯網頁面中的數據是非結構化和半結構化的,可以先用網站公開的API或網絡爬蟲進行原始網頁抓取,再利用網頁解析工具解析并提取數據。然后將簡單、獨立的數據通過解析、清洗、重構,轉換成適合數據挖掘的形式,再對數據進行過濾、抽取和融合。經過上述預處理后,所獲取的源數據保存在由數據存儲計算層提供的分布式存儲中,可供數據分析層直接使用。
(3)數據存儲計算層。數據存儲計算層的主要功能是將數據采集及預處理層的數據進行高效存儲,并提高系統的容錯性。傳統的數據存儲方法和數據庫技術無法有效處理海量數據,所以本層中采用分布式的存儲架構解決該問題,通過分布式架構提升數據的存儲能力及數據吞吐量,通過在不同分布節點上的備份提高系統的容錯能力。
(4)數據分析層。數據分析分為兩類,分別是統計分析和數據挖掘。統計分析部分主要是對充電集中時間、充電電量增量情況和故障出現情況等信息的統計。數據挖掘部分包括基于用戶畫像的行為分析、趨勢分析、客戶分析等。針對用戶畫像的行為分析包括用戶充電統計、用戶偏好計算、用戶偏好調整。用戶充電統計算包括充電時長統計、充電時間段統計、充電地點統計;用戶偏好計算包括充電時長偏好計算、充電時間段偏好計算、充電地點偏好計算。數據挖掘分析可以根據需要進行擴展。
(5)數據應用層。數據應用層的主要功能是將數據分析層的分析結果為充電樁運營商及充電用戶服務。運營商服務方面包括數據分析結果的圖表展現,基于業故障分析的解決方案和預防措施,基于用戶行為分析的精準營銷和后續充電設施建設等。充電用戶服務方面包括基于充電樁位置及狀態信息的充電導航及充狀態查詢和充電預約,基于用戶行為分析的智能推薦。
3 新能源汽車充電樁數據分析挖掘關鍵技術
3.1 新能源汽車充電樁數據存儲計算技術
新能源汽車充電樁數據存儲計算技術主要包括由Hadoop的MapReduce分布式并行計算框架和HDFS分布式文件系統,以及存儲結構化數據和基礎結果數據的分布式數據庫。利用HDFS超大的存儲空間解決海量數據的存儲問題(如圖2所示),利用MapReduce分布式并行計算框架進行高速、可靠的數據分析處理(如圖3所示)。
3.2 新能源汽車充電樁數據挖掘技術
海量數據的挖掘常用的方法有分類、聚類、回歸分析、關聯規則、偏差分析等,它們分別從不同的角度對數據進行挖掘[4]。
(1)分類與聚類。分類與聚類都是按照相似性和差異性,把一組對象劃分成若干類。在新能源汽車充電樁海量數據分析中我們可以運用這兩種分析方法進行充電用戶的分類、屬性和特征分析、滿意度分析、充電行為趨勢預測等工作。分類方法有許多種,其中較為成熟的有決策樹、貝葉斯、支持向量機、人工神經網絡等。傳統的分區聚類、層次聚類、基于密度的聚類、基于模型的聚類和基于網格的聚類算法應用到大數據的聚類中需要進行抽樣或降維,而損失了聚類的精確性;并行聚類雖然對于大數據的聚類具有效率高、可擴展性好的優點,但是算法實現非常難;基于MapReduce能夠實現高可擴展的面向大數據的聚類算法,但對軟硬件資源要求高[5]。
(2)回歸分析。回歸分析是大數據分析中的一種預測性的建模技術,它研究的是自變量和因變量之間的數量變化關系,該技術一般用于預測分析,常用的有線性回歸、邏輯回歸、多項式回歸、逐步回歸、嶺回歸、套索回歸和ElasticNet回歸。其中,邏輯回歸在數據化運營中有更主流、更頻繁的應用,該分析技術可以很好地回答諸如預測、分類等數據化運營常見的分析項目主題。在新能源汽車充電樁數據挖掘中,可應用該技術預測用戶接受新服務的可能性。例如,通過降價等手段能否讓用戶在指定地點或時間進行充電。
(3)關聯規則分析。關聯規則分析在數據挖掘領域主要用于發現隱藏在大型數據集中有意義的聯系。關聯規則最初用于購物籃分析,通過分析顧客購物籃中商品之間的關聯,掌握顧客的購物習慣,幫助零售商開發更好的營銷策略。現在,該技術因為能夠成功預測銀行客戶需求,而在西方金融業中得到廣泛應用。在新能源汽車充電樁數據挖掘中,可以運用該技術進行用戶需求預測,利用預測信息,幫助充電樁運營商改善自身營銷。Apriori算法是著名的關聯規則數據挖掘算法,其最大的缺陷是多次掃描事務數據。因此,在新能源汽車充電樁海量數據挖掘中,我們可以使用FP-樹頻集算法,該算法比Apriori算法效率高且能較好地適應不同長度的規則。
(4)偏差分析。偏差分析的目的是發現與大部分其他對象不同的對象。例如,分類中的反常實例、模式的例外、觀察結果對期望的偏差等。偏差分析可采用的方法有橫道圖法、表格法及曲線法。在新能源汽車充電樁數據挖掘中,它可以應用到充電樁設備異常信息的發現、分析、識別及預警等方面。
4 結語
文章提出了一種能源汽車充電樁數據分析挖掘框架,詳細描述了該框架各層的作用及數據挖掘技術。通過對新能源汽車充電樁海量數據進行分析挖掘,找出充電用戶的行為特征和充電喜好,為運營商及用戶雙方提供更大價值的信息。隨著信息壁壘的打破,該數據分析挖掘框架也可用于車、樁、網數據融合后充電、用電、駕駛等大數據分析,結合用戶交通指數為充電站建設提供數據支持,進一步提高充電樁利用率,幫助運營商調整運營策略。
參 考 文 獻
[1]國家發展改革委.電動汽車充電基礎設施發展指南(2015—2020年)[Z].2015.
[2]中國南方電網有限責任公司.電動汽車充換電服務網絡運營監控系統通信規約第2部分:系統與充電設施(試行)[Z].2016
[3]管天云,侯春華.大數據技術在智能管道海量數據分析與挖掘中的應用[J].現代電信科技,2014(2).
[4]李蓉蓉.基于Hadoop的電商平臺大數據挖掘研究[J].南方農機,2017(22).
[5]海沫.大數據聚類算法綜述[J].計算機科學,2016(S1).
[6]張文,王東,鄭靜楠,等.電動汽車領域的大數據研究與應用[J].大眾用電,2016(12).
[7]潘鳴宇,張祿,孫舟,等.電動汽車領域的大數據處理與分析[J].電氣應用,2016(5).
[8]邢偉寅,鐘樂海,羅金生.基于互聯網+新能源汽車充電導航系統設計[J].價值工程,2017(12).