■ 呂達 呂龍進(呂達,國網浙江寧海縣供電有限責任公司;呂龍進,寧波財經學院金融與信息學院)
隨著社會的發展,能源是人類生存發展中不可缺少的物質基礎,然而隨著全球氣候變暖日益嚴重,環境越來越受到重視,以及石油、煤炭等能源逐漸減少,可再生能源日趨得到重視與推廣的能源。
近年來,我國光伏發電應用市場逐步擴大,其光伏發電機容量每年以成倍的速度增長,在光伏發電市場持續升溫的背景下,目前光伏產品制造業產能也逐漸擴大。光伏發電領域的市場競爭也越來越激烈。同時隨著政府對光伏產業的扶持,以及光伏技術的不斷提升,使得光伏發電的投資潛力不斷得到提升,吸引了大量客戶投資光伏,往往出現部分不適合安裝光伏的客戶,也裝上了光伏,效率不高,設置出現了套利投資的客戶,騙取國家補貼,非但沒有很好地促進光伏產業的發展,還使得大量浪費光伏基建,因此,針對現有的光伏客戶中,根據光伏客戶的數據信息,對光伏發電客戶進行細分,然后進行精準的營銷是非常重要的。
根據浙江省政府辦公廳《關于推進浙江省百萬家庭屋頂光伏工程建設的實施意見》的要求,大力推進鄉村既有家庭屋頂光伏建設,以新農村建設為契機,推進鄉村獨立住宅屋頂或庭院,以及企業屋頂建設家庭屋頂光伏發電系統,光伏客戶的發電效率和建設模式各不一樣,成本控制和預算較復雜,因此,如何篩選最有價值客戶是當前急需解決的問題。如何根據客戶信息,對光伏發電客戶的細分,實現精準營銷變得尤為重要。本文采用聚類算法,它是一種典型的無監督學習算法,根據樣本間的相似程度,將相似度高的分為一類,差別大的分成不同的類別,常用的相似度計算方法是歐式距離法。利用日負荷、負載率及電量使用波動這三個指標,運用K-Means聚類分析方法,實現對客戶的細分。
電力公司近些年大力部署泛在物聯網,對電力數據的采集基本達到全覆蓋,目前國家電網已掌握光伏客戶的數據信息有很多,如:供電單位、發電戶號、戶名、用電地址、并網點等級、發電容量、發電方式、發電量消納方式、機組信息、發電設備名稱、發電設備類型、發電設備型號、日發電量、月發電量、年發電量等等,但是如何有效利用這些數據,發現數據中的規律,挖掘有價值客戶是當前電力公司熱門話題,傳統的分析方法一般按照區域、所屬行業等方法來劃分客戶群,憑經驗篩選光伏客戶,進行退關,然而這種方式過于陳舊、粗獷,憑借主觀意識判斷為主,無法客觀反映用電客戶的特征,無法幫助電力部門精確掌握企業光伏安裝適用情況。
本文通過挖掘客戶間不同個體的行業及用電特性規律對群體進行聚類分析,根據光伏潛在投資價值,將對應的企業分為四類,建立全新的客戶群組。電力部門可以利用模型準確判斷客戶所屬類別,一方面,篩選優質客戶,進行有序地推廣分布式光伏安裝,提高電力公司的營銷成功率;另一方面針對不同的企業群組制定針對性極強的服務策略,提高服務質量。
取得營銷系統、用電信息采集系統數據庫訪問權限,編寫相應查詢語句,訪問營銷系統數據庫獲取監測范圍內所有計量裝置更換客戶信息,所提取的字段信息包括:供電單位(包含地市、區縣級、供電所)、發電戶號、戶名、用電地址、并網點電壓等級、發電容量、發電方式、發電量消納方式、機組信息、發電設備名稱、發電設備類型、設備型號、日發電量、月發電量、年發電量等,明細清單導出形成《家庭光伏發電信息統計明細表》,共收集到2273個家庭信息。

表1 全社會用電分類統計明細表
1.獲取日負荷指標字段
由用電信息系統中導出的企業每隔15分鐘的電壓使用數據,對于企業的評價:一、客戶用電白天高于夜間,光伏發電可直接利用,無需儲能或上網;二、用電穩定性高,波動越小越好。因此我們用一天間隔15分鐘獲取到的電壓使用的平均值均值來表示該客戶電壓的使用,用標準差差來表示波動情況,綜合這兩方面,我們定義了日負荷指標=(八點到十六點的平均值-其余時間的平均值)/標準差,由此公式得到了客戶的日負荷指標字段。
2.獲取電量使用指標字段
從用電信息系統中導出客戶2017年1月至2018年4月間每個月的用電量,對于企業的評價:用電量越穩定越好。因此,可以用電量使用的標準差來表示這個指標,但由于每個企業的規模不一致,還需經過方差的標準化,而從得到電量指標=月平均值/標準差,該指標是衡量用戶用電穩定性指標。
3.獲取日負載率指標字段
從用電信息系統中導出客戶2017年1月至2018年4月間每個月的用電量,及運行容量,從供電公司成本角度考慮,當公司用電量與運量容量比例越大,則對供電公司來說,光伏發電的效益最好,故定義日負載率=平均每月用電量/(運行容量*10*30)。
借助SPSSModeler數據挖掘軟件,客戶分類模型,如圖1所示

圖1 基于聚類分析的用戶細分流程圖

圖2 聚類的類別大小

圖3 變量的重要性排序
將用戶聚類成4類,通過運行軟件,我們得到圖2圖3。
由此可見,對決定用戶聚為一類的最重要因素是日負荷指標,其次是負載率,最后是電量指標(見圖4)。

圖4 聚類類別的指標值
負載率、電量指標與日負荷是電力公司使用光伏發電后所帶來的效益指標,所以越大越好,因此我們選擇聚類2作為主要營銷對象,其負載率為0.97,將近達到1,說明安裝的變壓器基本完全使用,日負荷指標為1.09,說明用戶電量使用情況是早上8點至下午16點的電量使用遠遠大于其余時間,光照時間使用電量大,適合安裝光伏發電。
電量指標為3.86,說明電量使用穩定性高,波動小。這類用戶也將是給公司帶來最好效益的企業,依賴于模型共選出305個客戶作為潛在最有價值光伏客戶,見表2。
從聚類結果上也可看出,聚類4是最不適合安裝光伏的,見表3。

表2 潛在光伏客戶識別

表3 最不適合安裝光伏客戶列表
本文利用營銷系統與用電信息采集系統的數據,提取光伏用戶的特征指標,利用數據挖掘中的聚類分析方法,對用戶進行細分,通過聚類結果,提取類別特征,選取適合營銷對象,實現精準營銷,能大大提高工作人員的效率,也能提高電力公司的經濟效益。