李玥
摘要:隨著互聯網技術的迅速發展,各行業其是銷售行業得到了快速的發展,同時也產生了海量的相關數據資源。作為銷售行業中的一部分,傳統的人工分析模式已經無法為電廠直供電、供熱和電力營銷提供必要的數據分析。需要利用大數據挖掘與分析技術,從海量的電力營銷數據中發掘潛在的、有價值的信息,快速有效地分析數據與信息,從而將各個信息孤島相互匯集成為決策輔助信息系統,更好地保證電廠生產的安全運行、銷售利潤和市場競爭力。
關鍵詞:大數據;支持向量機;數據挖掘;銷售模式
經過多年的使用和運行,電廠信息化系統已經積累了海量的數據資源,這些數據信息是散亂的、無序的和龐大的,蘊含的知識和價值巨大。文章引入了大數據挖掘技術,利用大數據挖掘的優勢創新電廠數據信息管理模式,提高電廠發展、服務水平和競爭力。
1 數據挖掘技術
隨著互聯網、信息化系統的運行和推廣,系統運行積累了海量的數據資源,可以采用支持向量機、K近鄰算法、BP神經網絡等大數據挖掘技術,從宏觀、微觀等多維度構建電廠經濟分析系統,挖掘電廠數據中潛在的有價值信息,指導電廠經營分析和管理,具有重要的作用。
1.1 支持向量機
支持向量機是一種基于分類的大數據挖掘技術,該挖掘技術可以針對非線性、高維空間的樣本數據實現挖掘分析,能夠利用核函數等優化數據挖掘過程,從海量的油品數據中挖掘高價值信息,并且能夠為油品銷售提供銷售、經營、管理決策知識。支撐向量機可以與遺傳算法、模糊數學、粒子群等思想集成在一起,實現算法優化,挖掘更多的信息知識。
1.2 K近鄰算法
K近鄰算法采用線性統計分類算法,已經在數據挖掘算法中得到了廣泛的普及,是一種非常成熟的算法。K近鄰算法的思路如下:給定一個樣本數據,計算該樣本與K個樣本相似程度,選擇相似程度最大的一個類別,將該樣本劃分為這個類別中。K近鄰算法運行中,所選擇的鄰居都已經擁有自己的類別歸屬,其可以依據最鄰近的一個數據對象或多個樣本類別確定樣本的歸屬,是一個比較簡單的經典大數據挖掘算法,K近鄰算法原理依賴于極限定理,但是在劃分類別時,其僅僅與少量的樣本數據對象存在關系,判定類別僅僅依靠少量的數據類別,對于類別交叉嚴重的待分類樣本來講,K近鄰算法并不適合,需要采用更高檔的學習器進行分類。
電廠經濟性分析系統引入數據挖掘技術,可以達到以下幾個目標:(1)關聯分析。電廠經濟性分析系統運行產生的大數據來源于發電、用電、傳輸等多個等環節,涉及各類型軟硬件設備,這些數據信息資源存在極大的關聯關系,比如簡單關聯關系、時序關聯關系、設備一軟件關聯關系、日志操作關聯關系等。(2)分類預測。電廠經濟性分析系統引入大數據挖掘之前,許多信息數據保存的較為繁亂,比如供用電設備種類和數量多,設備購置、維修、更換等運行記錄保存日期、位置、版本較多,容易產生不一致等特點。因此,分類預測可以根據電廠管理人員的需求,引入貝葉斯理論等構建一個分類算法,挖掘數據中相同類別的信息,這些類別可以是維修記錄、購置記錄,也可以是時間內容等,并且可以利用預測管理功能,預測設備運行趨勢。(3)聚類分析。電廠大數據多是供用電設備運行自動產生的數據,相關子數據集缺乏詳細的描述信息,此時可以采用聚類分析方法,將數據劃分為多個簇,簇內保持高度的相似性、同構性,簇間保持較大的差別性,這就可以把相同類別的數據劃分到一組,不同類別的數據劃分到多個簇。(4)偏差檢測。數據挖掘時發現數據集中的離群點或異常數據是一個重要的功能,比如電廠供用電網絡安全監測,該功能被稱為偏差檢測。偏差檢測主要包括分類中的反常實例、例外模式、觀測結果對期望值存在的偏離以及量值可以隨時間的變化而變化。偏差檢測的方法尋找觀察結果、參照之間的有意義差別,偏差分析的一個非常重要的特征是可以有效地過濾大量不感興趣的模式。
2 基于數據挖掘的電廠經濟性分析系統
近年來,我國各大電廠企業經過深層次和多方位改革、重組,電廠引入了先進的信息化技術,積累了海量的信息數據,但是數據整合存在較大的難度,無法快速提升電廠知名度和銷售利潤,更無法提升電廠企業競爭力。如圖1所示,大數據挖掘可以從海量的電廠銷售數據中發掘潛在的有價值信息,利用這些信息可以指導、創新電廠經營管理模式,構建一個電廠數據挖掘系統,為電廠經營提供主動化的推薦功能。電廠數據挖掘系統的一個顯著特點是,能夠收集電廠發電數據、售電數據等資料,并且根據用戶興趣偏好主動為用戶做出個性化推薦,并且能夠實時更新推薦內容,提高企業的服務水平。
電廠經營分析系統可以基于K均值算法構建自動分類用電群組。目前,人們生活中,不同的家庭購買的家用電器不同,用電量也是不同的,可以利用K均值算法構建一個自動分類的用戶群,這樣就可以將用戶消耗的電量劃分為高中低等檔次,針對電量用戶群可以制定一種更加優惠的措施,保證用戶價值持續提升;針對中檔次用戶制定一些力度較大的電量優惠措施,培養用戶高電量習慣,這樣就可以把中檔次用戶提高為高檔次用戶。另外,電廠也可以使用BP神經網絡可以構建一個電量需求識別模型,這樣就可以分析不同家庭用電器耗費的電量,更好地向用戶推薦耗電量較小的電氣,這對于提高用戶電量的有效利用率具有重要的作用和意義。具體地,電廠經營分析管理模式可以劃分為以下幾個方面:
2.1 聯想銷售,個性化推薦服務
基于用戶購買行為實現個性化推薦服務。利用大數據挖掘技術,可以獲取用戶購買的電力能源的記錄,并且統計客戶的行業信息,為客戶提供個性化的推薦服務,比如定制消防檔次,推薦低能耗家用電器等。
2.2 用戶群分,差異化營銷
實現用戶群分,不同等級客戶采用差異化營銷。采用K近鄰算法可以構建用戶群分模型,主題可以是購買頻次、售電金額等,針對售電金額較多的大客戶、價值較高的客戶推送力度較大的優惠信息,更好地黏住客戶,持續為電廠經營管理創造價值。
2.3 電量歷史銷量預測,擇機銷售
電量銷售預測與分析。隨著人們的生活質量提高,電力能源已經成為千家萬戶群眾和工廠的重要能源之一。不同的季節、不同的時間段,人們的耗電量是不同的,因此可以采用支持向量機、BP神經網絡等大數據分析技術,從電量銷售數據中挖掘用電量高峰,展示各個季節的電量銷售數量、時間段,細化電量銷售的具體情況,以便能夠預測電量銷售高峰發作時間段,保證電廠可以提供充足的電量能源。
2.4 專家庫,提升電量銷售決策知識
構建電量銷售專家分析庫,便于電廠企業經營決策。電量數據挖掘分析過程中,可以采用現有的經驗知識構建一個功能豐富電量專家決策庫,以便能夠為電廠提供經營、管理決策知識,幫助電廠制定戰略銷售決策時具有較高方向性,便于持續改善電廠的發展能力、競爭能力。
3 結語
隨著“互聯網+”的誕生和發展,電廠可以充分地利用大數據挖掘技術發現電量銷售數據中潛在的有價值信息,實現電量用戶群分、差異化營銷,滿足電量銷售多樣化需求,提高電廠市場競爭力和利潤。