張曦



[摘 要]常規(guī)的電力市場營銷數(shù)據(jù)挖掘方法以數(shù)據(jù)挖掘的負(fù)載均衡為主,為了平衡負(fù)載增加了大量的矢量運(yùn)算,影響了數(shù)據(jù)挖掘的效果,因此,文章設(shè)計(jì)了基于關(guān)聯(lián)規(guī)則技術(shù)的電力市場營銷數(shù)據(jù)挖掘方法。處理電力市場營銷數(shù)據(jù),將數(shù)據(jù)進(jìn)行各個(gè)維度變換,在保持原始數(shù)據(jù)值的基礎(chǔ)上將其映射到統(tǒng)一的數(shù)量級中,為數(shù)據(jù)挖掘提供基礎(chǔ)保障。基于關(guān)聯(lián)規(guī)則計(jì)算建立電力市場營銷數(shù)據(jù)倉庫,將處理完成的營銷數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉庫中,剔除與電力企業(yè)決策無關(guān)的營銷數(shù)據(jù),為電力企業(yè)提供決策支持。采用對比實(shí)驗(yàn),驗(yàn)證了該方法的數(shù)據(jù)挖掘效果更佳,能夠應(yīng)用于電力企業(yè)營銷管理工作中。
[關(guān)鍵詞]關(guān)聯(lián)規(guī)則技術(shù);電力市場;營銷數(shù)據(jù);數(shù)據(jù)挖掘方法
doi:10.3969/j.issn.1673-0194.2023.19.034
[中圖分類號]F272.7;TP391.113 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號]1673-0194(2023)19-0113-04
0? ? ?引 言
在激烈的電力市場競爭環(huán)境中,如何占領(lǐng)電力市場成為電力企業(yè)獲得發(fā)展必須思考的關(guān)鍵問題。在此背景下,電力企業(yè)逐漸建立了與市場接軌的營銷機(jī)制,完善了電力市場營銷模式。在電力企業(yè)市場營銷的過程中,存在大量的數(shù)據(jù),想要從大量的數(shù)據(jù)中找出對營銷決策有意義的數(shù)據(jù),就需要采用營銷數(shù)據(jù)挖掘方法。針對此類問題,研究人員設(shè)計(jì)了多種方法。其中,基于耦合度量的電力市場營銷數(shù)據(jù)挖掘方法,與基于Tex-RCNN的電力市場營銷數(shù)據(jù)挖掘方法的應(yīng)用較為廣泛。
基于耦合度量的電力市場營銷數(shù)據(jù)挖掘方法,主要是利用K-tras分割聚類算法,將電力市場營銷數(shù)據(jù)進(jìn)行聚類更新,將最優(yōu)決策數(shù)據(jù)分類到同一個(gè)數(shù)據(jù)集中,通過數(shù)據(jù)挖掘模型不斷更新量化營銷數(shù)據(jù),從而提升數(shù)據(jù)挖掘效率[1]。基于Tex-RCNN的電力市場營銷數(shù)據(jù)挖掘方法,主要是利用Tex-RCNN的雙層感知結(jié)構(gòu),將電力營銷數(shù)據(jù)進(jìn)行數(shù)值偏移量分析,獲取電力市場營銷表征參數(shù),通過建立決策識(shí)別模型,將營銷數(shù)據(jù)進(jìn)行精準(zhǔn)挖掘[2]。以上兩種方法均能夠進(jìn)行電力市場營銷數(shù)據(jù)挖掘,但是受到K-tras分割聚類與Tex-RCNN的感知結(jié)構(gòu)的影響,數(shù)據(jù)挖掘過程中存在大量的運(yùn)算過程,數(shù)據(jù)挖掘的相關(guān)性較低,影響挖掘精準(zhǔn)度[3]。因此,本文利用關(guān)聯(lián)規(guī)則技術(shù),設(shè)計(jì)了電力市場營銷數(shù)據(jù)挖掘方法。
1? ? ?電力市場營銷關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法設(shè)計(jì)
1.1? ?處理電力市場營銷數(shù)據(jù)
電力市場營銷的數(shù)據(jù)包括歷史售電數(shù)據(jù)、售電量、售電時(shí)間、售電行業(yè)類別等方面。電費(fèi)賬單是電力企業(yè)與客戶之間的溝通形式,通過采集客戶基本用電數(shù)據(jù),完善該用戶的交易記錄、用電信息、維修記錄等數(shù)據(jù),避免用戶數(shù)據(jù)的疏漏[4]。本文將電力市場營銷數(shù)據(jù)采集完成之后,對其進(jìn)行各個(gè)維度的數(shù)據(jù)變換,在保持原始數(shù)據(jù)值的基礎(chǔ)上,映射到統(tǒng)一的數(shù)量級中,為數(shù)據(jù)挖掘提供基礎(chǔ)保障。在市場營銷數(shù)據(jù)的事物空間中,涉及多種量綱維度的影響,數(shù)據(jù)出現(xiàn)連續(xù)離散化的情況,影響營銷數(shù)據(jù)挖掘售電規(guī)律。因此,本文引入最大—最小規(guī)范化屬性,對電力市場營銷數(shù)據(jù)進(jìn)行線性變換[5]。數(shù)據(jù)規(guī)范化處理公式如下:
式(1)中,為經(jīng)過處理的電力市場營銷數(shù)據(jù);v為未經(jīng)過處理的原始營銷數(shù)據(jù);minA為數(shù)據(jù)集中的最小值;maxA為數(shù)據(jù)集中的最大值[6]。在此基礎(chǔ)上,本文將連續(xù)屬性的營銷數(shù)據(jù)值進(jìn)行非線性函數(shù)轉(zhuǎn)換,公式如下:
式(2)中,xk,i為第k個(gè)數(shù)據(jù)經(jīng)過第i個(gè)屬性的轉(zhuǎn)換輸出值;Pk為第k個(gè)營銷數(shù)據(jù)向量;Ti為第i個(gè)屬性的數(shù)據(jù)中心。營銷數(shù)據(jù)的轉(zhuǎn)換函數(shù)幾何圖形表示為:
如圖1所示,在n維空間中,將Pk與Ti輸入到轉(zhuǎn)換函數(shù)中進(jìn)行數(shù)據(jù)轉(zhuǎn)換[7]。將數(shù)據(jù)轉(zhuǎn)換之后,數(shù)據(jù)屬性的連續(xù)離散化問題得以緩解,相關(guān)屬性的值并非連續(xù)性的,更有利于挖掘營銷數(shù)據(jù)的規(guī)律。
1.2? ?基于關(guān)聯(lián)規(guī)則計(jì)算建立電力市場營銷數(shù)據(jù)倉庫
本文將處理完成的營銷數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉庫中,剔除與電力企業(yè)決策無關(guān)的營銷數(shù)據(jù),為電力企業(yè)提供決策保障。在電力市場營銷數(shù)據(jù)挖掘的過程中,本文從三個(gè)步驟進(jìn)行,處理整合數(shù)據(jù)、建立數(shù)據(jù)挖掘倉庫,以及引入關(guān)聯(lián)規(guī)則算法直接挖掘數(shù)據(jù)源[8]。在數(shù)據(jù)整合處理完成之后,本文將相同屬性的營銷數(shù)據(jù)集合到一個(gè)數(shù)據(jù)集合中,針對某一相同屬性整合各種營銷數(shù)據(jù)。假設(shè)I為電力市場營銷項(xiàng)目數(shù)據(jù),D作為一個(gè)屬性的數(shù)據(jù)倉庫,則每一項(xiàng)關(guān)聯(lián)數(shù)據(jù)均滿足的條件。如果項(xiàng)目ik∈T,則數(shù)據(jù)T支持項(xiàng)目ik,則屬性A在數(shù)據(jù)倉庫D的支持度為:
式(3)中,為屬性A在數(shù)據(jù)倉庫D的支持度;DA為在D中挖掘出為屬性A的數(shù)據(jù)量;Dm位移D中的實(shí)際數(shù)據(jù)量。給定最小支持度閾值,若DA>,則稱屬性A是頻繁營銷數(shù)據(jù)集。在關(guān)聯(lián)規(guī)則技術(shù)支持下,將數(shù)據(jù)倉庫D中的交易數(shù)據(jù)X、Y進(jìn)行挖掘可信度分析,公式為:
式(4)中,為規(guī)則的挖掘可信度。根據(jù)用戶的用電情況,給定最小支持度閾值與最小可信度閾值,在此框架下,得到關(guān)聯(lián)規(guī)則,如圖2所示。
如圖2所示,交易數(shù)據(jù)X、Y之間存在X^Y的關(guān)系,在支持度—可信度的框架下,關(guān)聯(lián)規(guī)則的基礎(chǔ)上,對數(shù)據(jù)倉庫中的交易數(shù)據(jù)進(jìn)行相關(guān)度分析,公式如下:
式(5)中,δ為數(shù)據(jù)倉庫中的交易數(shù)據(jù)挖掘的相關(guān)度;P為關(guān)聯(lián)系數(shù)。當(dāng)δ>1時(shí),數(shù)據(jù)X與數(shù)據(jù)Y存在正相關(guān)的關(guān)系;當(dāng)δ=1時(shí),數(shù)據(jù)X與數(shù)據(jù)Y不相關(guān);當(dāng)δ<1時(shí),數(shù)據(jù)X與數(shù)據(jù)Y存在負(fù)相關(guān)的關(guān)系。本文以售電量為度量,將售電量、售電價(jià)、氣溫、降水等數(shù)據(jù)作為空間屬性,形成數(shù)據(jù)倉庫。每一類別的屬性數(shù)據(jù)分類存儲(chǔ)在數(shù)據(jù)倉庫中,最大程度上提升數(shù)據(jù)挖掘效率。
2? ? ?實(shí) 驗(yàn)
為了驗(yàn)證本文設(shè)計(jì)的數(shù)據(jù)挖掘方法是否符合相關(guān)性需求,本文對上述方法進(jìn)行了實(shí)驗(yàn)分析。最終的實(shí)驗(yàn)結(jié)果則以文獻(xiàn)[1]基于耦合度量的電力市場營銷數(shù)據(jù)挖掘方法、文獻(xiàn)[2]基于Tex-RCNN的電力市場營銷數(shù)據(jù)挖掘方法,以及本文設(shè)計(jì)的基于關(guān)聯(lián)規(guī)則技術(shù)的電力市場營銷數(shù)據(jù)挖掘方法進(jìn)行對比的形式呈現(xiàn)。具體的實(shí)驗(yàn)過程以及實(shí)驗(yàn)結(jié)果如下。
2.1? ?實(shí)驗(yàn)過程
本文選取了某城市2018年至2023年所有1月份
的月售電量作為實(shí)驗(yàn)數(shù)據(jù)集,并將影響月售電量的數(shù)據(jù)選取出來,確保本次實(shí)驗(yàn)的真實(shí)性。影響月售電量的數(shù)據(jù)包括售電量、售電均價(jià)、平均氣溫、降水量等。其中,2018年1月份的售電量為3.154×107kWh,售電均價(jià)為0.334元/kWh,平均氣溫為-11.5℃,降水量為1.7mm。2019年1月份的售電量為3.895×
107kWh,售電均價(jià)為0.362元/kWh,平均氣溫為-12.9℃,降水量為25.3mm。2020年1月份的售電量為3.026×107kWh,售電均價(jià)為0.361元/kWh,平均氣溫為-12.5℃,降水量為0.7mm。2021年1月份的售電量為3.450×107kWh,售電均價(jià)為0.386元/kWh,平均氣溫為-12.0℃,降水量為0.9mm。2022年1月份的售電量為3.627×107kWh,售電均價(jià)為0.377元/kWh,平均氣溫為-7.3℃,降水量為3.8mm。2023年1月份的售電量為4.005×107kWh,售電均價(jià)為0.420元/kWh,平均氣溫為-11.8℃,降水量為1.4mm。將原始數(shù)據(jù)經(jīng)過概化處理,得到FP-tree的頻繁項(xiàng)集合,如圖3所示。
如圖3所示,E、P、T、R表示的是售電量、售電均價(jià)、平均氣溫、降水量等概化數(shù)據(jù),每個(gè)數(shù)據(jù)集均存在5種概化等級,分別為低水平、中低水平、中等水平、中高水平、高水平。將概化數(shù)據(jù)輸入數(shù)據(jù)挖掘模型中,得到各自概化數(shù)據(jù)的等級水平,并設(shè)定相關(guān)規(guī)則,對電力市場近5年的營銷數(shù)據(jù)進(jìn)行分析。
2.2? ?實(shí)驗(yàn)結(jié)果
在上述實(shí)驗(yàn)條件下,本文隨機(jī)選取出多種強(qiáng)關(guān)聯(lián)規(guī)則,每種規(guī)則的支持度、可信度、相關(guān)度不同。本文將最小支持度閾值設(shè)定為0.155,最小可信度閾值設(shè)定為0.350,最小相關(guān)度閾值設(shè)定為0.850。在其他條件均一致的情況下,將文獻(xiàn)[1]基于耦合度量的電力市場營銷數(shù)據(jù)挖掘方法的數(shù)據(jù)挖掘指標(biāo)、文獻(xiàn)[2]基于Tex-RCNN的電力市場營銷數(shù)據(jù)挖掘方法的數(shù)據(jù)挖掘指標(biāo),以及本文設(shè)計(jì)的基于關(guān)聯(lián)規(guī)則技術(shù)的電力市場營銷數(shù)據(jù)挖掘方法的數(shù)據(jù)挖掘指標(biāo)進(jìn)行對比。實(shí)驗(yàn)結(jié)果如表1所示。
如表1所示,P1表示低水平售電均價(jià);T2表示中低水平平均氣溫;R3表示中等水平降水量;R4表示中高水平降水量;E5表示高水平售電量。本次實(shí)驗(yàn)建立了4種規(guī)則,分別為規(guī)則①:{P1}?{E5},規(guī)則②:{T2}?{E1},規(guī)則③:{R3}?{E2},規(guī)則④:{P1,R4}?{E5}。其中,規(guī)則①的最小支持度閾值為0.155,最小可信度閾值為0.350;規(guī)則②的最小支持度閾值為0.160,最小可信度閾值為0.350;規(guī)則③的最小支持度閾值為0.155,最小可信度閾值為0.250;規(guī)則④的最小支持度閾值為0.160,最小可信度閾值為0.300。在數(shù)據(jù)挖掘的過程中,超過最小閾值,才能確保數(shù)據(jù)挖掘的有效性。
在其他條件均一致的情況下,使用文獻(xiàn)[1]基于耦合度量的電力市場營銷數(shù)據(jù)挖掘方法之后,數(shù)據(jù)挖掘指標(biāo)的支持度、可信度、相關(guān)度均偏低,存在低于最小閾值的情況,使數(shù)據(jù)挖掘的關(guān)聯(lián)性降低,影響電力市場營銷的下一步?jīng)Q策。使用文獻(xiàn)[2]基于Tex-RCNN的電力市場營銷數(shù)據(jù)挖掘方法之后,數(shù)據(jù)挖掘指標(biāo)的支持度、可信度、相關(guān)度較之文獻(xiàn)[1]方法均有所提升,且數(shù)據(jù)挖掘相關(guān)指標(biāo)較為穩(wěn)定。但是,使用該方法之后,在規(guī)則②、規(guī)則④仍存在低于最小閾值的情況,需對其進(jìn)一步處理。而使用本文設(shè)計(jì)的基于關(guān)聯(lián)規(guī)則技術(shù)的電力市場營銷數(shù)據(jù)挖掘方法之后,數(shù)據(jù)挖掘的相關(guān)指標(biāo)均較高,支持度、可信度、相關(guān)度均超過了最小閾值水平,可以滿足數(shù)據(jù)挖掘需求,為電力市場營銷決策提供基礎(chǔ)數(shù)據(jù)支撐。
3? ? ?結(jié)束語
綜上所述,電力市場是電力營銷的基礎(chǔ),企業(yè)迫切需要轉(zhuǎn)變營銷思路,以高效、便民、提升終端能源占用率為目的,引導(dǎo)電力消費(fèi)、刺激電力消費(fèi)。電力企業(yè)在市場營銷過程中產(chǎn)生了大量的數(shù)據(jù),在電力企業(yè)的發(fā)展過程中,歷史營銷數(shù)據(jù)能夠?yàn)楹罄m(xù)營銷決策提供支持。因此,本文結(jié)合關(guān)聯(lián)規(guī)則技術(shù),設(shè)計(jì)了電力市場營銷數(shù)據(jù)挖掘方法。從數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等方面,對電力市場營銷數(shù)據(jù)進(jìn)行規(guī)范化挖掘,為電力企業(yè)提供下一步?jīng)Q策的基礎(chǔ)條件,確保電力企業(yè)的長遠(yuǎn)發(fā)展。
主要參考文獻(xiàn)
[1]蔡燕萍.基于耦合度量的負(fù)載平衡大數(shù)據(jù)聚類挖掘方法[J].蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2023,37(2):40-44.
[2]覃浩,劉振華,蘇立偉,等.基于Tex-RCNN的電力營銷語音服務(wù)用戶意圖識(shí)別模型[J].微型電腦應(yīng)用,2022,38(12):93-97.
[3]牛任愷,張鑫磊,王玉君,等.基于數(shù)據(jù)挖掘的電力營銷稽查業(yè)務(wù)監(jiān)管系統(tǒng)[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2022,40(1):103-110.
[4]曹喜如,梁錦灝,全威龍,等.基于KH Coder文本數(shù)據(jù)挖掘中日農(nóng)業(yè)經(jīng)濟(jì)發(fā)展特點(diǎn)對比[J].山西農(nóng)經(jīng),2023(5):37-39.
[5]蕭展輝,鄒文景,鄧麗娟,等.電力營銷客戶服務(wù)中臺(tái)數(shù)據(jù)傳輸安全自動(dòng)監(jiān)測技術(shù)[J].自動(dòng)化與儀器儀表,2022(10):111-114,119.
[6]劉翠玲,胡聰,王鵬,等.基于營銷大數(shù)據(jù)的電力客戶多維度信用評價(jià)模型研究[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,44(6):198-208.
[7]蘇立偉,劉振華,蘇華權(quán),等.基于數(shù)據(jù)負(fù)荷序列聚類的配電網(wǎng)電力營銷實(shí)時(shí)信息系統(tǒng)測試[J].電網(wǎng)與清潔能源,2021,37(12):64-69,80.
[8]張悅,田秀霞,顏赟成,等.一種基于分級策略的電力營銷大數(shù)據(jù)訪問控制方案[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021(5):169-184.
[收稿日期]2023-05-24