999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類算法的新能源汽車用戶居住地預(yù)測(cè)*

2021-06-04 07:50:46程登張亮趙小羽黎飛王興月黃祖朋
汽車實(shí)用技術(shù) 2021年10期
關(guān)鍵詞:新能源用戶

程登,張亮,趙小羽,黎飛,王興月,黃祖朋

(上汽通用五菱汽車股份有限公司技術(shù)中心,廣西 柳州 545007)

引言

用戶畫(huà)像也叫用戶角色,是用戶大數(shù)據(jù)分析的主要內(nèi)容[1]。用戶畫(huà)像屬于用戶信息標(biāo)簽集合,在現(xiàn)實(shí)生活中真實(shí)存在,除了用戶姓名、年齡等靜態(tài)信息外,還包括用戶的使用特性等。通過(guò)用戶訪談的形式收集用戶畫(huà)像會(huì)導(dǎo)致信息缺失以及統(tǒng)計(jì)不及時(shí)等不足。大數(shù)據(jù)時(shí)代,數(shù)據(jù)成倍地增加,通過(guò)對(duì)用戶大數(shù)據(jù)的挖掘,獲取用戶駕駛行為的數(shù)據(jù),可以幫助整車企業(yè)深入分析用戶畫(huà)像,為用戶提供更好的服務(wù)用戶。

本文基于DBSCAN聚類[2]和K-means聚類[3]算法,通過(guò)某型新能源汽車T-BOX實(shí)時(shí)采集的海量數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)進(jìn)行預(yù)清洗、聚類分析、通過(guò)建立預(yù)測(cè)模型去預(yù)測(cè)用戶的居住地,從而豐富某型新能源汽車的用戶畫(huà)像。

1 數(shù)據(jù)預(yù)處理

1.1 數(shù)據(jù)樣本

新能源汽車終端基于 GB/T 32960-2016《電動(dòng)汽車遠(yuǎn)程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范》,定時(shí)采集CAN網(wǎng)絡(luò)上的數(shù)據(jù),并上傳到企業(yè)的新能源大數(shù)據(jù)平臺(tái)。本次實(shí)驗(yàn)所使用的是某整車企業(yè)100臺(tái)新能源汽車,最近3個(gè)月的用戶車輛行駛數(shù)據(jù),主要包含有:車輛停車經(jīng)緯度、啟動(dòng)時(shí)間、行駛里程、充電時(shí)刻、充電經(jīng)緯度等數(shù)據(jù)。

1.2 數(shù)據(jù)清洗

海量的原始數(shù)據(jù)中存在著大量不完整的數(shù)據(jù),這將影響數(shù)學(xué)建模的效率,導(dǎo)致挖掘結(jié)果存在偏差,因此數(shù)據(jù)清洗尤為重要。數(shù)據(jù)清洗主要是刪除原始數(shù)據(jù)中的無(wú)關(guān)數(shù)據(jù)、重復(fù)數(shù)據(jù)、噪聲數(shù)據(jù)等。本次數(shù)據(jù)清洗主要是將經(jīng)緯度越界數(shù)據(jù)、異常數(shù)據(jù)和軌跡漂移點(diǎn)等剔除。

2 聚類算法

2.1 DBSCAN聚類算法

DBSCAN算法是一類基于密度的聚類算法。其主要思想為:在樣本集合X={x1,x2,x3,…,xN}中任意選取一個(gè)數(shù)據(jù)點(diǎn)出發(fā),按照密度可達(dá)的條件往外擴(kuò)張,最終得到一個(gè)最大化的區(qū)域。若初始點(diǎn)是核心點(diǎn),則這個(gè)最大化的區(qū)域就是一個(gè)類或一簇;若初始點(diǎn)為邊界點(diǎn),則會(huì)跳至下一個(gè)點(diǎn);若初始點(diǎn)為噪聲點(diǎn),則直接將該點(diǎn)標(biāo)記為噪聲點(diǎn)。

在DBSCAN聚類算法中,主要涉及以下定義:

定義1 Eps鄰域。對(duì)于聚類樣本集合X中的任意一點(diǎn)p,以p為圓心,Eps為半徑,所包含的區(qū)域就是p的Eps鄰域,記為 NEps(p)。

定義2 核心對(duì)象。對(duì)于聚類樣本集合X中的任意一點(diǎn)p,統(tǒng)計(jì)該點(diǎn)Eps鄰域范圍內(nèi)的所有數(shù)據(jù)點(diǎn)個(gè)數(shù)v,則核心對(duì)象是指v不小于MinPts的數(shù)據(jù)點(diǎn)。

定義3 直接密度可達(dá)。如果q∈NEps(p),同時(shí)點(diǎn)p為核心對(duì)象,則認(rèn)為對(duì)象q從p直接密度可達(dá)。

定義4 密度可達(dá)。在聚類樣本集合X中,如果存在序列p1,p2,…pn,且滿足p1=q,pn=p。若是pi+1從pi直接密度可達(dá),則對(duì)象p從q密度可達(dá)。

圖1 DBSCAN聚類算法解析圖

2.2 K-means聚類算法

空間聚類算法作為一種空間數(shù)據(jù)劃分的重要方法,主要將對(duì)象的空間距離按照相似性準(zhǔn)則劃分到若干個(gè)子集中,使得相同子集中各元素間差別最小,不同子集中各元素間差別最大。空間聚類算法是建立在各種樣本的空間距離基礎(chǔ)上,最常用的是歐幾里得距離:

式中,i=(xi1,xi2,…,xim)和j=(yj1,yj2,…,yjm)是兩個(gè)m維的數(shù)據(jù)樣本。

根據(jù)空間聚類算法的類別劃分是使得同一類的內(nèi)部相似度最大、差異度最小,而不同類別的相似度最小、差異度最大。公式(1)的歐幾里得距離作為劃分準(zhǔn)則,即任一空間對(duì)象與該對(duì)象所屬類的幾何中心之間的距離比該對(duì)象到任何其他類的幾何中心距離都小。

圖2 K-means聚類算法解析圖

如圖2所示,詳細(xì)描述了K-means聚類算法的聚類設(shè)計(jì)過(guò)程。首先,由用戶確定所要聚類的準(zhǔn)確數(shù)目k,并隨機(jī)選擇k個(gè)對(duì)象,代表一個(gè)類的均值或中心,對(duì)剩余的每個(gè)對(duì)象,根據(jù)其(各類中心的距離將它賦給最近的簇。然后重新計(jì)算每個(gè)簇內(nèi)對(duì)象的平均值形成新的聚類中心,這個(gè)過(guò)程重復(fù)進(jìn)行,直到下列(2)式準(zhǔn)則函數(shù)收斂為止。

這里,E是所有研究對(duì)象的平方誤差總和,p為空間的點(diǎn),即數(shù)據(jù)對(duì)象。ai是簇Ai的平均值,按照這個(gè)準(zhǔn)則生成的結(jié)果簇趨向于獨(dú)立和緊湊。

2.3 DBSCAN聚類和K-means聚類混合算法

K-means聚類算法對(duì)異常點(diǎn)敏感,無(wú)法解決噪聲點(diǎn)的問(wèn)題,若地理位置的分布過(guò)于分散,按照固定k值聚合,得到的中心點(diǎn)位置可能和實(shí)際相差甚遠(yuǎn),導(dǎo)致結(jié)果有差異。DBSCAN聚類算法是按照活動(dòng)半徑的密度可達(dá)來(lái)聚合,其結(jié)果是將數(shù)據(jù)集合分類,并不求出中心點(diǎn)。

因此本文設(shè)計(jì)了一種基于DBSCAN聚類和K-means聚類的混合算法:利用 DBSCAN算法的密度可達(dá)特性將用戶的地理位置數(shù)據(jù)按活動(dòng)半徑聚合成若干個(gè)簇,并且將每一簇的數(shù)據(jù)集作為新的輸入,再利用K-means算法的迭代聚合求出中心點(diǎn)的位置。

3 實(shí)驗(yàn)結(jié)果及分析

基于DBSCAN聚類的實(shí)現(xiàn)過(guò)程,設(shè)定關(guān)鍵參數(shù)Eps和MinPts。從聚類數(shù)據(jù)樣本集X中任意選取一點(diǎn)p,若該點(diǎn)的條件符合核心對(duì)象的判定,那么從該點(diǎn)密度可達(dá)的所有數(shù)據(jù)點(diǎn)成為一個(gè)聚類,而不屬于任何簇的數(shù)據(jù)點(diǎn)則被標(biāo)記為噪聲點(diǎn)。關(guān)鍵參數(shù)Eps和MinPts的選擇對(duì)聚類效果影響很大,表1中展示出不同Eps和MinPts組合時(shí),算法模型的準(zhǔn)確率,根據(jù)多次實(shí)驗(yàn),最終確定最優(yōu)解。

表1 DBSCAN算法參數(shù)選擇

圖3分別給出了不同Eps和MinPts組合時(shí),其聚合效果。通過(guò)對(duì)比,可以看到Eps=1000米淺黃色的類聚的精度較差,Eps=500米聚類未完全剔除噪聲點(diǎn),Eps=200米聚類結(jié)果精度較高。因此,本文在DBSCAN算法中選取的關(guān)鍵參數(shù)為:Eps=200米,MinPts=5。

圖3 不同參數(shù)聚類對(duì)比圖

通過(guò) K-means聚類算法可以得到用戶居住地的 GPS數(shù)據(jù),再對(duì)數(shù)據(jù)糾偏,將聚類出來(lái)的GPS數(shù)值轉(zhuǎn)化為適配電子地圖的值。再通過(guò)電子地圖開(kāi)放平臺(tái)中的逆地理編碼API服務(wù)地址得到精確的地址,最后得出該地址周邊的居住小區(qū)。以高德地圖為例,將聚類后的GPS數(shù)據(jù)糾偏后,通過(guò)高德地圖開(kāi)放平臺(tái)的數(shù)據(jù)接口,實(shí)現(xiàn)逆地理編碼,得到用戶的居住地。

表2是采集分預(yù)測(cè)結(jié)果,可以看出,基于DBSCAN聚類和K-means聚類混合算法的用戶居住地預(yù)測(cè),可以精準(zhǔn)算出用戶居住地。對(duì)于整個(gè)數(shù)據(jù)采集樣本,整體的準(zhǔn)確度高達(dá)85%以上。

表2 用戶居住地預(yù)測(cè)結(jié)果

4 結(jié)論

本文基于DBSCAN聚類和K-means聚類混合算法設(shè)計(jì)了一種新能源汽車用戶居住地的預(yù)測(cè)模型,結(jié)合大數(shù)據(jù)能夠準(zhǔn)確預(yù)測(cè)用戶居住地,有效地解決無(wú)法獲取新能源汽車用戶居住地的難題,豐富了用戶畫(huà)像的標(biāo)簽種類,有助于營(yíng)銷推廣活動(dòng)制定。

猜你喜歡
新能源用戶
63%新能源二手車開(kāi)不滿5萬(wàn)公里就被賣掉
新能源汽車成為主流還需要多久?
海峽姐妹(2019年8期)2019-09-03 01:01:00
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
買不買新能源汽車
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
“新能源門”的背后
風(fēng)能(2015年4期)2015-02-27 10:14:36
順應(yīng)新能源發(fā)展趨勢(shì)
風(fēng)能(2015年4期)2015-02-27 10:14:34
Camera360:拍出5億用戶
100萬(wàn)用戶
主站蜘蛛池模板: 欧美一区二区丝袜高跟鞋| 国产内射一区亚洲| 国产午夜无码专区喷水| 波多野结衣无码视频在线观看| 亚洲色图欧美在线| 欧美另类精品一区二区三区| 日本尹人综合香蕉在线观看| 东京热一区二区三区无码视频| 九九热免费在线视频| 欧美国产日韩在线观看| 国产精品亚欧美一区二区三区| 九九热视频精品在线| 亚洲综合香蕉| 美女扒开下面流白浆在线试听| 国产流白浆视频| 国产一级妓女av网站| 国产成人乱无码视频| 综合五月天网| 欧美一区二区三区不卡免费| 四虎国产永久在线观看| 国产高清毛片| 日韩欧美国产三级| 97视频免费看| 免费无码AV片在线观看国产| 国产一级精品毛片基地| 91久草视频| 国产极品美女在线观看| 久久久波多野结衣av一区二区| a色毛片免费视频| 色欲不卡无码一区二区| 国产精品一区二区不卡的视频| 99久久国产综合精品女同| 久久一色本道亚洲| 超碰精品无码一区二区| 亚洲精品国产首次亮相| 欧美成人午夜影院| 久久综合九九亚洲一区| 乱人伦99久久| 亚洲免费福利视频| 亚洲性视频网站| 久久毛片基地| 91精品在线视频观看| 成年片色大黄全免费网站久久| 亚洲码在线中文在线观看| 无码aaa视频| 国产视频只有无码精品| 国产麻豆91网在线看| 亚洲综合亚洲国产尤物| 国产91视频免费| 97精品国产高清久久久久蜜芽| 色网站在线视频| 最新精品久久精品| 69av在线| 国产新AV天堂| 欧美中文字幕一区| 国产精品国产主播在线观看| 72种姿势欧美久久久久大黄蕉| 精品撒尿视频一区二区三区| 97国产精品视频自在拍| 国产主播一区二区三区| 国产午夜福利亚洲第一| 亚洲欧美综合精品久久成人网| 男女性午夜福利网站| 青青操国产| 国产网友愉拍精品视频| 日韩欧美中文在线| 无码久看视频| 国产aaaaa一级毛片| 亚洲欧美在线综合一区二区三区| 国产成人亚洲精品无码电影| 国产日本欧美在线观看| 国产在线麻豆波多野结衣| 99视频在线看| 亚洲精品无码抽插日韩| 美女被狂躁www在线观看| 久久青草免费91线频观看不卡| 91小视频在线| 国产极品粉嫩小泬免费看| 国产欧美日韩精品第二区| 国产丝袜91| 欧美精品啪啪一区二区三区| 亚洲成人免费看|