999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的新能源汽車用戶感知研究

2025-05-19 00:00:00曾若辰石鼎鑫
上海管理科學 2025年2期
關鍵詞:新能源分類消費者

Research on User Perception of New Energy Vehicles Based on Data Mining

ZENGRuochen1SHI Dingxin2 (1.SILC Business School, University, 2Ol8OO,China;2.SPDBank, 2OOl2O,China)

Abstract: Electric vehicle have shown explosive growth in recent years,but the growing electric vehicle industry has also led to many problems, such as uneven product quality and poor user experience. Therefore,in the increasingly competitive market, how to timely and accurately grasp the consumer demand,understand the consumer evaluation information on various aspects of the product,to bring better products and services for consumers is crucial. Traditional methods such as questionnaire surveys to obtain consumer demand and quality evaluation obviously can no longer meet the current needs. In this paper, the market information of electric vehicle was analyzed through data mining technology to explore user needs and pain points. The study finds that users’concerns about electric vehicle are mainly focused on cost-effectiveness,interior,space and other aspects.At the same time, the study also finds that users are generally more satisfied with the appearance of electric vehicle,and generally less satisfied with the comfort.

Key words: electric vehicle; data mining;user perception

0 引言

本文利用汽車網站中新能源汽車用戶的在線評論,從消費者的角度出發,基于產品的不同維度獲取用戶評論。通過聚類算法,將具有相似內容和特征的評論歸為一類,從而發現用戶關注的主題。進一步針對確定的主題,構建情感分類模型,并得出了用戶對新能源汽車感知不同維度的滿意程度以及關注程度。同時,通過對滿意度和關注度的相關性分析,研究揭示了消費者在購買新能源汽車過程中,可能面臨的挑戰和痛點。

1文獻綜述

針對新能源汽車用戶偏好和用戶感知方面的研究,國內外學者進行了廣泛的調查和實證分析。Bennett等(2016)對影響新能源汽車推廣的因素進行過探究;Jena(2020)基于印度電動汽車消費者數據,運用機器學習等方法進行了情感分析;Ferguson等(2018)利用加拿大消費者的調查結果,探究了消費者對電動汽車的態度和偏好程度;Singh等(2020)對現有文獻進行了元分析,進一步研究了購買新能源汽車的影響因素;余帆(2022)從8個維度出發,針對國內用戶評論進行了情感分析,研究發現,消費者對新能源汽車的購買意愿受到多種因素影響,如價格、續航里程、充電設施、環保意識等。

為深入挖掘用戶感知,不同研究采用情感分析和用戶畫像等方法對在線評論進行分析。情感分析主要通過自然語言處理技術,對用戶評論中的情感傾向進行量化分析。用戶畫像是通過挖掘用戶評論中的關鍵信息,構建用戶特征模型,以便更精確地了解用戶需求和喜好。通過數據挖掘技術,可以從海量數據中獲取描述用戶的標簽,這些用戶標簽被廣泛應用于推薦系統和產品運營(張彩紅等,2023)。

傳統汽油車用戶研究經過多年的積累和發展已經形成了比較完善的評價體系,例如中國汽車技術研究中心有限公司從2012年起已經連續7年開展汽油車消費者滿意度調研工作,從產品、銷售、售后三個方面,進行評價指標下沉,形成了完備的測量用戶滿意度的指標體系和研究模型。然而,新能源汽車與傳統汽油車在產品特性、使用情境、維修保養等方面存在著顯著差異。新能源汽車面臨著不同的市場環境和用戶群體。根據消費者行為學的理論,不同的用戶群體對產品滿意度的評判方式也不盡相同。因此,對于新能源汽車用戶滿意度的影響因素以及滿意度的影響機制,仍需要進一步深入研究。

過去的研究較多依賴于傳統的問卷調查和訪談等方式,而較少利用在線評論等大數據方法。此外,現有研究主要關注購買前消費者行為的影響因素,而較少對購買后行為和消費者滿意度的影響因素進行研究。相比之下,基于網絡評論的文本挖掘研究相對較少,即使在研究消費者滿意度的影響因素時,也很少對這些因素進行排序,以找出它們的重要程度。本文基于在線評論挖掘,深入研究新能源汽車用戶感知、用戶偏好、情感分類等方面。

2 研究方法

2.1數據采集與預處理

本文采用的數據來自頭部汽車垂直門戶網站的汽車用戶口碑數據。用戶可以在該網站上查找汽車相關的新聞、信息、評測以及購車指南等內容。同時,該網站也提供了用戶口碑評論的功能,讓用戶可以分享自己的購車、使用經驗以及對特定汽車的評價和看法。該網站的用戶口碑評論有以下特征:用戶口碑評論數量龐大,涉及的汽車品牌和車型繁多,覆蓋了幾乎所有的主流汽車品牌和車型;用戶口碑評論包含的內容多種多樣,包括購車經驗、車輛性能、外觀設計、內飾配置、油耗表現、車輛故障、售后服務等方面。

為了收集新能源汽車的用戶評論,本文采用爬蟲技術,從目標網站收集相關數據。我們設置目標車型ID,以便針對特定新能源汽車品牌和型號抓取用戶評論,目標涉及市面主流新能源汽車品牌與型號。

本文共采集到16900余條關于新能源汽車的用戶評論,包括用戶對于各個新能源車系的各個車型的具體評價。數據內容主要是“車系、滿意一評論詳情、不滿意一評論詳情、空間一評論詳情、駕駛感受一評論詳情、續航一評論詳情、外觀一評論詳情、內飾一評論詳情、性價比一評論詳情、操控一評論詳情、舒適性一評論詳情、智能化一評論詳情”。其中“最滿意一評論詳情”與“最不滿意一評論詳情”代表了用戶對于該款車系最強烈的正面與負面評價。而“空間一評論詳情、駕駛感受一評論詳情、續航一評論詳情、外觀一評論詳情、內飾一評論詳情、性價比一評論詳情、操控一評論詳情、舒適性一評論詳情、智能化一評論詳情”則是用戶對于車系這些具體方面的評價。

對數據進行預處理主要包括分詞、去除空值和選取停用詞。首先是去除一些常見的停用詞,比如數字、符號,同時還包括一些無意義的語氣詞和一些不包含信息量的詞匯,比如“新能源”“車子”等,因此將這些無關的主題詞加入停用詞。根據采集的數據集特性,數據標注主要分為兩類:第一類是標注為“最滿意”和“最不滿意”的評論數據;第二類是標注為“空間、駕駛感受、續航、外觀、內飾、性價比、操控、舒適性和智能化”這些指標的評論數據。通過使用第二類標簽的數據集訓練情感分類模型,然后使用訓練好的模型對標注“滿意”與“不滿意”兩個標簽的口碑數據進行分類,得到用戶對新能源汽車各個方面的具體滿意程度以及關注程度。

2.2主題聚類及情感分類模型

LDA(LatentDirichletAllocation)是一種基于概率分布的主題模型,主要用于從大量文檔中提取潛在主題。LDA的基本思想是認為文檔是由多個主題組成的,而每個主題則是由多個詞匯組成的。通過LDA模型,可以獲得文檔中的潛在主題。本文使用LDA聚類模型對標注為“滿意/不滿意”的在線評論數據進行聚類,通過主題詞判斷需要研究的指標。LDA模型可以有效地幫助發現用戶評論中的關鍵主題,從而指導后續的情感分析研究。

在情感分析中,本文根據主題詞篩選出相關評論,然后利用機器學習方法訓練模型,以實現對評論情感的自動分類。我們采用三種模型包括樸素貝葉斯、TextCNN和MLP(多層感知器)來進行預測,最后通過投票分類的策略得到最終結果。樸素貝葉斯分類器是基于貝葉斯定理的一種分類方法,具有簡潔、訓練速度快的特性。TextCNN是一種基于卷積神經網絡(CNN)的文本分類模型,TextCNN能夠自動捕捉文本的局部特征,提取有用的信息,降低了特征工程的復雜性并且其訓練速度較快,適用于大規模數據集。MLP是一種多層感知機模型,屬于前饋神經網絡的一種。MLP能夠捕捉數據中的非線性關系,適用于復雜問題,并且通過增加網絡層數和神經元數量,可以更準確地挖掘評論中的潛在信息。為了綜合利用三個模型的優點,本文采用了投票分類的策略,將三種模型預測結果作為投票分類器的輸入得出最后的結果。投票分類是一種集成學習方法,它依賴于不同的機器學習模型進行預測,并根據所有模型的預測結果進行投票。具體步驟是將每一條評論都使用三個模型進行預測,三個模型會分別給出每條評論屬于每個分類維度的概率,然后將三個模型給出的概率加權平均,就能得出最終的每條評論屬于每個分類維度的概率。通過采用投票分類的方式,我們可以充分利用各種模型的優勢,避免依賴單一模型可能帶來的風險,從而在新能源汽車用戶感知的研究中獲得更準確和全面的結果。

2.3 模型構建

本文使用Gensim庫構建詞典和語料庫訓練LDA模型。為了確定最佳的主題數量,我們采用了一致性評分來評估不同主題數量下LDA模型的表現。嘗試了從1到10的主題數量,并計算了對應的一致性評分。這個過程涉及了對每種主題數量下的LDA模型進行訓練,并使用CoherenceModel計算對應的一致性評分。通過圖1一致性評分與主題數量之間的關系,可發現當主題數量為9時,一致性評分達到最高。

圖1一致性評分曲線

樸素貝葉斯分類模型構建

本文采用CountVectorizer將文本轉換為詞頻矩陣表示。CountVectorizer會計算每個單詞在文檔中出現的次數,并生成一個稀疏矩陣。這種表示方法可以有效地將文本數據轉換為適合樸素貝葉斯分類器處理的數值格式。為了評估模型的性能,我們將數據集劃分為訓練集( 80% 和測試集0 20% )。為確保訓練集和測試集的類別分布與總體相似,我們采用了分層抽樣的方法進行劃分。對于超參數的選取,通過分析訓練集和測試集的準確率隨alpha變化的曲線,我們確定了最佳的alpha值為O.3。基于選定alpha值,構建MultinomialNB分類器,并使用訓練集對其進行了訓練。

TextCNN分類模型構建

通過構建詞匯表,將每個詞映射為一個唯一的整數值。詞匯表的構建是通過統計所有文本中出現的詞及其頻率來實現的。進一步定義了一個將文本轉換為固定長度整數序列的函數,以便將其輸入到TextCNN模型中。在本研究中,我們將 20% 的數據劃分為測試集,剩余的 80% 用于訓練。TextCNN模型的關鍵超參數包括詞向量維度、類別數、卷積核數量、卷積核尺寸以及Dropout比率。分別設置這些超參數為128、9、100、[3,4,5]和0.5。此外,我們還設置了學習率為0.001、批處理大小為64以及訓練輪數為10。在TextCNN類的構造函數中,我們創建了詞嵌入層、卷積層列表、Dropout層和全連接層。根據上述超參數構建了TextCNN模型。圖2展示了訓練模型的準確率。

MLP分類模型構建

使用TF—IDF(Term Frequency—InverseDocumentFrequency)特征提取方法將文本轉換為稀疏矩陣表示。TF一IDF是一種常用于文本挖掘的特征權重計算方法,它考慮了詞匯在文檔中的頻率以及在整個語料庫中的逆文檔頻率。這種表示方式可以有效地將文本數據轉換為適合多層感知機(MLP)分類器處理的數值格式。將 20% 的數據劃分為測試集,剩余的 80% 用于訓練。本文使用sklearn庫構建了一個MLP分類器,其中包含兩個隱藏層(分別包含64個和32個神經元),激活函數為ReLU,優化器為Adam。在訓練過程中,我們還使用了 10% 的驗證集來監控模型性能并防止過擬合。

圖2模型準確率曲線

投票分類器構建

首先加載預訓練好的樸素貝葉斯、TextCNN和MLP模型,以及它們對應的特征提取器。接著,對于每個輸入的文本,我們分別用三個模型進行預測,并得到它們的分類概率。然后將這三個模型的概率結果加權平均,得到最終的概率分布。這種方法能夠充分利用不同模型的特點,增強整體分類性能。

此外,在“滿意”與“不滿意\"的評論數據當中,未必只設計“空間、駕駛感受、續航、外觀、內飾、性價比、操控、舒適性和智能化\"當中的單獨一類,同一條“滿意\"或者“不滿意\"的評論當中,可能同時涉及“空間、駕駛感受、續航、外觀、內飾、性價比、操控、舒適性和智能化\"當中的多個類型。而傳統的單標簽分類方法可能無法充分捕捉這種多樣性。為了更準確地反映評論中包含的各個方面,我們決定采用基于概率的分類方法。在分類過程中,我們設置了0.3的閾值。如果數據落在一個類當中的概率超過0.3,則歸為這個類。也就是說一個數據可能被歸為多個類,在計算不同類的滿意度時,這樣的數據會被重復計算。

3 結果與討論

3.1 聚類結果

通過構建LDA模型,我們將評論數據聚類為不同的主題并獲取了相應的主題詞。通過對主題詞的研究與歸納,分析了主題詞與評論類型的內在邏輯聯系,同時抽選了數條評論進行對比。我們發現這些主題詞可以與特定類型的評論相對應。表1顯示了聚類主題詞與對應評論類型。新能源汽車用戶在撰寫在線評論時,主要關注車輛的空間、駕駛感受、續航、外觀、內飾、性價比、操控、舒適性和智能化等方面。這些方面反映了用戶在評價新能源汽車時的核心關切點。

表1聚類主題詞與對應評論類型

3.2 分類結果

圖3展示了各分類維度的總體滿意度。

圖3各分類維度總體滿意度

在所有車系的綜合評價中,外觀和性價比方面的總體滿意度最高。這意味著消費者對新能源汽車的外觀設計大體上感到滿意,新能源汽車通常具有獨特的設計和形象,相比傳統燃油車更顯新穎和個性。性價比的高滿意度則表明,消費者普遍認為新能源汽車在價格、配置和性能方面達到了較好的平衡。緊隨其后的是駕駛感受,得益于新能源汽車的加速性能、穩定性等因素,消費者在駕駛新能源汽車時體驗較滿意。續航和智能化的滿意度也相對較高,反映了新能源汽車在這些領域取得的進展符合消費者期望。

然而,操控、空間、內飾、舒適性等方面的滿意度較低,其中舒適性的滿意度最低。這意味著新能源汽車在舒適性方面存在相當大的提升空間。對于新能源汽車來說,座椅舒適度、噪聲控制和乘坐空間等因素的表現顯然還有待提升。同時,內飾和空間的滿意度也相對較低,這可能說明消費者對新能源汽車在這些方面的表現有更高的期待。

圖4展示了各分類的關注度,關注度按分類評論的個數來判別。消費者在評價新能源汽車時,關注度的排名如下:性價比、內飾、空間、續航、外觀、智能化、舒適性和駕駛感受,最后是操控。

圖4各分類關注度

性價比是消費者在評價新能源汽車時最為重視的部分。其次是內飾,消費者對新能源汽車的內部裝飾和設計有著顯著的關注。接下來是空間,消費者關心新能源汽車的內部空間,這包括乘坐空間和儲物空間。足夠的空間可以提供更高的舒適度和實用性,無論是日常通勤還是長途旅行,都能滿足消費者的需求;續航能力也是消費者的一大關注點,尤其是對于電動汽車來說,足夠的續航里程能減少充電次數,提高使用便利性。同時,消費者也關心充電設施的便利程度,包括充電站的分布、充電速度等。舒適性和駕駛感受的關注度接近,消費者希望新能源汽車在行駛過程中提供穩定且舒適的駕駛體驗。操控性是消費者關注最低的一項。

綜合以上分析,我們可以看出,雖然消費者在選擇新能源汽車時關注的重點各有不同,但他們共同關心的是汽車的整體性能和價值。

4總結

本文采集并分析了新能源汽車用戶在線評論數據,利用了LDA聚類模型、樸素貝葉斯、TextCNN和MLP等多種情感分類模型,旨在深入挖掘消費者對新能源汽車不同方面的滿意程度以及對新能源汽車不同方面的重視程度。

首先,通過LDA主題聚類,研究發現用戶的關注度主要集中在新能源汽車的性價比、內飾、空間和續航等方面,而對于操控等方面的關注度相對較低。

其次,通過用戶的評價滿意度分類,研究發現在新能源汽車的各個方面中,外觀獲得了最高的滿意度,而舒適性的滿意度最低。這意味著當前的新能源汽車市場在外觀設計方面已經滿足用戶需求,但在舒適性方面仍有很大的提升空間。

本研究揭示了消費者對新能源汽車的真實需求和期望,為汽車制造商提供了有益建議。此外,本研究還提供了解市場動態和消費者行為變化的重要途徑。通過對新能源汽車用戶評論的情感分析,揭示了消費者對新能源汽車不同方面的滿意程度以及對新能源汽車不同方面的重視程度。這些發現對于汽車制造商、政府和企業制定更加合理有效的產品改進策略、市場推廣策略以及政策支持措施具有重要指導意義。

參考文獻

[1] 涂宇,牛盼強.碳中和背景下上海車展助力汽車產業新能 源化路徑研究[J].上海管理科學,2023,45(01):50-53.

[2] BENNETT R,KOTTASZ R,SHAWS.Factorspoten tiallyaffecting the successful promotion of electric vehicles [J]. Journal of Social Marketing,2016.

[3] JENAR.An empirical case study on Indian consumers’sentiment towards electric vehicles:A big data analytics approach [J].Industrial Marketing Management,2O2O,9O:605-616.

[4] FERGUSONM,MOHAMED M,HIGGINSCD,etal. Howopenare Canadianhouseholdsto electricvehicles?A na tional latent class choice analysis with willingness-to-pay and metropolitan characterization[J]. Transportation Research PartD: Transport and Environment,2018,58:208-224.

[5] SINGHV,VAIBHAV S.A reviewand simplemeta-analysis offactors influencing adoption of electric vehicles[J].Trans portation Research Part D: Transport and Environment, 2020,86:102436.

[6] 余帆.基于文本挖掘的新能源轎車用戶情感分析[J].物流工 程與管理,2022,44(1):137-140.

[7] 張彩紅,李想,周雪俠,等.基于情感分析的突發公共衛生事 件微博評論用戶畫像構建[J].醫學信息學雜志,2023,44(3): 18-22.

猜你喜歡
新能源分類消費者
分類算一算
消費者網上購物六注意
今日農業(2020年20期)2020-12-15 15:53:19
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
知識付費消費者
買不買新能源汽車
悄悄偷走消費者的創意
悄悄偷走消費者的創意
“新能源門”的背后
風能(2015年4期)2015-02-27 10:14:36
主站蜘蛛池模板: 草草影院国产第一页| 国产地址二永久伊甸园| 香蕉视频在线观看www| 亚洲视频免费在线| 青青草国产一区二区三区| 亚洲国产亚综合在线区| 亚洲国产精品日韩欧美一区| 亚洲成人动漫在线观看| 亚洲精品桃花岛av在线| 91在线精品麻豆欧美在线| 狠狠色丁香婷婷综合| 精品国产乱码久久久久久一区二区| 欧美日韩精品一区二区视频| 国产va欧美va在线观看| 国产成人高清在线精品| 啊嗯不日本网站| 国产一级毛片yw| 亚洲 日韩 激情 无码 中出| 99这里精品| 日韩国产欧美精品在线| 亚洲日韩精品欧美中文字幕| 热99re99首页精品亚洲五月天| 乱人伦99久久| 91精品啪在线观看国产91九色| 日韩毛片免费视频| 久久精品视频一| 欧美特黄一级大黄录像| 另类欧美日韩| 毛片网站观看| 亚洲av日韩av制服丝袜| 嫩草国产在线| 88国产经典欧美一区二区三区| 亚洲人成亚洲精品| 久久综合成人| 精品国产一区二区三区在线观看| 人与鲁专区| 在线综合亚洲欧美网站| 国产精品午夜福利麻豆| 台湾AV国片精品女同性| 91青青草视频| 国产成人h在线观看网站站| 亚洲综合国产一区二区三区| 91色爱欧美精品www| 国产综合亚洲欧洲区精品无码| 午夜天堂视频| 精品久久久无码专区中文字幕| 久草视频福利在线观看| 亚洲视频二| 国产网友愉拍精品视频| 欧美、日韩、国产综合一区| 国产成人亚洲精品无码电影| 国产日本欧美在线观看| 国产在线麻豆波多野结衣| 国产成本人片免费a∨短片| 亚洲综合18p| 国产超薄肉色丝袜网站| 欧美一级一级做性视频| 高清国产在线| 国产精品污视频| 国产激情无码一区二区APP| 国产欧美视频综合二区| 又大又硬又爽免费视频| 亚洲成a人片7777| 中文字幕欧美日韩高清| 久久精品这里只有精99品| 国产好痛疼轻点好爽的视频| 欧美在线精品怡红院| 亚洲va视频| 国产一级毛片网站| 丰满人妻中出白浆| 色135综合网| 免费一级全黄少妇性色生活片| 午夜福利无码一区二区| 国产精品白浆无码流出在线看| 国产玖玖视频| 亚洲成a人在线观看| 四虎影视永久在线精品| 午夜福利在线观看入口| 制服丝袜一区| 在线精品欧美日韩| 免费看的一级毛片| 国产麻豆va精品视频|