999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

情感分類器結合Norton模型預測汽車銷量

2021-03-04 07:36:13顧洪建張帆萬甜甜張衡
時代汽車 2021年3期

顧洪建 張帆 萬甜甜 張衡

摘 要:為了在“互聯網+大數據+人工智能+區塊鏈+物聯網”高度信息化的社會精準預測汽車銷量,本文首先利用詞圖、維特比等算法對汽車評價內容進行分詞操作來獲取關鍵詞語;其次利用樸素貝葉斯分類器的方法對分詞的結果進行計算,獲得每條評論內容的情感指數;再次利用Norton模型的三代產品模型結合情感指數來組成擬合模型,同時利用最小二乘原理估計擬合模型的參數;最后利用估計的參數結合某款汽車的評論數據以及每個季度的汽車銷量來驗證模型,驗證結果的準確性高達91.29%。基于此模型,企業可進行車型的銷量預測,為合理規劃生產和戰略布局提供參考和依據。

關鍵詞:詞圖 維特比 情感指數 樸素貝葉斯 Norton模型 最小二乘法

Sentiment Classifier Combined With Norton Model to Predict Car Sales

Gu Hongjian,Zhang Fan,Wan Tiantian,Zhang Heng

Abstract:In order to accurately predict the sales of cars in a highly informatized society of "Internet + Big Data + Artificial Intelligence + Blockchain + Internet of Things", this article first uses word graphs, Viterbi and other algorithms to segment the car evaluation content to obtain the keywords; secondly, the article uses the naive Bayes classifier method to calculate the result of word segmentation to obtain the sentiment index of each review content; thirdly the article uses the three-generation product model of the Norton model combined with the sentiment index to form a fitting model, while the principle of the square method is used to estimate the fifteen parameters of the fitting model; finally, the estimated parameters are combined with the review data of a certain car and the car sales of each quarter to verify the model; the accuracy of the verification results is as high as 91.29%. This model can basically meet the actual forecasting needs, and can provide reference and basis for the reasonable production planning of the enterprise.

Key words:word graph, Viterbi, sentiment index, naive Bayes, Norton model, least square method

1 引言

一直以來汽車都是我國國民經濟重要的支柱產業,改革開放以來,我國汽車產業快速發展,技術水平穩步增強,現已成為世界較大的汽車市場。精準的預測汽車銷量不但可以為汽車產業的營銷提供有力支撐,而且還有利于管理、生產、采購、物流等計劃流程的優化。此外,銷量預測還可以在一定程度上為車企獲得健康持續發展的源動力提供保證。從今年市場表現來看,在疫情最嚴重的2月,我國汽車行業的生產和銷售基本處于停滯狀態,成為拉低全國經濟指標的最主要因素。我國工業增長值同比增長速度和汽車同比增速及日均產量,均受疫情影響出現斷崖式的波動,因此精準預測汽車銷量對國民經濟健康有序發展具有一定的推動,對十四五規劃起到決定性作用[1-2]。

當下,人們以帖子、論觀點等形式表達和分享對各種主題的看法。這些評論和看法通常會透露出個人情感,例如幸福、憤怒、悲傷、批評和稱贊,并且潛在的消費者可以瀏覽產品的公眾意見,從而做出購買決定。在過去近十年里,網站評論內容傳達的情感已經通過情感分析技術轉化為正向評價(正向情感)和負向評價(負向情感)的二分類問題,進一步帶動了自然語言處理的發展與進步[3]。

Norton模型的誕生是以Bass模型為基礎,但是Norton模型更符合當前的市場,因為當新一代產品出生之后,老一代產品并不會立刻消失、消亡,它會和新產品共存一段時間,新一代產品的影響力是一個逐漸向四周擴散的過程。同時新一代產品的影響力影響力獲得包括兩個方面:一方面是從上代產品的影響力轉移過來,另一個方面是由于新產品本身的先進性而新創造的市場影響力。汽車產品的更新迭代非常符合這種趨勢,因此本文采用一種“情感分類器結合Norton模型預測汽車銷量”的方法來預測短時間內的汽車銷量。

2 研究路線

本文研究內容主要分為四個部分,第一部分是數據的采集以及數據的預處理;第二部分是利用機器學習方法對線上評論的數據進行情感分類(積極因素和消極因素);第三部分利用情感分類的結果結合Norton模型擬合新的模型;第四部分利用擬合后的模型對數據進行預測及分析,本文具體的結構圖如下圖1所示。

2.1 數據采集及預處理

2.1.1 數據采集

數據采集收集了兩種類型的數據,即評論數據和產品的歷史銷售數據。銷量數據可以在各個產品的官方網站或者國家統計局上面獲取。

2.1.2 分詞處理

對評論內容的分詞采用的方法是基于python語言結合詞圖、節點之間距離以及維特比算法來進行分詞,分詞結果如下表1所示。

2.1.3 篩選關鍵詞語的頻數

經過2.1.2小節分詞后,會存在很多無意義的詞存在,比如“的”、“呀”、“很”等詞語,然后對其余詞語進行詞頻統計,比如“我很喜歡這個車型,對里面的配置也很喜歡,開著它會讓我感到很快樂和高興,它是我的兄弟以及好朋友,我建議大家都可以來購買這個很不錯的車”這句話經過分詞處理以及剔除無意的詞語,最后得到的關鍵詞語詞頻如下圖2所示[3-5]。

2.1.4 確定情感詞語詞庫

要計算評論內容的情感分類要使用情感詞典,本文在眾多情感詞典中選用更具權威性的CNKI,即2007年10月22日知網發布“情感分析用詞語集(beta版)”的情感詞典,在本文中情感類別主要分為兩類(正面評價和負面評價)。

2.2 情感分類

在情感分類器中,選擇樸素貝葉斯作為情感分類器,樸素貝葉斯是一種概率型分類器,對一個評論內容來說,貝葉斯分類器會返回給后驗概率最大的情感類別,情感類別用表示,即C+和C-分別表示正面評價的類別和負面評價的類別。根據樸素貝葉斯原理,可以用如下公式計算每條口碑的情感類別[3-5],如下公式(1)所示。

(1)

如果有k條評論,那么公式(1)可以改為公式(2)。

(2)

假設通過每個時間段t需要計算評論情感,那么情感指數Q(t)由下式(3)計算:

(3)

其中,m為t時間段評論的次數,qtm經過樸素貝葉斯公式得到,sgn為二值化函數,如果c為-1,sgn(c)=-1;如果c為1,sgn(c)=1;Q(t)為計算后的情感指數。

2.3 擬合模型

擬合模型指的是利用2.2小節計算的情感指數結合Norton模型,利用最小二乘法估計的參數擬合模型,使得這組參數保證擬合的結果與實際結果的差值最小。

2.3.1 模型原理介紹

Norton模型是以Bass模型為基礎拓展起來的,Bass模型假定潛在的消費者可以分為兩類,即創新者和模仿者,并且Bass模型的一般形式如下:Bass模型一般形式如下式(4)所示:

(4)

其中,s(t)為時間段t結束時前消費者的數量,m是潛在購買量的總數, p表示創新群體系數(且0<=p<=1),q表示模仿群體系數(且0<=q<=1),公式(4)可以看出,知道了m、p、q的值,就可以預測t+1時間段內消費者的數量,因為s(t)不是產品的銷售量,但是可以根據消費者利用的頻率間接估算產品的銷售量,在現實生活中汽車是耐用消費品,因此此內容提取的情感時費者的數量可以視為產品銷售量[6-9]。

評論區指數可被可被用來表示消費者對該產品的個人偏好。如果該產品獲得消費者更多贊譽與肯定(正面評價),并且這種積極的肯定將影響潛在的消費者積極購買該產品;同樣如果該產品獲得了消費者的更多批評與否定(負面評價),并且這種消極的否定也會影響潛在的消費者放棄購買該產品,轉向其他的競品產品;因此模仿群體的購買決策時間會受到社會系統成員之間的相互影響。

基于上面分析可知模仿群體系數q與消費者對該產品的情感指數有關,因此模仿群體系數q可以看作是感指數Q(t)的函數,如下公式(5)所示。

q=f(Q(t)) (5)

Verhulst于1983年根據WOM理論提出來的模仿群體系數q與情感指數Q(t)呈現S型曲線,當情感指數Q(t)為正向評價時,q的值隨著Q(t)的增加而增大,并且 q的二階導數隨著Q(t)的增加先增加后減少;當情感指數Q(t)為負向評價時,q的值隨著Q(t)的增加而減小,并且q的二階導數隨著Q(t)的增加先增加后減少。

2.3.2 模型參數求解

2.3.1小節介紹了Norton模型的原理以及參數,本小節將介紹普通最小二乘法求解模型的參數,因為Norton模型是三代產品模型。普通最小二乘法(OLS)是回歸模型最根本的一個模型,并且它是一種數學優化模型,最小二乘法模型可以估計參數,從而簡單地求得該產品的銷量,并使得求出來的銷量與實際銷量之間誤差的平方和為最小,也就是所有觀測值到回歸模型之間的距離平方和最小。

2.4 預測分析

2.4.1 模型求解

汽車作為耐用消費產品,以此為例來說明此模型更具有魯棒性。網站收集了名稱為X的汽車產品量,該汽車產品共有三代。中將這三代產品命名為A產品,A+產品和A++產品。下圖3給出了X汽車產品3代的每個季度銷量的示意圖。

利用表4X汽車產品每個季度的銷量以及評論數據,帶入到以上小節的公式中,經過多次利用最小二乘法計算模型的參數。

2.4.2 預測結果分析

利用表5的參數以及模型,可以預測出X汽車產品第3代(A++產品)后五個季度的汽車銷量,然后該預測數據與實際數據相比較獲得模型的準確度。X汽車產品第3代(A++產品)預測銷量的誤差占實際銷量比例如圖4所示。

利用此模型預測的X汽車產品第3代(A++產品)的以后五個季度的汽車銷量的誤差都在8%-10%之內,五個季度的平均誤差為8.71%,基本可以給企業提出一些生產的建議,使企業在投入最小的資本獲得更大的利潤,同時帶動汽車產業進一步發展。

3 結語

本文基于樸素貝葉斯情感分類器結合Norton模型對某款型號汽車的三代產品進行分析,預測的結果平均誤差大約為8.71%,具有一定的指導作用。為了提高準確率,文本可以進一步擴大數據源,把抖音等數據結合起來計算;還可以提取線性支持向量機(SVM)情感分類器結合Norton模型預測銷量;并且采用深度學習技術求解模型參數,使得求解參數更加準確,預測結果更加符合實際。

參考文獻:

[1]D.Fantazzini and Z.Toktamysova, “Forecasting German car sales using Google data and multivariate models,”International Journal of Production Economics,vol.170,pp. 97-135,2015,http://dx.doi.org/10.1016/j.ijpe.2015.09.010.

[2]E.Cambria,Affective computing and sentiment analysis,IEEE Intell. Syst. 31(2)(2016)102-107.

[3]梁柯,李健,陳穎雪,劉志鋼.基于樸素貝葉斯的文本情感分類及實現[J].智能計算機與應用,2019,9(05):150-153+157. LIANG K,LI J,CHEN Y X,LIU Z.Text sentiment classification and realization based on Naive Bayes[J]. Intelligent Computers and Applications,2019,9(05):150-153+157.

[4]李丹陽.面向中文評論的情感分析方法研究[D].西安工業大學,2019.LI D Y. Research on sentiment analysis methods for Chinese comments [D].Xi'an Technological University,2019.

[5]葛霓琳.基于詞典和機器學習的酒店評論情感分析[D].江蘇科技大學,2019. GE N L. Sentiment analysis of hotel reviews based on dictionary and machine learning [D]. Jiangsu University of Science and Technology,2019.

[6]Zhi-Ping Fan,Yu-Jie Che,Zhen-Yu Chen. Product sales forecasting using online reviews and historical sales data:A method combining the Bass model and sentiment analysis[J]. Journal of Business Research,2017,74.

[7]https://baike.sogou.com/v200960.htm?fromTitle=%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95.

[8]劉丹丹,周躍進.基于偏最小二乘法結構方程模型的江蘇外資高質量評價研究[J].江蘇商論,2020(08):41-45+58. LIU D D, ZHOU Y J. Research on the high-quality evaluation of Jiangsu foreign capital based on partial least squares structural equation model[J]. Jiangsu Commercial Theory,2020(08):41-45+58.

[9]張妤,鄧廷勇,夏冰.基于LS-SVM的中文文本情感分類[J].科學技術創新,2019(26):56-57. ZHANG Y,DENG T Y,XIA B. Chinese text sentiment classification based on LS-SVM[J].Science and Technology Innovation,2019(26):56-57.

主站蜘蛛池模板: 欧美视频在线观看第一页| 成人韩免费网站| 美女潮喷出白浆在线观看视频| 69av在线| 国产高清不卡| 99精品视频九九精品| 欧美va亚洲va香蕉在线| 国产AV无码专区亚洲A∨毛片| 中文字幕资源站| 毛片网站在线看| 九色91在线视频| 亚洲妓女综合网995久久| 国产精品一区二区国产主播| 亚洲视频色图| 9966国产精品视频| 日韩精品亚洲一区中文字幕| 亚洲福利一区二区三区| 蜜臀AV在线播放| 精品国产黑色丝袜高跟鞋 | 午夜精品一区二区蜜桃| 婷婷激情五月网| 日韩精品免费一线在线观看| 怡春院欧美一区二区三区免费| 免费无码网站| 日韩AV无码免费一二三区 | 伊人婷婷色香五月综合缴缴情| 日韩高清成人| 国产不卡一级毛片视频| 亚洲福利网址| 亚洲无码精彩视频在线观看| 青青草原国产精品啪啪视频| 日韩av无码DVD| 幺女国产一级毛片| 欧美在线导航| 国产精品一区在线观看你懂的| 成人福利在线观看| 国产日韩精品一区在线不卡 | 五月天丁香婷婷综合久久| 久久夜色撩人精品国产| 在线日本国产成人免费的| 国产乱子伦一区二区=| 熟妇无码人妻| 中文字幕精品一区二区三区视频| 蜜桃臀无码内射一区二区三区| 国产精品欧美亚洲韩国日本不卡| 99九九成人免费视频精品| 亚洲无码37.| 国产成人精品视频一区二区电影| 亚洲国产精品成人久久综合影院| 亚洲天堂网在线播放| 久久婷婷人人澡人人爱91| 日日碰狠狠添天天爽| 中文天堂在线视频| 乱人伦视频中文字幕在线| 亚洲三级色| 少妇精品在线| 亚洲综合国产一区二区三区| 国产精品香蕉在线| 欧美日韩福利| 五月婷婷精品| 国产福利免费在线观看| 久操中文在线| 国产自无码视频在线观看| 亚洲色图另类| 欧美成人怡春院在线激情| 热九九精品| 丁香六月综合网| 久久毛片免费基地| 久久人体视频| 伊人色综合久久天天| 亚洲欧洲日产国产无码AV| 天天干伊人| 国产特级毛片aaaaaa| 综合色在线| 国产成人精品一区二区| 亚洲日韩高清在线亚洲专区| 中文字幕1区2区| 好紧好深好大乳无码中文字幕| 暴力调教一区二区三区| 日韩精品高清自在线| 久久精品中文字幕免费| 欧美成人aⅴ|