999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

樸素貝葉斯分類算法在提升電信客戶滿意度方面的研究應用

2019-03-25 08:13:18張聰慧
科技視界 2019年2期

張聰慧

【摘 要】針對電信客戶數據量龐大的特點,采用基于python語言的樸素貝葉斯分類算法,對電信客戶的投訴內容進行分類,以便在更短的時間內對客戶的投訴意見作出有效的處理,從而提高客戶的滿意度。

【關鍵詞】貝葉斯分類;多項式模型;高斯模型;伯努利模型

中圖分類號: TP23 文獻標識碼: A 文章編號: 2095-2457(2019)02-0122-002

【Abstract】In view of the huge amount of data of telecom customers, the naive Bayesian classification algorithm based on Python language is adopted to classify the complaints of telecom customers, so as to effectively deal with the complaints of customers in a shorter time, thereby improving customer satisfaction.

【Key words】Bayesian classification; Polynomial model; Gauss model; Bernoulli model

0 引言

樸素貝葉斯(Nave Bayes)是一種簡單但是實用性很強的分類模型,其構造基礎是貝葉斯理論。樸素貝葉斯模型有較強的特征條件獨立假設,被廣泛應用于海量文本分類任務。本文首先簡述貝葉斯分類算法的原理和常用的三種模型,然后基于Python編程語言和sklearn自帶的貝葉斯分類器對電信客戶的投訴內容進行分類,計算分類的準確率,并輸出投訴內容的分類結果,進而提高客戶的滿意度。

1 樸素貝葉斯分類算法原理簡述

1)樸素貝葉斯分類算法是貝葉斯分類算法的一種,它基于一個實例在給定類別值的條件下各特征屬性值間是相互獨立的,利用類別的先驗概率和樣本信息通過貝葉斯公式計算未知文本屬于某一類別的后驗概率,最大的后驗概率即為文本分類的判別結果。

2)樸素貝葉斯分類的原理:

3)樸素貝葉斯分類器是基于樸素貝葉斯理論的分類器,通常有三種實現方式,分別是基于多項式模型實現、基于高斯模型實現和基于伯努利模型實現。其中多項式模型主要用于文本的主題分類,會考慮單詞在文檔中出現的次數,而伯努利模型不考慮詞頻,只考慮這個單詞有沒有出現,假設詞是等權重的,主要用于文本情緒分析。

(1)多項式模型

使用多項式模型進行分類,假設N是樣本總數,k是總的類別個數,n是特征的維數,NYK是類別為yk的樣本的個數,N是類別為yk的樣本中第i維特征的值為xi的樣本的個數。多項式模型在計算先驗概率P和條件概率時P(x|y),會做一些平滑處理,設α是平滑值,則:

(2)高斯模型

高斯模型適用于輸入特征是連續(xù)值的隨機變量的情況,假設每一維特征都服從高斯分布(正態(tài)分布)。在高斯模型中,假設:y~Bernoulli(φ)=pφp1-φ

(3)伯努利模型

在伯努利模型中,每個特征的取值是布爾型的,即true和false,或者1和0。以文本分類為例,某個單詞在文檔中出現過,則其特征值為1,否則為0。當特征值為1時,條件概率的計算公式為:

2 程序設計

2.1 文本分類步驟包括

(1)文本預處理:對于中文文本分類來說,主要是分詞、去停用詞,然后隨機抽取部分文本作為訓練數據,剩余部分作為測試數據;(2)文本特征提取:特征權重計算,并保存特征化后的特征提取對象;(3)訓練分類器:建立分類器對象,并調整模型參數,利用經特征提取的訓練數據對分類器訓練、評估并保存;(4)待分類文本預處理:加載特征提取對象;(5)加載分類器,對測試樣本進行分類,輸出分類預測結果。

下面以基于多項式模型的python語言為例,對72243條電信客戶投訴文本進行分類。隨機抽取80%的數據作為訓練集,20%的數據作為測試集,進行文本特征提取,訓練分類器,進行評分并保存。

部分實現代碼如下:

2.2 實驗結果輸出

2.2.1 分類器評估

分類器評估結果輸出如圖1所示,分類的準確率可達到91.1%,后續(xù)將增大訓練樣本空間,優(yōu)化分類器參數,分類器的準確率可獲得進一步提高;

2.2.2 分類結果及應用

分類器的部分輸出結果如圖2所示,將客戶口語化的投訴內容,轉換成某種業(yè)務投訴分類的標準化類別,根據投訴內容對故障現象進行分類。基于樸素貝葉斯分類算法可準確分類的能力,配合前端語音識別系統,可在客戶服務系統中實現投訴內容的識別與預分類,從而按分類結果自動反饋處理建議,在提升用戶體驗和投訴處理效率的同時,也可節(jié)約人力成本;

3 結束語

基于樸素貝葉斯理論的貝葉斯分類器是一種常用的分類器,分類器利用已標注好的訓練文本訓練得到,然后對測試文本進行測試,求得文本屬于某個類別的概率。本來利用python語言和sklearn庫,實現了電信客戶投訴文本的自動分類,分類過程實現比較簡單,分類效果良好,能在較短的時間內對客戶的投訴作出處理,從而提高客戶的滿意度。

【參考文獻】

[1]蔣盛益,李霞,鄭琪著.數據挖掘原理與實踐[M].北京:電子工業(yè)出版社.2013.

主站蜘蛛池模板: 亚洲第一精品福利| 午夜国产在线观看| 亚洲欧美日韩中文字幕在线| 黄片在线永久| 午夜精品福利影院| 国产精品久久久久婷婷五月| 亚洲Aⅴ无码专区在线观看q| 欧美一区二区三区欧美日韩亚洲 | 成人av专区精品无码国产| 日韩无码视频专区| 色婷婷综合激情视频免费看| 国产流白浆视频| 国产福利小视频在线播放观看| 996免费视频国产在线播放| 爱做久久久久久| 国产午夜福利亚洲第一| V一区无码内射国产| 高h视频在线| 国产一区二区福利| 日韩小视频在线播放| 99国产精品免费观看视频| 无码福利视频| 欧美色伊人| 色婷婷电影网| 欧美国产日韩另类| 久久五月天国产自| 亚洲欧洲日本在线| 久青草国产高清在线视频| 中文字幕在线看| 亚洲综合精品香蕉久久网| 欧美日韩一区二区三区在线视频| 国产精选自拍| 波多野结衣久久高清免费| 思思热在线视频精品| 亚洲天堂视频网站| 最新无码专区超级碰碰碰| 亚洲中文字幕久久精品无码一区| 欧洲日本亚洲中文字幕| 国产精品丝袜视频| 日韩无码精品人妻| 国产亚洲视频在线观看| 大学生久久香蕉国产线观看| 亚洲伊人天堂| 真实国产乱子伦视频| h网址在线观看| 99精品国产自在现线观看| 欧美亚洲一二三区| 精品视频在线一区| 国产性猛交XXXX免费看| 99热最新网址| 久久综合亚洲鲁鲁九月天| 亚洲精品第一在线观看视频| 午夜激情婷婷| 国产91熟女高潮一区二区| 精品天海翼一区二区| 国产人人射| 久久精品视频一| 日本在线国产| 国产呦视频免费视频在线观看| 精品99在线观看| 无遮挡一级毛片呦女视频| av午夜福利一片免费看| 亚洲swag精品自拍一区| 亚洲第一成年网| 国产网友愉拍精品| 国产人成乱码视频免费观看| 国产免费久久精品99re不卡 | 欧美第九页| 国产男人的天堂| 成人亚洲国产| 日韩在线视频网站| 性色一区| 色播五月婷婷| 亚洲一级毛片在线观播放| 欧美精品在线观看视频| 久久久久人妻一区精品| 丝袜国产一区| 久久精品一品道久久精品| 日韩国产欧美精品在线| 色综合a怡红院怡红院首页| 久久久久免费精品国产| 欧美日韩国产精品va|