張家菊,林慧蘋
基于客服對話的產品和服務質量分析
張家菊,林慧蘋*
(北京大學 軟件與微電子學院,北京,102600)(?通信作者電子郵箱linhp@ss.pku.edu.cn)
現有的產品和服務質量分析常通過問卷調查或利用商品評論,但存在問卷收集難度大、商品評論中存在無效數據等問題。客服對話作為顧客與商家之間溝通的橋梁,包含了豐富的顧客意見,覆蓋了從產品到服務的多個方面,然而現在利用客服對話分析產品和服務質量的研究還較少。提出了一種基于客服對話的產品和服務質量分析方法,首先結合產品特征和服務藍圖,確定產品和服務質量的評價要素,并結合重要性?滿意度分析(IPA)法定義評價要素的重要性和滿意度指標;然后對客服對話進行主題提取和情感分析,定量分析產品和服務的重要性和滿意度。以某消毒除菌產品淘寶旗艦店的真實客服對話為例應用了該方法,建立了18個評價要素,并基于90余萬條真實的歷史客服對話對評價要素的重要性和滿意度進行了量化,從而分析旗艦店產品和服務的質量。最后通過對專業客服的問卷調研,驗證了所提方法的有效性。
客服對話;質量分析;重要性;滿意度;主題提取;情感分析
隨著企業競爭的日趨激烈,商家只有不斷提升自身產品和服務的質量,才能夠獲得顧客的青睞。因此,如何發現產品和服務中存在的問題,成為研究學者和商家共同關注的問題。
目前,人們常常通過向顧客發放調查問卷,從而獲得顧客對產品和服務的意見或建議。隨著自然語言處理技術的蓬勃發展,人們也不斷嘗試從商品評論文本中抽取用戶需求[1]、產品特征[2]以分析用戶對產品的偏好程度,或者來改進產品設計[3]。然而,采用問卷調研或者利用商品評論數據分析,存在一定的局限性:
1)問卷發放和收集難度大,難以全面收集問題。
2)商品評論中有關產品質量的評價較多,而涉及服務質量的評價較少,且相對集中于售后問題。
3)研究表明,受各種評論激勵策略的影響,商品評論中存在無效數據或虛假數據,容易對分析結果產生干擾[4]。
電商客服是顧客與店鋪溝通的橋梁,顧客在網購任何環節遇到問題,都會與客服溝通。因此,客服對話中包含了豐富的、有關產品和服務的“第一手”信息。與商品評論數據相比,客服對話數據具有如下的特點:
1)對話內容覆蓋范圍廣。客服對話貫穿網絡購物流程的所有環節,包含售前、售中、售后等各個階段。無論是對產品價格的疑惑,對產品的咨詢或不滿,還是對物流運輸速度的吐槽,都會在客服對話中有所提及。
2)蘊含豐富的顧客情緒。顧客在與客服溝通時往往非常直率,言語中包含大量的情感詞、語氣詞,能夠反映出顧客對產品和服務的態度。
3)數據真實性高。與商品評論常常受評論激勵策略影響不同,客服對話往往更能反映顧客對產品或服務的真實態度。
因此,基于客服對話數據分析產品和服務質量,是對基于問卷和基于商品評論進行分析的有益補充,具有積極意義。
目前,利用客服對話分析產品和服務質量的研究仍較少,研究面臨兩個挑戰:一是缺少相適應的評價體系;二是客服對話呈現為問答方式,且具有口語化嚴重、用詞多樣性高、文本長度較短等特點,經實驗發現傳統的隱含狄利克雷分布(Latent Dirichlet Allocation, LDA)等方法不適用于客服對話的主題提取。
本文利用主題提取技術和情感分析技術對客服對話進行挖掘,提出一種定量分析產品和服務質量的方法。首先,結合產品特征分析和服務特征分析,確定了面向產品特征和服務特征的評價要素,結合重要性?滿意度分析(Importance? Performance Analysis, IPA)理論定義了各評價要素重要性指標和滿意度指標;然后,采用基于CorEx模型的半監督主題提取方法和基于DialogueRNN模型的情感分析方法對客服對話進行挖掘,對重要性和滿意度指標進行量化;最后以某消毒除菌產品淘寶旗艦店一年的真實客服對話數據為例,對其產品和服務質量進行定量分析,并通過專家問卷調研,驗證了本文方法的有效性。
服務質量分析以服務質量SERVQUAL模型[5]應用最為廣泛,從設施、可靠性、響應性、保障性、情感投入等五個方面評價服務質量。在此基礎上,研究學者又進一步提出了擴展的服務績效(SERVPERF)模型[6]。這些模型通常以調查問卷量表的形式進行分析研究。
在評價指標的度量方面,加權方法、層次分析法(Analytic Hierarchy Process, AHP)等都是常用的方法。例如,賀可太等[7]針對云制造服務提出了一套從需求者利益和風險兩個方面建立的分級服務考核指標,并采用加權的方式進行量化。
對于產品質量的分析,除了問卷調研,研究學者們還基于產品評論數據集開展了廣泛的研究。例如,Qi等[1]和Chen等[8]都從在線評論中挖掘客戶對產品特征的意見,并和質量模型KNAO相結合,來優化產品策略。Kauffmann等[2]從產品評論中抽取出產品特征以及用戶對這些特征的情感態度,對產品特征打分,結合產品星級、情感評分、價格等其他指標綜合排名,幫助銷售經理和消費者進行決策。
大多數研究多關注產品或者服務單方面的質量。由于客服對話既包含產品咨詢信息,又包括對產品提供全過程服務的反饋,為同時分析兩者提供了可能。然而,現有的SERVQUAL、SERVPERF等模型中的評價維度不完全適用于客服對話分析。此外,針對產品和服務,也需要建立一套相對一致的指標體系。Martilla等[9]提出的重要性?滿意度分析(IPA)法在識別了識別評價要素后,從重要程度(Importance)和滿意度(Performance)兩個方面來衡量評價要素。該方法自提出以來,已經在餐飲業[10]、旅游業[11]、民航業[12]、金融業[13]等不同領域得到了廣泛的應用和驗證。因此,分別為產品和服務質量確定評價要素,采用重要性和滿意度指標,是同時分析產品和服務質量的一種可行途徑。
在主題提取技術方面,經典的主題模型有潛在語義分析(Latent Semantic Analysis, LSA)模型[14]、概率潛在語義分析(Probabilistic Latent Semantic Analysis, PLSA)模型[15]和LDA模型[16],其中,LDA模型應用廣泛。除經典LDA模型外,研究學者不斷提出適用于不同場景的LDA改進模型。例如,在短文本主題建模的場景下,Yan等[17]提出了詞對主題模型(Biterm Topic Model, BTM),使用詞對特征代替LDA模型中原有的單個詞特征。除了經典無監督模型,為了引導主題朝著預期的方向生成,研究學者們提出了多種半監督主題模型。例如Andrzejewski等[18-19]提出了兩種半監督主題模型。
Gallagher等[20]進一步提出了基于CorEx錨定詞的半監督主題模型,允許用戶預先定義一組或多組詞匯,并將詞匯錨定到一個或多個預定義的主題,從而引導主題朝著錨定詞的方向去生成。由于效果好,CorEx主題模型得到了廣泛應用,其中,錨定詞的生成是其應用效果的關鍵。
在情感分析技術方面,常用的方法有基于情感詞典與規則的方法、基于機器學習的方法和基于深度學習的方法;其中,基于深度學習的方法在近年來得到了廣泛應用。例如,Hameed等[21]將雙向長短期記憶(Bi?directional Long Short?Term Memory, BiLSTM)模型用于電影評論的情感極性分類,Yuan等[22]使用TextCNN模型對財經文本的情感極性進行分類,Biswas等[23]使用BERT(Bidirectional Encoder Representations from Transformers)模型識別StackOverflow上發帖人的情感,de Sousa等[24]將BERT模型應用到股票新聞的情感傾向性識別任務上,均獲得較好效果。
特別地,2019年Majumder等[25]提出了一個專門針對對話場景的情感分析模型——DialogueRNN模型。該模型核心思想是:說話者在某一時刻的情感不僅與當前的發言內容有關,還受到之前的發言內容和之前的情感狀態的影響。實驗結果表明,DialogueRNN模型在對話情感分析方面取得了較為理想的效果。
本文結合IPA理論、文本挖掘技術和情感分析技術,提出了一種利用客服對話數據定量評價產品和服務質量的方法。該方法分為評價體系建立和產品與服務定量分析兩個階段,分析流程如圖1所示。
圖1 產品和服務質量分析流程
這一階段的主要任務是確定產品和服務的質量評價要素和評價指標。
1)評價要素:經過與領域專家討論,產品質量的評價要素通常與其功能特征、制造特征和銷售特征相關。
a)功能特征:包括產品的功能、使用方法等與產品功能密切相關的評價要素。
b)制造特征:包括產品的生產日期、保質期等產品在制造過程中被賦予的要素。
c)銷售特征:包括產品的定價、優惠活動、銷售規格等產品在銷售過程中被賦予的要素。
服務質量的評價要素是指商家提供服務過程中涉及的因素,例如,商家發貨速度、快遞運輸速度等。本文面向服務過程,以Shostack[26]的研究為基礎,建立電商服務藍圖,如圖2所示,根據售前、售中、售后三個階段的服務接觸點來確定服務質量的評價要素:
a)售前階段:包括瀏覽商品時對商品問題的咨詢以及將商品加入購物車、提交訂單并支付訂單等一系列下單操作。因此,售前的服務質量評價要素為:對顧客咨詢的響應速度以及下單操作的快捷程度。
b)售中階段:包括商家揀貨發貨以及物流公司快遞運輸這兩個環節。因此,本階段評價要素為:商家發貨的及時性與發貨的正確性、物流運輸速度、終端配送服務水平以及商品簽收時的完好性。
c)售后階段:包括用戶發起售后申請。因此,本階段評價要素為:對用戶售后申請的響應性以及補償性。
圖2 電商服務藍圖
2)評價指標。評價指標包括重要性指標和滿意度指標。通過主題提取模型可以獲得每段對話的主題,進而根據顧客提及各產品服務要素的頻率,可以定量計算出要素的重要性得分。
其中:n表示要素k在全部對話語料中被提及的次數;表示對話語料庫中的總對話數量。
進一步地,以顧客的情感態度來表征滿意度。具體做法是:通過情感分析方法獲得每段對話的顧客情感,根據顧客提及各產品服務要素時的情緒,定量計算評價要素的滿意度得分。
在定量分析階段,利用主題提取和情感分析技術對客服對話進行挖掘,計算重要性指標和滿意度指標。
1)客服對話主題提取。
經過對比分析,本文采用基于CorEx模型的半監督主題提取客服對話主題詞。由于錨定詞集設定直接影響主題詞提取效果,因此本文結合產品和服務要素定義,提出一種錨定詞預設與擴展方法,如圖3所示。
a)錨定詞預設。依據產品和服務評價素以及各個要素的含義說明,人工地為每個要素給出1~5個關鍵詞,構成該主題的預設錨定詞集。
b)錨定詞擴展。基于真實的客服對話數據對預設錨定詞集進行擴充,使其能夠更好地反映客服語料特征。首先對客服語料進行分詞與詞性標注,篩選出詞性為名詞、動詞或形容詞、并且詞頻高于閾值的詞匯,構成候選錨定詞集。接著,計算候選錨定詞集中的詞匯與預設錨定詞的相似度,挑選出相似度高于閾值的候選詞匯,將其加入擴展錨定詞集。
c)主題提取。基于擴展的錨定詞集和CorEx半監督主題提取模型[20]從客服對話中提取出與產品和服務評價要素相一致的主題。
圖3 基于擴展錨定詞集的客服對話主題提取流程
2)客服對話情感分析。
客服對話上下文交互緊密,且對話語句較短,部分語句表意不明,上下文詞匯缺省問題嚴重,為此,本文采用適用于對話場景情感分析的DialogueRNN模型來計算對話的情感。
本文基于某經營消毒除菌產品的淘寶旗艦店所提供的真實客服對話開展應用研究。該旗艦店的產品主要包括消毒液、衣物除菌洗滌劑和除菌洗手液等。
本文收集了自2018年1月1日至2018年12月31日、為期一年的歷史客服對話數據,共包含25 734段對話,913 265條數據。其中,客服和顧客一次完整的對話記錄視為一段對話,每條發言記錄計為一條數據。
在分析評價之前,首先對數據進行了必要的預處理,包括數據脫敏、過濾無意義的過短對話、對話分詞、去停用詞等。
表1 某旗艦店的產品和服務質量評價要素定義
采用主題一致性作為評價指標,三種模型的實驗結果如圖4所示。實驗表明:當主題數量大于15時,CorEx半監督模型的主題一致性高于其他兩個模型,比BTM高約0.11,比LDA模型高約0.15。實際應用中,主題的數量與產品服務評價要素的數量一致,往往多于15(在本例中為18),因此CorEx模型是三者之中效果最優的。
圖4 不同主題模型的實驗結果對比
進一步地,統計客服對話中與各評價要素相關的對話數量,結果如表2所示。
為了驗證DialogueRNN模型的效果,以經典的BERT模型、BiLSTM模型和TextCNN模型作為基準,基于旗艦店真實對話數據設計對比實驗。模型參數設置如下:迭代次數epoch設置為30,batch_size設置為128,dropout_rate設置為0.05,Adam優化器的學習率設置為0.001。
采用精確率(Precision)、召回率(Recall)和F1值(F1-measure)值作為評價指標,四種模型的實驗結果如表3所示。由表3可知:與BiLSTM模型、TextCNN模型和BERT模型相比,DialogueRNN模型在面向客服對話的情感分析任務中表現最優。
使用基于DialogueRNN模型的客服對話情感分析方法獲得每個對話語句的滿意度得分。以k產品氣味為例,表4中展示了部分計算結果。滿意度得分越接近于1,說明顧客情緒越差;越接近于0,說明顧客情緒越好。
表2 各評價要素的對話數量
表3 不同情感分析模型的實驗結果對比
表4 對話滿意度得分計算結果示例
根據2.1節中的式(1)、(2),計算出各產品和服務評價要素的重要性得分和滿意度得分,結果如表5所示。
由實驗結果可知:
1)第一象限(右上)內,“產品價格”這個要素的值和值都非常大,這表明顧客對“產品價格”非常重視,且對當前的“產品價格”感到非常不滿意。結合主題提取方法所提取出的真實對話樣例,分析出顧客對“產品價格”感到不滿的主要原因是:剛買完就降價導致心理不平衡、經常購買的老顧客卻沒有得到專屬優惠、嫌棄產品價格太高等。
2)第二象限(左上)內,存在“產品氣味”“生產日期”“產品顏色”三個要素。表明關注這三個要素的顧客人數不多,但是非常不滿意。結合主題模型提取出的對話樣例分析發現,顧客對“產品氣味”的不滿主要是由于氣味太重、氣味刺鼻、氣味太沖等。顧客對“生產日期”的不滿主要體現在:生產日期太過久遠、在瓶身上找不到生產日期標識等。顧客對“產品顏色”的不滿主要體現在:消毒產品自帶的顏色容易污染白色衣物。
3)第三象限(左下)內,存在“產品包裝”“產品功效”“保質期”“產品規格”四個要素,屬于顧客提及較少且較為滿意的部分,商家無須刻意關注。
4)第四象限(右下)內,存在“產品用法”一個評價要素。結合具體語料發現,顧客提及“產品用法”時,主要與客服探討的是用法用量及適用環境,最后都會以感謝結尾,極少出現不滿情緒,商家只需繼續保持該優勢即可。
表5 各評價要素的重要性得分和滿意度的計算結果
圖5 產品質量的IPA象限圖
1)第一象限(右上)內,存在“貨品完好性”“運輸時效性”“發貨正確性”三個服務質量評價要素,表明A店鋪這三項服務的水平急需改進。結合具體語料分析發現,顧客對“貨物完好性”感到不滿的主要原因是:在快遞運輸過程中,經常發生包裝破損、瓶子碎裂、液體漏出等問題。顧客對“發貨正確性”感到不滿的主要原因是:貨物發錯、發少、與實際訂單不一致以及沒有附送贈品等問題。顧客對“運輸時效性”感到不滿的主要原因是:物流運輸速度慢、物流信息更新不及時等。
2)在第二象限(左上)內,存在“配送服務水平”“系統穩定性”兩個要素。結合語料分析,顧客對“配送服務水平”感到不滿的主要原因是:配送員的服務態度惡劣。顧客對“系統穩定性”感到不滿的主要原因是:某些操作按鈕點擊后無響應。由于該要素出現頻數極低,可能是由于顧客自身網絡環境差導致的,屬于極個別現象,暫時無須關注。
3)在第三象限(左下)內,存在“咨詢響應性”、“發貨及時性”、“補償性”三個要素,屬于顧客提及較少且較為滿意的部分,因此,無需刻意關注。
4)在第四象限(右下)內,存在“退換貨響應性”一個要素。售后服務質量較高,對顧客退換貨申請的處理較好。
圖6 服務質量的IPA象限圖
我們通過問卷調研的方式來檢驗分析結果是否有效。如果問卷發放給顧客,因評論顧客和問卷顧客的不同對檢驗會帶來影響,而專業客服對于顧客意見有著相對客觀、整體的認識,因此,邀請旗艦店46名專業客服填寫調查問卷,基于她們的工作經驗對本文提出的18個評價要素的重要性和滿意度給出評價。問卷設計為各評價要素重要性和滿意度的1~10分的矩陣量表。問卷結果收集回來后,對矩陣量表進行統計分析,并等比例映射到同一坐標系中,如圖7、8所示。
圖7 本文方法與問卷調研得到的重要性對比
分析表明,本文方法計算得到的重要性和滿意度指標與專家的經驗看法基本保持一致,這表明本文提出的基于客服對話的產品服務分析方法是有效的。
“產品氣味”滿意度的情感計算結果比問卷結果略好。與客服專家深入討論后發現,顧客在提及氣味時,往往是在抱怨氣味刺鼻,因此客服給出了較差的情緒。而在算法中,在做主題提取時,區分了抱怨氣味刺鼻的對話和咨詢產品香型的對話,顧客在咨詢產品香型時的情緒是較為中性的,綜合之后顧客對氣味的整體情緒得分比問卷結果略好。
圖8 本文方法與問卷調研得到的滿意度對比
本文基于客服對話,借助主題提取技術和情感分析技術,設計了一種產品和服務質量的定量分析方法,并在某企業真實場景下進行了應用驗證。結果表明,客服對話與評論相比,情緒表達更強烈。顧客遇到問題時,一般會找客服溝通;偶爾特別滿意時,也會向客服傾訴。因此,客服對話分析,比較適合于發現存在的問題,以及顧客特別滿意的方面,是對其他的方法,例如基于用戶評論的質量分析方法的有益補充。
[1] QI J Y, ZHANG Z P, JEON S, et al. Mining customer requirements from online reviews: a product improvement perspective[J]. Information and Management, 2016,53(8): 951-963.
[2] KAUFFMANN E, PERAL J, GIL D, et al. Managing marketing decision?making with sentiment analysis: an evaluation of the main product features using text data mining[J]. Sustainability, 2019, 11(15): No.4235.
[3] WANG Y, MO D Y, TSENG M M. Mapping customer needs to design parameters in the front end of product design by applying deep learning[J]. CIRP Annals — Manufacturing Technology, 2018, 67(1): 145-148.
[4] 李璐旸,秦兵,劉挺. 虛假評論檢測研究綜述[J]. 計算機學報, 2018, 41(4): 946-968.(LI L Y, QIN B, LIU T. Survey on fake review detection research[J]. Chinese Journal of Computers, 2018, 41(4): 946-968.)
[5] PARASURAMAN A, ZEITHAML V A, BERRY L L. A conceptual model of service quality and its implications for future research[J]. Journal of Marketing, 1985, 49(4):41-50
[6] CORNIN J J, Jr., TAYLOR S A. Measuring service quality: a reexamination and extension[J]. Journal of Marketing, 1992, 56(3):55-68.
[7] 賀可太,朱道云. 云制造服務質量評價[J]. 計算機集成制造系統, 2018, 24(1):53-62.(HE K T, ZHU D Y. Quality evaluation of cloud manufacturing service[J]. Computer Integrated Manufacturing Systems, 2018, 24(1):53-62.)
[8] CHEN D D, ZHANG D W, LIU A. Intelligent Kano classification of product features based on customer reviews[J]. CIRP Annals — Manufacturing Technology, 2019, 68(1):149-152.
[9] MARTILLA J A, JAMES J C. Importance?performance analysis[J]. Journal of Marketing, 1977, 41(1): 77-79.
[10] IRMA, RIDWAN M, KASIM K. Implementation of Importance Performance Analysis (IPA) towards the quality of duck products in a begos restaurant[J]. Hasanuddin Journal of Animal Science, 2020, 2(1): 34-42.
[11] LI S, XIAO Q. Classification and improvement strategy for design features of mobile tourist guide application: a Kano?IPA approach[J]. Mobile Information Systems, 2020, 2020: No.8816130.
[12] 孔祥芬,陳鵬. 改進的Kano模型和IPA模型的綜合應用探索——以民航航班延誤服務為例[J]. 工業工程, 2017, 20(3):9-14.(KONG X F, CHEN P. Comprehensive application of improved Kano model and IPA model — taking the civil aviation flight delay service as an example[J]. Industrial Engineering Journal, 2017, 20(3): 9-14.)
[13] MAZZA BASYA M, UTAMI B S A. Analisis SWOT dengan model Importance Performance Analysis (IPA) pada layanan fintech bank Syariah di Indonesia[J]. el?Qist: Journal of Islamic Economics and Business, 2020, 10(2): 179-191.
[14] LANDAUER T K, FOLTZ P W, LAHAM D. An introduction to latent semantic analysis[J]. Discourse Processes, 1998, 25(2/3): 259-284.
[15] HOFMANN T. Unsupervised learning by probabilistic latent semantic analysis[J]. Machine Learning, 2001, 42(1/2): 177-196.
[16] BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[17] YAN X H, GUO J F, LAN Y Y, et al. A biterm topic model for short texts[C]// Proceedings of the 22nd International Conference on World Wide Web. New York: ACM, 2013:1445-1456.
[18] ANDRZEJEWSKI D, ZHU X J, CRAVEN M. Incorporating domain knowledge into topic modeling via Dirichlet forest priors[C]// Proceedings of the 26th International Conference on Machine Learning. New York: ACM, 2009: 25-32.
[19] ANDRZEJEWSKI D, ZHU X J. Latent Dirichlet allocation with topic?in?set knowledge[C]// Proceedings of the NAACL HLT 2009 Workshop on Semi?Supervised Learning for Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2009: 43-48.
[20] GALLAGHER R J, REING K, KALE D, et al. Anchored correlation explanation: topic modeling with minimal domain knowledge[J]. Transactions of the Association for Computational Linguistics, 2017, 5: 529-542.
[21] HAMEED Z, GARCíA?ZAPIRAIN B. Sentiment classification using a single?layered BiLSTM model[J]. IEEE Access, 2020, 8: 73992-74001.
[22] YUAN X P, LI Y W, XUE Z, et al. Financial sentiment analysis based on pre?training and TextCNN[C]// Proceedings of the 2020 Chinese Intelligent Systems Conference, LNEE 706. Singapore: Springer, 2021: 48-56.
[23] BISWAS E, KARABULUT M E, POLLOCK L, et al. Achieving reliable sentiment analysis in the software engineering domain using BERT[C]// Proceedings of the 2020 IEEE International Conference on Software Maintenance and Evolution. Piscataway: IEEE, 2020: 162-173.
[24] DE SOUSA M G, SAKIYAMA K, RODRIGUES L D S, et al. BERT for stock market sentiment analysis[C]// Proceedings of the IEEE 31st International Conference on Tools with Artificial Intelligence. Piscataway: IEEE, 2019: 1589-1593.
[25] MAJUMDER N, PORIA S, HAZARIKA D, et al. DialogueRNN: an attentive RNN for emotion detection in conversations[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 6818-6825.
[26] LYNN SHOSTACK G. How to design a service[J]. European Journal of Marketing, 1982, 16(1):49-63.
Product and service quality analysis based on customer service dialogues
ZHANG Jiaju, LIN Huiping*
(,,102600,)
Existing product and service quality analysis is often based on questionnaire survey or product reviews, but there are problems such as difficulty in questionnaire collection and invalid data in product reviews. As a bridge between customers and businesses, the customer service dialogue contains rich customer opinions from product to service perspective, however, there are still few studies using customer service dialogues to analyze product and service quality. A product and service quality analysis method based on customer service dialogues was proposed, which firstly combined the product features and service blueprint to determine product and service quality evaluation factors, and used the Important?Performance Analysis (IPA) method to define the importance and performance index of evaluation factors. Then, quantitative analysis of the importance and satisfaction of products and services was performed by using the dialogue topic extraction and sentiment analysis. The method was applied on the real customer service dialogues of a Taobao flagship store which sells disinfection and sterilization products, and 18 evaluation factors were established, whose importance and performance were quantified based on more than 900 thousand real historical customer service dialogues, thereby analyzing the quality of products and services of the flagship store. Finally, a questionnaire on the professional customer service employees was carried out to verify the effectiveness of the proposed method.
customer service dialogue; quality analysis; importance; performance; topic extraction; sentiment analysis
This work is partially supported by National Key Research and Development Program of China (2018YFB1702900).
ZHANG Jiaju, born in 1996, M. S. candidate. Her research interests include data mining, service quality analysis, natural language processing
LIN Huiping, born in 1974, Ph. D., associate professor. Her research interests include data mining, intelligent manufacturing.
1001-9081(2022)11-3527-07
10.11772/j.issn.1001-9081.2022010073
2022?01?20;
2022?04?15;
2022?04?21。
國家重點研發計劃項目(2018YFB1702900)。
TP311
A
張家菊(1996—),女,吉林榆樹人,碩士研究生,主要研究方向:數據挖掘、服務質量分析、自然語言處理;林慧蘋(1974—),女,福建仙游人,副教授,博士,CCF會員,主要研究方向:數據挖掘、智能制造。