999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

顧客網絡購物滿意度影響因素的文本挖掘與主題提取研究

2022-06-28 02:56:16何有世溫玉美
軟件導刊 2022年6期
關鍵詞:文本滿意度模型

何有世,溫玉美

(江蘇大學管理學院,江蘇鎮江 212013)

0 引言

近年來,隨著電子商務與互聯網技術的不斷發展,網絡購物已成為消費者購物的主要方式之一。2021 年中國互聯網信息中心發布的第47 次《中國互聯網絡發展狀況統計報告》顯示,2020 年我國網上零售額達11.76 萬億元,同比增長10.9%,其中實物商品的網上零售額達9.76 萬億元,占社會消費品零售總額的24.9%[1]。由此可見,我國網絡購物的市場規模在不斷擴大,電子商務成為眾多企業和商家必選的營銷渠道,競爭日益激烈。然而,用戶滿意度是消費者購買的決定性因素[2],因此研究影響顧客網絡購物滿意度因素則顯得愈發重要。

據2021 年《中國電子商務用戶體驗與投訴數據報告》顯示,退款問題、商品質量、網絡欺詐、售后服務、網絡售假、虛假促銷等是零售商被投訴的主要原因[3]。由此可見,網絡購物中存在諸多影響顧客購物滿意度的問題。消費者負面的網購體驗,一方面影響了其回購的可能性,另一方面易于使其產生負面影響。當顧客購物滿意度較高時,極可能向周圍朋友推薦產品,從而間接宣傳了產品和商家[4]。因此,研究顧客購物滿意度與何種因素相關,并進一步分析其中的核心因素,可幫助企業、商家獲取消費者的信任,制定相應的營銷策略,對提高市場競爭力具有重要意義。

隨著城市化和工業化進程的加快,農村大量年輕勞動力涌向城鎮,常住居民中老年人口數量相對較多,人口老齡化現象嚴重。尤其是丘陵山區村莊,常住人口以老年人為主,亟待建設養老設施[8]。此外,村級日間照料中心設置較少,沒有形成一定的規模。

實驗不僅是生命觀念和科學思維的實踐,也是培養社會責任的途徑。“模擬尿糖的檢測”中有一個問題: 醫生僅憑一份尿液樣本就能斷定某人患糖尿病嗎?意在引導學生基于生物學的認識,參與個人與社會事物的討論,并作出理性解釋和判斷。教師可引導學生進行充分討論,并達成統一認識: 僅憑一份尿液樣本不能斷定某人患糖尿病,食糖過多使血糖暫時過高,也會導致尿液中暫時出現葡萄糖。從而理解任何確診或治療決策都不能基于某一單項檢測結果。此外,通過關注糖尿病,鼓勵學生宣傳關愛生命的觀念和知識,崇尚健康的生活方式。再如在“種群的特征”的教學中,引導學生從年齡結構的角度解讀全面二胎政策,關注社會議題。

目前,各網絡購物平臺都具有用戶評論功能,消費者會對網購后的購買經歷、產品質量、售前服務、物流、售后服務等方面進行評論[5]。這些評論客觀反映消費者網購體驗]的同時,提供了海量數據[6-7。隨著文本挖掘技術的不斷發展,學者們開始運用LDA(Latent Dirichlet Alloca?tion)模型識別在線評論的主題,挖掘消費者的真實需求。通過LDA 模型提取評論主題不但體現了消費者的偏好特征[8-9],并且反映了消費者在消費體驗過程中的關注重點[10],因此部分學者將在線評論主題作為影響顧客滿意度的重要因素。Guo 等[11]運用LDA 模型從在線評論中提取酒店顧客滿意度影響因素。Situmean 等[12]通過LDA 模型挖掘影響餐廳顧客滿意度的重要因素。馮坤等[13]將LDA模型提取在線評論主題作為影響生鮮電商滿意度的重要因素。此外,相較于傳統顧客滿意度調查方法,采集在線評論不受時間、人工成本等因素影響。鑒于此,本文通過采集顧客的在線評論,運用LDA 模型識別顧客在線評論主題,提取網絡購物滿意度的影響因素。

1 相關工作

目前關于網絡購物顧客滿意度影響因素的研究中,大多從實證研究角度,通過問卷調查、文獻調研、訪談等方式收集數據開展研究。例如,Agnihotri 等[14]通過問卷調查方式搜集在線客服的相關數據,研究在線客服與客戶之間的溝通對顧客滿意度的影響。孫永波等[15]采用小組座談和文獻分析法總結消費者對網絡商店滿意度的影響因素。然而,隨著互聯網和電子商務的不斷發展,在線評論系統成為了企業與客戶交流的重要工具[16-17],逐漸被學術界所重視。少部分學者通過不同研究方法,從顧客在線評論中提取影響顧客滿意度因素。例如,李玉萍等[18]通過內容分析法對顧客的在線評論進行編碼分析,提取了影響顧客滿意度因素包括質量、顧客期望、顧客成本、產品描述、尺碼、賣家服務、物流服務和社會價值。

綜上所述,目前相關研究僅從理論角度出發研究影響顧客網購滿意度因素,忽視了顧客在線評論往往直接反映了顧客網絡購物滿意度。雖有學者采用內容分析法對顧客在線評論進行編碼分析,研究影響顧客購物滿意度因素。但在大數據時代背景下,面對海量在線顧客評論,該方法需要耗費大量的人力和時間,效率較低。而LDA 模型可將非結構化的文本轉化為數字信息,易于文本建模,提高了數據處理效率,因此采用LDA 文本挖掘方法,從顧客網購評論中提取影響顧客滿意度的相關因素。

2 LDA主題模型應用原理

在Hofmann[19]提出概率潛在語義分析(Probabilistic Latent Semantic Analysis,PLSA)模型的基礎上,Blei 等[20]于2003 年提出了LDA 主題模型,推測文檔的主題分布。目前主題模型已成為文本挖掘的重要技術之一,并廣泛應用于數據挖掘、文本分類聚類、自然語言處理等領域。該模型將主題作為單詞的概率分布,通過提取單詞在文檔的共現信息與文檔語義相關的主題,并將所有文檔主題以概率分布的形式顯示,然后抽取部分文檔主題進行聚類。在該過程中,LDA 主題模型實現了從高維單詞空間到低維主題空間的映射[21],可有效實現文本降維,提取文本主題內容,生成文檔——主題矩陣與主題——詞匯矩陣,為客觀研究顧客滿意度影響因素提供了技術支撐,同時企業或商家能夠深入了解顧客的消費偏好。LDA 主題模型的圖模型如圖1所示。

Fig.1 Graph model of LDA topic model圖1 LDA主題模型的圖模型

②高壓水泵用于將清水壓入孔內,啟動壓力大于20pa。向缺陷中從頂部到底部噴射水流。噴管提升速度為10cm/min,轉速為20r/min。處理長度應為缺陷處上下50cm,高壓水流將灌樁的缺陷部分切割成泥漿狀。當切開一個孔而另一個孔溢出時,可以確定缺陷處已經被擊通。然后換另個一孔直到全部打通位置,在所有鉆孔連通后,通過水循環從樁體排出內部廢渣。當所有孔中的水流變成清水時,表明完成廢渣的清洗工作。

一般將困惑度(perplexity)作為主題模型泛化能力的評價標準[20],困惑度較低表明該模型具有良好的泛化能力,效果較好。假設文本語料庫中有M個測試文檔,其中文檔d中含有Nd個單詞,測試集中每個單詞出現的概率為p(w),則模型的困惑度計算公式如式(1)所示:

3 研究思路

在自然語言處理中,連詞、助詞、介詞等統稱為停用詞。由圖3 可見,“這個”“而且”“還是”的字體較大,表明該類詞的詞頻較高,不僅占用了大量的存儲空間,還影響數據的處理效率。因此,需要去除高頻且有效信息較少的詞語。本文通過對哈工大停用詞詞庫、百度停用詞詞表、四川大學機器學習智能實驗室停用詞庫等常見停用詞詞庫進行整合,提取了一個較為全面的停用詞詞表。

本文采用結巴中文分詞工具對采集的評論數據進行分詞處理,然而結巴自帶的字典僅適用于普通文本,由于電商評論存在領域內的特殊詞匯,導致結巴分詞的準確度下降。為此構建了自定義詞典,其中添加了“京東物流”“服務態度”“運行速度”等特殊詞語。然而顧客在評論時,通常會使用口語化的表述,例如:“物流特別快”“特別給力”等,此時分詞器將無法進行識別,因此要將該類詞手工添加到詞典中,并對評論文本中意思相近的詞進行整合。例如,將“商家”“店家”“店鋪”“賣家”統稱為“商家”,將“快遞員”“快遞小哥”“小哥”“配送員”統稱為“快遞員”等。分詞后通過如圖3 所示的詞云形式對詞頻排列在前50 的詞語進行展示。其中,詞云中字體大小代表詞頻大小,字體越大,表示詞頻越高。

其中,M為文檔集合中的文檔個數,N為文檔中包含的詞匯個數。假定文檔集合含有K個主題,則LDA 模型參數β的Dirichlet 分布可生成K個多項分布。文檔的主題概率分布同樣由Dirichlet 分布產生,其中α為產生文檔主題概率的模型參數,θ為文檔主題的概率分布,z為文檔主題詞匯的多項分布,w為主題詞匯的多項分布。

1.1 對象 選擇2011年1—12月在我院行前列腺電切術患者40例為觀察組,年齡53~79歲,平均年齡68.0歲,實施臨床護理路徑方法;以2010年1—12月在我院行前列腺電切術患者40例為對照組,年齡在56~81歲,平均年齡71.0歲,采用常規護理方法。入選條件:診斷明確,沒有嚴重的合并癥,且患者能配合完成各項治療和護理。兩組患者在年齡、文化程度等比較差異無統計學意義(P>0.05),具有可比性。

步驟2:運用LDA 模型提取評論主題,需要完成以下任務:①確定主題數(主題數值過大或過小都會影響分析結果的準確性);②利用LDA 模型尋找主題,構建主題詞匯矩陣。

步驟3:通過詞頻統計與LDA 模型結果分析,探析顧客網購滿意度影響因素。

Fig.2 Technology road圖2 技術路線

4 在線顧客評論數據采集與預處理

京東購物平臺自動過濾了一部分無效評論(顧客進行了評分但未進行評論),相較于其它購物平臺,該平臺評論語句較長,評論數據的整體質量較高。因此,本文選取了京東商城消費者評價數據作為挖掘顧客網購滿意度影響因素的數據源。

4.1 數據采集

京東商城允許采集一定數量的評論,每款產品最多采集1 000 條評論,于是選取每種類型中銷量最靠前的2 款產品進行評論采集。本文利用Python 爬蟲技術采集京東商城中部分商品評論,為了避免評論數據采集片面化而影響研究結果的客觀性,實驗共采集了10 款商品的評論數據,共計10 000 條。分別從家用電器、生活日用、手機、母嬰及食品這5 種類別中選取兩個銷量靠前的京東自營商品,具體數據見表1。

Table 1 Collection list of commodity reviews表1 商品評論采集列

通過數據清洗后,整理了9 785 條顧客評論數據作為數據集,其中評論數據的基本特征如表2所示。

Table 2 Basic characteristics of review data表2 評論數據的基本特征

4.2 數據預處理

4.2.2 數據分詞

教育是農業不是工業,實施學校教育的目的不是把學生們都培養成機械、木訥的工業復制品,而是要給學生們其成長所需要的陽光和養分,讓學生們能夠充分按照其成長藍圖茁壯健康成長。因此,在小學數學教學過程中,我們應該充分注重數學課堂的個性化建設,關注學生們的個性化發展。

4.2.1 數據清洗

步驟1:通過爬蟲采集京東商城的顧客評論,并根據預處理后的評論數據繪制詞云圖與詞頻統計圖。

Fig.3 Word cloud圖3 詞云圖

4.2.3 去停用詞

由此可見,盡管人文主義者們崇尚古典智慧,歌頌古人的生活方式,但他們并非對任何時代的思想和理念全盤接受。他們更多的是“借古諷今”,運用古人智慧來解決現世社會中的“問題”。

由于采集的評論數據中包含表情、英文字符等無關數據,還存在評論內容重復或為空,因此需要對采集的初始數據進行清洗。為了便于實驗,本文在數據清洗中只保留漢字字符。

本文通過爬蟲采集顧客評論對評論文本依次進行去重、分詞及去停用詞處理,并利用Python 中的matplotlib 工具包繪制詞頻統計圖,最后使用LDA 主題模型提取評論主題。研究技術路線如圖2所示。

5 顧客評論數據分析

5.1 詞頻統計分析

分詞后對顧客評論的結果進行詞頻統計,按照詞頻大小從高到低進行排序,通過Python 的matplotlib 工具繪制排列位于前20 的高頻詞,如圖4 所示。高頻關鍵詞是指顧客在線購物評論中出現頻率較高,在一定程度上反映顧客網購關注重點的詞語。由圖4 可見,出現頻率較高的褒義詞,例如“喜歡”“不錯”“滿意”“好看”“好吃”等,表明消費者對網購產品的整體感受較為滿意。其次,描述產品屬性詞的詞頻較高,例如“品牌”“產品”“質量”“功能”“外觀”等均位居前十。除此之外,產品價格和服務也是消費者網購時所關注的重點,例如“價格”“物流”“速度”“包裝”“服務”等。

Fig.4 Statistical of word frequency圖4 詞頻統計

5.2 LDA模型分析

(1)確定主題數。LDA 模型可有效降維文本數據,挖掘潛在主題,但難以確定LDA 模型的主題數。當主題數過大時,會導致主題語義信息不明確;主題數較小時,會導致單個主題蘊含多層語義信息,因此確定主題數至關重要[22-23]。目前通常使用Perplexity 函數[24]確定主題數,理論上困惑度的大小與模型生成文檔的能力和泛化能力成反比,因此最優主題個數K為最小困惑度對應的主題數。困惑度隨模型主題數變化的趨勢如圖5所示。

由圖5 可見,隨著主題數不斷增加,模型困惑度呈現先減少后增加的趨勢。當主題數K=5 或6 時,模型的困惑度達到最小,表示此時模型的效果較好。通過比較K=5 與K=6 時LDA 模型的結果,發現K=5 時每個主題含有多層語義信息,而K=6 時每個主題的語義信息更為明確,因此本文LDA 模型的主題數目K取值為6。

Fig.5 The trend of confusion degree changing with the number of model topics圖5 困惑度隨模型主題數變化的趨勢

(2)LDA 模型結果分析。確定參數后對LDA 模型進行訓練,輸出每個主題詞匯。如表3 所示,提取位于前10 的詞作為該主題代表詞,并按照具體內容進行分類。

4.物聯網企業融資困難。作為戰略新興產業,物聯網產業屬于高風險、投資大的產業,需要巨額的資金投入,尤其在企業發展的初期,這往往令一般的中小企業投資者望而生畏。如果能有效解決物聯網企業發展過程中企業的融資難問題,使資金能順暢進入物聯網企業,無疑,可加速物聯網企業的發展。目前來看,以戰略性新興中小企業為例,其銀行信貸的比例極低,僅占全部中小企業的10%左右,而在美國這一比例高達33%,資金不足成為物聯網產業發展過程中無法回避的問題。

通過分析每個主題代表詞,最終得到5 個主題(見表3)。實驗結果表明,產品質量(A)、產品設計、產品質量(B)、物流服務、產品價格及品牌信譽是顧客網購時最為關注的主題。通過具體分析發現,在主題編號一與三中,“質量”“材質”“性能”等詞的權重較大,表明顧客對產品質量要求較高。在產品設計方面,“外觀”“設計”“功能”“容量”等詞擁有較高權重,表明顧客較為看重產品設計。在物流服務方面,“物流”“服務”“速度”等詞所占權重較高,表明物流服務是影響消費者網絡購物滿意度的重要因素。在產品價格方面,“產品”“價格”等詞語的權重較大,表明產品價格是消費者網絡購物時著重考慮的因素之一。另外,品牌信譽同樣也是消費者線上購買產品時考慮的重要因素之一。

Table 3 LDA model results表3 LDA模型結果

6 結語

本文基于LDA 模型對影響顧客網購滿意度因素進行研究,從大量顧客評論中挖掘產品設計這一新的影響因素。表明消費者在關注產品質量、產品價格、物流服務及品牌信譽的同時,也在關注產品的外觀設計。良好的外觀設計能為消費者帶來視覺上的享受,簡單易操作的功能設計可便于消費者使用,因此企業可從外觀與功能設計方面對產品進行提升。

相較于以往研究,依據顧客個體意見表達的大數據文本集,運用LDA 主題模型提取影響顧客網購滿意度因素,并通過實驗驗證該模型能夠有效挖掘顧客在線評論的潛在信息具有顯著的優勢。

該項目致力于將“高遠”貧苦地區的綠色食材和美食文化從山野田間推廣到城市餐桌。其中,“高遠”泛指以云南、新疆、西藏等深度貧困地區,重點關注上海對口幫扶的“高遠”地區,即云南、新疆喀什、西藏日喀則、青海果洛、貴州遵義、重慶萬州、湖北夷陵等7個省區市20個地州市101個縣市區,涉及貧困人口近300萬。

但該模型需要通過困惑度確定最優主題數K,后續將通過實驗,嘗試多種智能方法確定最佳主題數K,并結合情感分析技術探究消費者的情感傾向,為企業和商家提供更優質的服務。

猜你喜歡
文本滿意度模型
一半模型
多感謝,生活滿意度高
工會博覽(2023年3期)2023-04-06 15:52:34
16城市公共服務滿意度排行
小康(2021年7期)2021-03-15 05:29:03
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
淺談如何提升脫貧攻堅滿意度
活力(2019年19期)2020-01-06 07:34:38
在808DA上文本顯示的改善
明天村里調查滿意度
雜文月刊(2019年15期)2019-09-26 00:53:54
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲精品无码高潮喷水A| 欧美日本不卡| 黄色网页在线播放| 国产精品视频a| 欧美激情二区三区| 久久频这里精品99香蕉久网址| 91精品国产情侣高潮露脸| 一级毛片高清| 日韩欧美国产另类| 孕妇高潮太爽了在线观看免费| 欧美人与动牲交a欧美精品| 伊人久久大香线蕉影院| 欧美中文字幕在线视频| 国产亚洲视频免费播放| 国产精品内射视频| 亚洲午夜久久久精品电影院| 熟妇无码人妻| 91福利免费| 亚洲人成网站在线播放2019| 国产欧美在线观看一区| 欧美日韩亚洲综合在线观看| 欧美人人干| 亚洲精品视频网| 亚洲A∨无码精品午夜在线观看| 人人妻人人澡人人爽欧美一区| 精品91在线| 一级毛片在线播放免费| 国内自拍久第一页| 久久黄色免费电影| 亚洲精品制服丝袜二区| 国产真实乱人视频| 四虎影视永久在线精品| 91九色视频网| 欧美在线观看不卡| 久久久久人妻精品一区三寸蜜桃| 97色婷婷成人综合在线观看| 亚洲永久精品ww47国产| 久久人搡人人玩人妻精品| 丁香六月激情婷婷| 久久国产高清视频| 色噜噜综合网| 永久免费无码成人网站| 亚洲aaa视频| 51国产偷自视频区视频手机观看 | 女人爽到高潮免费视频大全| 一个色综合久久| 久久久久无码国产精品不卡| 亚洲av日韩av制服丝袜| 久久久久人妻一区精品色奶水| 97se亚洲综合在线韩国专区福利| 国产精品尤物铁牛tv| 六月婷婷精品视频在线观看| 在线综合亚洲欧美网站| 99久久精品国产自免费| www.99精品视频在线播放| 真人高潮娇喘嗯啊在线观看| 久久久成年黄色视频| 精品人妻无码区在线视频| 亚洲人成人伊人成综合网无码| 久久久久88色偷偷| 又爽又大又光又色的午夜视频| 91麻豆精品视频| 亚洲欧美自拍一区| 欧美精品伊人久久| 成人免费网站久久久| 欧美 国产 人人视频| 91亚洲视频下载| 亚洲av无码片一区二区三区| 国产一级毛片网站| 欲色天天综合网| 91色国产在线| 国产香蕉国产精品偷在线观看| 亚洲精品爱草草视频在线| 国产免费久久精品99re丫丫一| 欧美精品亚洲精品日韩专区| 99热这里只有精品免费| 色欲综合久久中文字幕网| 亚洲日韩久久综合中文字幕| 狠狠亚洲婷婷综合色香| 九九热精品视频在线| 91久久青青草原精品国产| 欧美性天天|