999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本分析的在線評論對產(chǎn)品性能提升作用探析

2021-04-23 10:57:40郭曉姝吳孟珊
中國管理信息化 2021年7期
關(guān)鍵詞:文本內(nèi)容用戶

郭曉姝,吳孟珊

(東北財經(jīng)大學(xué) 管理科學(xué)與工程學(xué)院,遼寧 大連 116025)

0 引言

在大數(shù)據(jù)的浪潮下,經(jīng)濟形勢正在不斷更迭調(diào)整,數(shù)字化、信息化成為了明顯趨勢,在社會環(huán)境驅(qū)動力與國家機關(guān)互聯(lián)網(wǎng)普及政策的雙重影響下,電子商務(wù)成為互聯(lián)網(wǎng)經(jīng)濟中的重要領(lǐng)域,是互聯(lián)網(wǎng)中最大的市場。網(wǎng)絡(luò)購物市場的快速發(fā)展,帶來了極大的經(jīng)濟效益,同時用戶生成內(nèi)容(UGC)作為線上購物的衍生品數(shù)量也隨之大幅增加,用戶生成內(nèi)容是一種大眾表達觀點和想法的方式,用戶通過互聯(lián)網(wǎng)和社交媒體以非營利目的參與到網(wǎng)絡(luò)活動中,用戶生成內(nèi)容在網(wǎng)絡(luò)購物市場的具體表現(xiàn)為用戶商品評論。這些評論信息無論是對消費者還是商家來說都具有特殊的價值。

對于消費者來說,這是一種意見反饋途徑,是一種實現(xiàn)參與互聯(lián)網(wǎng)生活的主要方式。同時也是一種信息收獲方式,可以通過了解商品質(zhì)量、商品服務(wù)售后情況進行綜合性考察,影響最終的購買決策。對于商家來說,商家與用戶之間的互動不僅可以幫助用戶進行選擇,增加了用戶黏性,更是一種重要的信息反饋來源,商家可以通過收集并分析在線用戶評論內(nèi)容對自身產(chǎn)品進行改進與更新,加強內(nèi)部控制,增加競爭力。本文利用文本分析的方法,研究用戶生成內(nèi)容對產(chǎn)品性能提升的作用,從而驗證用戶生成內(nèi)容的質(zhì)量。

1 研究方法與數(shù)據(jù)處理

1.1 研究方法

文本分析是一種大數(shù)據(jù)時代下的新興技術(shù),是數(shù)字化社會的產(chǎn)物。指的是對文本內(nèi)容進行檢索挖掘并提取主要的信息,通過技術(shù)手段將文中的特征詞抽取并進行量化后來表達文本內(nèi)容,特征提取是其主要內(nèi)容,這種技術(shù)常應(yīng)用于經(jīng)濟領(lǐng)域的研究。“詞袋法”是文本分析領(lǐng)域中較為常用的方法,其主要原理是對將不同情感傾向的詞語進行分類,形成不同的詞語列表,現(xiàn)存較為知名的文本分析系統(tǒng)有PEG(Project Essay Grader)系統(tǒng)、UEA(Intelligent Essay Assessor)系統(tǒng)等。在整個實驗過程中,進行了數(shù)據(jù)爬取、評論預(yù)處理、模型準備、模型構(gòu)建等多個步驟,使用文本分析的方法對某電子社區(qū)用戶生成內(nèi)容質(zhì)量進行判斷。

1.2 數(shù)據(jù)處理

1.2.1 數(shù)據(jù)源選擇

本次實驗所選取的數(shù)據(jù)均來自于某電產(chǎn)品子社區(qū),因其創(chuàng)新研發(fā)理念較為先進,故有較高的研究價值。社區(qū)中評論的電子產(chǎn)品是一家近年來興起成長速度較快、發(fā)展勢頭迅猛的互聯(lián)網(wǎng)公司生產(chǎn)的,“創(chuàng)新”是該企業(yè)文化的重要組成部分,其三大創(chuàng)新點在于生態(tài)鏈、參與感和自研發(fā)收集操作系統(tǒng),其中的“參與感”指向的就是用戶參與研發(fā)和營銷過程。該公司是國內(nèi)較早開始注意用戶生成內(nèi)容的企業(yè),對電子社區(qū)這樣一個用戶參與研發(fā)平臺的發(fā)展和運營注入了極大的精力,注重內(nèi)容和流量,快速形成自己的圈子和文化,收集用戶反饋充分利用了社交媒體及互聯(lián)網(wǎng),避免了傳統(tǒng)研發(fā)模式中的許多問題,將用戶視作研發(fā)導(dǎo)向者,減少了企業(yè)內(nèi)部人員的決策占比。因此,該電子社區(qū)中的數(shù)據(jù)能夠為本次實驗提供有效的數(shù)據(jù)支持,具有較高的分析價值。本次實驗用選取該電子社區(qū)“圈子”中參與成員較多且性能較相似的手機A 和手機A pro 兩款手機的評論進行文本分析。

1.2.2 數(shù)據(jù)獲取與預(yù)處理

通過爬蟲軟件PyCharm 2019.3.3 爬取5 000 條該電子社區(qū)“圈子”中手機A 和手機A pro 這兩款手機的評論數(shù)據(jù),清洗評論數(shù)據(jù)中重復(fù)的數(shù)據(jù),減小實驗干擾,最后獲得2 306 條手機A 相關(guān)評論,2 381 條手機A pro 的評論。

2 基于文本分析的用戶生成內(nèi)容建模

2.1 Snownlp 正負語料劃分

Snownlp 是Python 中的一個第三方類庫,用于中文文本情感分析。在過去,英文文本處理屬大多數(shù),故現(xiàn)存的大量自然語言處理庫都是面向英文的,為了增強處理中文文本的能力,Python 開發(fā)了這樣一個類庫。在現(xiàn)實使用中,多用于對評論內(nèi)容的情感分析。首先使用Sentiments 方法對已經(jīng)去重后的文本內(nèi)容進行正負語料劃分,并分別保存,由于想同時保留建議類評論和吐槽類評論,將劃分時的情感系數(shù)設(shè)定在0.8。劃分結(jié)果為,手機A 正向評論數(shù)為416,負向評論數(shù)為1890,負向評論占比為82.0%;手機A pro 正向評論數(shù)為436,負向評論數(shù)為1945,負向評論數(shù)占比為82.0%,并將兩款手機的負向評論重新保存成txt 文檔。

表1 手機正負向評論選例

可以觀察到兩款手機評論的負向評論數(shù)遠超于正向評論數(shù),但這并不意味著這兩款手機“差”,結(jié)合電子社區(qū)的性質(zhì)來看,不同于電子商城單純地購買評論,也不存在消費者習(xí)慣性好評的情況,其評論內(nèi)容大多是用戶對手機的改進建議、雷點吐槽以及提問,負向評論數(shù)多屬正常現(xiàn)象,并且這些負向評論代表了用戶期望,也更加具有研究價值,本實驗以負向評論語料為研究對象。

2.2 去停用詞及文本分詞

2.2.1 停用詞去除

為了提高搜索效率,將語料庫中沒有實際意義的字和詞進行過濾,如連接詞、語氣詞和副詞等在文本分析中并沒有實際的意義,沒有分析價值,比如“者”“也”“之”“乎”等虛詞,再如評論中的“品牌”“手機”等實驗中特別出現(xiàn)的名詞。本文使用哈工大停用詞表為材料進行操作,去除停用詞的步驟較為簡單:①使用Python 讀取停用詞表(哈工大版);②遍歷兩款手機的負向語料庫,將停用詞表中的詞語與之進行匹配,若存在相同詞語,則替換為空字符。

2.2.2 中文文本分詞

在本次試驗中,用到的電子社區(qū)產(chǎn)品評論屬于非結(jié)構(gòu)化的中文文本內(nèi)容,為了進行進一步的分析,需要將文本進行分解,主要包括將文本分割成句子、將句子分解成詞語兩部分。首先將文本切分成句子,在Python 第三方庫中比如nltk.tokenize 和正則分詞器RegexpTokenizer 等都可以實現(xiàn)對文本的劃分。接下來將句子分割成一個個單獨的詞語,句子是許多詞語的集合,在Python 中較為常見的兩種分詞系統(tǒng)是Pynlpir 和Jieba,本文采用Jieba 分詞算法,其工作原理是基于統(tǒng)計詞典的,在這個分詞系統(tǒng)中可以對分詞詞典進行自定義以及增減等操作,并可以對已有詞典進行動態(tài)的修改與維護。在Jieba 分詞對分離出來的這兩款手機的負向評論語料庫進行分詞處理。

經(jīng)過以上操作后對詞頻進行統(tǒng)計,分別打印出兩款手機負面評論中出現(xiàn)頻率最高的18 個詞匯,如表2 所示手機A pro高頻討論詞匯和表3 所示的手機A 高頻討論詞匯。

表2 手機A pro 高頻討論詞匯

表3 手機A 高頻討論詞匯

對比表2 和表3 中兩款手機的高頻討論詞匯可知,用戶相同的關(guān)注點在于“顯示”“系統(tǒng)”“更新”“屏幕”“聲音”“穩(wěn)定版”和“模式”方面。

2.3 模型構(gòu)建

本次實驗采用無監(jiān)督的貝葉斯模型LDA(Latent Dirichlet Allocation)主題模型,無須人工區(qū)分測試集和訓(xùn)練集。將去除停用詞、做過中文文本分詞的兩篇負向語料導(dǎo)入模型中進行建模分析,可以得到表4 和表5 所示結(jié)果。

表4 手機A 模型分析結(jié)果

表5 手機A pro 模型分析結(jié)果

在本次試驗中,筆者分別將兩篇負向語料文檔劃分成三個主題,經(jīng)過LDA 主題分析后,輸出每個主題下生成的10 個最有可能出現(xiàn)的詞語及其概率,即可以表示文本內(nèi)容的特征詞語,取每篇語料中概率相對較大的主題進行對比,展示如下。

手機A:0.017*“電池”+0.010*“更新”+0.007*“系統(tǒng)”+0.006*“顯示”+0.006*“后”+0.005*“電”+0.005*“充電”+0.005*“耗電”+0.005*“模式”+0.005*“屏幕”

手機A pro:0.015*“充電”+0.010*“10”+0.009*“更新”+0.008*“系統(tǒng)”+0.006*“買”+0.006*“解決”+0.006*“后”+0.005*“顯示”+0.005*“知道”+0.005*“王者”

對兩款手機的特征詞語進行比對后可以明顯觀察到,用LDA 主題模型分析所得的手機A 和手機A pro 的用戶生成內(nèi)容相似性較大,在手機A 負向用戶評論中出現(xiàn)頻率為0.010 的“系統(tǒng)”“更新”同樣以0.009 的頻率出現(xiàn)在手機A pro 的負向評論中;手機A 中出現(xiàn)頻率為0.007 的“系統(tǒng)”,“系統(tǒng)”也以0.008的頻率出現(xiàn)在手機A pro 中;手機A 中出現(xiàn)頻率為0.006 的“顯示”也以0.005 的頻率出現(xiàn)在手機A pro 中;手機A 中出現(xiàn)頻率為0.005 的“充電”在手機A pro 中的出現(xiàn)率甚至有提高,頻率達到了0.015。除此之外,“充電”“電池”和“耗電”三個詞可統(tǒng)一看作是用戶對電池系統(tǒng)的建議或吐槽,在兩款手機負向評論中出現(xiàn)頻率也都相對較高。特征詞語的相似度較高,說明兩篇負向語料文檔的相似度也較高,可以推理出手機A 和手機A pro存在著相似亟待解決的問題。雖然用戶在使用手機A 過程中出現(xiàn)的問題并未有效地在手機A pro 中得到完全解決,但是也有部分性能有所提高,分析其原因,筆者認為該公司對用戶評論的采納度不夠,或用戶需求沒有得到實質(zhì)性的滿足,總體用戶生成內(nèi)容有效性不高。電子產(chǎn)品的新一代的更新并不是所有性能都會改進,一般會在某一方面著重改進,這種改進是逐步細微的。

3 研究結(jié)果分析

本文以某電子社區(qū)為例,研究了用戶生成內(nèi)容對產(chǎn)品性能的影響,發(fā)現(xiàn)企業(yè)雖然重視社區(qū)中顧客對產(chǎn)品的評論,但是對用戶評論的采納度還并不足,綜合各方面因素分析原因如下。

3.1 人工閱讀用戶評論效率低下

電子社區(qū)中,有用戶間的交流,也有產(chǎn)品、技術(shù)和客服與用戶的交互,目標是及時聽取和吸收用戶的意見。這一行為使得該公司在用戶群體中收獲了較好的口碑,在線溝通的方式體現(xiàn)了對用戶的尊重,也存在人工閱讀效率相對較低的問題,該電子社區(qū)有大量的用戶基礎(chǔ),數(shù)十萬的活躍用戶每天都會產(chǎn)生大量的用戶評論,而相關(guān)團隊人員構(gòu)成有限,若只讓他們對成千上萬條用戶評論進行人工閱讀顯然是低效率的,僅憑借人工瀏覽的方式,會使得公司不能夠準確地了解到用戶們最為關(guān)注的產(chǎn)品特征,難以有效地進行收集反饋,從內(nèi)容中識別用戶需求,進而來對產(chǎn)品進行改進。

3.2 研發(fā)目標與用戶需求未能統(tǒng)一

除了用戶期望,研發(fā)工作也要符合公司對自身企業(yè)發(fā)展的規(guī)劃。電子產(chǎn)品的新一代的更新并不是所有性能都會改進,一般會在某一方面著重改進,這種改進是逐步細微的。如今社會的進步使得5G 手機成為了近來的熱點之一,不斷吸引著消費者的注意。隨著5G 網(wǎng)絡(luò)的逐漸普及和5G 商用牌照的發(fā)放,各大手機廠商紛紛進行跟隨潮流進行研發(fā)并推出自家的5G 手機,手機A pro 最大的賣點宣傳也是定位在性價比較高的5G手機,在研究和開發(fā)5G 匹配功能的同時,可能難以對用戶需求進行全面的滿足。

4 結(jié)語

在互聯(lián)網(wǎng)新時代下,自媒體的發(fā)展,用戶生成內(nèi)容海量增加,鮮明的褒貶性以及用戶對產(chǎn)品的主觀態(tài)度都在這些內(nèi)容中得到體現(xiàn)。面對這些海量的用戶生成內(nèi)容,各組織機構(gòu)都應(yīng)給予足夠的重視,致力在最短的時間內(nèi)取得更加全面的用戶反饋信息,并采取一定的改進措施。對大量評論數(shù)據(jù)進行分析后,總結(jié)出企業(yè)現(xiàn)階段對用戶生成內(nèi)容應(yīng)用還不夠充分,可能存在人工閱讀用戶評論效率低下、研發(fā)目標與用戶需求未能統(tǒng)一等問題,提出可使用文本分析手段進行總體研究、研發(fā)工作從局部到整體逐步滿足客戶需求等合理建議。本文存在著一些局限性,實驗中使用的模型還較為單一,沒有進行多種模型結(jié)合的創(chuàng)新性方法等;研究對象較少,由于其他款式的手機關(guān)注度較低,評論量較少,無法作為有效的參考數(shù)據(jù),故只選取了兩款手機進行比對,無法做出連續(xù)的比較。今后將增加數(shù)據(jù)量,進一步研究用戶生成內(nèi)容對產(chǎn)品性能提升的作用機制。

猜你喜歡
文本內(nèi)容用戶
內(nèi)容回顧溫故知新
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內(nèi)容
臺聲(2016年2期)2016-09-16 01:06:53
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
如何獲取一億海外用戶
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 精品小视频在线观看| www亚洲天堂| 国产亚洲美日韩AV中文字幕无码成人| 免费无码网站| 在线色国产| 综合色区亚洲熟妇在线| 日韩在线观看网站| 亚洲欧洲一区二区三区| 内射人妻无套中出无码| 99久久精品美女高潮喷水| www精品久久| 日韩视频福利| 精品無碼一區在線觀看 | 色国产视频| 久久久久国产精品熟女影院| 国产免费好大好硬视频| 欧美一区二区福利视频| 国产在线精品美女观看| 久久精品娱乐亚洲领先| 免费人成在线观看成人片| 色窝窝免费一区二区三区| 亚洲无码A视频在线| 国产精品人莉莉成在线播放| 亚卅精品无码久久毛片乌克兰| 成人一级免费视频| 污污网站在线观看| 国产视频你懂得| 国产欧美精品一区二区| 亚洲欧美日韩视频一区| 夜精品a一区二区三区| 亚洲国产日韩在线观看| 影音先锋亚洲无码| 一本久道久综合久久鬼色| 又大又硬又爽免费视频| 亚洲毛片一级带毛片基地| 亚洲aⅴ天堂| 性做久久久久久久免费看| 蝴蝶伊人久久中文娱乐网| 丁香六月激情综合| 9cao视频精品| 亚洲欧洲自拍拍偷午夜色无码| 日韩av高清无码一区二区三区| 欧美三级不卡在线观看视频| 欧美日韩国产精品综合 | 永久免费无码日韩视频| 无码av免费不卡在线观看| 色妞www精品视频一级下载| 成人中文字幕在线| 天天色综网| 亚洲首页在线观看| 欧美自慰一级看片免费| 国产又色又爽又黄| 久久semm亚洲国产| 毛片最新网址| 大陆精大陆国产国语精品1024| 久久人妻xunleige无码| 欧美一道本| 久久久国产精品无码专区| 91福利片| 重口调教一区二区视频| 国产剧情无码视频在线观看| 婷婷色狠狠干| 国产成人精品一区二区三在线观看| 国产资源免费观看| 中文字幕无码中文字幕有码在线| 91麻豆精品国产高清在线| 人人爽人人爽人人片| 欧美日韩在线成人| 久久婷婷综合色一区二区| 天天色综合4| 亚洲性视频网站| 欧美在线网| 免费播放毛片| 波多野结衣第一页| 97se亚洲综合| 国产亚洲欧美日韩在线一区二区三区| 九色综合伊人久久富二代| h网址在线观看| 国产乱人伦AV在线A| 亚洲成a人片77777在线播放| 亚洲福利网址| 亚洲欧美成人影院|