999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義分析的電子商務產品用戶評價分析與研究

2017-07-05 19:15:46董敏王琨
商場現代化 2017年11期

董敏+王琨

摘 要:隨著Web3.0的迅速發展,人們無論在生活上還是工作中,對電子商務的依賴性都不斷的增強。因此用戶在電子商務平臺中對商品的選擇上,很大程度上依賴于該商品的用戶評價。對于商家來說,在投資產品時也依賴于用戶對該商品的評價等級,因此如何建立電子商務平臺中產品的用戶評價分析模型,為用戶和商家提供可靠的決策依據有著重要的作用。本文主要是基于語義分析的模型,采取VSM來得到用戶評價總體情感傾向。

關鍵詞:電子商務;語義分析;情感分析;VSM

一、引言

對于電子商務平臺中產品的用戶等級分析,通常都是采用對本文情感分析技術要進行實現。文本的情感分析可以稱作為情感的傾向性計算,主要是對用戶的產品、服務、組織機構和事件等進行實時性評價分析。當前對于文本的情感分析是一門較為新興的技術領域,其目的是利用機器人來對互聯網的文本信息進行采集后的數據,通過情感分析來對用戶發表信息時的情感心態。在電子商務領域則是體現在對用戶關注的產品的情感等級的分析,從而對產品操作得到可信的據測性依據。

二、電子商務產品用戶評價情感分析現狀

本文的情感分析技術早在上世紀90年代就有許多研究人員開始進行初步的嘗試研究,并根據市場的實際需求建立起相關的產品和應用。

哈爾濱工業大學對互聯網情感分析現狀和動態進行調研、挖掘和探究,提出現有的情感分析中存在的問題,通過對這些問題的闡述和探討,提出在情感分析領域未來的主要研究方向和目標。同濟大學也以新浪微博的平臺,對動車事故網友發表的微博和評論進行用戶情感分析,他們提出了微博中的六種情感類別,并據此建立了情感分析模型,研究微博文本的影響力和計算網友情感的技術和方法,對該事故之后的公共的情感進行了分析和探討。清華大學的謝麗星等多人研究了基于層次結構的多策略中文微博情感分析和特征提出的方法。他們通過SVM的監督學習實驗,對主題的識別和文本的情感傾向分析取得了不錯的效果。

目前對于電子商務平臺的文本情感分析,還沒有出現較為系統的研究成果,不過根據市場的需要,也出現一些比價平臺,通過對多個主流電子商務平臺的各項數據采集,特別是對于價格、用戶評價,特別是對與好評和差評信息進行動態采集,形成一個多個電子商務平臺的價格對比,以引導用戶選擇高性價比的產品。比如,國內的慢慢買、盒子比價網、瑯瑯比價網等,提供國內外多個電子商務平臺的商品信息的價格和用戶評價的對比。

三、電子商務產品用戶評價分析算法研究

1.用戶評價信息的獲取

對于用戶評價信息的獲取,主要利用網絡爬蟲來進行采集。因此可以設計一個基于電子商務平臺的主題網絡爬蟲的設計。由于一般的電子商務平臺的商品評價頁面都是動態呈現的,因此如何解決對用戶評價的數據更新是設計該主題網絡爬蟲的技術關鍵。

對于動態網站的數據采集,可以建立索引空間,采用哈希表的形式將用戶評價信息建立動態索引,利用哈希查找算法,提高采集中查找的效率,從而實現對動態用戶評價信息的采集。

由于目前各類型電子商務平臺眾多,如果需要多全平臺的產品用戶評價信息進行采集,就需要較大的存儲空間和處理器,因此可以利用云計算平臺來建立云爬蟲,利用云計算的高計算、大存儲和高帶寬網絡的優點實現大數據的用戶評價信息的采集,也為后續的情感分析提供龐大的數據集。

2.用戶評價信息的特征詞處理技術分析

特征詞的提出主要分為:文本切詞、文本去重和特征詞提取三個步驟。

文本切詞:將一段詞語獨立切分為多個獨立的詞語,這是文本特征詞處理的基礎技術。當前分詞算法有字符串匹配算法、基于理解的算法和基于自動學習的算法等。

字符串匹配算法是最為常見的算法之一,其特點是實現簡單,詞語的匹配精度性較高。可以建立和維護字符串庫,實現不斷的自我更新和自我學習。具體的匹配過程是,對文本進行逐一分解后,通過對出現在字符串中的本文塊,則匹配成功。為了提高匹配的準確性,可以使用正向最大匹配、逆向最大匹配和雙向最大匹配等方法。

文本去重:對于本文切詞后,會存在許多重復的詞語,這就需要進行對切詞后的重復短語進行去重處理。這里主要是研究使用布隆過濾器(Bloom Filter)來進行對文本的去重處理。布隆過濾器是上世紀70年代Howard Bloom提出來的一種二進制向量數據結構,它可以很好的利用空間和時間效率,來驗證一個元素在集合中是否重復出現。

Bloom Filter的去重原理是:位數組K個獨立HASH函數。將HASH函數對應的值的位數組置1,查找時如果發現所有HASH函數對應位都是1說明存在,很明顯這個過程并不保證查找的結果是100%正確的。同時也不支持刪除一個已經插入的關鍵字,因為該關鍵字對應的位會牽動到其他的關鍵字。所以一個簡單的改進就是counting Bloom filter,用一個counter數組代替位數組,就可以支持刪除了。

特征詞提取:文本的特征詞提出主要是選取文本中的特征項,當前的提取方法比較多,最為常見的是文檔詞頻提取法,也稱作為DF。DF是指在整個文本詞語集中,包含了所指定的某個或多個特征項,其計算公式為:

在計算公式中,DF(t)是指所包含的特征項t的詞頻率,通過使用文檔詞頻提取法可以對每個特征項在整個文本出現的頻率進行統計,再根據設定的特征項設定的閾值,去掉一些小于閾值的特征項,進而從采集的文本中提取出所需的特征值。在電子商務平臺中的用戶評價信息,主要是對用戶評價信息分詞后,提取出用戶用于產品的評價特征項,對產品的優良、好壞進行特征項的分析。

3.基于VSM技術的用戶評價信息的情感分析

對于電子商務平臺中用戶評價信息,經過采集、切詞、特征值的提取和去重操作后,就剩下對處理后短語進行情感分析,也就是信息相似度的計算。對于目前來說信息相似度技術較為成熟的就是向量空間模型技術(VSM),該中技術就是把兩個文本短語簡化為向量運算,通過計算向量之間的相似度來衡量文本短語之間的相似度。

本文研究的電子商務平臺用戶評價研究的VSM情感分析過程如下:

(1)預處理,先對采集的用戶評價文本進行中英文切詞,并過濾所有停用詞。

(2)對用戶評價文本中的分詞短語的關鍵詞進行選擇與加權,對用戶評價文本中若干個關鍵詞進行頻度的計算。

(3)通過把兩個處理后的短語建立向量空間模型、求出向量空間中的余弦值。對于建立向量空間模型的方法就是把短語簡化為關鍵詞的權重為分量的N維向量來進行表示。對于D1和D2兩個文本來說,要求的之間的相似度Sim(D1,D2),其余弦公式為:■,其中W1k和W2k分別表示D1和D2兩個短語第k(1<=k<=n)個關鍵字的權值。

(4)如果所求的兩個用戶評價文本的余弦值大于所設定的閾值,那么就說明這兩個短語是相似的,否則說明該個短語與評價信息并不相似。

經過對所有切詞后的短語進行相似度計算后,得出的余弦值與事先設定好的閾值進行比較后,作為用戶評價情感傾向度分析的評價標準,通過把所有評價中的文本短語進行計算后,就可以判斷用戶評價對于商品的情感,也就可以作為對該商品的評價等級。對于設置的閾值可以在分析過程中,通過對詞語出現的頻度來不斷的進行調整,實現自我學習的能力,從而進一步的提高用戶評價情感傾向度分析的準確性。

四、總結

綜上所述,對于電子商務平臺的用戶評價信息的分析中,主要是采取了SVM方法進行分析,通過信息的采集、特征項的提取和情感的分析等來對產品的評價進行分析,為用戶和商家提供決策上的有效依據。但是由于目前電子商務平臺的迅速的發展,各類電子商務信息量巨大,如何提高對用戶評價的采集效率,切詞的合理性和對用戶評價信息情感分析的準確度方面,還需要進一步提高研究的深度和廣度。

因此下一步的研究方向是如何把本文研究的分析平臺和當前主流的云計算平臺相結合,依托云計算平臺的高計算能力、高可靠性和高存儲性等眾多優點。進一步的提高分析平臺的工作效率和對用戶評價的情感傾向度的分析能力。

參考文獻:

[1]張冬雯,崔志超,許云峰.電子商務產品評論多級情感分析的研究構架[J].網絡安全技術與應用,2013-09.

[2]楊彪.面向電子商務的評論文本情感分析研究[D].重慶交通大學,2014-04.

[3]田金靈.B2C電子商務中情感因素與顧客滿意及購買行為的關系[J].湖南工業職業技術學院學報,2013-08.

[4]嚴建援,張麗,張蕾.電子商務中在線評論內容對評論有用性影響的實證研究[J].情報科學,2012-05.

[5]游貴榮,吳為,錢沄濤.電子商務中垃圾評論檢測的特征提取方法[J].現代圖書情報技術,2014-10.

主站蜘蛛池模板: 又爽又大又光又色的午夜视频| 精品人妻一区无码视频| 91www在线观看| 日韩欧美高清视频| 国内精自线i品一区202| 日韩中文字幕亚洲无线码| 人妻丝袜无码视频| 在线免费不卡视频| 国产小视频a在线观看| 国产一区成人| 国产一区二区免费播放| 亚洲国语自产一区第二页| 91免费观看视频| 玩两个丰满老熟女久久网| 欧美乱妇高清无乱码免费| 狠狠亚洲五月天| 91区国产福利在线观看午夜| 91成人在线观看视频| 国产 在线视频无码| 欧美亚洲一区二区三区导航| 亚亚洲乱码一二三四区| 就去色综合| 国产精品999在线| 久久亚洲日本不卡一区二区| 996免费视频国产在线播放| 婷婷色一二三区波多野衣| 又污又黄又无遮挡网站| 国产欧美日韩在线在线不卡视频| 久久大香伊蕉在人线观看热2 | 国产在线日本| 91久草视频| 亚洲男人的天堂网| 在线99视频| 亚洲人成网18禁| 亚洲一级毛片在线观播放| 国产极品粉嫩小泬免费看| 四虎国产精品永久一区| 91在线激情在线观看| 国产男女免费完整版视频| 国产三级国产精品国产普男人| 成人国产精品网站在线看| 午夜国产大片免费观看| 色成人亚洲| 成人免费视频一区| 国产玖玖玖精品视频| 97久久精品人人| 久久久受www免费人成| 日韩黄色大片免费看| 黄色一级视频欧美| 亚洲另类国产欧美一区二区| 国产在线高清一级毛片| 久久婷婷色综合老司机| 91小视频版在线观看www| 波多野吉衣一区二区三区av| 九色视频线上播放| 欧美精品1区| 又猛又黄又爽无遮挡的视频网站| 美女视频黄频a免费高清不卡| 精品国产中文一级毛片在线看| 亚洲91精品视频| 国产区人妖精品人妖精品视频| 91丝袜美腿高跟国产极品老师| 高清国产在线| 色爽网免费视频| 男人天堂伊人网| а∨天堂一区中文字幕| 啪啪啪亚洲无码| 亚洲免费成人网| 丰满少妇αⅴ无码区| 欧美成人h精品网站| 成人亚洲视频| 久久99热66这里只有精品一| 国产在线高清一级毛片| 国产精品尹人在线观看| 国产高颜值露脸在线观看| 久久性视频| 色悠久久久久久久综合网伊人| 欧美精品成人一区二区视频一| 91亚洲精品国产自在现线| 国产成人无码播放| 91美女在线| 国产成+人+综合+亚洲欧美|