999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義分析的電子商務產品用戶評價分析與研究

2017-07-05 19:15:46董敏王琨
商場現代化 2017年11期

董敏+王琨

摘 要:隨著Web3.0的迅速發展,人們無論在生活上還是工作中,對電子商務的依賴性都不斷的增強。因此用戶在電子商務平臺中對商品的選擇上,很大程度上依賴于該商品的用戶評價。對于商家來說,在投資產品時也依賴于用戶對該商品的評價等級,因此如何建立電子商務平臺中產品的用戶評價分析模型,為用戶和商家提供可靠的決策依據有著重要的作用。本文主要是基于語義分析的模型,采取VSM來得到用戶評價總體情感傾向。

關鍵詞:電子商務;語義分析;情感分析;VSM

一、引言

對于電子商務平臺中產品的用戶等級分析,通常都是采用對本文情感分析技術要進行實現。文本的情感分析可以稱作為情感的傾向性計算,主要是對用戶的產品、服務、組織機構和事件等進行實時性評價分析。當前對于文本的情感分析是一門較為新興的技術領域,其目的是利用機器人來對互聯網的文本信息進行采集后的數據,通過情感分析來對用戶發表信息時的情感心態。在電子商務領域則是體現在對用戶關注的產品的情感等級的分析,從而對產品操作得到可信的據測性依據。

二、電子商務產品用戶評價情感分析現狀

本文的情感分析技術早在上世紀90年代就有許多研究人員開始進行初步的嘗試研究,并根據市場的實際需求建立起相關的產品和應用。

哈爾濱工業大學對互聯網情感分析現狀和動態進行調研、挖掘和探究,提出現有的情感分析中存在的問題,通過對這些問題的闡述和探討,提出在情感分析領域未來的主要研究方向和目標。同濟大學也以新浪微博的平臺,對動車事故網友發表的微博和評論進行用戶情感分析,他們提出了微博中的六種情感類別,并據此建立了情感分析模型,研究微博文本的影響力和計算網友情感的技術和方法,對該事故之后的公共的情感進行了分析和探討。清華大學的謝麗星等多人研究了基于層次結構的多策略中文微博情感分析和特征提出的方法。他們通過SVM的監督學習實驗,對主題的識別和文本的情感傾向分析取得了不錯的效果。

目前對于電子商務平臺的文本情感分析,還沒有出現較為系統的研究成果,不過根據市場的需要,也出現一些比價平臺,通過對多個主流電子商務平臺的各項數據采集,特別是對于價格、用戶評價,特別是對與好評和差評信息進行動態采集,形成一個多個電子商務平臺的價格對比,以引導用戶選擇高性價比的產品。比如,國內的慢慢買、盒子比價網、瑯瑯比價網等,提供國內外多個電子商務平臺的商品信息的價格和用戶評價的對比。

三、電子商務產品用戶評價分析算法研究

1.用戶評價信息的獲取

對于用戶評價信息的獲取,主要利用網絡爬蟲來進行采集。因此可以設計一個基于電子商務平臺的主題網絡爬蟲的設計。由于一般的電子商務平臺的商品評價頁面都是動態呈現的,因此如何解決對用戶評價的數據更新是設計該主題網絡爬蟲的技術關鍵。

對于動態網站的數據采集,可以建立索引空間,采用哈希表的形式將用戶評價信息建立動態索引,利用哈希查找算法,提高采集中查找的效率,從而實現對動態用戶評價信息的采集。

由于目前各類型電子商務平臺眾多,如果需要多全平臺的產品用戶評價信息進行采集,就需要較大的存儲空間和處理器,因此可以利用云計算平臺來建立云爬蟲,利用云計算的高計算、大存儲和高帶寬網絡的優點實現大數據的用戶評價信息的采集,也為后續的情感分析提供龐大的數據集。

2.用戶評價信息的特征詞處理技術分析

特征詞的提出主要分為:文本切詞、文本去重和特征詞提取三個步驟。

文本切詞:將一段詞語獨立切分為多個獨立的詞語,這是文本特征詞處理的基礎技術。當前分詞算法有字符串匹配算法、基于理解的算法和基于自動學習的算法等。

字符串匹配算法是最為常見的算法之一,其特點是實現簡單,詞語的匹配精度性較高。可以建立和維護字符串庫,實現不斷的自我更新和自我學習。具體的匹配過程是,對文本進行逐一分解后,通過對出現在字符串中的本文塊,則匹配成功。為了提高匹配的準確性,可以使用正向最大匹配、逆向最大匹配和雙向最大匹配等方法。

文本去重:對于本文切詞后,會存在許多重復的詞語,這就需要進行對切詞后的重復短語進行去重處理。這里主要是研究使用布隆過濾器(Bloom Filter)來進行對文本的去重處理。布隆過濾器是上世紀70年代Howard Bloom提出來的一種二進制向量數據結構,它可以很好的利用空間和時間效率,來驗證一個元素在集合中是否重復出現。

Bloom Filter的去重原理是:位數組K個獨立HASH函數。將HASH函數對應的值的位數組置1,查找時如果發現所有HASH函數對應位都是1說明存在,很明顯這個過程并不保證查找的結果是100%正確的。同時也不支持刪除一個已經插入的關鍵字,因為該關鍵字對應的位會牽動到其他的關鍵字。所以一個簡單的改進就是counting Bloom filter,用一個counter數組代替位數組,就可以支持刪除了。

特征詞提取:文本的特征詞提出主要是選取文本中的特征項,當前的提取方法比較多,最為常見的是文檔詞頻提取法,也稱作為DF。DF是指在整個文本詞語集中,包含了所指定的某個或多個特征項,其計算公式為:

在計算公式中,DF(t)是指所包含的特征項t的詞頻率,通過使用文檔詞頻提取法可以對每個特征項在整個文本出現的頻率進行統計,再根據設定的特征項設定的閾值,去掉一些小于閾值的特征項,進而從采集的文本中提取出所需的特征值。在電子商務平臺中的用戶評價信息,主要是對用戶評價信息分詞后,提取出用戶用于產品的評價特征項,對產品的優良、好壞進行特征項的分析。

3.基于VSM技術的用戶評價信息的情感分析

對于電子商務平臺中用戶評價信息,經過采集、切詞、特征值的提取和去重操作后,就剩下對處理后短語進行情感分析,也就是信息相似度的計算。對于目前來說信息相似度技術較為成熟的就是向量空間模型技術(VSM),該中技術就是把兩個文本短語簡化為向量運算,通過計算向量之間的相似度來衡量文本短語之間的相似度。

本文研究的電子商務平臺用戶評價研究的VSM情感分析過程如下:

(1)預處理,先對采集的用戶評價文本進行中英文切詞,并過濾所有停用詞。

(2)對用戶評價文本中的分詞短語的關鍵詞進行選擇與加權,對用戶評價文本中若干個關鍵詞進行頻度的計算。

(3)通過把兩個處理后的短語建立向量空間模型、求出向量空間中的余弦值。對于建立向量空間模型的方法就是把短語簡化為關鍵詞的權重為分量的N維向量來進行表示。對于D1和D2兩個文本來說,要求的之間的相似度Sim(D1,D2),其余弦公式為:■,其中W1k和W2k分別表示D1和D2兩個短語第k(1<=k<=n)個關鍵字的權值。

(4)如果所求的兩個用戶評價文本的余弦值大于所設定的閾值,那么就說明這兩個短語是相似的,否則說明該個短語與評價信息并不相似。

經過對所有切詞后的短語進行相似度計算后,得出的余弦值與事先設定好的閾值進行比較后,作為用戶評價情感傾向度分析的評價標準,通過把所有評價中的文本短語進行計算后,就可以判斷用戶評價對于商品的情感,也就可以作為對該商品的評價等級。對于設置的閾值可以在分析過程中,通過對詞語出現的頻度來不斷的進行調整,實現自我學習的能力,從而進一步的提高用戶評價情感傾向度分析的準確性。

四、總結

綜上所述,對于電子商務平臺的用戶評價信息的分析中,主要是采取了SVM方法進行分析,通過信息的采集、特征項的提取和情感的分析等來對產品的評價進行分析,為用戶和商家提供決策上的有效依據。但是由于目前電子商務平臺的迅速的發展,各類電子商務信息量巨大,如何提高對用戶評價的采集效率,切詞的合理性和對用戶評價信息情感分析的準確度方面,還需要進一步提高研究的深度和廣度。

因此下一步的研究方向是如何把本文研究的分析平臺和當前主流的云計算平臺相結合,依托云計算平臺的高計算能力、高可靠性和高存儲性等眾多優點。進一步的提高分析平臺的工作效率和對用戶評價的情感傾向度的分析能力。

參考文獻:

[1]張冬雯,崔志超,許云峰.電子商務產品評論多級情感分析的研究構架[J].網絡安全技術與應用,2013-09.

[2]楊彪.面向電子商務的評論文本情感分析研究[D].重慶交通大學,2014-04.

[3]田金靈.B2C電子商務中情感因素與顧客滿意及購買行為的關系[J].湖南工業職業技術學院學報,2013-08.

[4]嚴建援,張麗,張蕾.電子商務中在線評論內容對評論有用性影響的實證研究[J].情報科學,2012-05.

[5]游貴榮,吳為,錢沄濤.電子商務中垃圾評論檢測的特征提取方法[J].現代圖書情報技術,2014-10.

主站蜘蛛池模板: 国产91色在线| 亚洲日本中文字幕乱码中文| 国产精品太粉嫩高中在线观看| 久久精品日日躁夜夜躁欧美| 亚洲无码视频图片| 国产凹凸视频在线观看| 国产成人乱无码视频| 国产无码在线调教| 在线看免费无码av天堂的| 激情综合婷婷丁香五月尤物| 四虎免费视频网站| 亚洲熟女中文字幕男人总站| 找国产毛片看| 国产aaaaa一级毛片| 亚洲国产精品久久久久秋霞影院| 国产亚洲精品精品精品| 日韩欧美国产另类| 99ri国产在线| 国产aⅴ无码专区亚洲av综合网| 亚洲天堂成人在线观看| 日韩中文欧美| AV无码国产在线看岛国岛| 亚洲无码高清一区二区| 国产高潮视频在线观看| 亚洲Av激情网五月天| 午夜视频免费一区二区在线看| 国产乱人伦精品一区二区| 欧美成人第一页| 欧美成人h精品网站| 午夜一级做a爰片久久毛片| aaa国产一级毛片| 国产精品视频观看裸模| 亚洲高清国产拍精品26u| 色综合婷婷| 欧美午夜网站| 国产一区二区三区在线观看视频| 国产亚洲欧美日韩在线观看一区二区| 国产主播福利在线观看| 青青热久麻豆精品视频在线观看| 中国国产A一级毛片| 五月天福利视频| 久久天天躁狠狠躁夜夜躁| 九九这里只有精品视频| 久久婷婷人人澡人人爱91| 午夜久久影院| 国产又爽又黄无遮挡免费观看| 国产精品黄色片| 福利在线不卡| 欧美a级在线| 精品国产电影久久九九| 素人激情视频福利| 久久久久中文字幕精品视频| 色婷婷电影网| 四虎综合网| 最新午夜男女福利片视频| 成人小视频在线观看免费| 中文成人在线| 亚洲免费毛片| 亚洲无码免费黄色网址| 色婷婷亚洲综合五月| 国产精品性| 999福利激情视频| 农村乱人伦一区二区| 色视频久久| 国产欧美日韩va另类在线播放| 四虎精品国产AV二区| 国产91熟女高潮一区二区| 亚洲中文字幕手机在线第一页| 国产日本一区二区三区| 欧美五月婷婷| 波多野结衣在线se| 91视频99| 亚洲视频四区| 国产理论最新国产精品视频| 久久精品国产免费观看频道| 黄色成年视频| 亚洲色偷偷偷鲁综合| 精品伊人久久久大香线蕉欧美| 亚洲精品视频免费看| 亚洲浓毛av| 亚洲男人在线天堂| 日韩福利在线视频|