999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

旅游景點評論情緒的大數據檢測、分類和惡意過濾系統的設計

2021-08-05 05:26:01覃鐐銘柯寧寧
速讀·中旬 2021年9期

覃鐐銘 柯寧寧

◆摘? 要:隨著我國人民大眾的生活水平普遍提高,對生活質量的越來越重視,越來越多的人選擇在空閑之余外出旅游,而且隨著互聯網的快速發展,再加上智能終端的普及,基本上人人都可以在任何時間任何網絡信號普及到的地方,通過旅游網站獲取旅游景點的信息及發表評論和分享旅游游記,旅游網站對這些評論數據缺乏有效的管理和利用,大部分企業的評論系統都會讓客戶在評論時評定一個“星級”或者“等級”來對旅游評論信息進行分類。但是這種分類方法不是很靈活,過于死板,本文針對這種狀況,設計一個基于貝葉斯分類的對評論數據文本自身進行分析,得出評論文本的情感傾向,并且過濾其中的惡意評論的系統。

◆關鍵詞:情感分析;樸素貝葉斯;自然語言處理;結構化感知機

在旅游領域,各大企業都對用戶評論、游記、旅游心得等用戶的直接反饋信息極為注重,這些用戶評論、游記、旅游心得等都是用戶在體驗自身企業服務或者游玩景點的時候的直接感受,而往往其他客戶在考慮是否出行時,受這些評論信息的影響是巨大的,既“好評”如潮的旅游景點往往更能吸引客戶的出行。因此大部分企業的評論系統都會讓客戶在評論時評定一個“星級”或者“等級”來對旅游評論信息進行分類。但是這種分類方法不是很靈活,過于死板,有時候“星級”高的旅游評論不一定是所謂的“好評”,而“星級”低的旅游評論信息也不一定都是完全的“差評”。因此傳統依賴用戶評分的去判斷情感傾向的分類方法已經不適應現在的網絡環境了,需要一個針對旅游評論文本信息本身的分類方法。

1評論數據處理框架

首先對獲取到的評論數據進行預處理,包括去掉重復的數據,然后使用預訓練的感知機分詞模型對去重后的數據進行分詞,然后就是去除其中的停用詞。在數據預處理完之后,使用預訓練的貝葉斯模型進行分類的預測,然后過濾其中的惡意評論,最終得出結果。評論數據處理框架的如圖1所示。

1.1機械去重

因為現在大多數的旅游網站都自帶評論功能,用戶不作評論的話會自動進行潛在評論,這些評論往往是重復的而且沒有什么實際意義。本文直接采取對比兩條評論是否一樣來去重。

1.2中文分詞

中文分詞是自然語言處理的一個極其重要的步驟,分詞的準確率對下一步的去停用詞和情感分析有極大的影響,本文采用結構化感知機去預測句子的切割序列。結構化預測就是給定一個模型λ及打分函數scoreλ(·),利用打分函數給一些備選結構打分,選取分數最高的結構作文預測輸出。

所以結構化感知機算法就應該如下:

(1)讀入樣本(x(i),y(i)),執行結構化預測公式(3)

(2)與預期結果對比,正確則獎勵特征函數的權重增加[ω←ω+Φx(i),y(i)],錯誤則[ω←ω-Φx(i),y(i)]

回到中文分詞,中文分詞可以看作是給文本進行序列標注的問題,即給每個字標注標簽,只有在在特定標簽的時候切割句子,本文定義了有四種標簽的標注集{B,M,E,S},分別代表這一個詞語的開始,中間,結束和單字詞語。序列標注的最大特點就是標簽之間的依賴性,在隱馬可洛夫模型中,這種模型是利用初始狀態向量和狀態轉移概率矩陣來體現這種依賴性。

1.3去除停用詞

停用詞一般是指文字中的代詞、語氣詞、稱謂詞和地點副詞等,這些詞語對于情感分析的影響不大,去除有助于提高系統的運行效率。本文通過將一些常用的無意義的符號和停用詞構建成停用詞詞典,然后使用詞典匹配的方式,過濾掉評論中的停用詞。

1.4貝葉斯分類

樸素貝葉斯是從古典的數學理論--貝葉斯原來得出的一種分類模型,它具有扎實的數學基礎和穩定的分類效率。貝葉斯分類是先用概率統計對訓練樣本進行分類,然后結合先驗概率和后驗概率,得出結果,避免只使用先驗概率來以偏概全。

1.4過濾惡意評論

惡意評論的過濾就是將前面貝葉斯分類中被分類到惡意評論的文本進行過濾。

2結束語

本文使用結構化感知算法訓練出一個線性模型,用來預測句子的分割序列,達到分詞的效果,結合樸素貝葉斯分類算法提取訓練樣本的特征,構建貝葉斯模型,預測評論文本的情感傾向,并且過濾其中的惡意評論。通過這種無監督的機器學習方法,克服了傳統的基于詞典的中文分詞和情感分析的對與OOV現象無可奈何的問題,擁有一定的解決新詞的能力,但是為了更好的適應網絡時代的發展,應該定期更新預料再次訓練獲取模型,從而達到更準確的結果。

參考文獻

[1]林欽,劉鋼.基于情感計算的商品評論分析系統[J].計算機應用與軟件,2014(12):39-44.

[2]肖江,王曉進.基于SVM的在線商品評論的情感傾向性分析[J].信息技術,2016(7):172-175.

[3]黃仁,張衛.基于word2vec的互聯網商品評論情感傾向研究[J].計算機科學,2014,34(8):2317-2321.

[4]宋恩梅,何帆.基于多網站的商品評論傾向性研究:以手機為例[J].圖書館學研究,2016(2):85-92.

[5]郭若男.基于Hadoop平臺的在線數據處理系統的設計與實現[D].北京郵電大學,2015.

主站蜘蛛池模板: 国产成人8x视频一区二区| 久久精品人人做人人综合试看| 成人国产精品一级毛片天堂| 久久亚洲欧美综合| 99在线视频网站| 亚洲无码视频一区二区三区 | 婷婷综合色| 青青草原国产| 亚洲天堂日本| 欧美成人精品在线| 成人福利在线视频| 99视频在线免费观看| 无码免费的亚洲视频| 亚洲专区一区二区在线观看| 亚洲av无码人妻| 无码又爽又刺激的高潮视频| 亚洲成人网在线播放| 欧美成人手机在线视频| 日韩欧美国产三级| 国产超碰一区二区三区| 91免费精品国偷自产在线在线| 亚洲三级成人| 久久国产乱子伦视频无卡顿| 久久成人18免费| 久久久久久久蜜桃| 99在线视频免费观看| 国产午夜精品鲁丝片| 国产一区成人| 国产精品性| 熟女成人国产精品视频| 国产激爽大片在线播放| 亚洲精品国产日韩无码AV永久免费网| 国产在线精品人成导航| 亚洲不卡影院| 91久久大香线蕉| 国产精品制服| 色成人亚洲| 在线毛片网站| 免费无码AV片在线观看中文| 99re视频在线| 国产区在线观看视频| 亚洲av无码人妻| 亚洲天堂日韩在线| 亚洲国产黄色| 中文字幕在线欧美| 伊人成人在线| 午夜福利无码一区二区| 在线观看无码av免费不卡网站| 国产91精选在线观看| 2022精品国偷自产免费观看| 在线观看免费黄色网址| 欧美一级专区免费大片| 黄色在线不卡| 欧美一级爱操视频| 无码久看视频| 免费大黄网站在线观看| 精品国产Av电影无码久久久| 九九视频免费在线观看| 美美女高清毛片视频免费观看| 日日拍夜夜操| 欧美劲爆第一页| 欧美日韩一区二区三| www.99在线观看| 国产日韩久久久久无码精品| 成人亚洲国产| 日韩激情成人| 亚洲欧洲自拍拍偷午夜色| 国产高清在线观看91精品| 成人在线观看不卡| 日韩欧美国产综合| 国产精品免费p区| 成人年鲁鲁在线观看视频| 免费一级毛片在线播放傲雪网| 无码一区18禁| 91午夜福利在线观看精品| 色综合手机在线| 国产美女精品人人做人人爽| 久无码久无码av无码| 色久综合在线| 日韩美毛片| 亚洲娇小与黑人巨大交| 欧美午夜网站|