999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA主題模型在體育賽事輿情挖掘中的運用

2018-07-09 09:46:08孫恩澤
大經貿 2018年5期
關鍵詞:模型

【摘 要】 針對傳統僅依靠文本高頻詞進行體育賽事輿情分析而忽視文本中潛在語義關聯的缺陷,開發出了一套基于LDA(latent dirichlet allocation)主題模型的體育賽事輿論系統,來對賽事的輿情主題進行發現提取。

引 言

如今,互聯網作為一個開放的空間,有大量的觀點在其中快速傳播,具有發散性強、滲透性強、隱蔽性強的特點。而一件小事通過在互聯網中的傳播發酵,往往議論會超出事情本身,擴展到社會的政治、經濟、文化層面,形成強大的輿論力量,如南京馬拉松選手跑丟事件、中國乒乓球賽國乒退賽風波。對于一個體育賽事而言,網上的輿論不僅會影響到人們參與或觀賞賽事的意愿以及賽事品牌形象、贊助商等方面,甚至還會影響到舉辦地的形象及產業發展,從而對一個賽事的舉辦帶來巨大的影響。

1 體育賽事網絡輿情概述

1.1 網絡輿情概念

對于“輿情”的定義,諸多學者有著不同的理解,根據輿情的特征認為輿情是指在一定的社會現實環境中,大多數人民群眾對待社會事務和問題所表達出的情緒、思想、觀點、意見的總和,是廣大人民群體滿足自身利益需要的一種訴求和表達的集中體現[1]。認為輿情是指公眾關于現實社會以及社會中的各種現象、問題所表達的信念、態度、意見和情緒表現的總和,具有相對一致性、強烈程度和持續性,對會發展及有關事態的進程產生影響,其中混雜著理智和非理智的成分[2]。

1.2 體育賽事網絡輿情

綜合上述對網絡輿情定義,我們可以認為體育賽事網絡輿情是人們通過互聯網這個媒介,對發生的與體育賽事相關的事件所表達出的包含其意愿、態度、行為傾向的看法、評論的總和。體育網絡輿情由于其自身的特點而呈現出獨特的特征。

1.2.1 受關注程度高。我國作為體育大國,許多體育運動項目都擁有龐大的粉絲群體。并且對于一項體育賽事舉辦而言,必然會在當地引起極大的注意。再加上參賽成員、比賽結果、打破記錄等這些天然的話題,自然會成為眾多媒體追逐的焦點,滿足了網絡媒體需要吸引人眼球的需求。

1.2.2 話題擴展型強。隨著體育賽事商業化、職業化程度不斷加深,體育賽事與社會政治、經濟、文化的聯系不斷緊密。

1.2.3 體育賽事關注符合二八法則。雖然體育項目及賽事種類繁多,但其中只有少數項目的熱門賽事比賽能夠在網上引起巨大的討論,相反大多數體育賽事在現階段,特別是相對冷門的賽事所受到的曝光還并不是很多,所以一般也很難形成很大的網絡輿情。

2 LDA主題模型

2.1 LDA主題模型的基本原理

潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)是由D. M. Blei等人在2003年提出的生成式主題模型。該生成模型的思想是,每一篇文章的每一個詞都是通過一定的概率選擇了某個主題,并從這個主題中以一定的概率選擇了某個詞語。

如圖所示,“詞語-文章”可以分解為“詞語-主題”和“主題-文檔”兩個因子,這是一種典型的矩陣分解模型。LDA模型就是矩陣分解的基礎上在加上先驗概率和似然概率。LDA因此可以看做是一種3層貝葉斯概率網絡,包含文檔(d)、主題(z)、和詞(w)3層結構。其中詞表的大小為L,一個L維向量(1,0,0,…,0,0)表示一個詞。由N個詞構成的文章記為d=(,,…,)。假定一個賽事輿論數據集D由M篇文章構成,記為D=(,,...,)。M篇文章分布著K個主題,記為(i=1,2,3…,K)。記α 和β為狄利克雷函數的先驗參數,θ為主題在文檔中的多項分布的參數,其服從超參數為α的Dirichlet先驗分布,為詞在主題中的多項分布的參數,其服從超參數β的Dirichlet先驗分布。

LDA主題模型已經廣泛應用于文本主題挖掘和聚類、文本相似度計算等方面,彌補了只使用文章高詞頻發現主題時,無法對潛在語義進行識別的不足,有效解決了多種指代的問題,避免了詞語二義性的干擾。

3 實證檢驗與結果

本系統實驗環境為windows平臺、運用python語言進行數據處理。實驗數據為某馬拉松賽事的參賽者網上評論。系統使用結巴分詞系統,使用wordtovector算法進行特征向量選擇,最后使用LDA算法進行主題提取。

從LDA主題分析處理后的結果可以看出,參賽者對此次賽事的不滿之處主要在于賽道設計不合理,補給不足等方面,并希望賽事的舉辦者在下次舉辦時能夠進行調整。

結 語

隨著大數據時代的帶來,合理運用LDA主題分析對網上有關體育賽事的觀點和主題進行挖掘,有利于了解某項賽事在人群中普遍形象,方便體育賽事組織管理者及時發現賽事的長處和不足,調整相應的組織及營銷策略。

【參考文獻】

[1] 錢儲. 大學生網絡輿情現狀分析及對策研究[J]. 綠色科技, 2016(15):255-256.

[2] 趙叢聰. 網絡輿論的功能和調控[J]. 視聽, 2013(2):41-42.

作者簡介:孫恩澤(1994-),男,漢族,河南平頂山人,研究生,現就讀于上海體育學院經濟管理學院,研究方向:體育管理。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲第一区精品日韩在线播放| 亚洲经典在线中文字幕| 欧美精品xx| av在线手机播放| 97在线国产视频| 青青草91视频| 欧美a级在线| 激情网址在线观看| 国产理论一区| 人妻21p大胆| 久操线在视频在线观看| 69av免费视频| 亚洲成在人线av品善网好看| 国产一在线| 青青青国产视频| 一级毛片不卡片免费观看| 无码不卡的中文字幕视频| 国产真实乱子伦视频播放| 91成人精品视频| 亚洲综合第一页| 国产网站黄| 一本大道东京热无码av| 青草91视频免费观看| 亚洲精品综合一二三区在线| 亚洲无线视频| 91福利在线看| 怡红院美国分院一区二区| 欧美中文字幕在线二区| 91探花国产综合在线精品| 欧美日韩精品在线播放| 88av在线播放| 996免费视频国产在线播放| 久久性妇女精品免费| 亚洲一区二区黄色| 美女视频黄又黄又免费高清| 人妻21p大胆| 久久精品66| 人妻21p大胆| 综合人妻久久一区二区精品| 夜夜拍夜夜爽| 67194亚洲无码| 91亚洲视频下载| 成人亚洲国产| 国产乱子伦一区二区=| 亚洲国产精品一区二区第一页免 | 久久99国产乱子伦精品免| av在线5g无码天天| 亚洲69视频| 亚洲娇小与黑人巨大交| 国产情精品嫩草影院88av| Jizz国产色系免费| 香港一级毛片免费看| 日韩精品一区二区深田咏美| 久久免费观看视频| 最新国产午夜精品视频成人| 欧美国产日韩在线| 亚洲系列中文字幕一区二区| 女人18毛片一级毛片在线 | 欧美伦理一区| 国产免费精彩视频| 欧美日本在线一区二区三区| 欧美一级黄色影院| 伊人久久大香线蕉aⅴ色| 亚洲中文久久精品无玛| 最新国产网站| 在线免费a视频| 91欧美在线| 国产精品.com| 国产在线无码av完整版在线观看| 91视频99| 日韩精品毛片人妻AV不卡| 国产欧美在线观看一区| 国产精品夜夜嗨视频免费视频| 国产18在线| 国产丝袜91| 丁香六月激情综合| 九九久久精品国产av片囯产区| 国产精品专区第1页| 日韩欧美中文字幕在线精品| 国产精品思思热在线| 国产熟女一级毛片| 免费久久一级欧美特大黄|