999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據技術的網絡熱搜關鍵詞提取算法

2021-07-03 04:15:56王珊珊梁同樂
電子測試 2021年10期

王珊珊,梁同樂

(1.廣東輕工職業技術學院信息技術學院,廣東廣州,510300;2.廣東郵電職業技術學院計算機學院,廣東廣州,510630)

0 引言

針對基數過大的網絡熱搜關鍵詞提取很容易出現提取查全率低的現象,證明以往研究存在一定的局限性[1]。因此,有必要對網絡熱搜關鍵詞提取算法展開優化設計。大數據技術作為一種信息化技術,主要針對巨量資料展開,具有高效性、真實性的優勢,以其強大的統一功能在眾多技術中脫穎而出,成為線下主流應用技術?;诖耍欣碛蓪⒋髷祿夹g應用在網絡熱搜關鍵詞提取算法中,基于大數據技術設計網絡熱搜關鍵詞提取算法,希望能夠在提高網絡熱搜關鍵詞提取查全率的同時,為網絡熱搜關鍵詞提取方面的發展提供新思路。

1 大數據技術

大數據技術主要是通過互聯網的優越性,徹底打破了時間以及空間的限制,在海量信息中挖掘出有價值的信息[2]。大數據技術下的信息特征為以多元的方式呈現數據,形成龐大的信息隊列,其中也隱含了實時性的優勢。大數據下借助信息化技術為依托,通過在大量數據中提取出有價值的信息,并挖掘數據中存在的內部規律[3]。結合國外針對大數據技術的研究中,主要將大數據技術分為兩大類,包括:數據存儲技術以及數據處理技術?;诖髷祿夹g具有效率高、精度高、使用方便等優點,已經被廣泛應用在各個領域中?;诖?,本文設計的基于大數據技術,網絡熱搜關鍵詞提取算法,其具體內容,詳見下文。

2 基于大數據技術的網絡熱搜關鍵詞提取算法

2.1 確定網絡熱搜關鍵詞特征的模糊空間

網絡熱搜關鍵詞信息特征的模糊空間示意圖,如圖1所示。

在圖1中,以A、B、C為網絡熱搜關鍵詞信息特征的模糊空間中的映射直線。結合ai1、ai2與ai3的關系可見,網絡熱搜關鍵詞信息特征空間維數越大,網絡熱搜關鍵詞信息特征模糊空間的面積越?。环粗?,網絡熱搜關鍵詞信息特征模糊空間的面積越大。因此,網絡熱搜關鍵詞信息特征的模糊空間只適用于對單一網絡熱搜關鍵詞信息特征進行描述,針對綜合網絡熱搜關鍵詞信息的特征還需要基于大數據技術,加權融合網絡熱搜關鍵詞。

圖1 網絡熱搜關鍵詞信息特征的模糊空間示意圖

2.2 基于大數據技術加權融合網絡熱搜關鍵詞

在確定網絡熱搜關鍵詞特征的模糊空間的基礎上,本文針對綜合網絡熱搜關鍵詞信息的特征通過大數據技術進行加權融合[4]。本文以網絡熱搜關鍵詞語義的重要程度為指標,以關鍵詞中的Hamming距離為標準,計算網絡熱搜關鍵詞模糊語義距離。設其為Sim(x,y),可得公式(1):

公式(1)中,n 指的是網絡熱搜關鍵詞語義特征矢量;i指的是綜合網絡熱搜關鍵詞信息的特征個數,為實數;w指的是平滑系數;m 指的是摩擦系數;k指的是網絡熱搜關鍵詞信息權值系數;g指的是關鍵詞隸屬度函數;μ指的是關鍵詞特征嵌入維數;x指的是網絡熱搜關鍵詞信息一維距平化Hamming距離橫坐標;y指的是網絡熱搜關鍵詞信息一維距平化Hamming距離縱坐標。網絡熱搜關鍵詞信息一維距平化Hamming距離橫坐標以及縱坐標能夠直接決定關鍵詞在模糊語義距離屬性中的具體點位信息,即為模糊語義特征描述?;谀:Z義距離屬性的基本特征,計算網絡熱搜關鍵詞信息模糊特征數值以及網絡熱搜關鍵詞信息特征距離,得到模糊語義網絡熱搜關鍵詞信息特征距離綜合信息表,為基于大數據技術加權融合網絡熱搜關鍵詞提供基礎信息。并以此為網絡熱搜關鍵詞分數索引,網絡熱搜關鍵詞分數越高證明其在網絡熱搜關鍵詞提取時的優先級越高,從而保證了盡可能多的關鍵詞結點被提取。

2.3 提取網絡熱搜關鍵詞

采用大數據技術Reduce中的稀疏表示技巧,得到完整的基于大數據技術的網絡熱搜關鍵詞提取算法,可得公式(2):

公式(2)中,u指的是網絡熱搜關鍵詞提取頻率。以公式(2)為基于大數據技術提取網絡熱搜關鍵詞的最終方程式,根據網絡熱搜關鍵詞特征矢量的位置,輸出網絡熱搜關鍵詞提取結果。至此,完成基于大數據技術的網絡熱搜關鍵詞提取算法設計。

3 實例分析

3.1 實驗準備

本文通過設計實例分析的方式,在web平臺中選取2個真實數據集作為實驗對象。首先,使用本文設計的提取算法基于大數據技術提取網絡熱搜關鍵詞,通過matalb軟件記錄網絡熱搜關鍵詞提取的查全率,將其設為實驗組;再使用傳統提取算法提取網絡熱搜關鍵詞,同樣通過matalb軟件記錄網絡熱搜關鍵詞提取的查全率,將其設為對照組。由此可見,本次實驗主要內容為測試兩種提取算法的查全率,網絡熱搜關鍵詞提取的查全率越高證明提取更加全面、可靠。通過設置10次實驗,針對matalb軟件測得的查全率,記錄實驗數據。

3.2 實驗結果分析與結論

將兩種提取算法下的查全率進行對比,查全率對比結果,如下表1所示。

表1 網絡熱搜關鍵詞提取查全率對比

根據表1可知,通過實驗組測得的查全率高于對照組兩倍以上,基于大數據技術設計的網絡熱搜關鍵詞提取算法在查全率方面相比傳統算法具有明顯的優勢。綜上所述,設計的網絡熱搜關鍵詞提取算法對網絡熱搜關鍵詞提取更全面,有理由直接投入現實應用。

4 結束語

文章針對基于大數據技術的網絡熱搜關鍵詞提取算法展開研究,通過以上研究可以表明,利用本文設計的基于大數據技術的網絡熱搜關鍵詞提取算法能夠在網絡熱搜關鍵詞提取過程中取得顯著的應用效果,解決以往網絡熱搜關鍵詞提取難的問題。因此,有理由加大大數據技術在網絡熱搜關鍵詞提取中的應用力度。由此可見,未來網絡熱搜關鍵詞提取算法方面的發展可以以大數據技術為核心,為網絡熱搜關鍵詞提取領域的研究提供學術意義。

主站蜘蛛池模板: 久久频这里精品99香蕉久网址| 久久久久久尹人网香蕉| 欧美精品啪啪| 亚洲中文字幕在线观看| 国产清纯在线一区二区WWW| 天堂在线www网亚洲| 亚洲三级a| 一级毛片中文字幕| 精品三级网站| 四虎精品国产AV二区| 亚洲中文字幕国产av| 欧美成人午夜在线全部免费| 亚洲一区二区三区国产精华液| 国产激情无码一区二区APP | 国产成人无码Av在线播放无广告| 久久国产精品波多野结衣| 日本高清免费不卡视频| 成人韩免费网站| 欧美不卡在线视频| 久久黄色小视频| 香蕉综合在线视频91| 欧美a级在线| 欧美性猛交xxxx乱大交极品| 免费观看欧美性一级| 香蕉国产精品视频| 嫩草影院在线观看精品视频| 久久男人资源站| 噜噜噜久久| 亚洲一区二区三区在线视频| 成人午夜天| 福利在线一区| 国产粉嫩粉嫩的18在线播放91| 久久精品一品道久久精品| 91麻豆久久久| 欧美日韩精品综合在线一区| 国产欧美视频在线| 亚洲伊人久久精品影院| 久久精品这里只有精99品| 亚洲一区网站| 99视频精品全国免费品| 国产v欧美v日韩v综合精品| 欧美亚洲日韩中文| 日本一本在线视频| 97青草最新免费精品视频| 91精品情国产情侣高潮对白蜜| 91精品久久久久久无码人妻| 国产视频大全| 99精品视频播放| 四虎综合网| 国产91视频免费观看| 91网红精品在线观看| 中文纯内无码H| 久久精品亚洲中文字幕乱码| 久久动漫精品| 在线观看精品自拍视频| 国产欧美日韩一区二区视频在线| 久久精品国产国语对白| 五月天久久综合国产一区二区| 国产一区亚洲一区| 国产成人av大片在线播放| 婷婷丁香在线观看| 国产导航在线| 久久无码免费束人妻| 亚洲欧洲日韩久久狠狠爱 | 国产a在视频线精品视频下载| 亚洲中文字幕97久久精品少妇| 成年看免费观看视频拍拍| 免费aa毛片| 91国内在线视频| 在线日韩一区二区| 欧美不卡视频在线观看| 国产人成乱码视频免费观看| 国产天天色| 色婷婷在线影院| 在线观看无码av免费不卡网站| 伊在人亞洲香蕉精品區| 福利在线不卡| 亚洲一区二区成人| 在线a网站| 少妇人妻无码首页| 国产精品自拍露脸视频| 在线免费观看AV|